新京报贝壳财经讯(记者罗亦丹)3月4日,智谱发布了“2025开源年”的第一个模型:首个支持生成汉字的开源文生图模型——CogView4,其在DPG-Bench基准测试中的综合评分排名第一,该模型也是首个遵循Apache 2.0协议的图像生成模型。
CogView4支持中英双语提示词输入,擅长理解和遵循中文提示词,是一款能够在画面中生成汉字的开源文生图模型,能更好地满足广告、短视频等领域的创意需求。在技术实现上,CogView4将文本编码器从纯英文的T5 encoder换为具备双语能力的GLM-4 encoder,并通过中英双语图文进行训练,使CogView4模型具备双语提示词输入能力。

CogView4生成的图片
校对 穆祥桐
相关文章:
广东英德:以数字检察助力法律监督提质增效04-17
首个云超算国标正式发布04-17
新一代节能控制技术落地!轨交站场“零碳化”变成现实04-16
高德发布全球首个AI导航智能体,让导航变得“会思考、能预判、有温度”04-15
广电视听智能体(AI Agent)开发工具在短视频创作领域得到应用04-15
人从众!来南阳,看超燃展会04-13
云南已向缅甸发送6批省级救灾物资04-12