新京报贝壳财经讯(记者罗亦丹)3月4日,智谱发布了“2025开源年”的第一个模型:首个支持生成汉字的开源文生图模型——CogView4,其在DPG-Bench基准测试中的综合评分排名第一,该模型也是首个遵循Apache 2.0协议的图像生成模型。
CogView4支持中英双语提示词输入,擅长理解和遵循中文提示词,是一款能够在画面中生成汉字的开源文生图模型,能更好地满足广告、短视频等领域的创意需求。在技术实现上,CogView4将文本编码器从纯英文的T5 encoder换为具备双语能力的GLM-4 encoder,并通过中英双语图文进行训练,使CogView4模型具备双语提示词输入能力。

CogView4生成的图片
校对 穆祥桐
相关文章:
人工智能,重磅利好!08-27
上汽通用“牵手”Momenta,别克至境L7将化身“AI驾驶宗师”08-21
隧道建造打通数据孤岛08-21
百度:海外出现大量蒸汽机MuseSteamer虚假网站,谨防受骗08-19
OpenAI:如果你想快速烧掉百万美元,就训练自己的AI模型吧07-26
扰乱经济金融秩序!北京、深圳、苏州、重庆等多地紧急提示风险→07-14
“世界上最强AI模型”发布,马斯克放话!07-14