阿里重磅开源Qwen-Image！中文生图不再“乱码”

200亿参数模型惊艳亮相，复杂排版、书法笔触一键生成，国产图像模型首超国际巨头

阿里通义千问团队昨日震撼开源其首个图像生成基础模型——Qwen-Image，一举攻克AI生图领域的"文字噩梦"。这款200亿参数的多模态扩散Transformer模型，凭借突破性的中文渲染能力和精准图像编辑技术，在多个基准测试中碾压国际主流模型，标志着中国在多模态AI领域实现重大突破。

技术突破：让AI真正"读懂"汉字

传统图像生成模型在处理文字时常常"缺笔少画"，尤其对结构复杂的中文更是束手无策。Qwen-Image通过三大创新彻底扭转了这一局面：

渐进式文本渲染训练

采用课程学习策略，从简单非文本内容起步，逐步进阶到多行文本、段落级语义理解，最终实现中英文混排海报级生成。这种"由易到难"的训练方式使模型文本生成能力获得质的飞跃。

双编码器协同架构

创新性地整合Qwen2.5-VL语义编码器与VAE重建编码器。输入图像被拆解为语义特征和视觉细节特征，确保编辑时既能理解"将短发变成长发"的指令，又保留面部痣、皱纹等关键特征。

超50亿高质量数据锤炼

团队构建覆盖文档、海报、PPT的专用数据集，结合七阶段渐进过滤机制清洗数据，特别强化中文文本样本。训练中动态平衡重建损失与感知损失，显著减少网格伪影等常见瑕疵。

实战封神：中文场景全面碾压竞品

在官方发布的测试案例中，Qwen-Image展现出惊人的实用性：

文化场景精准还原

输入"李白窗前写'床前明月光'"的提示词，生成的画面不仅意境古典，"床前明月光"五个字更以书法笔触自然融入窗棂阴影中，毫无生硬贴图感。

商业设计开箱即用

用户要求生成"蓝绿色科技风PPT页面"，模型自动排版出中央主标题"量子位AI Coding线下沙龙"，顶部嵌入企业logo，底部精准插入两张配图（现场照片+AI编程示意图），专业设计能力堪比人类设计师。

跨语言无缝切换

在生成"宫崎骏风格云计算主题图"时，模型依据景深变化将"云存储""云计算"等中文词汇错落排布在云雾中，与画面浑然一体。英文测试中同样准确还原书店橱窗每本书的标题字体。

性能霸榜：12项SOTA刷新行业标准

根据最新技术报告，Qwen-Image在权威测试中全面领先：

测试类别	关键指标	Qwen-Image得分	领先幅度
通用图像生成(GenEval)	图像质量(FID)	10.2	平均9%↑
中文渲染(ChineseWord)	文字准确率	92.7%	14%↑
图像编辑(GEdit)	用户满意度(MOS)	4.3/5	业界第一
图文混排(OneIG-Bench)	布局合理性	顶级水平	前三强

尤其在中英文混合的复杂提示词测试中，其表现甚至超越OpenAI的GPT-4o和备受追捧的Midjourney。

生态开放：人人可用的创作神器

目前该模型已全开源上线，普通用户可通过多种渠道体验：

零门槛在线试玩

登录QwenChat官网选择"图像生成"，输入中文提示词即可实时生图。魔搭社区同步推出快速生图（新手友好）与专业生图（支持ControlNet/图生图）双模式。

开发者深度定制

Hugging Face和GitHub提供完整模型权重。通过DiffSynth-Studio工具链，仅需4GB显存即可本地部署，并支持训练专属LoRA风格模型。

企业级解决方案

阿里巴巴同步开放API接口，教育机构可快速生成课本插图，电商平台能批量制作带精准文案的商品海报，颠覆传统设计工作流。

随着Qwen-Image的开源，长期由西方主导的AI生图格局正被重构。正如开发者社区热评："当中文不再成为AI的'乱码'，意味着技术民主化真正到来。"

展开阅读全文

更新时间：2026-02-21

标签：科技阿里重磅乱码中文模型图像精准语义编码器文本海报技术笔触

1 2 3 4 5

阿里重磅开源Qwen-Image！中文生图不再“乱码”

郭文海会见科大讯飞团队：深化人工智能领域合作发展

Anthropic发布Claude 4.1编程测试称霸

告别交互生硬、情感薄弱！重塑 AI 陪伴硬件互动体验

ElevenLabs推出AI音乐生成器，声称可商业使用

这一局，特朗普输得很彻底！美国“关税大棒”刚打下来，中国发放183张通行证，巴西不怕了

襄阳益泰腾达机械制造有限公司成立，注册资本500万人民币

特朗普狮子大开口！新规曝光：想进美国市场？不交钱免谈！

不到1天，美财长对华有了新称呼，特朗普被敲打：赶紧放开出口

白银有色等投资成立科技产业公司

直降7200万，昔日城市地标，今日无人问津！镇江大酒店将迎来第四次拍卖

央视曝光几款新型危害APP，多人存款一夜蒸发

美国狂挖中巴墙脚，巴基斯坦一个急转弯，中方这下可以放心了

林武在菏泽日照调研

2025.8.7早评：降准利好加持，A股迎关键布局窗口

三女子入住知名酒店，凌晨突然“发出巨大声响，大量污水从头顶浇下”

白银有色等投资成立科技产业公司

乔锋智能：公司高度重视应用于人形机器人领域的数控机床

格力电器：目前公司芯片团队近千人，技术人员占比超60%

机器人产业ETF（159551）收涨超3%！宇树科技发布新四足机器

华依科技：已为智元人形机器人供货IMU产品

浙江云遥信息技术有限公司成立，注册资本1000万人民币

海特高新：华芯科技开发了成熟稳定的GaAs无源芯片制程等

阿里巴巴：年度股东大会将于9月25日召开

重磅来袭：雅水概念会爆发吗？大盘三连阳，明天怎么走？

值得等待！iPhone首款折叠屏提前曝光，科技感十足