2025 年开源图生图模型盘点：Kandinsky 5.0、Qwen-Image 与 Z-Image

2025 年开源图生图模型迎来爆发，盘点 Kandinsky 5.0、Qwen-Image 与 Z-Image 三款代表模型。Kandinsky 5.0 主打多语言支持与高效推理；Qwen-Image 专注中文排版与文本渲染优化；Z-Image 则以轻量化设计实现低显存部署。文章对比了三者的架构、性能参数及适用场景，为开发者与创作者提供选型参考，推动 AI 图像生成技术的普惠化发展。

极光发布于 2026/3/22更新于 2026/4/188 浏览

2025 年，开源图生图模型领域迎来爆发式增长，三大代表模型——Kandinsky 5.0、Qwen-Image 和 Z-Image——以截然不同的技术路线和参数规模，共同重塑了 AI 图像生成的生态格局。这些开源模型不仅降低了创作门槛，更通过多语言支持、中文排版优化和轻量化设计等创新，填补了国内 AI 图像生成领域的空白。与 2024 年相比，2025 年的开源图生图模型在推理速度、分辨率支持和中文适配上实现了全面突破，为创意产业、广告营销和内容创作等领域提供了强大工具。

一、三大开源图生图模型全景概览

2025 年的开源图生图模型呈现出明显的差异化竞争格局：一方面，以俄罗斯 Sber 银行的 Kandinsky 5.0 为代表的多语言支持模型专注于高效推理和国际化场景；另一方面，阿里通义千问团队的 Qwen-Image 和通义实验室的 Z-Image 则分别以中文排版优化和轻量化设计见长，形成了针对不同用户需求的互补生态。三大模型的发布，标志着全球开源图生图技术已达到工业级水准，为从个人创作者到专业设计团队的全谱系用户提供了普惠化 AI 创作工具。

模型名称	发布时间	参数规模	核心架构	开源协议	主要特点
Kandinsky 5.0 Image Lite	2025 年 11 月	6B	CrossDiT+Flow Matching	MIT 协议	多语言支持，16 步生成，最高 1408×1408 分辨率
Qwen-Image	2025 年 8 月	20B	MMDiT 架构	Apache 2.0	中文排版优势，长文本渲染准确率 89%，支持 ControlNet
Z-Image	2025 年 11 月 28 日	6B	S³-DiT 架构	Apache 2.0	轻量化设计，8 步采样，最低 8GB 显存支持

这三大模型的发布，标志着全球开源图生图技术已达到工业级水准。Kandinsky 5.0 填补了开源领域多语言图像编辑的空白，Qwen-Image 解决了中文文本渲染的行业痛点，而 Z-Image 则通过极致的轻量化设计，将高质量图像生成能力带入消费级硬件（目前 Z-Image-Turbo 已发布，Z-Image-Base 和 Z-Image-Edit 尚未正式发布）。它们共同推动了 AI 图像生成技术的民主化进程，使创作不再是专业人士的专利。

在这里插入图片描述

二、Kandinsky 5.0：俄罗斯开源 AI 的里程碑之作

Kandinsky 5.0 由俄罗斯 Sber 银行于 2025 年 11 月正式开源，是欧洲最大的开源项目之一，成为图像与视频生成领域的全新标杆。该系列包含三款核心模型：6B 参数的 Image Lite（图像生成/编辑）、2B 参数的 Video Lite（文本/图像到视频生成）和 19B 参数的 Video Pro（高质量视频生成），均支持最长 10 秒视频生成。Image Lite 作为图生图任务的主力模型，凭借其多语言支持和高效推理能力，迅速在国际开发者社区引发热议。

在这里插入图片描述

技术架构方面，Kandinsky 5.0 采用基于流匹配（Flow Matching）范式和潜在扩散管道（Latent Diffusion Pipeline）的核心架构，核心骨干网络为 CrossDiT（Cross-Attention Diffusion Transformer）。其创新点在于引入 NABLA 稀疏注意力机制，通过邻域自适应块级稀疏注意力，将高分辨率视频训练/推理速度提升 2.7 倍，保持 90% 稀疏率且不损失质量。模型通过多阶段训练流程（预训练→监督微调→蒸馏→RL-based 后训练），将生成步骤（NFE）从 100 降至 16，显著提升了推理效率。

模型名称	分辨率支持	采样步数	显存需求	中文能力	开发难度	适用场景
Kandinsky 5.0	1408×1408	16 步	16GB（最低，需量化卸载）/24GB（舒适运行）	中等	高	国际广告设计、多语言内容创作
Qwen-Image	1024×1024	8-50 步	16-42GB	顶尖	中	中文海报、电商产品图、PPT 设计
Z-Image	1024×1024	8 步	8-16GB(Turbo/Base/Edit 版本显存需求会有差异)	优秀	低	日常创意设计、移动端部署

2025 年开源图生图模型盘点：Kandinsky 5.0、Qwen-Image 与 Z-Image

一、三大开源图生图模型全景概览

二、Kandinsky 5.0：俄罗斯开源 AI 的里程碑之作

更多推荐文章

相关免费在线工具

三、Qwen-Image：中文图像生成的革命性突破

四、Z-Image：轻量级大模型的普惠革命

五、性能对比与用户选择指南

六、开源图生图模型的未来发展趋势

七、结语：开源图生图的普惠时代

2025 年开源图生图模型盘点：Kandinsky 5.0、Qwen-Image 与 Z-Image

一、三大开源图生图模型全景概览

二、Kandinsky 5.0：俄罗斯开源 AI 的里程碑之作

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

三、Qwen-Image：中文图像生成的革命性突破

四、Z-Image：轻量级大模型的普惠革命

五、性能对比与用户选择指南

六、开源图生图模型的未来发展趋势

七、结语：开源图生图的普惠时代