小白保姆级教程：用Qwen-Image-2512搭建AI绘画工作流

优质文章学习记录

12 Apr 2026 — 11 min read

小白保姆级教程：用Qwen-Image-2512搭建AI绘画工作流

你是不是也试过在ComfyUI里折腾半天，模型装好了、节点连对了，结果点“出图”却卡在加载、报错、黑图、或者生成一堆看不懂的色块？别急——这次我们不讲原理、不堆参数、不聊架构，就用最直白的方式，带你从零开始，把阿里最新开源的Qwen-Image-2512-ComfyUI镜像真正跑起来、用得顺、画得稳。

这是一份专为新手准备的实操指南。不需要你懂Python、不用配环境变量、不查报错日志、不翻GitHub文档。只要你会点鼠标、能看懂中文提示、有台带4090D显卡的机器（或租用云算力），就能跟着一步步完成：部署→启动→选工作流→输提示词→三分钟内看到第一张高清图。

全程无术语轰炸，所有操作都截图级还原；所有路径都写清楚；所有按钮都标明白；所有坑我都替你踩过了——包括那个容易被忽略的“缩放图像”节点、那个必须更新的ComfyUI内核、还有三个ControlNet方案到底该选哪个才不翻车。

准备好了吗？咱们现在就开始。

1. 镜像部署与一键启动

Qwen-Image-2512-ComfyUI是ZEEKLOG星图镜像广场提供的预置镜像，已集成阿里通义实验室最新发布的Qwen-Image 2512版本模型、完整ComfyUI运行环境、常用ControlNet支持包及内置工作流。无需手动下载模型、不用配置依赖、不碰命令行——真正的开箱即用。

1.1 部署前确认事项

硬件要求：单张NVIDIA RTX 4090D显卡（显存≥24GB）即可流畅运行；若使用云算力，请选择“4090D单卡”规格实例
系统环境：镜像已预装Ubuntu 22.04 + CUDA 12.1 + PyTorch 2.3，无需额外安装
存储空间：镜像体积约18GB，建议预留至少30GB空闲磁盘空间（用于缓存和生成图）

注意：该镜像不兼容A卡、Mac芯片、低显存显卡（如3060 12G以下）。若你用的是其他显卡，请勿强行部署，否则大概率卡在模型加载阶段。

1.2 四步完成部署与启动

按顺序执行以下操作，每一步都有明确反馈：

进入ZEEKLOG星图镜像广场，搜索“Qwen-Image-2512-ComfyUI”，点击【立即部署】
选择算力规格（务必选“4090D单卡”），设置实例名称（如qwen-paint-01），点击【创建实例】

运行一键启动脚本（注意是数字“1”，不是字母“l”）：

bash "1键启动.sh"

实例启动后，进入控制台，切换到/root目录：

cd /root

脚本执行时会自动：

检查CUDA与PyTorch版本兼容性
启动ComfyUI服务（端口默认8188）
输出访问地址（形如 http://xxx.xxx.xxx.xxx:8188）

成功标志：终端最后出现 ComfyUI is running on http://0.0.0.0:8188，且网页可正常打开。

小贴士：如果浏览器打不开页面，请检查云服务商安全组是否放行8188端口；本地部署用户请确认防火墙未拦截。

2. 网页界面初识与内置工作流调用

ComfyUI不像WebUI那样点点就出图，它靠“节点连线”驱动流程。但别怕——这个镜像已为你准备好开箱即用的内置工作流，你只需要点几下，就能直接生成图片。

2.1 登录ComfyUI主界面

在浏览器中打开上一步获得的地址（如 http://123.45.67.89:8188）
页面加载完成后，你会看到左侧一栏菜单：Queue（队列）、Manager（管理）、Load（加载）、Save（保存）等
重点看左上角“ComfyUI”Logo右侧的“工作流”按钮（图标为两个重叠方块）→ 点击它

此时页面左侧会弹出一个文件树面板，显示所有预置工作流。

2.2 找到并加载Qwen-Image专用工作流

镜像内置了三类工作流，全部放在 /root/ComfyUI/custom_nodes/Qwen-Image-Workflows/ 目录下：

工作流名称	适用场景	特点
`Qwen-Image-Base.json`	纯文生图入门	最简结构，仅含提示词+采样器+模型加载，适合测试基础效果
`Qwen-Image-ControlNet-Canny.json`	线稿控制绘图	支持上传手绘草图或自动生成Canny边缘图，精准控制构图
`Qwen-Image-ControlNet-Union.json`	多模式自由切换	集成InstantX ControlNet Union模型，一键切换canny/depth/openpose/softedge四种控制方式

小白首推：直接双击打开 Qwen-Image-Base.json ——这是你今天要跑通的第一张图的起点。

提示：工作流加载后，中间画布会自动显示节点图。若节点重叠或位置混乱，按 Ctrl+Shift+R（Windows/Linux）或 Cmd+Shift+R（Mac）一键重排布局。

3. 基础文生图：三分钟生成你的第一张图

我们以 Qwen-Image-Base.json 为例，手把手走完从输入到出图的全流程。所有操作都在网页内完成，无需改代码、不碰配置文件。

3.1 关键节点说明（只看这4个就够了）

节点名称	位置	作用	小白怎么操作
`CLIP Text Encode (Prompt)`	左侧中部	输入正向提示词（你想要的画面）	双击节点 → 在`text`框里输入中文描述，如“一只橘猫坐在窗台上，阳光洒在毛发上，写实风格，高清细节”
`CLIP Text Encode (Negative Prompt)`	左侧偏下	输入反向提示词（你不想要的东西）	双击 → 输入“模糊、畸变、多手指、文字、水印、低质量”（镜像已预填，可直接用）
`KSampler`	中部偏右	控制出图质量与速度	保持默认值即可：`steps=20`, `cfg=7`, `sampler=euler`, `scheduler=normal`
`Save Image`	右下角	保存生成的图片	不用改！它已自动连接输出，生成后会存到 `/root/ComfyUI/output/`

重要提醒：Qwen-Image对中文提示词支持极好，直接写中文，不用翻译成英文。比如写“水墨山水画”比写“ink painting landscape”效果更稳。

3.2 实操：生成一张高清橘猫图

点击顶部菜单栏的 Queue → Queue Prompt（或直接按 Ctrl+Enter）
等待右下角状态栏显示 Running... → Done（通常需45–90秒，4090D单卡）
刷新 /root/ComfyUI/output/ 目录（或点击左侧Manager→Browse→output），找到最新生成的PNG文件

双击 CLIP Text Encode (Negative Prompt) 节点，确认内容为（或补充）：

模糊、畸变、多肢体、多余爪子、文字、logo、水印、低分辨率、JPEG伪影、3D渲染感

双击 CLIP Text Encode (Prompt) 节点，在文本框中输入：

一只胖橘猫慵懒地趴在老式木窗台上，窗外是春日樱花，阳光透过玻璃在猫毛上形成光斑，毛发根根分明，胶片质感，8k高清

你刚刚完成了一次完整的Qwen-Image文生图流程。没有报错、没有黑图、没有反复调试——这就是预置镜像的价值。

4. 进阶控图：用ControlNet让画面听你指挥

纯文生图很酷，但有时你想“指定猫坐的位置”“让窗台角度更斜一点”“保留手绘草图的线条感”——这时候就得请出ControlNet。镜像已集成三种主流方案，我们只讲最易上手、效果最稳、适配性最强的一种。

4.1 推荐方案：InstantX Qwen-Image-ControlNet-Union

为什么选它？

单一模型文件（qwen_image_controlnet_union.safetensors），装一次就搞定全部控制类型
预处理器集成在Aux节点中，点选即用，不用手动找canny/depth模型
官方工作流已优化，节点少、逻辑清、容错高
❌ 不推荐DiffSynth的Model Patch方案（需手动加载多个patch，新手易配错路径）

4.2 三步启用ControlNet控图

以“用线稿控制橘猫姿势”为例：

加载工作流：在左侧工作流面板中，双击打开 Qwen-Image-ControlNet-Union.json
上传参考图：
- 点击画布中 Load Image 节点 → Choose File → 上传一张手绘草图（或用在线工具生成Canny图）
- 或直接使用内置预处理器：找到 Preprocessor 节点 → 点击下拉菜单 → 选 canny → 再点 Run Preprocessor（自动生成边缘图）
选择控制类型 & 出图：
- 找到 ControlNetApplyAdvanced 节点 → 点击 control_net_name 下拉框 → 选 qwen_image_controlnet_union.safetensors
- 在 control_mode 中选 balanced（平衡模式，兼顾构图与细节）
- 点击 Queue Prompt，等待出图

🖼 效果对比小实验：用同样提示词“橘猫坐窗台”，纯文生图可能猫头偏大或窗台比例失真；加入Canny线稿后，猫的轮廓、窗台边缘、光影走向会严格贴合你的草图——这才是真正“可控”的AI绘画。

5. 常见问题与避坑指南（小白必读）

这些坑，我全替你踩过了。照着做，省下至少两小时debug时间。

5.1 出图失败？先看这三点

现象	原因	解决方法
点击`Queue Prompt`后无反应，状态栏一直显示`Queued`	ComfyUI服务未完全启动或端口冲突	重新运行 `/root/1键启动.sh`，确认终端末尾出现 `Starting server` 字样
生成图是纯黑/纯灰/严重色偏	图像尺寸过大（>1024×1024）导致显存溢出	在工作流中找到 `Scale Image` 节点 → 将 `width` 和 `height` 改为 `896`（Qwen-Image最佳分辨率）
提示词写了中文但生成图完全不相关	使用了旧版ComfyUI内核（<2025.08.20）	进入 `/root/ComfyUI` 目录 → 运行 `git pull && git checkout main && python main.py --skip-prompt` 更新

5.2 怎么让图更精细？三个实用技巧

技巧1：微调CFG值
KSampler 节点中的 cfg（Classifier-Free Guidance）控制提示词遵循强度。默认7适合通用场景；想更贴合描述，可调至9–10；想保留更多创意发散，可降至5–6。
技巧2：加“高清修复”节点
镜像已内置 Ultimate SD Upscale 节点。将 Save Image 的输入端，改为接 Ultimate SD Upscale 的输出 → 设置 upscale_by=1.5 → 再出图，细节锐度提升明显。
技巧3：用负向提示词“压住”常见缺陷
Qwen-Image偶有生成多余肢体或结构错乱，可在反向提示词末尾追加：
extra limbs, disfigured hands, floating objects, broken anatomy, extra fingers

5.3 模型与工作流存放位置（方便你后续扩展）

所有资源均按标准ComfyUI结构组织，路径清晰可查：

类型	存放路径	说明
Qwen-Image主模型	`/root/ComfyUI/models/checkpoints/`	文件名含 `qwen_image_2512`
ControlNet模型	`/root/ComfyUI/models/controlnet/`	InstantX方案在此，DiffSynth方案在 `model_patches/` 和 `loras/`
内置工作流	`/root/ComfyUI/custom_nodes/Qwen-Image-Workflows/`	所有`.json`文件，可直接复制到其他ComfyUI环境
生成图保存位置	`/root/ComfyUI/output/`	每次生成自动按日期建子文件夹

进阶提示：想换其他风格？把工作流中 CheckpointLoaderSimple 节点的模型名，换成 /root/ComfyUI/models/checkpoints/ 下其他.safetensors文件名即可，无需重启服务。

6. 总结：你已经掌握了Qwen-Image工作流的核心能力

回顾一下，今天我们完成了：

部署零门槛：一行命令启动，4090D单卡即跑
界面不迷路：认准“工作流”按钮，三类预置流程各司其职
出图三分钟：中文提示词直输，反向提示词预设，KSampler参数不动也能出好图
控图有抓手：InstantX ControlNet Union方案，点选即用，线稿/深度/姿态全支持
避坑有清单：黑图、卡队列、色偏等问题，对应解法已验证有效

这不是终点，而是你AI绘画工作流的起点。接下来你可以：
→ 把Qwen-Image-ControlNet-Union.json复制到自己电脑的ComfyUI里，离线使用；
→ 用/root/ComfyUI/custom_nodes/Qwen-Image-Workflows/里的工作流为模板，定制电商海报、插画分镜、设计草图；
→ 结合镜像中已安装的Impact Pack节点，实现自动人脸检测+局部重绘；
→ 甚至把Qwen-Image接入你的企业知识库，生成符合品牌调性的营销图。

技术不难，难的是有人帮你把路铺平。现在，路已通，图已出，剩下的，就是你拿起提示词，开始创作。

获取更多AI镜像

想探索更多AI镜像和应用场景？访问 ZEEKLOG星图镜像广场，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

小白保姆级教程：用Qwen-Image-2512搭建AI绘画工作流

优质文章学习记录