ComfyUI节点式工作流实战：从零搭建你的第一个AI绘画流程（附SDXL模型配置）

优质文章学习记录

09 Apr 2026 — 4 min read

ComfyUI节点式工作流实战：从零搭建你的第一个AI绘画流程（附SDXL模型配置）

如果你已经玩过一阵子Stable Diffusion WebUI，对文生图、图生图的基本操作了然于胸，甚至尝试过LoRA、ControlNet等进阶功能，但总觉得创作过程像在操作一个“黑箱”——参数调来调去，结果却总有些不可控的随机性。那么，是时候推开ComfyUI这扇门了。

ComfyUI带来的，是一种截然不同的创作体验。它把AI绘画的生成过程，从一个个模糊的滑块和按钮，拆解成清晰可见的“节点”与“连线”。在这里，你不是在向一个复杂的软件输入指令，而是在亲手搭建一条图像生产的“流水线”。从加载模型、编码提示词，到采样降噪、解码输出，每一步都直观地呈现在你面前，任由你调整、优化甚至创造全新的连接方式。这种掌控感，正是进阶创作者所追求的。

对于SDXL这类更强大但也更复杂的模型，ComfyUI的节点式架构优势尤为明显。它让你能精细地控制Base和Refiner模型的协作流程，灵活调整不同阶段的提示词权重，甚至插入自定义的图像处理步骤。告别WebUI中那些笼统的预设，你将获得对图像生成每一个细节的指挥权。

1. 核心理念：从“黑箱操作”到“可视化流水线”

在深入节点之前，我们需要先扭转一个思维定式。传统的WebUI界面，本质上是将一套固定的、预设好的工作流封装起来，提供给你一系列高级参数控件。你调整“采样步数”，但看不到潜空间（Latent Space）是如何一步步被去噪的；你使用“高分辨率修复”，却不清楚图像是如何被放大、重绘的。

ComfyUI则反其道而行之，它将这些预设全部打散，还原为最基本的构建块——节点。每个节点都只负责一个非常具体、单一的任务，例如：

加载模型 (Checkpoint Loader)
将文字转换为模型能理解的向量 (CLIP Text Encode)
在潜空间中进行噪声采样与去噪 (KSampler)
将潜空间数据解码为最终像素图像 (VAE Decode)

你的工作，就是用“线”将这些节点按照逻辑顺序连接起来，构建一条完整的图像生成流水线。这听起来复杂，但一旦理解，其灵活性和透明度是无可比拟的。你可以随时“暂停”流水线的任何一个环节，检查中间产出的数据（比如潜空间特征），也可以轻松地替换某个环节（比如换一个VAE模型），或者插入新的处理节点（比如在生成中途进行色彩校正）。

这种工作方式，特别适合解决SDXL模型配置中的典型问题。例如，SDXL的Base和Refiner两阶段模型如何协同？在ComfyUI中，你可以用两个Checkpoint Loader分别加载它们，然后用一个KSampler先跑Base模型若干步，再将中间结果传递给另一个专门为Refiner模型配置的KSampler继续细化。整个过程清晰明了，参数独立可控。

2. 环境准备与核心节点初识

假设你已经通过秋叶整合包或官方Git仓库成功部署了ComfyUI，打开那个略显“极客”的界面，我们首先来认识几个最核心的节点。别被满屏的空白吓到，我们从一张白纸开始搭建。

右键点击画布空白处，会弹出庞大的节点选择菜单。最常用的几个节点可以通过搜索快速找到：

Checkpoint Loader (模型加载器)：一切创作的起点。它负责将你下载的.safetensors或.ckpt模型文件加载到显存中。一个关键细节是，它有三个输出端口：MODEL（去噪U-Net）、CLIP（文本编码器）、VAE（图像编解码器）。对于SDXL，你通常需要加载Base和Refiner两个模型。
CLIP Text Encode (CLIP文本编码器)：将你输入的自然语言提示词（Prompt）和负面提示词（Negative Prompt）转化为AI模型能够处理的数学向量。它需要一个CLIP输入（来自模型加载器），输出CONDITIONING信号，用于指导图像生成的方向。
Empty La

Ubuntu24.04/Open WebUI+Ollama 本地部署

官方文档 🏡 首页 | Open WebUI 文档本地部署 * 连接本地 Ollama 服务： * 使用服务器测试了下：初次对话耗时较长，后续效率还不错；目前无法联网（废话）对话中即可选择模型：不过我的硬件不支持，所以就先不做测试了修改 Ollama 配置：宿主机 Ollama 服务地址：http://host.docker.internal:11434（我猜你不想一个一个字母敲，就直接大胆使用“cv大法”吧）查看本地模型 ID：管理员面板/设置/外部连接：运行页面：使用 Docker Compose 封装运行：其中镜像拉取速度比较慢 docker compose up -d 修改配置文件：由于本地已经运行了 Ollama

Web文件下载 : 从PDF预览Bug到Hook架构演进

在 Web 开发中，下载功能看似简单，却隐藏着浏览器行为差异与跨域安全限制的陷阱。今天，我原本只想做一个导出不同文件格式的功能，却遇到了一个bug：生成Word或MD文件时，Chrome浏览器都会正常弹出下载框，但导出PDF文件时却不行——PDF会直接在当前页面预览，看起来明明是要下载PDF，结果却直接进入了预览模式，而且我原本打开的页面还被这个预览页面覆盖了。一、为什么 PDF 会“不请自来”地预览？ 1.浏览器的 MIME 类型策略浏览器如何处理一个 URL，取决于服务器返回的 MIME 类型（Multipurpose Internet Mail Extensions）。 * Word/MD 文件：由于 Chrome 等浏览器没有内置渲染引擎，它会识别为“不可直接读取的内容”，从而触发下载。 * PDF 文件：现代浏览器均内置了功能强大的 PDF 渲染器。当它接收到 application/

【Rust编程】Actix-web 开发环境搭建完整教程

Actix-web 开发环境搭建完整教程 * Actix-web 开发环境搭建完整教程 * 一、前置准备：安装 Rust 工具链 * 1. 安装 Rustup（Rust 版本管理器） * 2. 验证安装 * 3. 配置国内镜像源（加速依赖下载） * 4. 安装开发工具 * 二、创建 Actix-web 项目 * 1. 创建项目骨架 * 2. 添加 Actix-web 依赖 * 三、编写第一个 Actix-web 应用 * 1. 基础代码（`src/main.rs`） * 2. 配置环境变量（可选） * 四、运行与测试服务 * 1. 启动开发服务器 * 2. 测试端点 * 3.

Day 93：【99天精通Python】终极项目 - AI 聊天机器人 (下) - 前端界面与部署

Day 93：【99天精通Python】终极项目 - AI 聊天机器人 (下) - 前端界面与部署前言欢迎来到第93天！在过去的两个章节中，我们已经搭建了一个功能强大的后端： * 支持流式对话和多轮记忆。 * 支持上传 PDF 作为知识库进行 RAG 问答。今天，我们要为这个强大的"大脑"配上一副漂亮的"面孔"。我们将使用原生 HTML, CSS, JavaScript 编写一个聊天界面，并学习如何将整个项目部署上线。本节内容： * 聊天界面 HTML 结构 * CSS 美化 * JavaScript 核心逻辑 (EventSource) * 文件上传交互 * 项目最终部署一、HTML 骨架 (templates/