ComfyUI v0.18.0 发布：显存与内存极限优化、VAE架构全面进化、API节点与前端生态深度升级

优质文章学习记录

05 Apr 2026 — 6 min read

一、版本概览：一次“以稳定性与性能为核心”的里程碑更新

ComfyUI v0.18.0 于 2026 年 3 月 21 日 正式发布，这是一个不可变版本（仅允许修改发布标题与说明），也是目前为止变更密度最高、底层改动最深的一次版本更新之一。

本次更新共计：

53 次提交
79 个文件变更
22 位贡献者
覆盖 核心推理、VAE、显存管理、训练、API 节点、前端、工作流模板、CLI 参数、跨平台支持

整体方向可以总结为四个关键词：

更省显存 · 更稳内存 · 更强扩展 · 更一致的数据类型体系

二、显存与内存管理：v0.18.0 的绝对核心

1. VAE 内存优化达到新高度（LTX / WAN / 视频 VAE 全覆盖）

这是本次更新中最重要、也是改动最多的部分。

主要变化包括：

LTX VAE 解码显存多轮削减
- 解码阶段峰值内存显著下降
- 中间结果在 intermediate_device 上累积
- 解码流程改为更细粒度的 chunk 处理
LTX VAE 编码器新增分块机制
- 编码阶段支持 chunked encoder
- CPU IO 分块加载，显著降低显存压力
WAN VAE 显存优化
- 避免大分辨率下的 OOM
- Tiler 场景更安全
视频 VAE 修复显存泄漏
- 修复 tiler fallback 场景下的 VRAM leak
像素空间 VAE 潜在问题修复
VAE 输出支持原地处理
- 有效降低峰值 RAM 消耗
tiled decode 峰值内存进一步降低

✅ 结果：
即使是中低显存显卡，也能稳定运行高分辨率图像、复杂视频工作流。

2. 中间数据 dtype / device 体系全面统一

ComfyUI 在 v0.18.0 中系统性推进了一个重要理念：

中间值必须严格跟随 intermediate dtype 与 device

涉及节点与模块：

EmptyLatentImage
EmptyImage
多个推理中间变量
VAE 中间解码与编码结果

新增参数：

--fp16-intermediates
- 强制中间计算使用 FP16
- 显著降低显存占用
- 针对部分文本编码模型存在兼容性问题，已明确标注并修复相关回归

同时：

修复了 FP16 intermediates 在部分文本编码器中不生效的问题
明确区分权重 dtype 与中间计算 dtype
Load Diffusion Model 节点中 weight_dtype 被标记为高级参数

3. 动态显存与内存安全机制增强

新增命令行参数：
- --enable-dynamic-vram
  - 可强制开启动态显存机制
pinned read 逻辑增加更多排除条件
- 修复极少数情况下的输出损坏问题
跳过程序退出时的模型 finalizer
- 避免退出阶段的异常与卡死
atomic 写入 userdata
- 防止程序崩溃时的数据损坏

三、推理与训练能力升级

1. 多精度与新数据格式支持

新增 MXFP8 支持
Trainer 支持：
- FP4
- FP8
- FP16
原生 dtype 支持
量化线性层自动求导函数

✅ 对训练场景的意义：

更低显存占用
更灵活的混合精度训练
更适合大模型与实验性模型

2. Attention 与平台适配优化

AMD gfx1150 启用 PyTorch Attention
针对特定模型禁用 SageAttention
- 避免推理异常
Apple Silicon 文本编码器 GPU 运行尝试后回退
- 确保稳定性优先

四、API Nodes 与模型生态升级

1. API Nodes 功能扩展

Tencent TextToModel / ImageToModel 节点修复
Nano Banana 2 新增 thought_image 支持
新增 Quiver SVG 节点
本地 API 与云端规范对齐
模型弃用标记：
- seedream-3-0-t2i
- seedance-1-0-lite

2. Context Window 与条件处理能力增强

新增 slice_cond
支持按模型调整上下文窗口条件尺寸
inline context window 导入结构优化

五、前端与工作流生态更新

1. 前端版本持续迭代

comfyui-frontend-package 升级至：
- 1.41.19
- 1.41.20
- 1.41.21
使用 no-store cache header
- 防止前端资源缓存导致的版本不一致问题

2. 工作流与 UI 体验改进

工作流模板更新至 v0.9.26
节点新增 essentials_category
- 支持 Essentials 标签页
- 新手与高频节点更易发现

六、CLI、管理器与基础设施

Manager 版本升级：
- 4.1b4
- 4.1b5
- 4.1b6
comfy-aimdo 升级：
- 0.2.11
- 0.2.12
Windows 平台 RAM 释放策略优化
- 推理速度提升
- 内存回收更及时
CI 增加校验规则
- 阻止自动生成的 AI 协作标记进入主分支

七、稳定性修复与回滚说明

本次版本也包含多个关键回滚与问题修复：

回滚外部分布式缓存 API 的相关改动
修复多次回归问题
修复初始化变量缺失
删除无效的权重初始化代码
避免子类场景下错误触发延迟初始化

这些操作的核心目标只有一个：

确保 v0.18.0 在复杂真实工作流中的长期稳定运行

八、总结：为什么 v0.18.0 是“必须升级”的版本

代码地址：github.com/Comfy-Org/ComfyUI

如果你符合以下任一情况，v0.18.0 都是强烈推荐升级的版本：

显存 8G / 12G 甚至更低
使用 LTX / WAN / 视频 VAE
需要高分辨率或大批量推理
关注推理稳定性与内存安全
使用 API Nodes 或自动化部署
进行模型训练或混合精度实验

ComfyUI v0.18.0 并不是功能堆砌型更新，而是一次深度“工程级进化”。

海光 DUC 环境（海光 DCU K100_AI）部署 ollama+deepseek

看到 ZEEKLOG 上好多的这个部署流程不是要收费就是写的不清不楚，所以决定将我的部署流程写出来，明明所有的官方文档都是免费的。 “不太懂为什么吃了别人免费的饭，现在拉出来的屎要收费！” 声明：本人不是专业运维实施人员，所有的流程都是靠试或直觉，还有一点点的知识正式开始：系统：Kylin Linux Advanced Server V10（Lance） CPU：海光 C86 7360（24 核）内存：256GB 内核：Linux-4.19.90-52.48.v2207.ky10.x86_64 显卡：海光 DCU K100_AI（Co-processor） 1. 环境部署 1.1 驱动安装光合开发者社区下载驱动通过显卡型号选择驱动驱动版本

小龙虾 OpenClaw 安装教程：从零到能干的 AI 助手

一、OpenClaw 是什么？ OpenClaw（社区俗称「小龙虾」）是一款可本地/自建的开源 AI 助手，特点是「能干活」：除对话外，支持浏览器自动化、桌面控制、向量记忆、定时任务等，并可通过 Gateway 接入微信、飞书、Telegram、Discord 等渠道。技术栈以 Node.js 为核心，适合作为「AI + 自动化 + 多端接入」的练手或生产项目。本文以学习 + AI + 前端为场景，手把手带你完成安装与第一次配置。二、安装前准备 2.1 系统与硬件 * 系统：Windows 10/11、macOS 12+（推荐 14+

测评6款热门AI原型图工具：Cursor、Figma、墨刀AI尽在其中

我们都知道，产品经理常常在各个需求中徘徊，各个会议里穿梭，真正能静下心来画原型图的时间，往往是在夜深人静的时刻。而那些号称能“解放产品经理双手”的AI原型图工具，究竟能否在真实的工作场景中发挥作用？为此，我们对当前几款热门的AI原型图工具进行了实测评估，包括：Cursor、FigmaMake、墨刀AI、FramerAI、UizardAI 和 Loveable.dev，看看哪一款工具更值得投入使用。一、6个AI原型图工具测评总览通过体验对比，我们将6款AI工具按照功能侧重点划分为三类： * 结构派（重原型结构）：墨刀AI、FramerAI，更注重页面结构和功能流程； * 界面派（重UI设计）：FigmaMake、UizardAI，侧重视觉效果和界面呈现； * 技术派（重代码实现）：Cursor、Loveable.dev，通过AI生成代码实现原型，更适合有技术背景的用户。通过对这6个AI原型图工具的测试体验，综合测评下来结论如下： 1. AI能帮助产品经理产出原型图吗？答案：是的。目前这几款AI工具都可以通过文本输入快速生成较为高保真的原型界面，基本能满足初稿需

专利相关链接（AI辅助）

上传资料：微信文件助手搜索引擎：必应，百度，谷歌镜像专利检索查询和下载网站：黑马链接，cnki，全球档案 AI辅助链接：kimi，DeepSeek，豆包，秘塔，开搜，天工AI，博查，纳米AI，元宝通用大模型：腾讯元器，阶跃AI，文心一言，阿里百炼个人知识库（智能体）链接：智谱清言，腾讯云，千问，ima知识库