2025最新如何在本地部署 Stable Diffusion3.5超详细完整教程

2025最新如何在本地部署 Stable Diffusion3.5超详细完整教程

在本地部署 Stable Diffusion 3.5:让 AI 绘图更便捷

前言

随着人工智能的快速发展,图像生成技术日益成熟,Stable Diffusion 3.5 作为一款强大的 AI 绘图工具,广泛应用于设计师、创作者等人群的视觉内容生成。它能够通过文本提示生成高质量图像,且具备较高的可控性和细腻的生成效果。

然而,默认情况下,Stable Diffusion 3.5 仅能在局域网内运行,远程操作或者出门时调整参数、查看进度会受到限制。在本文中,我们将通过本地部署的方式,帮助您克服这一限制,实现更加灵活的使用。

提示:不同型号的 Stable Diffusion 对硬件要求有所不同。以 Large Turbo 版本为例,推荐配备至少 8GB 显存以保证流畅运行。
文章目录在本地部署 Stable Diffusion 3.5:让 AI 绘图更便捷前言1. 本地部署 ComfyUI环境准备步骤 1:下载 ComfyUI步骤 2:选择合适的脚本步骤 3:启动 ComfyUI步骤 4:设置中文语言2. 下载 Stable Diffusion 3.5 模型模型选择步骤 1:下载模型文件步骤 2:下载 Clip 编码器文件步骤 3:运行 ComfyUI 服务3. 演示文生图步骤 1:加载示例工作流步骤 2:设置模型步骤 3:输入提示词并生成图像总结

1. 本地部署 ComfyUI

环境准备

  • 操作系统:Windows 11 专业版
  • 显卡要求:至少 8GB 显存

步骤 1:下载 ComfyUI

访问 ComfyUI 的官方 GitHub 页面,下载最新版的免安装版:

打开 GitHub 页面后,找到免安装版并下载解压至本地目录。

ComfyUI GitHub 下载页面

步骤 2:选择合适的脚本

在解压后的文件夹中,您会看到 run_cpurun_nvidia_gpu 两个脚本。run_cpu 是通过 CPU 解码,而 run_nvidia_gpu 则是通过 NVIDIA 显卡加速,后者运行速度更快。

选择适合您硬件的脚本,双击运行。

ComfyUI 运行脚本

步骤 3:启动 ComfyUI

运行脚本后,打开浏览器并访问 http://127.0.0.1:8188,即可进入 ComfyUI 的控制界面。

ComfyUI 页面

默认界面是英文,我们接下来设置为中文,以便更好地进行操作。

步骤 4:设置中文语言

  1. 下载中文语言包:中文插件下载链接
  2. 将解压后的文件放入 ComfyUI 根目录下的 custom_nodes 文件夹中。
中文语言包配置
  1. 回到 ComfyUI,进入设置并选择中文语言。
ComfyUI 设置中文

至此,ComfyUI 界面已经切换为中文,操作更加直观。

2. 下载 Stable Diffusion 3.5 模型

模型选择

Stable Diffusion 3.5 系列有多个版本,本教程使用的是 Stable Diffusion 3.5 Large Turbo 版本。

  • Stable Diffusion 3.5 Large:适合需要高质量图像的专业用户,建议使用 16GB 以上显存。
  • Stable Diffusion 3.5 Large Turbo:速度更快,生成过程更高效,推荐 8GB 显存。
  • Stable Diffusion 3.5 Medium:较为轻量,适合消费级硬件。

点击以下链接下载 Large Turbo 版本模型文件:

步骤 1:下载模型文件

在下载页面找到 sd3.5_large_turbo.safetensors 文件,并将其保存到 ComfyUI 的 models/checkpoint 文件夹中。

模型下载

步骤 2:下载 Clip 编码器文件

接下来,下载以下 Clip 编码器文件并将其保存至 ComfyUI 的 models/clip 文件夹中:

Clip 编码器下载

步骤 3:运行 ComfyUI 服务

回到 ComfyUI 根目录,运行一键脚本启动服务。

3. 演示文生图

步骤 1:加载示例工作流

将下载的 SD3.5L_Turbo_example_workflow.json 文件拖入 ComfyUI 界面中。

加载工作流

步骤 2:设置模型

在左侧的 Clip 设置中,选择刚刚下载的模型。

设置模型

步骤 3:输入提示词并生成图像

在中间的 CLIP 文本编码器中输入提示词,点击右侧的“添加提示词队列”按钮。

生成图像

生成图像后,您就可以看到在本地成功运行的 Stable Diffusion 3.5 模型生成的图像,操作更加便捷。

总结

恭喜您!通过本教程,您已经成功在本地部署了 Stable Diffusion 3.5 模型,并搭建了自己的 AI 绘画工作站。以下是整个部署过程的总结:

  • 第一步:搭建工作台
    • 下载并解压 ComfyUI 免安装版。
    • 启动服务,安装中文插件,完成环境配置。
  • 第二步:安装模型
    • 下载并安装 Stable Diffusion 3.5 Large Turbo 模型及所需的 Clip 编码器。
    • 将模型文件准确放入 ComfyUI 对应文件夹。
  • 第三步:启动并测试
    • 重启 ComfyUI 服务,加载示例工作流。
    • 输入提示词并生成第一张图像。

您已成功完成本地部署,并可以开始探索更多的功能和高级工作流。如果您希望将其转换为公网地址,便于远程访问,建议参考相关教程进行配置。

感谢您跟随本教程完成部署,祝您的创作之旅愉快!

Read more

AI 编程效率翻倍:Superpowers Skills 上手清单 + 完整指南

AI 编程效率翻倍:Superpowers Skills 上手清单 + 完整指南

前言 在 AI 编程普及的当下,很多开发者都会用 Claude Code、Cursor、Copilot 等 AI 助手写代码,但普遍面临一个痛点:AI 写代码 “无规划、低质量、无流程”,往往写出来的代码需要大量返工,甚至不符合工程规范,反而降低开发效率。 而 Superpowers Skills(简称 “Superpowers”),正是为解决这个问题而生 —— 它是一套系统化的 AI 编程工作流框架,把资深工程师的开发经验,固化为 20 + 个可组合的 “技能(Skill)”,强制 AI 遵循 TDD、系统化调试等最佳实践,让 AI 从 “盲目写代码” 变成 “有规划、重质量、可追溯” 的专业开发伙伴。

Python 构建AI多智能体系统:让三个 AI 协作完成复杂任务

Python 构建AI多智能体系统:让三个 AI 协作完成复杂任务

单个 AI 能做的事有限,三个 AI 分工协作能做的事远超你想象。本文用纯 Python 从零实现一个多智能体系统,完整代码可直接运行。 * 一、什么是多智能体系统(Multi-Agent System)? * 二、为什么不用现成框架? * 三、系统架构设计 * 四、代码实现 * 4.1 基础类:定义 Agent * 4.2 定义三个专业 Agent * 4.3 协调者:任务调度中心 * 4.4 主程序:启动你的 AI 团队 * 五、执行流程详解 * 六、扩展:加入工具能力 * 七、性能对比 * 八、注意事项 * 总结 一、

8倍速语音转写革命:Whisper V3 Turbo如何重塑实时交互体验

8倍速语音转写革命:Whisper V3 Turbo如何重塑实时交互体验 【免费下载链接】whisper-large-v3-turbo 项目地址: https://ai.gitcode.com/hf_mirrors/openai/whisper-large-v3-turbo 导语 OpenAI最新发布的Whisper V3 Turbo模型通过架构革新,将语音识别速度提升8倍的同时保持高精度,重新定义了实时语音转写的技术标准,为会议记录、多语言直播、智能客服等场景带来效率飞跃。 行业现状:实时交互的技术瓶颈 2024年语音识别技术正从"能听懂"向"会理解"快速进化,但实时性与准确性的平衡始终是行业痛点。据行业研究显示,传统语音识别系统平均延迟超过500ms,在直播字幕、实时会议等场景中难以满足用户需求。声网音频算法专家李嵩指出:"当前系统都是说完话后才开始理解,而人与人交流时听众在说话过程中就已开始理解",这种延迟严重影响了实时交互体验。 与此同时,多语言支持成为全球化应用的关键挑战。随着跨境会议、国际直播等场景的爆发式增长,

Stable Diffusion底模对应的VAE推荐:提升生成质量的关键技术解析

Stable Diffusion底模对应的VAE推荐:提升生成质量的关键技术解析 引言:VAE在Stable Diffusion生态系统中的核心作用 变分自编码器(VAE)是Stable Diffusion生成架构中不可或缺的组件,负责将潜在空间表示与像素空间相互转换。尽管常常被忽视,VAE的质量直接影响图像生成的细节表现、色彩准确性和整体视觉效果。本文将深入解析不同Stable Diffusion底模对应的最优VAE配置,从技术原理到实践应用全面剖析VAE的选择策略。 VAE在Stable Diffusion中的核心功能包括: * 编码过程:将输入图像压缩到潜在空间表示(latent representation) * 解码过程:将潜在表示重构为高质量图像 * 正则化作用:确保潜在空间遵循高斯分布,便于扩散过程采样 一、VAE技术原理深度解析 1.1 变分自编码器的数学基础 变分自编码器的目标是学习数据的潜在表示,其数学基础建立在变分推断之上。给定输入数据 x x x,VAE试图最大化证据下界(ELBO): log ⁡ p ( x ) ≥ E q ( z ∣