第五节.Stable Diffusion大模型

优质文章学习记录

05 Apr 2026 — 8 min read

🍉大模型（Stable Diffusion 模型）

大模型，也叫 Stable Diffusion 模型，是 Stable Diffusion 绘图的核心基础，所有生成效果都依赖它。

常见版本

大模型已迭代出多个版本，常见的有：

Stable Diffusion 1.4（SD1.4）
Stable Diffusion 1.5（SD1.5）
Stable Diffusion 2.0（SD2.0）
Stable Diffusion 2.1（SD2.1）
Stable Diffusion XL（SDXL）
Playground、Stable Cascade 等

对初学者来说，重点记住两个主流版本：

SD1.5：最经典、生态最成熟，适合大多数场景
SDXL：新一代大模型，画质更高、细节更强

其他版本可以后续慢慢了解。

重要注意事项

SD1.5 和 SDXL 不通用：

SD1.5 必须搭配 SD1.5 专用 的 ControlNet 等模型
SDXL 必须搭配 SDXL 专用 的 ControlNet 等模型用错版本会直接报错，后面会结合案例详细说明。

🍉为什么要切换不同的大模型？

要理解为什么要切换大模型，核心是搞清楚 SD1.5 和 SDXL 这两代主力模型的区别：

1. 理论层面：SDXL 更 “强”

SDXL（新版本）：训练用的是 1024×1024 分辨率图像
- 理论上出图效果更好
- 能理解更多词汇
- 画面更精致、细节更丰富
SD1.5（老版本）：训练用的是 512×512 分辨率图像
- 基础能力不如 SDXL

2. 现实层面：SD1.5 更 “好用”

SD1.5
- 发布早，生态极其成熟
- 有海量微调模型、LoRA、ControlNet 等配套资源
- 出图效果已经很好，商用场景大多够用
- 对显卡要求低，生成速度快
SDXL
- 发布晚，生态还在追赶
- 模型体积大，对显卡要求高
- 微调难度大，间接拖慢生态发展
- 出图速度比 SD1.5 慢好几倍
- 这些限制导致普及速度较慢

简单总结：

追求画质、细节、表现力 → 优先用 SDXL
追求速度、兼容性、生态资源 → 优先用 SD1.5

2026.1现状：SDXL 生态变好，但 SD1.5 仍主流

到 2026 年 1 月，SDXL 的生态已经比刚发布时完善很多，但 SD1.5 依然是很多人的首选。这一点很重要，因为后面用别人的 ComfyUI 工作流时，必须先看作者用的是哪个版本的大模型，再做对应调整，否则容易报错。

加速模型：LCM / Turbo / Lightning

除了官方版本，你还会遇到带 LCM、Turbo、Lightning 等后缀的模型，它们都属于加速模型。

背景：SDXL 对电脑性能要求高，生成速度慢，所以官方和第三方都在做加速方案。
代价：加速通常会牺牲一点画质（优秀的加速模型，画质损失很小）。
用途：适合需要快速出图、预览效果的场景。

刚才花了一点时间，了解两大版本的差别，那么为什么每个版本下，会有那么多的第三方模型呢？

主要是为了增强某些方面的特殊优化。

优化之后，有些模型会更适合画写实类的画面，有些是二次元，还有一些模型会很适合画幻想元素等等。这个就好比，第三节提到的“雕刻师”都是转职过的，技能上会有所偏向，平时大家使用的，也大多是这些微调的大模型，效果会更好。

🍉模型下载网站：

LibLib（哩布哩布）

LibLib 是国内的大模型分享平台，无需科学上网即可访问。

经过一年多发展，已沉淀大量优质模型，包含不少原创作者的作品；
同时也搬运了许多国外优秀模型，下载方便；
虽有部分模型不开放下载，但绝大多数可免费获取。

官方地址：https://www.liblib.art/

Civitai（C 站）

Civitai 是业内老牌的模型网站，也被称作 C 站。

特点：模型全、更新快，配有缩略图，方便筛选；
限制：需要科学上网 (魔法)才能访问；
官方地址：https://civitai.com/

Hugging Face（抱脸）

Hugging Face 也被称作 “抱脸”，是一个可以下载插件、模型和代码的平台。

特点：更偏向开发者，而非设计师，查找资源的操作门槛相对较高；
访问限制：早期无需科学上网，现在需要科学上网才能正常访问；
官方地址：https://huggingface.co/

🍉模型推荐

面对众多模型，如何挑选效果好的？

其实没有绝对标准，核心是按任务和目标选择：

做漫画 → 选二次元风格大模型
做摄影 → 选写实类大模型

这也是 AI 绘画需要大容量硬盘的原因 —— 很多人会下载几十 G 甚至上百 G 的模型，来覆盖不同场景。

当然，也有一些公认优秀的模型，下面做简单推荐，大家可以先下载，后续使用时就不用临时等待下载了。

这里我将一些常用的模型存到了网盘里，大家可以去一键下载。
链接: https://pan.baidu.com/s/1zUVEfCKQmvYUx7JAN_1rvw 提取码: g2wp

SD1.5

写实类模型推荐

majicMIX realistic（麦橘写实）

这是一款非常优秀的真人写实模型，深受摄影师群体喜爱；
生成美女等写实人像效果稳定、靠谱；
下载地址：majicMIX realistic 麦橘写实

ChilloutMix

一款老牌写实真人模型，在早期非常流行；
虽然现在看技术上稍显落后，但日常使用依然可行；
下载地址：ChilloutMix

Realistic Vision

一款通用型写实大模型，适用场景广、通用性强；
缺点：生成亚洲面孔时，效果不如 majicMIX realistic、ChilloutMix 出色；
优点：在其他写实场景（如风景、静物、欧美人像等）中表现实用；
下载地址：Realistic Vision V6.0

2.5D 模型

ReVAnimated

实用性非常高，已默认打包在提供的 ComfyUI 中；
若不慎删除，可在相关网站或网盘中重新下载；
下载地址：ReVAnimated

动漫模型

Counterfeit-V2.5

经典动漫风格大模型，适合二次元插画、角色生成；
下载地址：Counterfeit-V2.5

SDXL 写实类模型推荐

XXMix_9realisticSDXL

专门针对 SDXL 版本 的写实模型；
解决了默认 SDXL 模型生成亚洲面孔效果不佳的问题，适合生成亚洲人像；
下载地址：XXMix_9realisticSDXL

realisticStockPhoto_v20

一款通用性很强的 SDXL 写实类模型；
下载地址：realisticStockPhoto_v20

其他模型

Juggernaut XL

一款通用性较强的模型，在数字艺术类作品的生成上表现出色；
下载地址：Juggernaut XL

🍉模型下载后，如何安装？

在 ComfyUI 中，大模型无需安装，只需放到指定文件夹即可。

下载的 Stable Diffusion 大模型，放在 models 下的 checkpoints 文件夹中；
可以在 checkpoints 里建二级文件夹分类存放，也可以直接放进去，ComfyUI 都能识别。

下一节，我们就基于一个实际案例，来讲解如何通过大模型来生成一张不错的图片，大家不见不散。

【保姆级教程】无成本零门槛安装配置OpenClaw龙虾AI全能助手

哈喽大家好！最近爆火的 OpenClaw（龙虾AI）全能助手大家体验了吗？它不仅能帮你自动整理邮件、查询天气，还能全自动写小红书笔记并发布，简直是打工人和自媒体人的摸鱼神器！很多小伙伴想玩但又怕配置太复杂、花销太大。今天给大家带来一篇零门槛、保姆级的安装配置教程！教你如何低成本获取云服务器，轻松实现 AI 大模型自由。全程图文指引，小白也能轻松搞定，赶紧跟着操作起来吧！一、获取云服务器想要畅玩 OpenClaw，首先我们需要一个服务器。这次教大家如何获取腾讯云轻量服务器来进行配置。 ⏰ 活动时间：2026年1月21日 - 3月31日腾讯推出了登录 CodeBuddy 送 2C2G4M 轻量服务器的限时活动：登录先送1个月，活跃7天再送2个月。 👉 【官方地址】：https://www.codebuddy.cn/promotion/?ref=ie2rwhd1loq 根据页面提示安装好软件并登录账号后，直接选择一个月的轻量应用服务器即可。之后只要累计活跃7天就能续费两个月（每天和 AI

收藏！只为就业：纯LLM、多模态大模型、AIGC该选哪条路？

这绝对是2025年计算机应届生及算法方向求职者最焦虑的问题，没有之一。过去几年，我从一线技术面试官做到团队负责人，面过的候选人从海外大厂博士到985硕士，累计不下八百人。聊得多了，也摸清了行业招聘的底层逻辑，今天就抛开虚言，从实战角度给大家盘清这三条赛道的利弊。我不跟大家扯虚无的行业报告、千亿级市场规模这些空话——这些数据对普通人找工作毫无意义。核心只从「看简历、面候选人、拍板发offer」的一线视角，帮你判断哪条路更适合长期就业、薪资更高、更难被替代。先定时间坐标：2026年1月。大模型领域技术迭代太快，去年的最优解今年可能就成了内卷重灾区，这个时间点的行业现状，对求职决策至关重要。先给结论，不绕弯子：优先all in多模态大模型如果你的目标是拿下高质量算法岗，追求长期职业价值、低替代风险和高薪资天花板，别犹豫，直接深耕多模态领域。至于为什么这个方向是最优解，我把逻辑拆透，大家听完自己判断。先看清三条赛道的真实现状 1. 纯语言大模型（LLM）：基建化定型，算法岗内卷加剧 2025年的纯LLM领域，核心特征就四个字：基建化、工程化。现在想从零训练一个

从思考到实现：在 VS Code 中集成 MiniMax M2.1，解锁 AI 编程新范式

在 AI 辅助编程（AI Coding）百家争鸣的今天，开发者们一直在寻找那个既能理解复杂逻辑、又能精准产出代码的“神队友”。最近，MiniMax M2.1 凭借其独特的 Interleaved Thinking（交错思考）机制，在编程圈引起了广泛关注。为什么选择 MiniMax 进行编程？ 1. 逻辑严密的“交错思考”：不同于普通模型直接输出代码，M2.1 会先在 <think> 标签内进行深度推理，分析架构后再下笔，极大地减少了逻辑断层。 2. 超大上下文支持：在处理大型项目或重构复杂函数时，M2.1 能够精准捕捉全局上下文信息。 3. 极速中文理解：作为国产大模型的佼佼者，它在中文注释理解和响应速度上有着天然优势，拒绝“小作文”式的废话。选购指南：主流

【AI】高效交互的艺术：AI提示工程与大模型对话指南

🔥小龙报：个人主页 🎬作者简介：C++研发，嵌入式，机器人等方向学习者 ❄️个人专栏：《AI》 ✨ 永远相信美好的事情即将发生文章目录 * 前言 * 一、ChatatGPT介绍 * 二、什么是提示工程？ * 三、大语言模型的底层原理 * 四、AI的相关术语 * 五、如何与AI（以ChatatGPT为例）更好交流 * 5.1 使用AI的核心 * 5.2 提示组成结构 * 5.3 创建好的提示的策略 * 5.4 提示的类别 * 5.5 创建在和AI提示的进阶框架 * 5.6如何减少AI回答的空洞无味感 * 5.7 如何提高AI回答的可读性 * 六、使用AI的更多技巧 * 6.1 高效提示的原则 * 6.