第五节.Stable Diffusion大模型

优质文章学习记录

07 Apr 2026 — 8 min read

🍉大模型（Stable Diffusion 模型）

大模型，也叫 Stable Diffusion 模型，是 Stable Diffusion 绘图的核心基础，所有生成效果都依赖它。

常见版本

大模型已迭代出多个版本，常见的有：

Stable Diffusion 1.4（SD1.4）
Stable Diffusion 1.5（SD1.5）
Stable Diffusion 2.0（SD2.0）
Stable Diffusion 2.1（SD2.1）
Stable Diffusion XL（SDXL）
Playground、Stable Cascade 等

对初学者来说，重点记住两个主流版本：

SD1.5：最经典、生态最成熟，适合大多数场景
SDXL：新一代大模型，画质更高、细节更强

其他版本可以后续慢慢了解。

重要注意事项

SD1.5 和 SDXL 不通用：

SD1.5 必须搭配 SD1.5 专用 的 ControlNet 等模型
SDXL 必须搭配 SDXL 专用 的 ControlNet 等模型用错版本会直接报错，后面会结合案例详细说明。

🍉为什么要切换不同的大模型？

要理解为什么要切换大模型，核心是搞清楚 SD1.5 和 SDXL 这两代主力模型的区别：

1. 理论层面：SDXL 更 “强”

SDXL（新版本）：训练用的是 1024×1024 分辨率图像
- 理论上出图效果更好
- 能理解更多词汇
- 画面更精致、细节更丰富
SD1.5（老版本）：训练用的是 512×512 分辨率图像
- 基础能力不如 SDXL

2. 现实层面：SD1.5 更 “好用”

SD1.5
- 发布早，生态极其成熟
- 有海量微调模型、LoRA、ControlNet 等配套资源
- 出图效果已经很好，商用场景大多够用
- 对显卡要求低，生成速度快
SDXL
- 发布晚，生态还在追赶
- 模型体积大，对显卡要求高
- 微调难度大，间接拖慢生态发展
- 出图速度比 SD1.5 慢好几倍
- 这些限制导致普及速度较慢

简单总结：

追求画质、细节、表现力 → 优先用 SDXL
追求速度、兼容性、生态资源 → 优先用 SD1.5

2026.1现状：SDXL 生态变好，但 SD1.5 仍主流

到 2026 年 1 月，SDXL 的生态已经比刚发布时完善很多，但 SD1.5 依然是很多人的首选。这一点很重要，因为后面用别人的 ComfyUI 工作流时，必须先看作者用的是哪个版本的大模型，再做对应调整，否则容易报错。

加速模型：LCM / Turbo / Lightning

除了官方版本，你还会遇到带 LCM、Turbo、Lightning 等后缀的模型，它们都属于加速模型。

背景：SDXL 对电脑性能要求高，生成速度慢，所以官方和第三方都在做加速方案。
代价：加速通常会牺牲一点画质（优秀的加速模型，画质损失很小）。
用途：适合需要快速出图、预览效果的场景。

刚才花了一点时间，了解两大版本的差别，那么为什么每个版本下，会有那么多的第三方模型呢？

主要是为了增强某些方面的特殊优化。

优化之后，有些模型会更适合画写实类的画面，有些是二次元，还有一些模型会很适合画幻想元素等等。这个就好比，第三节提到的“雕刻师”都是转职过的，技能上会有所偏向，平时大家使用的，也大多是这些微调的大模型，效果会更好。

🍉模型下载网站：

LibLib（哩布哩布）

LibLib 是国内的大模型分享平台，无需科学上网即可访问。

经过一年多发展，已沉淀大量优质模型，包含不少原创作者的作品；
同时也搬运了许多国外优秀模型，下载方便；
虽有部分模型不开放下载，但绝大多数可免费获取。

官方地址：https://www.liblib.art/

Civitai（C 站）

Civitai 是业内老牌的模型网站，也被称作 C 站。

特点：模型全、更新快，配有缩略图，方便筛选；
限制：需要科学上网 (魔法)才能访问；
官方地址：https://civitai.com/

Hugging Face（抱脸）

Hugging Face 也被称作 “抱脸”，是一个可以下载插件、模型和代码的平台。

特点：更偏向开发者，而非设计师，查找资源的操作门槛相对较高；
访问限制：早期无需科学上网，现在需要科学上网才能正常访问；
官方地址：https://huggingface.co/

🍉模型推荐

面对众多模型，如何挑选效果好的？

其实没有绝对标准，核心是按任务和目标选择：

做漫画 → 选二次元风格大模型
做摄影 → 选写实类大模型

这也是 AI 绘画需要大容量硬盘的原因 —— 很多人会下载几十 G 甚至上百 G 的模型，来覆盖不同场景。

当然，也有一些公认优秀的模型，下面做简单推荐，大家可以先下载，后续使用时就不用临时等待下载了。

这里我将一些常用的模型存到了网盘里，大家可以去一键下载。
链接: https://pan.baidu.com/s/1zUVEfCKQmvYUx7JAN_1rvw 提取码: g2wp

SD1.5

写实类模型推荐

majicMIX realistic（麦橘写实）

这是一款非常优秀的真人写实模型，深受摄影师群体喜爱；
生成美女等写实人像效果稳定、靠谱；
下载地址：majicMIX realistic 麦橘写实

ChilloutMix

一款老牌写实真人模型，在早期非常流行；
虽然现在看技术上稍显落后，但日常使用依然可行；
下载地址：ChilloutMix

Realistic Vision

一款通用型写实大模型，适用场景广、通用性强；
缺点：生成亚洲面孔时，效果不如 majicMIX realistic、ChilloutMix 出色；
优点：在其他写实场景（如风景、静物、欧美人像等）中表现实用；
下载地址：Realistic Vision V6.0

2.5D 模型

ReVAnimated

实用性非常高，已默认打包在提供的 ComfyUI 中；
若不慎删除，可在相关网站或网盘中重新下载；
下载地址：ReVAnimated

动漫模型

Counterfeit-V2.5

经典动漫风格大模型，适合二次元插画、角色生成；
下载地址：Counterfeit-V2.5

SDXL 写实类模型推荐

XXMix_9realisticSDXL

专门针对 SDXL 版本 的写实模型；
解决了默认 SDXL 模型生成亚洲面孔效果不佳的问题，适合生成亚洲人像；
下载地址：XXMix_9realisticSDXL

realisticStockPhoto_v20

一款通用性很强的 SDXL 写实类模型；
下载地址：realisticStockPhoto_v20

其他模型

Juggernaut XL

一款通用性较强的模型，在数字艺术类作品的生成上表现出色；
下载地址：Juggernaut XL

🍉模型下载后，如何安装？

在 ComfyUI 中，大模型无需安装，只需放到指定文件夹即可。

下载的 Stable Diffusion 大模型，放在 models 下的 checkpoints 文件夹中；
可以在 checkpoints 里建二级文件夹分类存放，也可以直接放进去，ComfyUI 都能识别。

下一节，我们就基于一个实际案例，来讲解如何通过大模型来生成一张不错的图片，大家不见不散。

JSBSim 1.0.0无人机仿真系统完整实战手册

本文还有配套的精品资源，点击获取简介：JSBSim 1.0.0是一款基于Java的开源无人机飞行模拟框架，用于高精度仿真无人机的动力学行为和飞行控制。新版在动力系统、环境建模、控制系统、接口设计、性能优化等方面均有显著提升，支持多种无人机类型和飞行场景模拟。适用于无人机研发、控制算法测试、故障模拟与自主导航开发，是无人机研究者和开发者的重要工具。本资料基于完整1.0.0版本内容，适合无人机技术学习与项目实践使用。 1. JSBSim无人机仿真框架概述 JSBSim是一个基于C++开发的开源飞行器动力学仿真引擎，具备高精度的飞行物理建模能力，广泛应用于无人机系统的设计、测试与仿真验证。其模块化架构支持灵活配置，涵盖动力系统、空气动力学、环境模拟与飞行控制等多个核心模块。其核心优势在于： - 开源可扩展：用户可通过XML配置文件定义飞行器模型，并支持自定义模块的集成。 - 跨平台兼容性：支持Linux、Windows及macOS系统，便于多平台仿真部署。 - 高精度仿真：采用实时物理引擎，结合大气模型与传感器建模，提供接近真实飞行的模拟环境。本章将为读者梳理JSB

仿生新势力：Openclaw开源仿生爪，如何革新机器人抓取？

仿生新势力：Openclaw开源仿生爪，如何革新机器人抓取？引言在仓储、农业乃至家庭服务中，机器人如何像猫一样灵巧、自适应地抓取千变万化的物体？这曾是行业难题。如今，一个名为 Openclaw 的开源仿生机械爪项目，正以其独特的被动适应性设计和亲民的成本，在机器人末端执行器领域掀起波澜。本文将深入解析Openclaw的仿生奥秘、实现原理、应用场景及未来布局，带你全面了解这款来自开源社区的“仿生新势力”。一、核心揭秘：从猫爪到机械爪的实现原理本节将拆解Openclaw如何将生物灵感转化为工程现实。 1. 仿生学设计理念 Openclaw的核心灵感源于猫科动物爪部。当猫抓取物体时，其爪趾会自然地包裹贴合物体表面，这种能力主要依赖于其肌腱和骨骼的被动结构，而非大脑的实时精密控制。Openclaw借鉴了这一思想，核心是被动适应性机制。它无需依赖复杂的传感器反馈和实时力控算法，仅凭精巧的机械结构即可根据物体形状自动调整接触点和抓取力，从而极大地简化了控制系统。配图建议：猫爪与Openclaw的对比图，或Openclaw抓取不同形状物体的动态示意图。 2. 欠驱动与

【选型】地瓜机器人RDK系列选型指南：X3 vs X5 vs S100 vs S100P（含资源对比图）

在机器人开发领域，地瓜机器人（D-Robotics）凭借其“RDK（Robot Developer Kit）”系列开发套件，已成为众多开发者和创业团队的首选平台。从轻量级边缘计算到高性能具身智能，地瓜机器人已构建了覆盖多场景的完整产品线，致力于为开发者提供高性价比、高集成度、高扩展性的解决方案。其核心芯片“旭日®”系列持续迭代，推动AI与机器人深度融合，助力实现从感知到控制的全链路自主化。本文将深入对比当前主流的四款RDK开发套件：RDK X3、RDK X5、RDK S100、RDK S100P，并提供详细的资源对比图与应用场景分析，帮助你快速完成技术选型，降低开发门槛，提升项目落地效率。一、产品定位概览在深入参数前，先明确每款产品的核心定位，以便根据项目阶段、预算和性能需求做出合理选择。 ● RDK X3：轻量级边缘AI计算模组，适合入门级机器人、智能摄像头、无人机等低功耗、小体积场景。是初学者和教育项目的理想起点，具备基础AI推理能力，可快速搭建视觉识别系统。 ● RDK

FPGA实现多协议编码器接口：BISS-C、SSI与多摩川的集成设计

1. 工业编码器接口的统一挑战与FPGA方案在工业自动化领域，高精度运动控制系统的核心挑战之一是如何高效集成多种编码器协议。不同厂商的编码器采用不同的通信协议，比如BISS-C、SSI和多摩川协议，每种协议都有自己的时序要求、数据格式和校验机制。传统方案往往需要为每种协议设计独立的硬件接口，这不仅增加了系统复杂度，还提高了成本和维护难度。我在实际项目中多次遇到这样的需求：客户希望用一个控制板卡同时支持多种编码器，但又不愿意增加额外的硬件成本。这时候FPGA的优势就凸显出来了。FPGA的可编程特性允许我们在同一块硬件上实现多种协议接口，通过逻辑资源复用和状态机控制，真正做到"硬件统一、软件定义"。我记得有一次为数控机床项目设计编码器接口时，就遇到了同时连接BISS-C和多摩川编码器的需求。最初尝试用MCU+多路转换芯片的方案，但实时性总是达不到要求。后来转向FPGA方案，不仅实现了协议兼容，还将响应时间从原来的毫秒级降低到了微秒级。这种性能提升对于高精度运动控制来说是至关重要的。 2. BISS-C协议深度解析与FPGA实现 2.1 BISS-C协议核心机制 BISS