大模型微调主要框架 Firefly vs LLaMA Factory 全方位对比表

优质文章学习记录

09 Apr 2026 — 5 min read

Firefly vs LLaMA Factory 全方位对比表 + 生物医药垂类微调选型建议

一、核心维度对比表格

对比维度	Firefly（流萤）	LLaMA Factory
开发主体	个人开源：杨建新（YeungNLP），前Shopee NLP工程师，中山大学硕士	社区开源：hiyouga核心维护，全球开源社区协同迭代
项目定位	聚焦中文大模型的轻量化训练框架+配套中文优化模型	通用型全栈大模型微调框架，无语言/模型偏向，极致兼容
支持基座模型	以中文友好模型为主（Llama系列、Qwen、ChatGLM、Firefly自训模型），覆盖有限但深度适配	全主流开源模型全覆盖（Llama、Qwen、Mistral、DeepSeek、GLM、Yi、Firefly等），几乎无适配成本
支持微调方式	基础SFT、LoRA/QLoRA、增量预训练，进阶对齐方法较少	SFT、DPO/IPO/KTO、RLHF、预训练、多模态微调，全流程对齐方案完整
中文优化	原生深度优化：中文分词、语料、表达逻辑专项适配，中文生成质感最优	通用框架无原生中文特化，依赖基座模型本身中文能力，可通过数据弥补
使用门槛	配置简洁、脚本轻量化，中文新手教程充足，上手快	UI/命令行双模式，模板化YAML配置，零代码WebUI，新手友好度拉满
硬件显存优化	支持4/8bit量化、QLoRA，单卡消费级显卡可跑7B~13B模型	量化、LoRA、梯度检查点、多卡并行等优化更全面，大参数模型适配性更强
文档&社区	中文文档完善，作者公众号/知乎答疑，社区规模中等，问题响应较快	国内外社区双活跃，Issue/教程/二次开发案例极多，复杂问题解决方案丰富
部署导出	支持基础量化导出、本地推理，生产级部署工具链简易	多格式导出（LoRA合并、GGUF、GPTQ、AWQ），对接主流推理框架，生产部署完整
扩展性	聚焦中文SFT场景，自定义扩展、多任务适配能力一般	插件化架构，可自定义数据集格式、训练策略、新增模型，扩展性极强
维护频率	稳定迭代，更新节奏偏个人开源节奏	高频更新，新模型、新算法第一时间集成
适用核心人群	中文垂类开发者、个人科研、轻量化中文对话任务	全场景开发者、多模型测试、进阶对齐、复杂垂类、工程化落地

二、核心差异一句话总结

Firefly：专精中文场景，小而精，配置简单，中文生成效果上限高，适合纯中文垂类快速微调。
LLaMA Factory：全能通用框架，大而全，兼容所有模型与微调方法，社区生态无敌，适合试错、多模型对比、进阶训练。

三、通用场景快速选型规则

纯中文对话/文案/国内垂类任务 → 优先 Firefly
多模型轮换测试、需DPO/RLHF进阶对齐、多模态微调 → 必选 LLaMA Factory
新手零基础、追求一键运行、不想处理代码适配 → 优先 LLaMA Factory（WebUI）
追求极致中文流畅度、轻量化脚本、极简部署 → 优先 Firefly
企业生产落地、多格式导出、分布式训练 → 优先 LLaMA Factory

四、结合你的「小分子药物筛选/生物医药垂类」专属建议

结合你做AI生物医药、小分子药物筛选、论文相关垂类微调的需求，给出针对性结论：

1. 优先推荐方案：LLaMA Factory

核心适配理由：

生物医药场景会用到Llama、DeepSeek、Qwen、Yi等多类基座模型，LLaMA Factory无适配成本，可快速对比不同基座在医药数据上的效果。
垂类微调常需要迭代数据、尝试LoRA/量化参数，甚至后续做DPO对齐优化回答准确性，LLaMA Factory全流程支持。
本地消费级显卡训练、低显存环境下，其量化与显存优化比Firefly更细致，大参数模型训练稳定性更好。
生物医药文献多为中英混合，LLaMA Factory不绑定中文特化，可灵活适配双语垂类数据，通用性更强。
社区海量医药/科研垂类微调案例、踩坑文档，遇到训练报错、参数不合理问题更容易找到解决方案。

2. 可选备选方案：Firefly

仅适用于：

你的训练数据100%为中文医药文献、中文问答，极致追求中文表达流畅度。
仅固定使用1~2款中文基座（Qwen/ChatGLM），不做多模型对比，只需要快速完成基础SFT。

3. 最优折中实操方案（兼顾两者优势，最推荐你使用）

采用 LLaMA Factory 框架 + Firefly系列基座模型 组合：

用LLaMA Factory的易用UI、参数优化、全格式支持，降低训练与部署成本。
加载Hugging Face上的Firefly预训练模型（Firefly-Llama、Firefly-Qwen），保留中文深度优化的基础能力。
注入你的小分子药物筛选、DrugBank、ZINC20相关垂类数据做LoRA微调，兼顾通用框架兼容性与中文生成质量。
训练完成后通过LLaMA Factory导出量化模型，本地推理或后续部署都更灵活。

五、极简最终结论

做小分子药物筛选这类科研垂类、多模型测试、双语数据、长期迭代 → 直接用 LLaMA Factory
仅做纯中文医药对话、极简快速微调、不折腾框架 → 用 Firefly
想要兼顾中文效果与框架易用性 → LLaMA Factory 微调 Firefly 基座模型（最适合你的场景）

需要我进一步给出适配生物医药数据格式的LLaMA Factory训练YAML模板、LoRA参数推荐，以及本地显卡（3090/4090）的显存优化配置吗？

【论文阅读笔记】Agent Memory相关文献追踪——异构存储和经验记忆相关

Memory in the Age of AI Agents: A Survey:Forms, Functions and Dynamics 这篇文章在formalize记忆的时候，给了三个层次的工作形成，演进，召回。Rethinking Memory in AI: Taxonomy, Operations, Topics, and Future 这篇更早的survey，把记忆的任务分为6大类——梳理、索引、更新、删除、检索、整合，也正好对应这个框架里的形成，演进，召回在方法总结上，这个图画得也比较好，很清楚的区隔了各个工作的专门方向。因为我的切入点仍然在于【异构内容】的记忆工程，所以作者众多较好的图中，我主要抠下来下面这张，这张其实也是工程实现中最常使用的集中存储形态。另外，这篇Survey提到了一些同类工作没有强调，

Yolo11 基于DroneVehicle数据集的无人机视角下车辆目标检测

1、关于DroneVehicle数据集介绍 DroneVenicle数据集是由天津大学收集、标注的大型无人机航拍车辆数据集。 DroneVehicle 数据集由无人机采集的共 56,878 幅图像组成，其中一半为 RGB 图像，其余为红外图像。我们对五个类别进行了带有方向性边界框的丰富标注。其中，汽车car 在 RGB 图像中有 389,779 个标注，在红外图像中有 428,086 个标注；卡车truck 在 RGB 图像中有 22,123 个标注，在红外图像中有 25,960 个标注；公交车bus 在 RGB 图像中有 15,333 个标注，在红外图像中有 16,590 个标注；面包车van 在

InstructPix2Pix效果实测：结构保留能力 vs Stable Diffusion 图生图对比

InstructPix2Pix效果实测：结构保留能力 vs Stable Diffusion 图生图对比 1. 为什么说InstructPix2Pix是真正的“魔法修图师” 你有没有过这样的经历：想把一张照片里的白天改成夜晚，或者给朋友P一副墨镜，又或者让一张普通街景变成雨天氛围——但打开PS，面对层层叠叠的图层和蒙版，最后只留下满屏困惑？传统图像编辑工具需要你懂色彩曲线、图层混合模式、甚至手绘遮罩；而Stable Diffusion这类图生图模型，又常常让人陷入“写对Prompt像解谜”的困境：多加一个词，画面就崩掉；少写一个细节，AI就自由发挥到千里之外。 InstructPix2Pix不一样。它不把你当设计师，也不把你当咒语学徒，而是直接把你当“导演”——你只需要用日常英语说出想法，它就照着执行，而且几乎不会跑偏。这不是滤镜，不是风格迁移，更不是粗暴重绘。它像一位经验丰富的修图老手，先仔仔细细看清原图里每一条轮廓线、每一个人物姿态、每一处光影关系，再只动你点名要改的那一小块。你让它“add sunglasses”，它不会顺手把人脸拉长、把背景重画一遍；你让它“

企微群机器人发markdown消息支持表格

结论 1.V1接口可以圈人，但是无法正确展示表格的markdown语法 2.V2接口可以展示表格的markdown语法，但是无法圈人 3.企微消息有长度限制前言今天是日本投降日，写篇技术文档。企业微信机器人发markdown表格信息+如何艾特人企微机器人发消息通知，目标是生成数据对比表格，然后艾特到具体的人来跟进事物的变化 1、成果收益发表格数据，圈人 2、背景目前机器人通知的内容太单调了，无法满足告警提醒的作用，需要罗列表格进行对比，需要艾特到具体人 3、解决方案如何支持markdown表格类型 1.企业微信从4.1.38开始支持markdown表格的语法了。可以参看官方文档4.1.38版本新功能介绍所以企业客户端要升级 2.我们历史使用的是msgtype：markdown，这个还是不支持的 { "msgtype": "markdown", "markdown&