大模型微调主要框架 Firefly vs LLaMA Factory 全方位对比表

优质文章学习记录

07 Apr 2026 — 5 min read

Firefly vs LLaMA Factory 全方位对比表 + 生物医药垂类微调选型建议

一、核心维度对比表格

对比维度	Firefly（流萤）	LLaMA Factory
开发主体	个人开源：杨建新（YeungNLP），前Shopee NLP工程师，中山大学硕士	社区开源：hiyouga核心维护，全球开源社区协同迭代
项目定位	聚焦中文大模型的轻量化训练框架+配套中文优化模型	通用型全栈大模型微调框架，无语言/模型偏向，极致兼容
支持基座模型	以中文友好模型为主（Llama系列、Qwen、ChatGLM、Firefly自训模型），覆盖有限但深度适配	全主流开源模型全覆盖（Llama、Qwen、Mistral、DeepSeek、GLM、Yi、Firefly等），几乎无适配成本
支持微调方式	基础SFT、LoRA/QLoRA、增量预训练，进阶对齐方法较少	SFT、DPO/IPO/KTO、RLHF、预训练、多模态微调，全流程对齐方案完整
中文优化	原生深度优化：中文分词、语料、表达逻辑专项适配，中文生成质感最优	通用框架无原生中文特化，依赖基座模型本身中文能力，可通过数据弥补
使用门槛	配置简洁、脚本轻量化，中文新手教程充足，上手快	UI/命令行双模式，模板化YAML配置，零代码WebUI，新手友好度拉满
硬件显存优化	支持4/8bit量化、QLoRA，单卡消费级显卡可跑7B~13B模型	量化、LoRA、梯度检查点、多卡并行等优化更全面，大参数模型适配性更强
文档&社区	中文文档完善，作者公众号/知乎答疑，社区规模中等，问题响应较快	国内外社区双活跃，Issue/教程/二次开发案例极多，复杂问题解决方案丰富
部署导出	支持基础量化导出、本地推理，生产级部署工具链简易	多格式导出（LoRA合并、GGUF、GPTQ、AWQ），对接主流推理框架，生产部署完整
扩展性	聚焦中文SFT场景，自定义扩展、多任务适配能力一般	插件化架构，可自定义数据集格式、训练策略、新增模型，扩展性极强
维护频率	稳定迭代，更新节奏偏个人开源节奏	高频更新，新模型、新算法第一时间集成
适用核心人群	中文垂类开发者、个人科研、轻量化中文对话任务	全场景开发者、多模型测试、进阶对齐、复杂垂类、工程化落地

二、核心差异一句话总结

Firefly：专精中文场景，小而精，配置简单，中文生成效果上限高，适合纯中文垂类快速微调。
LLaMA Factory：全能通用框架，大而全，兼容所有模型与微调方法，社区生态无敌，适合试错、多模型对比、进阶训练。

三、通用场景快速选型规则

纯中文对话/文案/国内垂类任务 → 优先 Firefly
多模型轮换测试、需DPO/RLHF进阶对齐、多模态微调 → 必选 LLaMA Factory
新手零基础、追求一键运行、不想处理代码适配 → 优先 LLaMA Factory（WebUI）
追求极致中文流畅度、轻量化脚本、极简部署 → 优先 Firefly
企业生产落地、多格式导出、分布式训练 → 优先 LLaMA Factory

四、结合你的「小分子药物筛选/生物医药垂类」专属建议

结合你做AI生物医药、小分子药物筛选、论文相关垂类微调的需求，给出针对性结论：

1. 优先推荐方案：LLaMA Factory

核心适配理由：

生物医药场景会用到Llama、DeepSeek、Qwen、Yi等多类基座模型，LLaMA Factory无适配成本，可快速对比不同基座在医药数据上的效果。
垂类微调常需要迭代数据、尝试LoRA/量化参数，甚至后续做DPO对齐优化回答准确性，LLaMA Factory全流程支持。
本地消费级显卡训练、低显存环境下，其量化与显存优化比Firefly更细致，大参数模型训练稳定性更好。
生物医药文献多为中英混合，LLaMA Factory不绑定中文特化，可灵活适配双语垂类数据，通用性更强。
社区海量医药/科研垂类微调案例、踩坑文档，遇到训练报错、参数不合理问题更容易找到解决方案。

2. 可选备选方案：Firefly

仅适用于：

你的训练数据100%为中文医药文献、中文问答，极致追求中文表达流畅度。
仅固定使用1~2款中文基座（Qwen/ChatGLM），不做多模型对比，只需要快速完成基础SFT。

3. 最优折中实操方案（兼顾两者优势，最推荐你使用）

采用 LLaMA Factory 框架 + Firefly系列基座模型 组合：

用LLaMA Factory的易用UI、参数优化、全格式支持，降低训练与部署成本。
加载Hugging Face上的Firefly预训练模型（Firefly-Llama、Firefly-Qwen），保留中文深度优化的基础能力。
注入你的小分子药物筛选、DrugBank、ZINC20相关垂类数据做LoRA微调，兼顾通用框架兼容性与中文生成质量。
训练完成后通过LLaMA Factory导出量化模型，本地推理或后续部署都更灵活。

五、极简最终结论

做小分子药物筛选这类科研垂类、多模型测试、双语数据、长期迭代 → 直接用 LLaMA Factory
仅做纯中文医药对话、极简快速微调、不折腾框架 → 用 Firefly
想要兼顾中文效果与框架易用性 → LLaMA Factory 微调 Firefly 基座模型（最适合你的场景）

需要我进一步给出适配生物医药数据格式的LLaMA Factory训练YAML模板、LoRA参数推荐，以及本地显卡（3090/4090）的显存优化配置吗？

写真提示词完全指南：从棚拍到情绪大片，AI帮你一键生成

大家好，我是AI培训韩老师！很多人问我，现在还需要去影楼拍写真？ no,no,no! 本文将为你系统梳理各类写真提示词的写法，并提供可直接套用的范例。无论你是想创作时尚大片、电影感叙事，还是特定主题写真，都能在这里找到灵感。一、摄影棚肖像：极简与光影的艺术核心要素：纯色/渐变背景、专业布光、高级服装、细腻质感、非居中构图。提示词范例：将图片转换为摄影棚风格的顶级脸部特写肖像照。她身穿一件合身的黑色高领针织衫，线条简洁，质感高级。人物侧身微微转向镜头，眼神专注而深邃。背景为纯黑色，画面采用高反差光影，明暗分明，阴影深邃。整体为黑白人像摄影风格，带有细腻的胶片颗粒，氛围冷峻而戏剧化，非居中构图，画面保留大量留白。二、电影感叙事写真：氛围与故事感核心要素：特定场景、连贯剧情、电影色调、字幕加持、多宫格拼图。提示词范例：基于人物长相生成三张拼接在一起的冬日电影感叙事写真。

AI 应用开发工程师（Agent方向）：打造未来的智能体架构！

文章目录 * 前言 * 一、什么是 AI Agent？为什么它如此重要？ * 二、AI Agent 开发工程师到底做什么？ * 三、AI Agent 开发工程师需要掌握哪些技能？ * 四、实战项目推荐（附 GitHub 项目） * 五、如何入行 AI Agent 开发？ * 总结前言在 AI 领域，AI Agent（智能体）正在成为最热门的方向之一。从智能客服到自动化办公助手，再到企业知识管理，AI Agent 正在改变人与机器的交互方式。那么，AI 应用开发工程师（Agent方向）是做什么的？需要掌握哪些技能？如何通过实战项目提升能力？

【AI大模型】ELMo模型介绍：深度理解语言模型的嵌入艺术

学习目标了解什么是ELMo.掌握ELMo的架构.掌握ELMo的预训练任务.了解ELMo的效果和成绩.了解ELMo的优缺点. 目录 🍔 ELMo简介 🍔 ELMo的架构 2.1 总体架构 2.2 Embedding模块 2.3 两部分的双层LSTM模块 2.4 词向量表征模块 🍔 ELMo的预训练任务 3.1 ELMo的本质思想 3.2 ELMo的预训练采用了典型的两阶段过程 🍔 ELMo模型的效果 🍔 ELMo的待改进点 🍔 小结 🍔 ELMo简介 ELMo是2018年3月由华盛顿大学提出的一种预训练模型. * ELMo的全称是Embeddings from Language Models. * ELMo模型的提出源于论文<< Deep Contextualized Word Representations >>. * ELMo模型提出的动机源于研究人员认为一个好的预训练语言模型应该能够包含丰富的句法和语义信息, 并且能够对多义词进行建模. 而传统的词向量(2013年的word2vec, 2014年的GloVe)

Claude Code Superpowers -“让 AI 像资深工程师一样工作，而不是像只会写代码的实习生。”‌

1、什么是Superpowers Superpowers不是独立工具，是Claude Code的插件系统。装上之后，Claude Code会自动多出一套”技能树”： brainstorming：帮你理清需求再动手，不是瞎写 test-driven-development：强制TDD流程，先写测试 systematic-debugging：4步调试法，找根因 writing-plans：把需求拆成2-5分钟的小任务 subagent-driven-development：子代理流水线干活核心就一句话：让AI不要瞎搞，按照专业开发流程来。 2、核心价值 “让 AI 像资深工程师一样工作，而不是像只会写代码的实习生。”‌ 它认为，AI 编程的主要问题不是“不会写”，而是“没有流程”。它通过一套可组合的“技能”（Skills），将传统开发中容易被跳过的关键环节变成不可绕过的自动化节点，从而解决 AI 编程中常见的“方向跑偏”、“忽略测试”、“代码质量不稳定”等问题。其核心价值体现在： * ‌强制测试驱动开发