LlamaFactory v0.9.4 正式发布：告别 2025，全面升级的 LLM 微调框架来了

优质文章学习记录

07 Apr 2026 — 3 min read

2025 年 12 月 31 日，LlamaFactory 正式发布 v0.9.4 版本。这是一个具有里程碑意义的版本，被官方定义为 不可变发布版本（Immutable Release），仅允许修改发布标题和发布说明内容。
该版本以 “Farewell to 2025” 为主题，向整个 2025 年告别，同时也宣布 LlamaFactory 将在 2026 年持续为社区提供简单、高效、先进的大模型微调框架。

以下为 LlamaFactory v0.9.4 的完整更新内容详解。

一、重要变更（Breaking Changes）

本次版本包含多项对使用者影响较大的变更，升级前请务必关注：

项目仓库名称变更
仓库名称已从 LLaMA-Factory 更新为 LlamaFactory，后续所有官方资源将统一使用新名称。
Python 版本要求升级
Python 3.9 与 3.10 已正式废弃。
LlamaFactory 现在要求 Python 3.11 – 3.13。
包管理工具迁移
项目从 pip 迁移至 uv。
安装方式更新为：
使用 uv pip install llamafactory
官方博客上线
LlamaFactory 官方博客已正式发布：
https://blog.llamafactory.net/en/

二、重磅新特性（New Features）

v0.9.4 在算法、训练后端和工程能力上实现了全面增强：

🔥 支持 正交微调（Orthogonal Fine-Tuning, OFT）
🔥 支持 新增 Token 的语义初始化（Semantic Initialization）
🔥 支持通过 MCoreAdapter 进行 Megatron-LM 训练
🔥 支持 KTransformers 后端
支持 MPO 算法
支持 FP8 精度训练
支持 Transformers v5
支持在函数调用消息中同时使用 推理内容与纯文本
支持 DeepSpeed AutoTP
支持 高效的 NPU 融合算子
支持 TRL 0.24

这些新特性进一步提升了 LlamaFactory 在大规模模型训练、分布式效率、硬件适配以及前沿算法支持方面的能力。

三、模型支持更新（Models）

v0.9.4 新增与扩展了大量前沿模型与多模态模型支持，覆盖文本、视觉及多任务场景：

Falcon H1
Kimi-VL
GLM-4.5V
Gemma3n
Granite4
Qwen3-2507
MiniCPM-V 4.0
Intern-S1-mini
Seed-OSS
MiniCPM-V 4.5
InternVL-3.5
ERNIE-4.5-Text
ERNIE-4.5-VL
Ling-V2
Qwen3-VL
Qwen3-Omni
Hunyuan-mt
GLM-4.6V
Ministral 3
VibeThinker
MiMo-V2-Flash
MiniMax-M1
MiniMax-M2

该版本在多模态、视觉语言建模和新一代通用模型支持方面达到了新的高度。

四、总结

代码地址：github.com/hiyouga/LlamaFactory

LlamaFactory v0.9.4 不只是一次常规更新，而是一次承前启后的关键版本：

告别 2025，面向 2026 全面进化
Python、工具链与训练体系全面升级
覆盖最新算法、硬件能力与模型生态
继续坚持“简单 + 高效”的 LLM 微调理念

如果你正在使用或计划使用 LlamaFactory 进行大模型训练与微调，v0.9.4 是一个值得重点关注和升级的版本。

告别 2025，下一站，2026。

LlamaFactory v0.9.4 正式发布：告别 2025，全面升级的 LLM 微调框架来了

优质文章学习记录

一、重要变更（Breaking Changes）

二、重磅新特性（New Features）

三、模型支持更新（Models）

四、总结

Read more

（10-1）大模型时代的人形机器人感知：视觉-语言模型在机器人中的应用

OpenClaw 完整安装与配置文档（包含Minimax/deepseek模型接入、飞书机器人接入）

手把手教你用Coze搭建AI客服机器人：从零到上线的完整流程

【无人机】无人机路径规划算法