LlamaFactory v0.9.4 正式发布：告别 2025，全面升级的 LLM 微调框架来了

优质文章学习记录

10 Apr 2026 — 3 min read

2025 年 12 月 31 日，LlamaFactory 正式发布 v0.9.4 版本。这是一个具有里程碑意义的版本，被官方定义为 不可变发布版本（Immutable Release），仅允许修改发布标题和发布说明内容。
该版本以 “Farewell to 2025” 为主题，向整个 2025 年告别，同时也宣布 LlamaFactory 将在 2026 年持续为社区提供简单、高效、先进的大模型微调框架。

以下为 LlamaFactory v0.9.4 的完整更新内容详解。

一、重要变更（Breaking Changes）

本次版本包含多项对使用者影响较大的变更，升级前请务必关注：

项目仓库名称变更
仓库名称已从 LLaMA-Factory 更新为 LlamaFactory，后续所有官方资源将统一使用新名称。
Python 版本要求升级
Python 3.9 与 3.10 已正式废弃。
LlamaFactory 现在要求 Python 3.11 – 3.13。
包管理工具迁移
项目从 pip 迁移至 uv。
安装方式更新为：
使用 uv pip install llamafactory
官方博客上线
LlamaFactory 官方博客已正式发布：
https://blog.llamafactory.net/en/

二、重磅新特性（New Features）

v0.9.4 在算法、训练后端和工程能力上实现了全面增强：

🔥 支持 正交微调（Orthogonal Fine-Tuning, OFT）
🔥 支持 新增 Token 的语义初始化（Semantic Initialization）
🔥 支持通过 MCoreAdapter 进行 Megatron-LM 训练
🔥 支持 KTransformers 后端
支持 MPO 算法
支持 FP8 精度训练
支持 Transformers v5
支持在函数调用消息中同时使用 推理内容与纯文本
支持 DeepSpeed AutoTP
支持 高效的 NPU 融合算子
支持 TRL 0.24

这些新特性进一步提升了 LlamaFactory 在大规模模型训练、分布式效率、硬件适配以及前沿算法支持方面的能力。

三、模型支持更新（Models）

v0.9.4 新增与扩展了大量前沿模型与多模态模型支持，覆盖文本、视觉及多任务场景：

Falcon H1
Kimi-VL
GLM-4.5V
Gemma3n
Granite4
Qwen3-2507
MiniCPM-V 4.0
Intern-S1-mini
Seed-OSS
MiniCPM-V 4.5
InternVL-3.5
ERNIE-4.5-Text
ERNIE-4.5-VL
Ling-V2
Qwen3-VL
Qwen3-Omni
Hunyuan-mt
GLM-4.6V
Ministral 3
VibeThinker
MiMo-V2-Flash
MiniMax-M1
MiniMax-M2

该版本在多模态、视觉语言建模和新一代通用模型支持方面达到了新的高度。

四、总结

代码地址：github.com/hiyouga/LlamaFactory

LlamaFactory v0.9.4 不只是一次常规更新，而是一次承前启后的关键版本：

告别 2025，面向 2026 全面进化
Python、工具链与训练体系全面升级
覆盖最新算法、硬件能力与模型生态
继续坚持“简单 + 高效”的 LLM 微调理念

如果你正在使用或计划使用 LlamaFactory 进行大模型训练与微调，v0.9.4 是一个值得重点关注和升级的版本。

告别 2025，下一站，2026。

SAP调用Web Service全流程详解

在企业应用集成中，SAP系统经常需要与外部系统通过Web Service进行数据交互。本文将基于一份实际操作文档，详细讲解如何在SAP中调用外部Web Service，涵盖从代理类创建、逻辑端口配置到代码调用的完整流程。一、概述 SAP调用外部Web Service通常分为三个核心步骤： 1. 创建代理类 – 通过SE80事务码，基于WSDL生成SAP端的代理类 2. 配置逻辑端口 – 使用LPCONFIG为代理类配置连接信息 3. 编写调用代码 – 在ABAP程序中实例化代理类并调用方法下面我们逐步展开说明。二、SE80创建代理类代理类（Proxy Class）是SAP内部对外部Web Service的本地映射，它封装了SOAP通信细节，使ABAP程序可以像调用本地类一样调用远程服务。操作步骤： 1. 进入SE80，选择“企业服务” → “服务创建” → “服务生成” 2. 输入WSDL地址，系统将解析服务定义 3. 选择需要生成的服务和操作 4. 指定包和传输请求，生成代理类及相关结构生成后的代理类包含： * 一个主代理类（

前端代码分割与懒加载：让你的应用飞起来

前端代码分割与懒加载：让你的应用飞起来毒舌时刻代码分割和懒加载？听起来就像是前端工程师为了掩饰自己代码写得太烂而发明的借口。你写的代码那么大，加载时间那么长，不分割能行吗？你以为随便分割一下代码就能解决性能问题？别做梦了！如果分割策略不合理，反而会导致更多的网络请求，让应用变得更慢。为什么你需要这个 1. 减少初始加载时间：通过代码分割，只加载当前页面所需的代码，减少初始加载时间，提高用户体验。 2. 优化资源利用：只加载用户需要的代码，避免加载不必要的资源，优化内存和带宽使用。 3. 提高首屏渲染速度：快速加载首屏所需的代码，让用户尽快看到页面内容。 4. 支持大型应用：对于大型应用，代码分割可以避免打包后的文件过大，导致加载时间过长。反面教材 // 这是一个典型的不使用代码分割的应用 import React from 'react'; import ReactDOM from 'react-dom'; import Home

耳机阻抗与前端适配：32Ω、150Ω、300Ω 耳机的功放推力需求分析

耳机阻抗与前端适配分析耳机阻抗（单位：欧姆，Ω）直接影响前端设备的推力需求。根据电功率公式： $$P = \frac{U^2}{R}$$ 其中$P$为功率，$U$为电压，$R$为阻抗。可知在相同电压下，阻抗越高，耳机获得的功率越小。以下是具体分析： 1. 32Ω 耳机 * 推力需求：低 * 适配设备：智能手机、普通播放器等便携设备 * 原理：低阻抗使耳机在低电压下即可获得足够功率。例如驱动1mW功率所需电压： $$U = \sqrt{P \times R} = \sqrt{0.001 \times 32} \approx 0.18 , \text{V}$$ 普通手机输出（

实验三 Windows Server 2022/2025 搭建 Web 服务器实验指导书

作者：非凡大爹｜版本：v1｜日期：2026-03-30｜DocID：CN-LAB-2026-03-WEB-1-LG-V1 原创声明：本文为非凡大爹原创，首发于ZEEKLOG，转载或引用请注明出处。一、实验基本信息课程名称： Windows 网络管理 / 网络操作系统 / 服务器配置与管理实验名称： Windows Server 2022/2025 搭建 Web 服务器实验性质：验证性 + 应用性实验实验类别：综合配置实验建议学时： 2 学时实验方式：学生独立操作 + 结果验证二、实验目的 1. 知识目标理解 Web 服务器的基本作用，了解网站从“本地网页文件”到“网络可访问服务”的基本发布过程，