LLaMA Factory 核心原理讲解

优质文章学习记录

10 Apr 2026 — 2 min read

大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于大模型算法的研究与应用。曾担任百度千帆大模型比赛、BPAA算法大赛评委，编写微软OpenAI考试认证指导手册。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。授权多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。

本文主要介绍了LLaMA Factory 核心原理讲解，希望能对学习大模型的同学们有所帮助。

文章目录

1. 前言
2. 核心模块讲解
3. SFT流程讲解

1. 前言

在之前的文章主要介绍了LLaMA Factory的操作方法，其中包括：

但也有同学提出疑问，想对LLaMA-Factory 核心原理有更加深入的了解。所以通过本篇博客的内容对原理进行深入的解析。

Read more

Claude Code本地化部署教程：零成本打造最强内网AI开发助手

Claude Code本地化部署教程：零成本打造最强内网AI开发助手

文章介绍了如何通过Ollama将Claude Code接入本地开源模型，实现不联网、不花钱、代码不出本地的开发环境。提供了详细配置教程，包括安装客户端、设置环境变量和启动本地模型。这种方式确保数据安全，无需订阅费用，可自由切换Qwen3、GLM等模型，为开发者提供了完全离线的AI辅助开发体验。如果你是一个开发者，一定被Claude Code的能力震惊了。简单来说，它不仅仅是一个聊天框，而是一个能直接住在你的工作空间内的数字员工，能读懂你的源码、系统功能修BUG、写报告，互联网检索等，在授权的情况下，还能运行终端命令。但是很多人担心隐私泄露，或者不想一直给Claude交昂贵的订阅费。今天，救星来了！通过Ollama可以把 Claude Code 这个“神级躯壳”接入本地运行的开源模型（如 Qwen3、GLM）。不联网、不花钱、代码不出本地，可谓是最强内网开发套装！为什么又要本地跑Claude Code? * 数据安全：公司代码资产，怎么敢随便传输到云端？本地运行，物理隔离最安心。 * 告别订阅：

海光 DUC 环境（海光 DCU K100_AI）部署 ollama+deepseek

看到 ZEEKLOG 上好多的这个部署流程不是要收费就是写的不清不楚，所以决定将我的部署流程写出来，明明所有的官方文档都是免费的。 “不太懂为什么吃了别人免费的饭，现在拉出来的屎要收费！” 声明：本人不是专业运维实施人员，所有的流程都是靠试或直觉，还有一点点的知识正式开始：系统：Kylin Linux Advanced Server V10（Lance） CPU：海光 C86 7360（24 核）内存：256GB 内核：Linux-4.19.90-52.48.v2207.ky10.x86_64 显卡：海光 DCU K100_AI（Co-processor） 1. 环境部署 1.1 驱动安装光合开发者社区下载驱动通过显卡型号选择驱动驱动版本

告别代码，迎接代理：Claude Code、OpenCode、OpenClaw等六大AI工具全面解析

如果你最近关注科技圈，一定会被一个词刷屏：AI代理（AI Agent）。从2024年底到2026年初，AI的发展已经不再局限于聊天窗口里的文字游戏，而是真正开始操控电脑、编写代码、甚至替我们“干活”。 Anthropic、OpenAI以及开源社区接连丢出一系列重磅产品：Claude Code、Cowork、OpenCode、OpenWork、OpenClaw、Codex……这些名字听起来既有重复又相互关联，它们到底有什么区别？哪个才是普通人也用得上的工具？今天，我们就来一次性梳理这七大项目，看看它们分别是什么，以及它们如何共同指向一个“AI执行一切”的未来。一、六大“工具”逐个看在深入对比之前，我们先分别认识一下这六位主角。它们虽然都顶着“AI工具”的头衔，但出身、能力和使命却大相径庭。 1. Claude Code：披着编程外衣的通用Agent 出身：Anthropic（2024年底推出）核心定位：终端里的自主AI助手。 Claude

多模态 AI 应用：图文音视频一体化开发实战教程

多模态 AI 应用：图文音视频一体化开发实战教程

什么是多模态AI 多模态AI是指能够同时处理文本、图像、音频、视频等多种不同类型数据的人工智能系统，它打破了单模态AI的信息壁垒，能更贴近人类理解世界的方式。比如我们日常使用的AI聊天机器人识图功能、视频自动字幕生成工具，都是多模态AI的典型应用。开发前的核心准备模型选型建议模型类型推荐模型适用场景开源轻量模型Qwen-VL-Chat、MiniGPT-4本地部署、快速验证云端API模型GPT-4V、Gemini Pro生产级应用、复杂任务处理专业领域模型CLIP、Whisper图像检索、音频转写等细分场景环境依赖安装我们将基于Python生态实现实战项目，需要安装以下核心库： # 基础依赖 pip install torch torchvision transformers pillow # 音频处理依赖 pip install librosa soundfile # 视频处理依赖 pip install opencv-python moviepy # API调用依赖（可选，用于调用云端多模态模型） pip install openai anthropic