LLaMA Factory 核心原理讲解

优质文章学习记录

08 Apr 2026 — 2 min read

大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于大模型算法的研究与应用。曾担任百度千帆大模型比赛、BPAA算法大赛评委，编写微软OpenAI考试认证指导手册。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。授权多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。

本文主要介绍了LLaMA Factory 核心原理讲解，希望能对学习大模型的同学们有所帮助。

文章目录

1. 前言
2. 核心模块讲解
3. SFT流程讲解

1. 前言

在之前的文章主要介绍了LLaMA Factory的操作方法，其中包括：

但也有同学提出疑问，想对LLaMA-Factory 核心原理有更加深入的了解。所以通过本篇博客的内容对原理进行深入的解析。

Read more

无人机数据集汇总无人机航拍各个方面检测分割数据集合集

本数据集集合了面向无人机视觉任务的大规模、多场景、多目标标注数据资源，涵盖了地理环境、智慧城市、基础设施巡检、农业生产、公共安全与灾害监测等多个关键领域。数据主要以两种主流格式提供：适用于目标检测的VOC/YOLO格式与适用于像素级语义分割的LabelMe格式，为算法开发与模型训练提供了高度结构化的标注支持。在地理与农业监测方面，包含田地、道路、森林、水体等地理要素的分割数据集，以及作物病害、杂草识别、农田农机、牛羊牲畜等农业目标的检测数据，支持精准农业与生态研究。智慧城市与交通领域提供了丰富的城市街道场景数据，涵盖行人、车辆、交通标志、占道经营、消防通道、广告牌等目标的检测与分割，助力城市智能化管理。基础设施巡检是另一重点，覆盖电力线、光伏板、桥梁、铁路、风力发电机等设备的缺陷与异常检测，以及工地车辆、施工人员、物料垃圾的识别，满足工业自动化巡检需求。在灾害与安全监控中，包含滑坡、洪水、火灾烟雾、河道垃圾、违规建筑等应急场景的检测与分割数据，同时提供了溺水人员、海上救援、军事目标等特殊任务的专项数据集。此外，

【Windows安装openclaw，配置qwen模型和ollama本地模型，飞书群组添加机器人】

【Windows安装openclaw，配置qwen模型和ollama本地模型，飞书群组添加机器人】

Windows11安装OpenClaw，配置千问Qwen模型及配置服务器本地模型Ollama，接入飞书机器人 * 第一步、安装Nodejs * 第二步、安装Git * 第三步、安装Openclaw * 配置本地大模型 * 第四步、配置飞书第一步、安装Nodejs 1、减少后续各种报错情况，先安装Nodejs，下载地址：https://nodejs.org/zh-cn/download，选择对应操作系统，24版本太新，有些依赖不适配，本文选择22.22.0版本，node-v22.22.0-x64.msi 直接双击安装即可。 2、安装完成看一下版本信息，用管理员权限打开win的PowerShell 3、执行 node -v 第二步、安装Git 1、安装Git 访问地址 https://git-scm.com/install/

【具身智能】机器人如何“看见”动作？一文读懂 3D 位姿与 5 种旋转表示法

【具身智能】机器人如何“看见”动作？一文读懂 3D 位姿与 5 种旋转表示法

当我们教一个机器人执行任务时，比如“拿起桌上的杯子”，我们到底在教它什么？我们不能只说“去拿杯子”。相反，我们必须给它一串精确的、机器可读的指令。这个指令的核心，就是 “位姿 (Pose)”。在机器人学和 3D 视觉中，位姿是描述一个物体在空间中完整状态的术语。这篇博客将深入探讨这个概念，特别是描述“朝向”的五种主流方法。理解这些，你就能明白为什么现代机器人（尤其是那些由机器学习驱动的）会使用一些看起来非常“奇怪”的数学表示。 1. 基础：位姿 (Pose) = 位置 + 姿态一个完整的“位姿”由两部分组成： 1. 位置 (Position)：物体在世界坐标系中的哪个点。 2. 姿态 (Orientation/Rotation)：物体的朝向。 📍 位置 (Position)：简单明了这部分很简单。我们通常用一个

Are Two LLMs Better Than One A Student-Teacher Dual-Head LLMs Architecture for Pharmaceutical Conten

Are Two LLMs Better Than One? A Student-Teacher Dual-Head LLMs Architecture for Pharmaceutical Content Optimization Authors: Suyash Mishra, Qiang Li, Anubhav Girdhar Deep-Dive Summary: 两个大模型优于一个吗？一种用于制药内容优化的师生双头大模型（LLMs）架构摘要在大语言模型（LLMs）日益广泛应用于制药等受监管行业的内容创作背景下，确保内容的科学准确性和法律合规性至关重要。传统的传统人工质量控制（QC）过程缓慢、易错且容易导致发布瓶颈。为了解决这一问题，本文提出了一种模块化的、由 LLM/VLM 驱动的 QC 架构，称为 LRBTC（语言、监管、品牌、