6.llamafactory项目介绍与安装部署

优质文章学习记录

07 Apr 2026 — 7 min read

一、学术资源加速

服务说明：AutoDL提供学术资源加速服务，主要解决GitHub和HuggingFace访问速度慢的问题，但仅限学术用途且不承诺稳定性
加速地址：包含github.com、githubusercontent.com、githubassets.com、huggingface.co等域名
终端配置：
注意事项：
- 建议不需要时关闭加速，可能影响正常网络
- 关闭命令：

二、主流微调框架介绍

1. Transformer

生态地位：Hugging Face核心库，NLP领域最广泛使用的基础框架
技术特点：
- 支持全参数微调
- 兼容PEFT库扩展
优势：
- 生态系统最完善，社区活跃
- 与PyTorch/TensorFlow无缝集成
- 模型和教程资源丰富
适用场景：中小规模模型实验、研究和开发，微调入门首选

2. PEFT

技术定位：参数高效微调标准库
核心方法：
- LoRA
- Prefix-tuning
- AdaLoRA
- Prompt Tuning
突出优势：
- 计算和存储成本极低
- 与Transformers完美集成
- 操作简单易用
局限性：仅支持单卡微调，不适合分布式训练
适用场景：资源受限环境（如单卡），需高效适配多任务的场景

3. LLaMA-Factory

产品特色：低代码/无代码快速微调框架
技术集成：
- 多种微调方法（含LoRA等）
- 集成优化技术
用户体验：
- 提供友好Web UI界面
- 支持拖拽式参数配置
- 无需深厚代码功底
典型应用：
- 快速原型验证
- 非技术人员微调
- 本课程主要教学框架

4. ModelScope

平台定位：阿里"模型即服务"(MaaS)平台
技术特点：
- 多模态模型支持
- 训练-评估-部署全流程
特色优势：
- 中文场景优化
- 企业级生产环境支持
适用场景：需要多模态模型和完整流水线的企业用户

5. MS-SWIFT

规模支持：超大规模模型微调
核心技术：
- LoRA/QLoRA
- 分布式训练
- 量化技术
模型覆盖：
- 支持500+LLM
- 200+多模态模型
适用场景：需要微调超大规模模型或追求极致性能的生产部署

6. Unsloth

技术突破：动态量化微调（2024年新技术）
核心优化：
- LoRA/QLoRA底层重构
- 训练速度提升2倍
- 显存占用大幅降低
显著特点：
- 量化微调几乎无损精度
- 兼容Hugging Face生态
当前局限：仅支持单卡微调
适用场景：
- 计算资源严格受限
- 追求训练效率极限
- 20B参数以下模型

7. 小结

框架选择指南：
- 入门实验：Transformers+PEFT组合
- 快速实现：LLaMA-Factory
- 企业多模态：ModelScope/MS-SWIFT
- 资源受限：Unsloth
发展趋势：Unsloth若能支持分布式训练，可能成为未来主导框架
课程选择：本课程以LLaMA-Factory作为主要教学框架

三、LLaMA-Factory项目介绍

项目地址: https://github.com/hiyouga/LLaMA-Factory
项目热度: 目前已有57.2k stars，287 watching和7k forks，从2023年开始人气持续快速增长

1. 支持的模型

覆盖范围: 支持几乎所有主流大语言模型，包括：
- Baichuan 2 (7B/13B)
- BLOOM/BLOOMZ (560M-176B)
- DeepSeek系列 (1.5B-671B)
- Gemma系列 (2B-27B)
- GLM系列 (9B-355B)
- GPT系列 (0.1B-120B)
- 最新支持的GPT-OSS (20B/120B)
模板支持: 每个模型都有对应的对话模板(chat template)

2. 安装要求

核心依赖:
- Python: 3.9(最低)/3.10(推荐)
- PyTorch: 2.0.0(最低)/2.6.0(推荐)
- Transformers: 4.49.0(最低)/4.50.0(推荐)
可选组件:
- CUDA: 11.6(最低)/12.2(推荐)
- Flash-attn: 2.5.6(最低)/2.7.2(推荐)
环境适配: 部分功能需要特定架构的显卡支持，如V100显卡不支持某些功能

3. 硬件要求

全精度训练:
- 32位: 7B模型需要120GB显存
- 16位(bf16): 7B模型需要60GB显存
高效微调方法:
- LoRA/Freeze: 7B模型仅需16GB显存
- QLoRA 8-bit: 7B模型需10GB显存
- QLoRA 4-bit: 7B模型仅需6GB显存

4. 安装

先在autodl购买实例
- 在autodl进入jupytelLab-终端
下载
- 输入
  - ls
  - cd autodl-tmp
  - git clone --depth 1 https://github.com/hiyouga/LlamaFactory.git
进入：
虚拟环境建议: 本地使用建议创建conda虚拟环境
conda create -n llamafactory python=3.10
安装
拓展模块安装
- flashAttention库----加速
  - pip install flash-attn --no-build-isolation #注意：V100不支持该库
- bitsandbytes库--量化库
  - pip install bitsandbytes
- deepspeed库---做分布式微调
  - pip install deepspeed==0.12.3
- accelerate库--加速
  - pip install accelerate

pip install -e . pip install -r requirements/metrics.txt

cd LlamaFactory

四、llama factory项目文件介绍

/data文件夹
- 存放数据集的文件夹，可以用开源数据集，也可以自己写数据集
/examples文件夹
- 提供了训练（deepspeed,lora,qlora,fsdp)、模型合并、推理等示例代码，可以该参数直接用
/scripts文件夹
- 存放微调、训练、模型合并、评估等脚本的文件夹
/docker文件夹
- 各类显卡的docker部署
/evaluation文件夹
- 评估模型性能数据集，脚本

五、启动llama

在终端输入：GRADIO_SERVER_PORT=6006 llamafactory-cli webui
打开powershell
点击那个地址就可以进入

密码输入的时候是不显示的，直接输入完即可

六、预训练模型下载

1. 模型选择与下载准备

目标模型: 本次微调使用的是通义千问3-4B-Base模型
模型特点:
- 是Qwen系列最新一代大型语言模型
- 提供密集型和专家混合(MoE)两种架构
- 预训练使用了119种语言的36万亿个标记
- 语言覆盖范围是Qwen2.5的三倍
- 包含编码、STEM、推理等丰富的高质量数据

2. 下载方法

魔塔社区：https://www.modelscope.cn/models
- 在终端新开一个窗口
- pip install modelscope
- cd
- cd autodl-tmp #下载到数据盘
- modelscope download --model Qwen/Qwen3.5-4B-Base --cache_dir ./

MIT室内场景识别数据集-15,571张图片室内场景识别机器人导航智能建筑深度学习机器学习语义理解安防监控虚拟现实`

🏢 MIT室内场景识别数据集-15,571张图片-文章末添加wx领取数据集 * 📦 已发布目标检测数据集合集（持续更新） * 🏢 MIT室内场景识别数据集介绍 * 📌 数据集概览 * 包含类别 * 🎯 应用场景 * 🖼 数据样本展示 * 使用建议 * 🌟 数据集特色 * 📈 商业价值 * 🔗 技术标签 * YOLOv8 训练实战 * 📦 1. 环境配置 * 安装 YOLOv8 官方库 ultralytics * 📁 2. 数据准备 * 2.1 数据标注格式（YOLO） * 2.2 文件结构示例 * 2.3 创建 data.yaml 配置文件 * 🚀 3. 模型训练 * 关键参数补充说明： * 📈 4. 模型验证与测试 * 4.1 验证模型性能 * 关键参数详解 * 常用可选参数 * 典型输出指标 * 4.2 推理测试图像

【花雕学编程】Arduino BLDC 之机器人IMU角度读取 + PID控制 + 互补滤波

基于 Arduino 平台实现 BLDC 机器人 IMU 角度读取 + 互补滤波 + PID 控制，构成了一个典型的姿态闭环控制系统。该架构是自平衡机器人（如两轮平衡车、倒立摆）或稳定云台的核心技术栈。它通过互补滤波融合 IMU 原始数据以获得精准姿态角，再利用 PID 控制器计算出维持平衡所需的电机驱动力矩，驱动 BLDC 电机执行动作。 1、主要特点传感器融合：互补滤波（Complementary Filter）这是系统的“感知中枢”，解决了单一传感器无法同时满足动态与静态精度需求的矛盾。频域分割策略：互补滤波本质上是一个频域滤波器。它利用低通滤波（LPF）处理加速度计数据，提取低频的重力方向分量（长期稳定，用于修正漂移）；同时利用高通滤波（HPF）处理陀螺仪数据，提取高频的角速度变化分量（动态响应快，

实现Python将csv数据导入到Neo4j

目录一、获取数据集 1.1 获取数据集 1.2 以“记事本”方式打开文件 1.3 另存为“UTF-8”格式文件 1.4 选择“是” 二、打开Neo4j并运行 2.1 创建新的Neo4j数据库 2.2 分别设置数据库名和密码编辑 2.3 启动Neo4j数据库 2.4 打开Neo4j数据库 2.5 运行查看该数据库是否为空三、打开Python创建项目 3.1 创建一个包，存项目 3.2 创建一个项目 3.3 检查自己的依赖是否完全

AI安全：视觉提示词注入攻击代码/实战教学｜针对Hugging Face开源大模型Stable Diffusion Model

提到提示词注入（Prompt Injection），大家的第一反应往往是精心构造的文本越狱指令。而在图生图任务中，输入图像在本质上扮演了视觉提示词的角色，与文本指令共同指导生成模型。基于这一视角，本文展示针对视觉提示词的注入攻击：通过PGD对抗攻击算法对输入图像进行像素级微调，使其生成的违规图像能够绕过开源大模型的NSFW安全检测机制。临近毕业，感觉市场对提示词注入比较感兴趣，因本人读博期间一直研究对抗攻击算法，所以决定尝试用对抗攻击的思路完成提示词注入攻击，误导开源模型生成违规图像。完整代码链接：https://github.com/YujiangLi0v0/Injection_Attack_Inpainting.git 目录 * 一、 NSFW防线：开源模型的安全过滤机制 * 二、攻击场景定义 (Threat Model) * 三、环境搭建 * 四、核心攻击流程详解 * 4.1. 固定随机因子 * 4.2 数据预处理 * 4.3. 攻击部分 * 4.3.1 重写扩散模型推理过程