LLaMA-Factory全流程训练模型

优质文章学习记录

10 Apr 2026 — 5 min read

🤗本文主要讲述在docker下使用LLaMA-Factory训练推理模型。

🫡拉取镜像

首先需要启动docker，然后在终端中输入：

docker run -tid --gpus all -p 8000:8000 --name LLM -e NVIDIA_DRIVER_CAPABILITIES=compute,utility -e NVIDIA_VISIBLE_DEVICES=all --privileged=true ubuntu:20.04

这个命令启动了一个 Ubuntu 20.04 容器，使用所有可用的 GPU
主机的 8000 端口映射到容器的 8000 端口
容器命名为 LLM，以特权模式运行容器

进入容器

docker exec -it LLM /bin/bash

🥰但现在还不行，我们只将GPU映射到了docker里，还没有安装驱动。

wget https://developer.download.nvidia.com/compute/cuda/12.6.2/local_installers/cuda_12.6.2_560.35.03_linux.run

然后运行程序

sh cuda_12.6.2_560.35.03_linux.run

随后会生成一些指引，默认安装就行。

root@82c2f2b69781:/home# ls /usr/local/ | grep cuda cuda cuda-12.6 root@82c2f2b69781:/home# nvcc -V bash: nvcc: command not found

这说明系统的 PATH 环境变量没有包含 /usr/local/cuda-12.6/bin

编辑环境变量 vim ~/.bashrc 加入下面两行： export PATH=/usr/local/cuda-12.6/bin:$PATH export LD_LIBRARY_PATH=/usr/local/cuda-12.6/lib64:$LD_LIBRARY_PATH 然后重新运行一下就生效了： source ~/.bashrc

验证成功 ~

root@82c2f2b69781:/home# echo $PATH /usr/local/cuda-12.6/bin:/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin

🤗docker内安装python

docker拉取的Ubuntu20.04没有任何配置，比如wget等命令需要自己通过apt-get install 安装

Index of /ftp/python/3.10.6/ 这是python源码包的地址（3.10.6为例）

wget https://www.python.org/ftp/python/3.10.6/Python-3.10.6.tgz

tar -zxvf Python-3.10.6.tgz cd Python-3.10.6 sudo ./configure # configure 脚本会检查系统环境，并生成 Makefile 文件，以便后续的 make 命令可以正确编译源代码

🤗最后一步：

sudo make sudo make test sudo make install

💥LLaMA-Factory

💫安装：

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git cd LLaMA-Factory pip install -e ".[torch,metrics]"

如果使用昇腾NPU的话，先设置一下环境变量：

export ASCEND_HOME_PATH=/usr/local/Ascend/ascend-toolkit/latest

💫下载模型：

git lfs install git clone https://www.modelscope.cn/Qwen/Qwen2.5-1.5B-Instruct.git

💫我们在 LLaMA-Factory/examples下创建 train.yaml 文件，这是微调训练模型的配置文件

### model model_name_or_path: /home/Qwen/Qwen2___5-1___5B-Instruct ### method stage: sft do_train: true finetuning_type: freeze # lora_target: all dataset: alpaca_zh_demo template: qwen cutoff_len: 10240 max_samples: 1000 overwrite_cache: true preprocessing_num_workers: 16 ### output output_dir: output logging_steps: 10 save_steps: 500 plot_loss: true overwrite_output_dir: true ### train per_device_train_batch_size: 1 gradient_accumulation_steps: 2 learning_rate: 1.0e-4 num_train_epochs: 3.0 lr_scheduler_type: cosine warmup_ratio: 0.1 fp16: true ddp_timeout: 180000000 ### eval val_size: 0.1 per_device_eval_batch_size: 1 eval_strategy: steps eval_steps: 500

💫使用vim写好后，我们使用 LLaMA-Factory/data/ alpaca_zh_demo.json这个数据集

instruction 部分描述了任务的具体指令。
input 部分通常包含任务所需的输入数据或信息。
output 部分是模型的输出。

💫开始微调训练

llamafactory-cli train examples/train.yaml

🕛️🕧️🕐️🕜️🕑️🕝️🕒️🕞️🕓️

loss ：模型在当前批次上的预测结果与实际标签之间的差异。
grad_norm：模型参数梯度的范数，反映梯度的大小，用于监控梯度爆炸或梯度消失的问题。
learning_rate：学习率是优化器在更新模型参数时使用的步长。
epoch：整个训练数据集被模型完整遍历的次数，一个 epoch 包含多个批次（batch）。

训练指标总结

***** train metrics ***** epoch = 3.0 total_flos = 2906404GF train_loss = 1.0846 train_runtime = 0:04:15.80 train_samples_per_second = 10.555 train_steps_per_second = 5.277

epoch: 训练的总轮次（3.0 个 epoch）。
total_flos: 训练过程中总共计算的浮点运算次数（2906404 亿次浮点运算）。
train_loss: 训练过程中的平均损失值（1.0846）。
train_runtime: 训练总共花费的时间（4 分 15.80 秒）。
train_samples_per_second: 每秒处理的样本数（10.555 个样本/秒）。
train_steps_per_second: 每秒处理的批次数（5.277 个批次/秒）。

💫 训练结束 ~

这是模型微调后产生的输出文件，包含了训练过程中生成的各种配置、权重、日志和结果

💯这时我们可以加载这个训练后的模型权重来对话：

from transformers import AutoModelForCausalLM, AutoTokenizer import torch # 我们的模型输出路径 model_name_or_path = "/home/LLaMA-Factory/output" model = AutoModelForCausalLM.from_pretrained(model_name_or_path) tokenizer = AutoTokenizer.from_pretrained(model_name_or_path) device = "cuda" if torch.cuda.is_available() else "cpu" model.to(device) prompt = "列出一个应该在野营应急包中的7件物品。" inputs = tokenizer(prompt, return_tensors="pt").to(device) with torch.no_grad(): outputs = model.generate(inputs.input_ids, max_length=50) response = tokenizer.decode(outputs[0], skip_special_tokens=True) print(response)

💦输出：

💯评估

Llamafactory 支持mmlu、cmmlu、ceval三种数据集验证。

llamafactory-cli eval --task mmlu --model_name_or_path /home/Qwen/Qwen2___5-1___5B-Instruct --template qwen --batch_size 1 –n_shot 5

💯推理

我们在LLaMA-Factory/examples 目录下新建一个 infer.yaml 文件进行推理，内容：

model_name_or_path: /home/Qwen/Qwen2___5-1___5B-Instruct template: qwen do_sample: false

运行：

 llamafactory-cli chat infer.yaml

Neo4j：图数据库使用入门

文章目录 * 一、Neo4j安装 * 1、windows安装 * （1）准备环境 * （2）下载 * （3）解压 * （4）运行 * （5）基本使用 * 2、docker安装 * 二、CQL语句 * 1、CQL简介 * 2、CREATE 命令，创建节点、关系、属性 * 3、MATCH 命令，查询 * 4、return语句 * 5、where子句 * 6、创建关系 * 7、delete删除节点和关系 * 8、remove删除标签和属性 * 9、set添加、更新属性 * 10、ORDER BY排序 * 11、UNION合并 * 12、

WIN11必备！QTTabBar中文优化版保姆级安装教程（含常见问题解决）

WIN11效率革命：深度定制你的资源管理器，不止于多标签如果你和我一样，每天要在Windows的资源管理器里花费大量时间，那你一定对那种反复在层层文件夹中穿梭、找不到上一个窗口的体验深恶痛绝。系统自带的文件管理工具，就像一个功能简陋的毛坯房，勉强能用，但毫无效率与舒适度可言。尤其是升级到WIN11后，虽然界面更现代，但核心的文件管理逻辑依然停留在上个时代，对于追求效率的用户来说，这无疑是一种巨大的生产力损耗。这篇文章，就是为那些不愿忍受现状，但又不想投入过多精力去学习复杂新软件的WIN10/WIN11用户准备的。我们不讨论那些需要彻底改变操作习惯的“重型”第三方管理器，而是聚焦于一种更优雅、更无感的解决方案：增强你正在使用的资源管理器本身。今天的主角，是一个经过国内开发者精心“魔改”的经典工具——QTTabBar的中文优化版。它就像给你的文件管理器做了一次精装修，保留了熟悉的格局，却赋予了它全新的、高效的能力。接下来，我将带你从零开始，完成这次效率升级，并深入探讨如何根据你的习惯，将它调校成最趁手的工具。 1. 为什么选择增强，而非替换？在深入安装细节之前，我们有必要先

Java Web HTML问卷调查系统系统源码-SpringBoot2+Vue3+MyBatis-Plus+MySQL8.0【含文档】

摘要随着互联网技术的快速发展，在线问卷调查系统已成为企业、教育机构和政府部门收集数据的重要工具。传统的纸质问卷调查方式效率低下，数据统计和分析过程繁琐，而基于Web的问卷调查系统能够实现问卷的快速创建、分发和数据分析，显著提升工作效率。此外，现代用户对系统的交互体验和响应速度提出了更高要求，因此开发一个高效、稳定且用户友好的在线问卷调查系统具有重要的现实意义。关键词：问卷调查系统、Web应用、数据收集、效率提升、用户交互。本系统采用前后端分离架构，后端基于SpringBoot2框架搭建，结合MyBatis-Plus实现高效数据库操作，MySQL8.0作为数据存储方案，确保系统的高性能和可扩展性。前端使用Vue3框架开发，利用其响应式特性和组件化设计提升用户体验。系统核心功能包括问卷创建、问题管理、用户权限控制、数据统计与可视化分析等，同时支持多终端适配，满足不同场景下的使用需求。关键词：SpringBoot2、Vue3、MyBatis-Plus、MySQL8.0、前后端分离、数据可视化。数据表设计问卷信息数据表问卷信息数据表用于存储用户创建的问卷基本信息，包括标题、

Python爬虫实战：高效解析Web of Science文献数据并导出CSV

1. 从零开始：为什么科研人员需要掌握Python爬虫如果你是一名研究生、博士生，或者正在从事学术研究，我猜你一定有过这样的经历：为了写一篇综述或者做文献计量分析，你需要手动从Web of Science（WoS）上，一篇一篇地复制粘贴文献的标题、作者、摘要、关键词、发表年份、期刊信息……这个过程不仅枯燥乏味，而且极其容易出错，复制到第50篇的时候，你可能已经头晕眼花，甚至怀疑人生了。我当年读博的时候，为了分析一个领域近十年的研究趋势，需要收集上千篇文献数据，手动操作几乎是不可能完成的任务。正是这种“痛点”，让我下定决心研究如何用技术解放双手。 Python爬虫，听起来像是程序员专属的高深技术，但其实它离我们科研人员并不遥远。简单来说，爬虫就是一个能自动访问网页、抓取并整理信息的程序。对于Web of Science这样的学术数据库，虽然它提供了强大的检索功能，但批量导出详细数据（尤其是摘要、作者机构等）到本地进行深度分析，往往需要付费或者功能受限。自己写一个爬虫，就成了最高效、最灵活的解决方案。它能让你在喝杯咖啡的功夫，