LLaMA-Factory 快速入门（五）：终端命令实操记录

优质文章学习记录

10 Apr 2026 — 5 min read

文章目录

1. 引言
2. 命令使用
3. 总结

1. 引言

在使用 LLaMA-Factory 进行大模型的微调、评估和部署时，llamafactory-cli 是最常用的命令行工具。它不仅支持命令行对话、训练、评估，还提供了网页界面、API 服务等多种交互方式。

本文将详细介绍 llamafactory-cli 的常用命令及其使用方法，帮助你快速上手并高效完成相关任务。

2. 命令使用

命令	功能简述
llamafactory-cli api	启动 OpenAI 风格的 API 服务
llamafactory-cli chat	在命令行中启动聊天界面
llamafactory-cli eval	评估模型
llamafactory-cli export	合并 LoRA 适配器并导出模型
llamafactory-cli train	训练模型
llamafactory-cli webchat	启动网页聊天界面
llamafactory-cli webui	启动 LlamaBoard 界面
llamafactory-cli version	显示版本信息

2.1 version（显示版本）

功能：显示 LLaMA-Factory 的版本信息，验证安装是否成功

执行命令：

llamafactory-cli version

执行后的效果如下：

2.2 webui（启动 LlamaBoard 界面）

功能：启动可视化界面 LlamaBoard，提供图形化操作入口

执行命令：

llamafactory-cli webui

执行后返回：

浏览器访问：http://127.0.0.1:7860

2.3 chat（命令行聊天）

功能：接在终端中与模型进行对话，无需启动网页

最小化命令：

llamafactory-cli chat \--model_name_or_path 模型名称或本地路径 \--template 模板名称

例如：

llamafactory-cli chat \--model_name_or_path /Users/yanglinwei/.cache/modelscope/hub/models/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B \--template deepseekr1

执行效果如下：

当然也可以从模型训练完的chekcpoint启动，命令如下：

llamafactory-cli chat \--model_name_or_path 模型名称或本地路径 \--adapter_name_or_path 训练后的路径\--template 模板名称

例如：

llamafactory-cli chat \--model_name_or_path /Users/yanglinwei/.cache/modelscope/hub/models/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B \--adapter_name_or_path saves/DeepSeek-R1-1.5B-Distill/lora/cx_666_final_optimized \--template deepseekr1

2.4 webchat（网页聊天）

功能：启动网页端聊天界面

webchat的功能跟chat命令差不多，只是webchat是给了一个web页面进行对话。最小化命令如下：

llamafactory-cli webchat \--model_name_or_path 模型名称或本地路径 \--template 模板名称

例如：

llamafactory-cli webchat \--model_name_or_path /Users/yanglinwei/.cache/modelscope/hub/models/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B \--template deepseekr1

当然也可以从模型训练完的chekcpoint启动webchat，跟chat命令差不多：

llamafactory-cli webchat \--model_name_or_path 模型名称或本地路径 \--adapter_name_or_path 训练后的路径\--template 模板名称

2.5 api（启动 API 服务）

功能：启动 OpenAI 风格的 API 服务

最小化命令：

llamafactory-cli chat \--model_name_or_path 模型名称或本地路径 \--template 模板名称

例如执行：

llamafactory-cli api \--model_name_or_path /Users/yanglinwei/.cache/modelscope/hub/models/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B \--template deepseekr1

可以看到输出了如下信息：

浏览器访问：http://localhost:8000/docs

可以看到开放了3种API，分别是：

接口名称	路径	说明
List Models	`/v1/models`	列出当前可用的模型，用于查看可选择的模型信息
Create Chat Completion	`/v1/chat/completions`	生成聊天回复，用于对话或文本生成
Create Score Evaluation	`/v1/score/evaluation`	对模型输出进行评分或评估，用于检测生成内容质量

直接执行ListModels列出当前可用的模型，可以看见返回：

执行Create Chat Completion，示例请求内容如下：

{"model":"deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B", "messages":[{"role":"user", "content":"你好，可以自我介绍一下吗？"}], "do_sample": true, "temperature":0.7, "top_p":0.9, "n":1, "max_tokens":512, "stream":false}

可以看到返回：

2.6 train（训练模型）

功能：启动训练流程，对模型进行微调

详情可以参考：《LLaMA-Factory 快速入门（一）：Mac 下大模型微调与部署全流程》

2.7 eval（评估模型）

功能：：对训练后的模型进行性能评估

详情可以参考：《LLaMA-Factory 快速入门（一）：Mac 下大模型微调与部署全流程》

2.8 export（导出模型）

功能：合并 LoRA 适配器并导出最终模型

详情可以参考：《LLaMA-Factory 快速入门（一）：Mac 下大模型微调与部署全流程》

3. 总结

本文详细介绍了 LLaMA-Factory 的命令行工具 llamafactory-cli 的常用功能，包括版本检查、命令行聊天、网页聊天、可视化界面、API 服务，以及训练、评估、导出等核心操作。

可以先从 chat / webchat 开始，快速体验模型效果；
如果需要部署服务，建议使用 api 模式；
完整训练流程中，train → eval → export 是必经的三个步骤。

通过灵活使用这些命令，大家可以快速搭建起属于自己的大模型微调与应用环境。

宇树 G1 机器人开发入门：有线 & 无线连接完整指南

适用读者：机器人二次开发者、科研人员开发环境：Ubuntu 20.04（推荐）机器人型号：Unitree G1 EDU+ 前言宇树 G1 是一款面向科研与商业应用的高性能人形机器人，支持丰富的二次开发接口。在正式进行算法调试与功能开发之前，首要任务是建立稳定的开发连接。本文将详细介绍两种主流连接方式：有线（网线直连）与无线（WiFi + SSH），并附上完整的配置流程，帮助开发者快速上手。一、有线连接（推荐新手优先使用）有线连接通过网线直接将开发电脑与 G1 机器人相连，具有延迟低、稳定性高、不依赖外部网络的优势，是新手入门和底层调试的首选方式。 1.1 前置条件所需物品说明开发电脑推荐安装 Ubuntu 20.04，或在 Windows 上使用虚拟机宇树 G1 机器人确保已开机且处于正常状态网线（

Magic API：低代码接口开发平台完全指南

Magic API：低代码接口开发平台完全指南 🌟 你好，我是励志成为糕手！ 🌌 在代码的宇宙中，我是那个追逐优雅与性能的星际旅人。 ✨ 每一行代码都是我种下的星光，在逻辑的土壤里生长成璀璨的银河； 🛠️ 每一个算法都是我绘制的星图，指引着数据流动的最短路径； 🔍 每一次调试都是星际对话，用耐心和智慧解开宇宙的谜题。 🚀 准备好开始我们的星际编码之旅了吗？目录 * Magic API：低代码接口开发平台完全指南 * 摘要 * 1. Magic API概述与核心概念 * 1.1 什么是Magic API * 1.2 Magic API的核心特性 * 1.3 Magic API的设计理念 * 2. Magic API架构设计与组件分析 * 2.1 整体架构概览 * 2.2 API引擎工作原理 * 2.3 脚本引擎与SQL执行机制 * 3. Magic API核心功能实现

Qwen3-VL-8B Web系统实操手册：proxy_server.py CORS配置与安全加固

Qwen3-VL-8B Web系统实操手册：proxy_server.py CORS配置与安全加固 1. 系统定位与核心价值你正在部署的不是一个简单的网页聊天框，而是一套开箱即用、生产就绪的AI对话基础设施。它把通义千问最新视觉语言模型（Qwen3-VL-8B）的能力，通过一个轻量但健壮的代理层，稳稳地交到用户浏览器手中。很多人卡在第一步：前端页面能打开，但发消息就报错“CORS blocked”；或者本地跑通了，一放到局域网里别人就访问不了；更常见的是，刚调通API，转头就发现日志里全是可疑的400/403请求——这些都不是模型的问题，而是代理服务器这道“门卫”的配置没到位。本手册不讲大道理，只聚焦一件事：让你的 proxy_server.py 既通得开，又守得住。我们会从零开始梳理它的CORS策略设计逻辑，手把手调整关键参数，再叠加三层实用级安全加固措施。所有操作都基于你已有的项目结构，无需重装、不改架构，改几行代码、加几个配置，就能让系统从“能用”升级为“

ofa_image-caption代码实例：扩展支持WebP格式与EXIF元数据保留功能

ofa_image-caption代码实例：扩展支持WebP格式与EXIF元数据保留功能 1. 引言你有没有遇到过这种情况？从手机或相机里导出一堆照片，想快速整理归档，却要一张张手动写描述，费时又费力。或者，在做内容创作时，需要为大量图片配上精准的英文说明，人工处理效率极低。今天要介绍的这个工具，就是来解决这个痛点的。它叫 ofa_image-caption，是一个纯本地运行的图像描述生成工具。简单来说，你给它一张图，它就能用英文告诉你这张图里有什么。这个工具的核心是基于一个叫 OFA 的模型，这个模型在图像描述生成领域表现很不错。我们之前发布的版本已经能很好地处理 JPG、PNG 这些常见格式了。但最近，越来越多的用户开始使用 WebP 这种更高效的图片格式，同时，很多摄影师和内容创作者也希望生成的描述能保留图片拍摄时的原始信息（比如拍摄时间、相机型号）。所以，我们对这个工具进行了一次重要的升级。这篇文章，我就带你手把手看看，我们是如何在原有代码基础上，扩展了对 WebP 格式的支持，并实现了 EXIF 元数据的保留功能。

文章目录

1. 引言

2. 命令使用

2.1 version（显示版本）

2.2 webui（启动 LlamaBoard 界面）

2.3 chat（命令行聊天）

2.4 webchat（网页聊天）

2.5 api（启动 API 服务）

2.6 train（训练模型 ）

2.7 eval（评估模型 ）

2.8 export（导出模型 ）

3. 总结

Read more

宇树 G1 机器人开发入门：有线 & 无线连接完整指南

Magic API：低代码接口开发平台完全指南

Qwen3-VL-8B Web系统实操手册：proxy_server.py CORS配置与安全加固

ofa_image-caption代码实例：扩展支持WebP格式与EXIF元数据保留功能

2.6 train（训练模型）

2.7 eval（评估模型）

2.8 export（导出模型）