LLaMA-Factory 快速入门（五）：终端命令实操记录

优质文章学习记录

09 Apr 2026 — 5 min read

文章目录

1. 引言
2. 命令使用
3. 总结

1. 引言

在使用 LLaMA-Factory 进行大模型的微调、评估和部署时，llamafactory-cli 是最常用的命令行工具。它不仅支持命令行对话、训练、评估，还提供了网页界面、API 服务等多种交互方式。

本文将详细介绍 llamafactory-cli 的常用命令及其使用方法，帮助你快速上手并高效完成相关任务。

2. 命令使用

命令	功能简述
llamafactory-cli api	启动 OpenAI 风格的 API 服务
llamafactory-cli chat	在命令行中启动聊天界面
llamafactory-cli eval	评估模型
llamafactory-cli export	合并 LoRA 适配器并导出模型
llamafactory-cli train	训练模型
llamafactory-cli webchat	启动网页聊天界面
llamafactory-cli webui	启动 LlamaBoard 界面
llamafactory-cli version	显示版本信息

2.1 version（显示版本）

功能：显示 LLaMA-Factory 的版本信息，验证安装是否成功

执行命令：

llamafactory-cli version

执行后的效果如下：

2.2 webui（启动 LlamaBoard 界面）

功能：启动可视化界面 LlamaBoard，提供图形化操作入口

执行命令：

llamafactory-cli webui

执行后返回：

浏览器访问：http://127.0.0.1:7860

2.3 chat（命令行聊天）

功能：接在终端中与模型进行对话，无需启动网页

最小化命令：

llamafactory-cli chat \--model_name_or_path 模型名称或本地路径 \--template 模板名称

例如：

llamafactory-cli chat \--model_name_or_path /Users/yanglinwei/.cache/modelscope/hub/models/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B \--template deepseekr1

执行效果如下：

当然也可以从模型训练完的chekcpoint启动，命令如下：

llamafactory-cli chat \--model_name_or_path 模型名称或本地路径 \--adapter_name_or_path 训练后的路径\--template 模板名称

例如：

llamafactory-cli chat \--model_name_or_path /Users/yanglinwei/.cache/modelscope/hub/models/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B \--adapter_name_or_path saves/DeepSeek-R1-1.5B-Distill/lora/cx_666_final_optimized \--template deepseekr1

2.4 webchat（网页聊天）

功能：启动网页端聊天界面

webchat的功能跟chat命令差不多，只是webchat是给了一个web页面进行对话。最小化命令如下：

llamafactory-cli webchat \--model_name_or_path 模型名称或本地路径 \--template 模板名称

例如：

llamafactory-cli webchat \--model_name_or_path /Users/yanglinwei/.cache/modelscope/hub/models/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B \--template deepseekr1

当然也可以从模型训练完的chekcpoint启动webchat，跟chat命令差不多：

llamafactory-cli webchat \--model_name_or_path 模型名称或本地路径 \--adapter_name_or_path 训练后的路径\--template 模板名称

2.5 api（启动 API 服务）

功能：启动 OpenAI 风格的 API 服务

最小化命令：

llamafactory-cli chat \--model_name_or_path 模型名称或本地路径 \--template 模板名称

例如执行：

llamafactory-cli api \--model_name_or_path /Users/yanglinwei/.cache/modelscope/hub/models/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B \--template deepseekr1

可以看到输出了如下信息：

浏览器访问：http://localhost:8000/docs

可以看到开放了3种API，分别是：

接口名称	路径	说明
List Models	`/v1/models`	列出当前可用的模型，用于查看可选择的模型信息
Create Chat Completion	`/v1/chat/completions`	生成聊天回复，用于对话或文本生成
Create Score Evaluation	`/v1/score/evaluation`	对模型输出进行评分或评估，用于检测生成内容质量

直接执行ListModels列出当前可用的模型，可以看见返回：

执行Create Chat Completion，示例请求内容如下：

{"model":"deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B", "messages":[{"role":"user", "content":"你好，可以自我介绍一下吗？"}], "do_sample": true, "temperature":0.7, "top_p":0.9, "n":1, "max_tokens":512, "stream":false}

可以看到返回：

2.6 train（训练模型）

功能：启动训练流程，对模型进行微调

详情可以参考：《LLaMA-Factory 快速入门（一）：Mac 下大模型微调与部署全流程》

2.7 eval（评估模型）

功能：：对训练后的模型进行性能评估

详情可以参考：《LLaMA-Factory 快速入门（一）：Mac 下大模型微调与部署全流程》

2.8 export（导出模型）

功能：合并 LoRA 适配器并导出最终模型

详情可以参考：《LLaMA-Factory 快速入门（一）：Mac 下大模型微调与部署全流程》

3. 总结

本文详细介绍了 LLaMA-Factory 的命令行工具 llamafactory-cli 的常用功能，包括版本检查、命令行聊天、网页聊天、可视化界面、API 服务，以及训练、评估、导出等核心操作。

可以先从 chat / webchat 开始，快速体验模型效果；
如果需要部署服务，建议使用 api 模式；
完整训练流程中，train → eval → export 是必经的三个步骤。

通过灵活使用这些命令，大家可以快速搭建起属于自己的大模型微调与应用环境。

MC.JS WEBMC 1.8.8 PLUS MOBILE在在线教育中的应用案例

快速体验 1. 打开 InsCode(快马)平台 https://www.inscode.net 2. 输入框内输入如下内容：创建一个基于MC.JS WEBMC 1.8.8 PLUS MOBILE的教育演示项目。要求：1) 实现一个简单的3D编程教学环境；2) 包含5个循序渐进的编程练习任务；3) 添加教学注释和提示系统；4) 支持移动设备访问；5) 提供学生作品展示区。请使用响应式设计，确保在不同设备上都有良好的用户体验。 1. 点击'项目生成'按钮，等待项目生成完整后预览效果最近在尝试将游戏开发引入编程教学时，发现MC.JS WEBMC 1.8.8 PLUS MOBILE这个工具特别适合做在线教育场景的实践。通过浏览器就能创建3D编程环境的特点，

MogFace人脸检测模型-WebUIGPU算力方案：单卡并发处理20路实时流人脸检测

MogFace人脸检测模型-WebUIGPU算力方案：单卡并发处理20路实时流人脸检测 1. 项目概述 MogFace人脸检测模型是一个基于深度学习的先进人脸检测解决方案，专门针对复杂场景下的多角度人脸识别进行了优化。该模型采用ResNet101作为骨干网络，在CVPR 2022会议上发表，具有出色的检测精度和稳定性。本方案展示了如何通过WebUI界面和GPU加速技术，实现单张GPU卡同时处理20路实时视频流的人脸检测任务。无论是正面人脸、侧脸、戴口罩的人脸，还是在光线较暗的环境下，该模型都能准确识别并定位人脸位置。核心能力特点： * 高精度检测：在各种复杂条件下保持稳定的人脸识别能力 * 实时处理：单卡支持20路视频流同时处理 * 易用接口：提供直观的Web界面和完整的API接口 * 部署灵活：支持服务器部署和本地运行两种模式 2. 技术架构与性能优势 2.1 模型架构设计 MogFace模型采用精心设计的网络结构，在保持高精度的同时优化了计算效率： # 模型核心架构示意 class MogFace(nn.Module): def __init__(

新手教程：如何正确完成libwebkit2gtk-4.1-0安装配置

如何在 Linux 上正确安装并配置 libwebkit2gtk-4.1：从踩坑到实战你是不是也遇到过这种情况？刚写好一个基于 GTK 的浏览器小程序，兴冲冲地编译运行，结果终端弹出一行红色错误： error while loading shared libraries: libwebkit2gtk-4.1.so.0: cannot open shared object file 或者，在 apt install 时被告知： E: Unable to locate package libwebkit2gtk-4.1-0 别慌——这几乎是每个初次接触 WebKitGTK 开发的 Linux 新手都会踩的“入门级大坑”。今天我们就来彻底搞懂： libwebkit2gtk-4.1 到底是什么？为什么它这么难装？

本地服务器用 OpenClaw + Open WebUI 搭建企业多部门 AI 平台（附 Docker 避坑指南）

引言：最近在尝试使用 OpenClaw，发现这个 AI 个人助理框架非常有意思。于是团队里就有人提出：能不能为公司的多个部门，分别搭建专属的 OpenClaw 服务器？诚然，现在有钉钉、飞书等成熟的办公软件可以接入 AI，但对于一些尚未全面普及此类协作软件的企业（或者需要绝对私有化部署的团队）来说，独立搭建一套内部 AI 门户依然是刚需。起初，我们考虑直接让大家通过 OpenClaw 自带的 Web 界面进行跨电脑访问。但实操后发现这存在致命缺陷： 1. 权限越界：自带的 Web 端拥有底层的配置编辑权限，暴露给普通员工极其不安全。 2. 无法溯源：多终端共用一个 Web 界面，根本无法追溯对话是由谁发起的。 3. 缺乏隔离：无法按部门精细化分配 API 额度或限制特定部门只能访问特定的 OpenClaw 节点，无法实现业务隔离。为了解决这些痛点，我们最终确定了这套架构方案：

文章目录

1. 引言

2. 命令使用

2.1 version（显示版本）

2.2 webui（启动 LlamaBoard 界面）

2.3 chat（命令行聊天）

2.4 webchat（网页聊天）

2.5 api（启动 API 服务）

2.6 train（训练模型 ）

2.7 eval（评估模型 ）

2.8 export（导出模型 ）

3. 总结

Read more

MC.JS WEBMC 1.8.8 PLUS MOBILE在在线教育中的应用案例

MogFace人脸检测模型-WebUIGPU算力方案：单卡并发处理20路实时流人脸检测

新手教程：如何正确完成libwebkit2gtk-4.1-0安装配置

本地服务器用 OpenClaw + Open WebUI 搭建企业多部门 AI 平台（附 Docker 避坑指南）

2.6 train（训练模型）

2.7 eval（评估模型）

2.8 export（导出模型）