【模型手术室】第四篇：全流程实战 —— 使用 LLaMA-Factory 开启你的第一个微调任务

优质文章学习记录

09 Apr 2026 — 2 min read

专栏进度：04 / 10 (微调实战专题)
很多初学者卡在环境配置和复杂的 torch.train 逻辑上。LLaMA-Factory 的核心优势在于它集成了几乎所有主流国产模型（DeepSeek, Qwen, Yi）和海外模型（Llama 3, Mistral），并且原生支持 Gradio 可视化面板，让你在网页上点点鼠标就能“炼丹”。

一、环境搭建：打造你的“炼丹炉”

为了保证训练不因版本冲突而崩溃，建议使用 Conda 进行物理隔离。

Bash

克隆项目

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory

安装核心依赖 (针对 CUDA 12.1 环境)

pip install -e .[metrics,bitsandbytes,qwen]

验证是否安装成功

llamafactory-cli version

二、准备食材：注册你的“行业黑话”数据集

LLaMA-Factory 有一套自己的数据集管理逻辑。你需要把上一篇生成的 security_expert_data.jsonl 放入 data/ 目录，并在 data/dataset_info.json 中注册它。

注册示例：

JSON

“my_security_data”: {
“file_name”: “security_expert_data.jsonl”,
“columns”: {
“prompt”: “instruction”,
“query”: “input”,
“response”: “output”
}
}

三、点火炼丹：WebUI 模式与脚本模式

初学者推荐：WebUI 模式
在终端执行 llamafactory-cli webui。
你会看到一个极其直观的界面。你需要设置：

模型名称：选择 DeepSeek-V3 或 Qwen2.5-7B。

微调方法：选择 lora。

数据集：勾选你刚刚注册的 my_security_data。

学习率：建议 5e-5。

计算精度：显存够选 bf16，不够选 fp16 或 int4。

高阶推荐：命令行模式 (CLI)
一旦参数调优确定，建议使用脚本运行，更稳定且方便记录。

Bash

llamafactory-cli train
–stage sft
–do_train
–model_name_or_path /path/to/your/model
–dataset my_security_data
–template qwen
–finetuning_type lora
–output_dir ./saves/security_agent_v1
–per_device_train_batch_size 4
–gradient_accumulation_steps 4
–lr_scheduler_type cosine
–logging_steps 10
–save_steps 100
–learning_rate 5e-5
–num_train_epochs 3.0
–plot_loss
–fp16

四、关键指标：如何看懂“炼丹炉”里的 Loss 曲线

在训练过程中，你会看到一个不断下降的 Loss（损失值）曲线。

理想曲线：平稳下降，最后在某个数值（如 0.5 - 1.2 之间）开始横向震荡。

警报曲线：Loss 突然降到 0（过拟合，模型只会背书）或者 Loss 突然飙升（梯度爆炸，模型疯了）。

对策：如果 Loss 不降，调大 learning_rate；如果 Loss 波动太大，调小 learning_rate 并增大 batch_size。

五、避坑指南：显存溢出的“救命稻草”

如果你运行报错 OutOfMemoryError：

开启量化：使用 --quantization_bit 4。

降低长度：将 --cutoff_len 从 1024 降到 512。

梯度检查点：确保开启了 --gradient_checkpointing。

国产编程 AI 天花板来了！通义千问 Qwen3.6-Plus 深度测评：百万上下文 + 最强代码能力

📌 摘要 2026 年 4 月 2 日，阿里巴巴通义实验室正式发布新一代旗舰模型 Qwen3.6-Plus。这款模型以100 万 token 超长上下文、业界领先的 Agentic Coding 能力和原生多模态理解三大核心亮点，成为当下最值得关注的国产大模型。本文将从技术架构、核心能力、实测表现到使用指南，带你全面了解这款"编程最强国产 AI"。一、重磅发布：Qwen3.6-Plus 是什么？ Qwen3.6-Plus 是通义千问 Plus 系列的下一代进化版本，标志着阿里在通用人工智能领域的又一次重大突破。与此前开源的 Qwen3 系列不同，Qwen3.6-Plus 采用专有模型策略（非开源），仅通过 API 提供服务。这是阿里从开源生态向商业化旗舰模型转型的重要信号，旨在为企业提供更稳定、

【Harness】[特殊字符] 深度解析Claude Code：什么是真正的AI Agent？小白也能看懂的Harness工程指南

🔥 深度解析Claude Code：什么是真正的AI Agent？小白也能看懂的Harness工程指南本文将带你从零理解AI Agent的本质，并通过Claude Code这个顶级案例，学习如何构建一个完整的Agent系统。读完本文，你将彻底理解为什么"模型就是Agent"这个核心观点。 📌 写在前面你是不是也经常看到"AI Agent"、"智能体"这些词，感觉很高大上但又搞不清楚到底是什么？网上各种"无代码Agent平台"、"拖拽式工作流"让人眼花缭乱，好像拖几个节点就能造出智能体了？今天这篇文章，我要彻底打破你的认知——告诉你什么才是真正的Agent，以及我们应该如何正确地构建Agent系统。 🎯 核心观点：模型就是Agent 一句话总结 Agent是一个经过训练的神经网络模型，不是框架，不是提示词链，不是拖拽式工作流。让我用一个更直白的比喻： 💡 人类 = Agent（

阿里出了个 AI JetBrains 编程插件 Qoder，使用了一周，值得上车

上周在群里看到有人说阿里出了个叫 Qoder 的 AI 编程工具，说是直接支持 JetBrains 全系 IDE，不用再装 Cursor 切来切去了。我平时写后端用的就是 IntelliJ IDEA，当时就去下了一个试试。用了一周，把能测的功能基本过了一遍，这篇文章把我的真实情况写出来，顺便把安装怎么做也说清楚。 — Qoder 是什么，和通义灵码有什么关系先把这个问题说清楚，因为很多人第一反应是：阿里不是已经有通义灵码了吗，又出一个？这两个确实都是阿里做的，但不是一回事。通义灵码是早期的阿里 AI 编程工具，定位是代码补全和问答助手，功能相对基础；Qoder 是 2025 年 8 月 22 日对外正式发布的新产品，定位是"Agentic 编码平台"，面向海外开发者，走的是另一条路线。官方的说法是，

AI提示词管理工具AiShort

简介什么是 AiShort？ AiShort (原名 ChatGPT Shortcut) 是一个精选的 AI 提示词库，能帮助用户更高效地使用大语言模型（LLM），例如 ChatGPT。它内置了大量经过优化和筛选的提示词，覆盖写作、编程、学术、求职等多种场景。用户只需一键复制，即可获得高质量的 AI 回复，极大地提升了工作和学习效率。主要特点 * 精选提示词库：内置上百个专业、实用的提示词，并持续更新。 * 智能搜索与过滤：通过关键词搜索或标签分类，快速定位你需要的提示词。 * 多语言支持：所有提示词均已翻译成十多种主流语言，方便不同母语的用户使用。 * 一键复制：简化操作流程，点击即可复制提示词，直接粘贴到任何 AI 对话窗口。 * 无需注册：用户无需注册即可立即开始使用，方便快捷。 * 我的收藏（高级功能）：用户可以保存喜欢的提示，并进行排序和自定义标签管理。 * 导出功能：支持将所有提示导出为

一、 环境搭建：打造你的“炼丹炉”

二、 准备食材：注册你的“行业黑话”数据集

三、 点火炼丹：WebUI 模式与脚本模式

四、 关键指标：如何看懂“炼丹炉”里的 Loss 曲线

五、 避坑指南：显存溢出的“救命稻草”

Read more