LLaMAFactory、ModelScope 大模型微调实战（下）

优质文章学习记录

10 Apr 2026 — 4 min read

一、前言

上次简单介绍了下 LLaMAFactory、ModelScope的微调，今天再来总结下如何部署已经微调好的大模型。

直通车→→→ https://blog.ZEEKLOG.net/tadexinnian/article/details/159154443

本次演示基于魔搭社区（https://www.modelscope.cn/my/mynotebook）

二、将模型转换为gguf

2.1 克隆llama.cpp 并安装环境依赖

-- 进入根目录 cd /mnt/workspace -- 需要用 llama.cpp 仓库的 convert_hf_to_gguf.py 脚本来转换 git clone https://github.com/ggerganov/llama.cpp.git -- 进入llama.cpp文件夹 cd llama.cpp -- 创建虚拟环境 python -m venv .venv -- 进入虚拟环境 source .venv/bin/activate -- 安装依赖 pip install -r requirements.txt

2.2 转换模型为 gguf

python convert_hf_to_gguf.py /mnt/workspace/LLaMA-Factory/saves/qwen3_sft_merged --outtype q8_0 --verbose --outfile /mnt/workspace/LLaMA-Factory/saves/qwen3_sft_merged/Qwen3-4B-Instruct_q8_0.gguf

执行结束后，gguf 文件会保存在

/mnt/workspace/LLaMA-Factory/saves/qwen3_sft_merged/Qwen3-4B-Instruct_q8_0.gguf

三、部署

3.1 基于llmma.app （推荐）

github https://github.com/ggml-org/llama.cp

3.1.1 安装llama.app

可参考 https://github.com/ggml-org/llama.cpp/blob/master/docs/install.md#homebrew-mac-and-linux

brew install llama.cpp

***如果提示未安装brew 执行下面的命令

/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"

3.1.2 加载大模型（cli模式）

llama-cli -m /mnt/workspace/LLaMA-Factory/saves/qwen3_sft_merged/Qwen3-4B-Instruct_q8_0.gguf

可在命令行跟大模型提问

3.1.3 以服务的模式加载大模型（server模式）

llama-server -m /mnt/workspace/LLaMA-Factory/saves/qwen3_sft_merged/Qwen3-4B-Instruct_q8_0.gguf --port 8080 # Basic web UI can be accessed via browser: http://localhost:8080 # Chat completion endpoint: http://localhost:8080/v1/chat/completions

访问 http://localhost:8080

3.2 基于ollama

-- 进入合并后的模型目录 cd /mnt/workspace/LLaMA-Factory/saves/qwen3_sft_merged -- 创建模型 ollama create my-qwen3-4b-sft-merged -f Modelfile -- 启动模型 ollama run my-qwen3-4b-sft-merged

启动时候报错，这是因为我们使用的Qwen3模型，ollama还没有支持，建议使用llama.cpp方式测试部署。

四、将模型上传至modelscope

4.1 获取token

https://www.modelscope.cn/my/access/token

4.2 获取用户名

https://www.modelscope.cn/my/settings/account

4.3 上传模型

-- 上传gguf 版本 modelscope upload 你的用户名/qwen3-4b-sft-merged-gguf /mnt/workspace/LLaMA-Factory/saves/qwen3_sft_merged --token 你的token

4.4 查看上传结果

https://www.modelscope.cn/my/myspace

4.5 下载上传之后的模型

https://www.modelscope.cn/models/tadexinnian/qwen3-4b-sft-merged-gguf

-- 安装modelscope pip install modelscope -- 下载模型 modelscope download --model tadexinnian/qwen3-4b-sft-merged-gguf

以windows 下载为例子，模型最终下载保存在

C:\Users\PC\.cache\modelscope\hub\models\tadexinnian\qwen3-4b-sft-merged-gguf\Qwen3-4B-Instruct_q8_0.gguf

五、结语

本文完整呈现了微调后大模型从格式转换到实际部署的全流程实践，通过 llama.cpp 实现 HF 模型到 GGUF 格式的转换，借助 llama.app 完成 CLI 与 Server 模式部署，并记录了 Ollama 部署 Qwen3 模型时的兼容问题，同时演示了 GGUF 模型在 ModelScope 平台的上传与下载流程。

整套方案以 llama.cpp 工具链为核心，步骤清晰、可直接复现，为轻量化大模型的本地部署与模型分享提供了一套实用的工程化参考，也为后续同类模型的落地与优化奠定了基础。

深度解析 MySQL 与 MCP 集成：从环境构建到 AI 驱动的数据交互全流程

前言在当前大语言模型（LLM）应用开发的浪潮中，MCP（Model Context Protocol）协议正在成为连接 AI 模型与本地数据设施的关键桥梁。本文将以 MySQL 数据库为例，详细拆解如何通过 MCP 协议让 AI 模型直接操作关系型数据库，涵盖从服务器发现、数据库架构设计、数据初始化、MCP 配置文件编写到复杂自然语言查询与写入的全过程。第一部分：MCP 服务器的发现与配置获取在进行任何数据交互之前，首要任务是确立连接协议与服务源。通过蓝耘 MCP 广场，开发者可以快速检索并获取所需的 MCP 服务器配置。在搜索栏输入 mysql 关键字，系统会立即检索出相关的 MCP 服务器资源。如下图所示，搜索结果中清晰展示了 MySQL 对应的 MCP 服务卡片。点击选中该 MCP 服务器后，

字节开源 DeerFlow 2.0——登顶 GitHub Trending 1，让 AI 可做任何事情

打开 deerflow 的官网，瞬间被首页的这段文字震撼到了，do anything with deerflow。让 agent 做任何事情，这让我同时想到了 openclaw 刚上线时场景。字节跳动将 DeerFlow 彻底重写，发布 2.0 版本，并在发布当天登上 GitHub Trending 第一名。这不是一次功能迭代，而是一次从"深度研究框架"到"Super Agent 运行时基础设施"的彻底蜕变。背景：从 v1 到 v2，发生了什么？ DeerFlow（Deep Exploration and Efficient Research Flow）

OpenClaw 生态主流 AI 模型真实性能 PinchBench深度解读（基于2026年3月12日测评数据）

OpenClaw 生态主流 AI 模型真实性能深度解读（2026年3月）基于 PinchBench 最新测评数据（2026-03-12），全面解析 39 款主流 AI 模型在 OpenClaw 生态中的真实表现 📊 测评概述本次测评涵盖 23 项真实场景任务，包括： * 📅 日历管理 * 💻 代码编写 * 📖 文档理解 * 🧠 上下文记忆 * 🔍 信息检索 * ✍️ 内容创作 * 📊 数据分析测评维度包括： * 成功率：任务完成的准确性 * 速度：响应时间 * 成本：API 调用费用 * 价值：性价比综合评估 🏆 总体排名 Top 10 排名模型综合成功率亮点🥇moonshotai/kimi-k2.583.5%全能王者，各项均衡🥈anthropic/claude-opus-4.

智谱AI API接入实战：免费模型不限量使用指南（含若手软件配置示例）

本教程适用于有AI能力的软件，例如：若手内容管家（批量生成内容、图片）：https://www.ruoshou.com/soft/2.html 若手AI重命名（智能修改文件名）：https://www.ruoshou.com/soft/3.html 其他非若手软件产品，但使用标准OpenAI API 格式请求的软件同样通用基本信息 1. 平台地址：https://www.bigmodel.cn/ 2. KEY地址：https://www.bigmodel.cn/usercenter/proj-mgmt/apikeys 3. 模型、价格列表：https://www.bigmodel.cn/pricing 4.