Windows环境本地大模型工具链安装教程:Ollama + llama.cpp + LLaMA Factory

Windows 11 本地大模型工具链终极教程:Ollama + llama.cpp + LLaMA Factory

本教程将指导你在 Windows 11 系统上,将 Ollamallama.cppLLaMA Factory 三个工具统一安装到 E 盘,并实现 GPU 加速、数据集配置和一键启动。所有步骤均已实际验证,适用于 RTX 5080 等现代显卡。


📁 1. 统一文件夹结构(推荐)

E 盘 创建父文件夹 LLM,用于集中管理所有相关文件。子文件夹规划如下:

text

E:\LLM\ ├── Ollama\ # Ollama 程序安装目录 ├── OllamaModels\ # Ollama 下载的模型存放目录 ├── llama.cpp\ # llama.cpp 源码(git 克隆) ├── LLaMA-Factory\ # LLaMA Factory 源码(git 克隆) ├── LLaMAWork\ # 个人工作区(数据集、配置等) │ └── datasets\ # 自定义数据集目录 └── models\ # 手动存放的 GGUF 模型文件(可选) 

⚙️ 2. 安装 Ollama 并指定存储位置

2.1 下载安装包

访问 Ollama 官网,下载 OllamaSetup.exe

2.2 自定义安装路径

管理员身份打开命令提示符,进入安装包所在目录,执行:

cmd

OllamaSetup.exe /DIR="E:\LLM\Ollama" 

2.3 设置模型存放路径

通过系统环境变量指定模型下载位置:

  1. 打开“系统属性” → “高级” → “环境变量”。
  2. 在“系统变量”中点击“新建”,变量名 OLLAMA_MODELS,变量值 E:\LLM\OllamaModels
  3. 确定保存,并重启电脑或重启 Ollama 服务。

2.4 验证安装

打开新命令行,输入 ollama -v 查看版本。拉取一个小模型测试:

cmd

ollama run deepseek-r1:1.5b 

模型应下载到 E:\LLM\OllamaModels 中。


🏗️ 3. 编译 GPU 版 llama.cpp(支持 CUDA)

3.1 安装编译工具

  • 安装 Visual Studio 2022(社区版),勾选“使用 C++ 的桌面开发”工作负载。
  • 安装 CMake,并确保添加到系统 PATH。

3.2 下载源码

cmd

cd /d E:\LLM git clone https://github.com/ggerganov/llama.cpp.git 

3.3 编译(启用 CUDA 支持)

cmd

cd llama.cpp mkdir build cd build cmake .. -G "Visual Studio 17 2022" -A x64 -DGGML_CUDA=ON cmake --build . --config Release 

编译成功后,可执行文件位于 build\bin\Release\。你可以将这些 .exe 文件复制到 E:\LLM\llama.cpp\ 根目录,方便调用。

3.4 验证 GPU 支持

运行 llama-cli.exe --help,查看是否有 -ngl N(GPU 层数)参数。若有,则支持 GPU。


🐍 4. 安装 LLaMA Factory(基于 Python 3.11)

4.1 安装 Miniconda

  • Miniconda 官网 下载 Windows 安装包。
  • 安装时勾选“Add Miniconda3 to my PATH environment variable”
  • 安装路径建议使用默认(例如 D:\WorkApp\Python\miniconda3)。

4.2 接受 Anaconda 服务条款(必须执行)

在命令提示符中依次执行以下三条命令:

cmd

conda tos accept --override-channels --channel https://repo.anaconda.com/pkgs/main conda tos accept --override-channels --channel https://repo.anaconda.com/pkgs/r conda tos accept --override-channels --channel https://repo.anaconda.com/pkgs/msys2 

4.3 创建 Python 3.11 虚拟环境并激活

cmd

conda create -n llamafactory python=3.11 -y conda activate llamafactory 
注意:LLaMA Factory 要求 Python ≥ 3.11,请勿使用 3.10 或更低版本。

4.4 安装 PyTorch(RTX 50 系列显卡需使用特定版本)

cmd

pip install torch==2.6.0 torchvision==0.21.0 --index-url https://download.pytorch.org/whl/cu124 

如果遇到兼容性警告,可改用 nightly 版本:

pip install --pre torch torchvision --index-url https://download.pytorch.org/whl/nightly/cu124 

验证 GPU 可用性:

python

python -c "import torch; print(torch.cuda.is_available())" 

若输出 True,则 PyTorch 可识别 GPU。

4.5 获取 LLaMA Factory 源码

cmd

cd /d E:\LLM git clone https://github.com/hiyouga/LLaMA-Factory.git 

4.6 安装 LLaMA Factory(开发模式)

确保虚拟环境已激活,进入源码目录并安装:

cmd

cd LLaMA-Factory pip install -e .[torch,metrics] 

等待安装完成。测试安装:

cmd

python -c "import llamafactory; print('OK')" 

若输出 OK,则安装正确。


🧪 5. 配置数据集(WebUI 中显示)

5.1 准备数据集文件

假设你有一个 Alpaca 格式的数据集 my_data.json,内容如下:

json

[ {"instruction": "计算 2+2", "input": "", "output": "4"}, {"instruction": "解释机器学习", "input": "", "output": "机器学习是..."} ] 

5.2 创建 dataset_info.json

E:\LLM\LLaMAWork\datasets 目录下创建 dataset_info.json,内容如下:

json

{ "my_dataset": { "file_name": "my_data.json", "formatting": "alpaca", "columns": { "prompt": "instruction", "query": "input", "response": "output" } } } 

5.3 在 WebUI 中使用

  • 启动 WebUI(见下一节)。
  • 在“数据路径”输入框中填写 E:\LLM\LLaMAWork\datasets,然后点击刷新按钮
  • 下拉列表中应出现 my_dataset,选中即可。
提示:也可以将数据集直接放入 E:\LLM\LLaMA-Factory\data 目录,并在该目录下的 dataset_info.json 中添加条目,这样路径保持默认。

🚀 6. 一键启动脚本(终极版)

由于虚拟环境中的 llamafactory-cli 可能因入口点问题不可用,推荐使用 绝对路径调用 Python 模块 的方式启动,稳定可靠。

6.1 确定虚拟环境 Python 路径

激活环境后运行:

cmd

conda activate llamafactory where python 

记下输出,例如 D:\WorkApp\Python\miniconda3\envs\llamafactory\python.exe

6.2 创建批处理脚本

在桌面新建文本文件,改名为 启动_LLaMA_Factory.bat,用记事本编辑,内容如下(请替换路径):

batch

@echo off title LLaMA Factory WebUI REM 虚拟环境的 Python 解释器绝对路径 set VENV_PYTHON=D:\WorkApp\Python\miniconda3\envs\llamafactory\python.exe REM LLaMA Factory 源码目录 set SRC=E:\LLM\LLaMA-Factory cd /d %SRC% "%VENV_PYTHON%" -m llamafactory.cli webui --server-port 7861 pause 

6.3 运行

双击脚本,等待服务器启动,然后浏览器访问 http://localhost:7861 即可使用 WebUI 进行模型微调。


❓ 7. 常见问题及解决方法

7.1 conda 命令找不到

  • 确保安装 Miniconda 时勾选了“Add to PATH”。
  • 若未勾选,手动将 D:\WorkApp\Python\miniconda3\Scripts 添加到系统 PATH。

7.2 conda 提示“Terms of Service have not been accepted”

  • 执行第 4.2 节的三条 conda tos accept 命令。

7.3 虚拟环境中运行 llamafactory-cli 找不到命令

  • 可能入口点未注册,改用 python -m llamafactory.cli 方式(已集成到一键脚本中)。
  • 确保虚拟环境中已正确安装 LLaMA Factory(执行 pip install -e .[torch,metrics])。

7.4 安装时提示“requires a different Python: 3.10.20 not in ‘>=3.11.0’”

  • 说明你的虚拟环境 Python 版本过低,请按第 4.3 节重新创建 Python 3.11 环境。

7.5 WebUI 中数据集不显示

  • 检查 dataset_info.json 是否存在于你指定的“数据路径”目录中。
  • 点击刷新按钮。
  • 确保数据集文件格式正确(JSON 或 JSONL),且 file_name 路径正确(可使用绝对路径)。
  • 查看控制台(运行脚本的窗口)是否有错误信息。

7.6 base 环境能运行但虚拟环境不能

  • 说明 LLaMA Factory 误安装在 base 环境。解决方案:
    1. 在虚拟环境中重新安装(第 4.6 节)。
    2. 使用一键启动脚本,直接指定虚拟环境 Python。
    3. 可选:清理 base 环境中的残留(见第 8 节)。

🧹 8. 清理 base 环境中的残留(可选)

如果你在 base 环境中也安装过 LLaMA Factory,可以安全卸载:

cmd

conda activate base pip uninstall llamafactory -y 

然后手动删除 C:\Users\你的用户名\miniconda3\Scripts\llamafactory-cli.exe 等残留文件(如果有)。注意:不要随意卸载 base 环境中的其他包,以免影响 conda 自身功能。


✅ 9. 验证 GPU 是否正常工作

9.1 查看 llama.cpp 日志

运行 llama-server.exe -m model.gguf -ngl 99 时,控制台输出:

text

load_tensors: offloading 27 repeating layers to GPU load_tensors: offloaded 29/29 layers to GPU 

表示 GPU 已启用。

9.2 使用 nvidia-smi 监控

打开另一个命令行窗口,运行:

cmd

 持续监控(每秒刷新一次) nvidia-smi -l 1 

或者使用nvitop命令监控

 安装:pip install nvitop 运行:nvitop 

在推理过程中,观察 GPU-Util 和显存占用是否上升。


📝 10. 总结

通过本教程,你已经在 E 盘建立了一个整洁、高效的本地大模型环境:

  • Ollama:快速体验流行模型。
  • llama.cpp:高性能推理 GGUF 模型,GPU 加速。
  • LLaMA Factory:图形化微调模型,支持自定义数据集。

一键启动脚本让你无需记忆命令,双击即可启动 WebUI。所有工具均可独立更新,互不干扰。

以上内容由deepseek总结生成

Read more

Python Web 开发进阶实战:数字孪生平台 —— 在 Flask + Vue 中构建实时物理世界镜像

Python Web 开发进阶实战:数字孪生平台 —— 在 Flask + Vue 中构建实时物理世界镜像

第一章:什么是数字孪生? 1.1 定义与演进 * NASA 最初定义(2010):航天器的虚拟副本,用于地面测试 现代扩展: 产品孪生:单个设备(如风机)过程孪生:生产线流程系统孪生:整座工厂、城市 1.2 数字孪生 vs 传统可视化 维度传统 SCADA数字孪生 数据维度 | 仅数值 | 数值 + 空间位置 + 拓扑关系交互性 | 只读 | 可干预、可仿真预测能力 | 无 | 基于物理/数据模型推演未来 关键区别:双向闭环 物理 → 数据 → 虚拟 → 决策 → 物理(控制) 第二章:平台架构设计 2.1 整体数据流 [物理设备]

3步快速上手CloudBeaver:轻松搭建Web数据库管理平台

3步快速上手CloudBeaver:轻松搭建Web数据库管理平台 【免费下载链接】cloudbeaverCloud Database Manager 项目地址: https://gitcode.com/gh_mirrors/cl/cloudbeaver CloudBeaver是一款强大的开源云数据库管理工具,让你通过浏览器就能统一管理多种数据库。无论你是开发人员还是数据库管理员,都能快速搭建属于自己的数据库管理平台。本指南将带你从零开始,3步完成CloudBeaver的部署和使用。 🎯 为什么选择CloudBeaver? 你是否遇到过这些问题? * 需要在不同数据库之间频繁切换,操作繁琐 * 团队成员使用不同的数据库客户端,难以统一管理 * 想要通过Web界面远程管理数据库,但找不到合适的工具 CloudBeaver正是为解决这些问题而生: * 统一管理:支持MySQL、PostgreSQL、Oracle等主流数据库 * Web界面:无需安装客户端,浏览器即可访问 * 开源免费:完全开源,无需支付任何费用 📋 环境准备检查 在开始安装前,请确保你的

Java Web 汽车票网上预订系统系统源码-SpringBoot2+Vue3+MyBatis-Plus+MySQL8.0【含文档】

Java Web 汽车票网上预订系统系统源码-SpringBoot2+Vue3+MyBatis-Plus+MySQL8.0【含文档】

摘要 随着互联网技术的快速发展,传统汽车票购票方式已无法满足现代用户的便捷性需求。线下购票存在排队时间长、信息不透明、跨区域购票困难等问题,亟需通过信息化手段优化服务流程。汽车票网上预订系统通过整合线上线下资源,为用户提供实时查询、在线选座、电子支付等功能,大幅提升购票效率和用户体验。该系统不仅解决了传统购票模式的痛点,还为交通运营企业提供了数据分析和运营优化的支持,推动行业数字化转型。关键词:汽车票预订、数字化转型、用户体验、线上支付、SpringBoot。 本系统采用前后端分离架构,后端基于SpringBoot2框架搭建,结合MyBatis-Plus实现高效数据操作,MySQL8.0作为主数据库保障数据存储的稳定性和扩展性。前端使用Vue3框架开发,通过Axios与后端交互,实现动态数据渲染和响应式布局。系统核心功能包括用户注册登录、车次查询、在线选座、订单管理、支付接口集成等,同时支持管理员对车辆信息、班次调度、用户行为等数据的可视化分析。系统设计遵循高内聚低耦合原则,确保代码可维护性和可扩展性。关键词:SpringBoot2、Vue3、MyBatis-Plus、MySQL8

双剑破天门:攻防世界Web题解之独孤九剑心法(十)

双剑破天门:攻防世界Web题解之独孤九剑心法(十)

免责声明:用户因使用公众号内容而产生的任何行为和后果,由用户自行承担责任。本公众号不承担因用户误解、不当使用等导致的法律责任 **本文以攻防世界部分题为例进行演示,后续会对攻防世界大部分的web题目进行演示,如果你感兴趣请关注** 目录 一:Lottery 二:ics-05 三:总结 一:Lottery 打开后发现这个靶场加载异常缓慢,然后他还给了源码,我们先不看源码先熟悉一下这个网站是什么 这应该是一个类似猜数字游戏,选对7个号码即可得到相应奖励 然后注册 随便输入7个数字发现一个也没中,白费2元 然后我们随便点击这个网站的功能发现如果想要flag需要有相对应的余额 我们这会的思路就是利用bp抓包看看能不能修改我们的余额 好像成功了,我们试一试能不能换flag 居然说没有足够的钱,这个方法不行只要将页面上的数字修改只要刷新就会变回原来的余额 居然不能修改余额那就看看在猜数字的页面有没有突破口,发现其访问了api.php我们继续代码审计 看到如下核心代码,首先随机生成七位数字(random_win_nums)然后将其赋值给$win_number。随后关