旧电脑 Win7 复活计划:编译与运行 llama.cpp (Qwen3版)

旧电脑 Win7 复活计划:编译与运行 llama.cpp (Qwen3版)

🦕 旧电脑 Win7 复活计划:编译与运行 llama.cpp (Qwen3版)

这份指南专为不支持新版软件的 Windows 7 设计,通过本地编译实现大模型运行。

手动编译可以获得最好的性能,不想自己手动编译 可以直接使用下面编译好的bin文件,同时包含下面用到的相关软件和替换文件httplib.h
链接:https://pan.quark.cn/s/2c5f627c93d7
提取码:cSJh

📋 0. 软件版本清单

请务必确保使用以下特定版本,以保证在 Win7 下的兼容性:

软件名称文件名 (根据截图)作用备注
编译环境w64devkit-x64-2.5.0.7z.exe提供 GCC 编译器核心工具
构建工具cmake-3.31.10-windows-x86_64.msi生成编译配置必须安装到默认路径
源码工具Git_for_Windows_(64bit)_v2.45.2.exe下载代码
浏览器Firefox Setup 115.30.0esr.exe唯一推荐Win7 支持的最后版本,用于打开聊天界面
备用浏览器109.0.5414.120_chrome_installer.exeChrome 109Win7 支持的最后 Chrome 版本

📥 第一阶段:下载代码并替换httplib.h (使用 Git Bash)

操作环境:Windows 桌面/资源管理器

  1. 准备目录:建议在 C 盘根目录 下操作,路径短,不容易出错。
  2. 打开 Git:在 C 盘空白处右键 -> “Open Git Bash here”
  3. 执行命令(请一行一行复制运行):
# 1. 克隆 llama.cpp 仓库git clone https://github.com/ggerganov/llama.cpp.git # 2. 进入文件夹cd llama.cpp # 3. 【核心步骤】切换到支持 Qwen3 的特定版本 (Tag: b5092)git checkout b5092 # 4. 【核心步骤】替换 /examples/server/httplib.h 文件 夸克网盘自取 
  1. 确认路径:确保代码文件夹就在 C:\llama.cpp

🛠️ 第二阶段:准备编译环境

操作环境w64devkit.exe 黑色终端

  1. 🛑 关闭杀毒软件 (Win7 必做)
    • 请务必彻底退出 360、腾讯管家、金山毒霸等。
    • 原因:Win7 下这些软件会拦截编译器生成的 conftest.exe 等临时文件,直接导致 Access Violation 报错。
  2. 启动编译终端
    • 解压 w64devkit-x64-2.5.0.7z.exe
    • 双击运行文件夹内的 w64devkit.exe
    • 在黑框中输入以下命令(注意路径写法):

进入代码目录

cd /c/llama.cpp 

⚙️ 第三阶段:清理与配置 (CMake)

操作环境w64devkit.exe 黑色终端

    • 直接复制下面这行长命令运行:
    • 成功标志:屏幕滚动后显示 Generating done

生成配置文件 (Win7 专用修复版)

"C:\Program Files\CMake\bin\cmake.exe". -G "MinGW Makefiles" -DLLAMA_CURL=OFF -DLLAMA_BUILD_TESTS=OFF -DCMAKE_C_COMPILER=gcc -DCMAKE_CXX_COMPILER=g++ 

清理环境 (防止旧缓存报错)

rm -f CMakeCache.txt rm -rf CMakeFiles 

🚀 第四阶段:执行编译

操作环境w64devkit.exe 黑色终端

    • -j4 表示使用 4 线程加速,如果电脑配置极低可改为 -j2
  1. 等待完成
    • 耐心等待进度条走到 [100%]
    • 编译完成后,bin 文件夹下会出现 llama-server.exe

开始编译

"C:\Program Files\CMake\bin\cmake.exe" --build . --config Release -j4 

✅ 第五阶段:验证结果

    • 在当前终端输入:
    • 看到 commit d3bd719 字样即为成功。

检查版本

./bin/llama-server.exe --version 

🤖 第六阶段:启动 Qwen3 模型 (Win7 专用方案)

Win7 的 CMD 窗口无法很好地显示聊天文字,必须使用浏览器模式

准备工作

  • 安装 Firefox 115 ESR (Firefox Setup 115.30.0esr.exe)。这是 Win7 下最稳定、兼容性最好的现代浏览器。

情况 A:加载 .gguf 文件

假设模型文件在 C:\models\qwen3.gguf

    • -c 4096: 上下文长度。如果内存大于 16G,可以设为 8192 或更高。

启动命令

./bin/llama-server.exe -m "/c/models/qwen3.gguf" -c 4096 --host 0.0.0.0 --port 8080

情况 B:加载 Ollama 缓存模型

如果你用 Ollama 下载过 Qwen3,可以直接利用它的缓存文件(无需转换)。

  1. 找到 Blob 文件
    • 路径:C:\Users\你的用户名\.ollama\models\blobs
    • 找到最大的那个文件(例如 sha256-abc1234...)。

启动命令

./bin/llama-server.exe -m "/c/Users/Administrator/.ollama/models/blobs/sha256-你的文件名..." -c 4096 --host 0.0.0.0 --port 8080

🌐 最后一步:开始对话

  1. 当黑框显示 HTTP server listening 时,保持黑框开启(不要关闭)。
  2. 打开 Firefox 115 浏览器。
  3. 地址栏输入:http://127.0.0.1:8080
  4. 界面加载后,即可在浏览器中与 Qwen3 流畅对话!
在这里插入图片描述

Read more

GpuGeek 大模型教程:凭借镜像与资源优势,带你畅行垂直 AI 领域

GpuGeek 大模型教程:凭借镜像与资源优势,带你畅行垂直 AI 领域

我的个人主页我的专栏:人工智能领域、java-数据结构、Javase、C语言,MySQL,希望能帮助到大家!!!点赞👍收藏❤ 文章目录 * 一:引言 * 二: GPUGEEK 平台的详细概述 * 2.1 充沛的算力资源 * 2.2丰富多元的镜像资源 * 2.3 繁荣的模型市场 * 2.4 灵活弹性的计费模式 * 2.5与其他平台的对比 * 三:接下来将带领大家进行GPUGEEk的注册 * 四:在线大模型的体验 * 4.1API 调用 * 4.1.1使用 Node.js 客户端调用 API * 4.1.2使用 Python 客户端调用 API * 4.1.

Python常用医疗AI库以及案例解析(2025年版、上)

Python常用医疗AI库以及案例解析(2025年版、上)

随着人工智能在医疗领域的持续深入发展,Python 已经成为医疗 AI 项目的首选开发语言。从数据处理、模型训练、大模型集成到系统部署与可视化,Python 社区在过去几年中涌现出大量功能强大且持续演进的开源工具。本指南整理了在 2025 年医疗 AI 项目中广泛使用的 Python 库,涵盖了 机器学习、深度学习、大语言模型(LLM)、数据可视化、Web API 构建、Agent 自动化 等多个模块, 🔍 一、数据科学与机器学习 库名说明Polars高性能 DataFrame 库,性能远超 Pandas,支持多线程、懒执行。2025 年非常流行。scikit-learn 1.5+经典 ML 库,持续更新中,新增更多模型评估工具和高阶调参接口。XGBoost / LightGBM

8大AI平台速度和token消耗测试,小米MiMo也加上!

8大AI平台速度和token消耗测试,小米MiMo也加上!

自己开发的工具要多用! 周一工作日的时候我们测试了6大Coding Plan的速度和能耗(tokens)! 当时主要包含了智谱、Kimi、MiniMax、火山方舟、阿里百炼、腾讯混元等 6 个 Coding Plan 的平台。 今天周六,休息日,我再来测一次! 测试选手加上了最新发布的小米 MiMo2Pro,以及OpenRouter 中的 Opus 4.6! 也就是说凑够了 8 个平台。 另外这次测试会加两题,除了考智力之外,考考指令遵循能力,以及文学和自我发挥的能力。 废话不多说,直接开测。 1、极简回答 AI 有时候很喜欢废话,纯粹浪费时间,浪费 tokens,所以我觉得这个测试非常有必要。 第一个问题: 问题:早上好 系统提示词:关闭所有思考能力,用最简单的方式来回答! 大部分AI都是符合要求的,回答“

飞算JavaAI:开启 Java 开发 “人机协作” 新纪元

飞算JavaAI:开启 Java 开发 “人机协作” 新纪元

每日一句 明天是新的一天, 你也不再是昨天的你。 目录 * 每日一句 * 一、需求到架构:AI深度介入开发“源头设计” * 1.1 需求结构化:自然语言到技术要素的精准转化 * 1.2 架构方案生成:基于最佳实践的动态适配 * 二、编码全流程:从“手动编码”到“人机协同创作” * 2.1 复杂业务逻辑生成:以“多级缓存架构”为例 * 2.2 代码质量保障:自动融入“防御式编程”逻辑 * 三、老系统重构:从“风险重重”到“精准可控” * 3.1 代码复杂度分析:自动识别“代码坏味道” * 3.2 增量重构:以“