旧电脑 Win7 复活计划：编译与运行 llama.cpp (Qwen3版)

优质文章学习记录

05 Apr 2026 — 4 min read

🦕 旧电脑 Win7 复活计划：编译与运行 llama.cpp (Qwen3版)

这份指南专为不支持新版软件的 Windows 7 设计，通过本地编译实现大模型运行。

手动编译可以获得最好的性能，不想自己手动编译可以直接使用下面编译好的bin文件，同时包含下面用到的相关软件和替换文件httplib.h
链接：https://pan.quark.cn/s/2c5f627c93d7
提取码：cSJh

📋 0. 软件版本清单

请务必确保使用以下特定版本，以保证在 Win7 下的兼容性：

软件名称	文件名 (根据截图)	作用	备注
编译环境	`w64devkit-x64-2.5.0.7z.exe`	提供 GCC 编译器	核心工具
构建工具	`cmake-3.31.10-windows-x86_64.msi`	生成编译配置	必须安装到默认路径
源码工具	`Git_for_Windows_(64bit)_v2.45.2.exe`	下载代码
浏览器	`Firefox Setup 115.30.0esr.exe`	唯一推荐	Win7 支持的最后版本，用于打开聊天界面
备用浏览器	`109.0.5414.120_chrome_installer.exe`	Chrome 109	Win7 支持的最后 Chrome 版本

📥 第一阶段：下载代码并替换httplib.h (使用 Git Bash)

操作环境：Windows 桌面/资源管理器

准备目录：建议在 C 盘根目录 下操作，路径短，不容易出错。
打开 Git：在 C 盘空白处右键 -> “Open Git Bash here”。
执行命令（请一行一行复制运行）：

# 1. 克隆 llama.cpp 仓库git clone https://github.com/ggerganov/llama.cpp.git # 2. 进入文件夹cd llama.cpp # 3. 【核心步骤】切换到支持 Qwen3 的特定版本 (Tag: b5092)git checkout b5092 # 4. 【核心步骤】替换 /examples/server/httplib.h 文件 夸克网盘自取

确认路径：确保代码文件夹就在 C:\llama.cpp。

🛠️ 第二阶段：准备编译环境

操作环境：w64devkit.exe 黑色终端

🛑 关闭杀毒软件 (Win7 必做)
- 请务必彻底退出 360、腾讯管家、金山毒霸等。
- 原因：Win7 下这些软件会拦截编译器生成的 conftest.exe 等临时文件，直接导致 Access Violation 报错。
启动编译终端
- 解压 w64devkit-x64-2.5.0.7z.exe。
- 双击运行文件夹内的 w64devkit.exe。
- 在黑框中输入以下命令（注意路径写法）：

进入代码目录

cd /c/llama.cpp

⚙️ 第三阶段：清理与配置 (CMake)

操作环境：w64devkit.exe 黑色终端

直接复制下面这行长命令运行：

成功标志：屏幕滚动后显示 Generating done。

生成配置文件 (Win7 专用修复版)

"C:\Program Files\CMake\bin\cmake.exe". -G "MinGW Makefiles" -DLLAMA_CURL=OFF -DLLAMA_BUILD_TESTS=OFF -DCMAKE_C_COMPILER=gcc -DCMAKE_CXX_COMPILER=g++

清理环境 (防止旧缓存报错)

rm -f CMakeCache.txt rm -rf CMakeFiles

🚀 第四阶段：执行编译

操作环境：w64devkit.exe 黑色终端

-j4 表示使用 4 线程加速，如果电脑配置极低可改为 -j2。

等待完成
- 耐心等待进度条走到 [100%]。
- 编译完成后，bin 文件夹下会出现 llama-server.exe。

开始编译

"C:\Program Files\CMake\bin\cmake.exe" --build . --config Release -j4

✅ 第五阶段：验证结果

在当前终端输入：

看到 commit d3bd719 字样即为成功。

检查版本

./bin/llama-server.exe --version

🤖 第六阶段：启动 Qwen3 模型 (Win7 专用方案)

Win7 的 CMD 窗口无法很好地显示聊天文字，必须使用浏览器模式。

准备工作

安装 Firefox 115 ESR (Firefox Setup 115.30.0esr.exe)。这是 Win7 下最稳定、兼容性最好的现代浏览器。

情况 A：加载 .gguf 文件

假设模型文件在 C:\models\qwen3.gguf。

-c 4096: 上下文长度。如果内存大于 16G，可以设为 8192 或更高。

启动命令：

./bin/llama-server.exe -m "/c/models/qwen3.gguf" -c 4096 --host 0.0.0.0 --port 8080

情况 B：加载 Ollama 缓存模型

如果你用 Ollama 下载过 Qwen3，可以直接利用它的缓存文件（无需转换）。

找到 Blob 文件：
- 路径：C:\Users\你的用户名\.ollama\models\blobs
- 找到最大的那个文件（例如 sha256-abc1234...）。

启动命令：

./bin/llama-server.exe -m "/c/Users/Administrator/.ollama/models/blobs/sha256-你的文件名..." -c 4096 --host 0.0.0.0 --port 8080

🌐 最后一步：开始对话

当黑框显示 HTTP server listening 时，保持黑框开启（不要关闭）。
打开 Firefox 115 浏览器。
地址栏输入：http://127.0.0.1:8080
界面加载后，即可在浏览器中与 Qwen3 流畅对话！

AI绘画建筑设计提示词：从基础到高级的完整创作指南

一、核心逻辑：高质量建筑提示词的 7 大组成部分 AI 对建筑的理解需要 “分层引导”，一个完整的提示词通常包含 7 个关键模块，你可根据需求灵活组合或删减，基础逻辑为：先明确 “画什么”，再定义 “怎么画”，最后优化 “画得好”。具体结构如下： [主体/建筑类型] + [风格/建筑师参考] + [环境/场景设定] + [细节与材质] + [构图与视角] + [灯光与氛围] + [画质/技术参数] 这一结构能让 AI 清晰捕捉设计核心，避免因信息模糊导致的 “偏离预期”，是高效创作的基础框架。二、分模块详解：建筑提示词词汇库与应用技巧 1. 主体 / 建筑类型：明确 “画什么” 的核心这是提示词的 “根基”，需精准定义建筑的功能与形态，避免笼统表述。

无脑通过github上copilot学生认证的方法(无需校园网，无需学生证)

最近在家尝试通过github上的copilot的学生认证，总是不能过。好在经过了12次尝试后，终于总结了一套无需校园网，无需学生证的目前有效的无脑通过方法，希望能对不方便的同学们有所帮助。（注：本文旨在帮助有需求却因为种种情况难以被识别成功的同学，对非学生人士的认证情况概不负责）一、注册github账号这里就不细说了，想要通过copilot的大部分都有github账号，如果没有的话可以去网上搜一下。二、2FA认证通过认证网址不是本文的重点，在此引用其他博主的内容：从0开始的github学生认证并使用copilot教程（超详细！）_github copilot-ZEEKLOG博客或者一个博客： [Git] 一次搞定：Github 2FA(Two-Factor Authentication/两因素认证) - 千千寰宇 - 博客园特殊情况值得注意的是，我在申请2FA时，发生了一个特殊情况——github上的二维码全是白色，没有显示出来，那就不要扫码，下面有一行字：unable to scan……，直接点里面的setup key链接就好了。三

不只是 Copilot：Kimi Code 正在改变写代码的方式

之前介绍过，在 Claude Code 中使用 Kimi，现在Kimi也推出自己的 CLI 了。但是目前是会员专供！ Kimi Code 是由 Moonshot AI（Kimi）推出的下一代 AI 编程助手/代码智能体，作为 Kimi 会员订阅中专为开发者设计的增值权益，旨在帮助开发者更快、更智能、更高效地完成编程任务。它可以直接融入开发流程、终端工具和主流 IDE，让 AI 编程能力成为日常开发的一部分。核心定位：你的 AI 代码伙伴 Kimi Code 不只是简单的补全工具，而是一个智能编程代理（AI Code Agent）： * 自动理解问题和代码结构，回答开发者的问题。 * 辅助编写、调试、重构和测试代码，覆盖开发生命周期。 * 直接运行在终端与

llama.cpp Vulkan后端在AMD显卡上的完整部署指南：从问题诊断到性能优化

llama.cpp Vulkan后端在AMD显卡上的完整部署指南：从问题诊断到性能优化【免费下载链接】llama.cppPort of Facebook's LLaMA model in C/C++ 项目地址: https://gitcode.com/GitHub_Trending/ll/llama.cpp 想要在AMD显卡上流畅运行llama.cpp却频频遭遇Vulkan初始化失败？本指南将带你系统解决兼容性问题，实现高效的大语言模型本地化部署。llama.cpp作为C/C++实现的高性能大语言模型推理框架，通过Vulkan后端可以显著提升GPU加速效果，但在AMD平台上的特殊配置需求往往让新手望而却步。问题快速诊断方法常见故障症状识别当你遇到以下任一情况时，很可能遇到了AMD显卡与Vulkan后端的兼容性问题： * 启动崩溃：程序启动时立即崩溃，日志显示"vkCreateInstance failed" * 加载卡顿：模型加载进度卡在"Initializing

🦕 旧电脑 Win7 复活计划：编译与运行 llama.cpp (Qwen3版)

📋 0. 软件版本清单

📥 第一阶段：下载代码并替换httplib.h (使用 Git Bash)

🛠️ 第二阶段：准备编译环境

⚙️ 第三阶段：清理与配置 (CMake)

🚀 第四阶段：执行编译

✅ 第五阶段：验证结果

🤖 第六阶段：启动 Qwen3 模型 (Win7 专用方案)

准备工作

情况 A：加载 .gguf 文件

情况 B：加载 Ollama 缓存模型

🌐 最后一步：开始对话

Read more

AI绘画建筑设计提示词：从基础到高级的完整创作指南

无脑通过github上copilot学生认证的方法(无需校园网，无需学生证)

不只是 Copilot：Kimi Code 正在改变写代码的方式

llama.cpp Vulkan后端在AMD显卡上的完整部署指南：从问题诊断到性能优化