本地离线部署AI大模型：OpenClaw + Ollama + Qwen3.5:cloud/Qwen3:0.6b 超详细教程（无需GPU）

优质文章学习记录

10 Apr 2026 — 7 min read

前言

随着开源大模型越来越成熟，我们完全可以在自己电脑上本地运行AI，不联网、不上传数据、免费使用，隐私性极强。

今天这篇文章，我会一步步带你完成：Ollama + Qwen3.5:cloud（主力模型）+ Qwen3:0.6b（轻量备选）+ OpenClaw 的本地部署，实现一个属于自己的本地聊天AI，兼顾效果与低配置适配。

一、项目介绍

本项目实现本地离线运行阿里通义千问系列大模型（Qwen3.5:cloud 主力模型 + Qwen3:0.6b 轻量备选模型），全程不需要云端API，不需要高性能显卡，普通电脑就能跑，可根据自身电脑配置选择对应模型。

用到的工具：

Ollama：最简单的本地大模型管理工具，一键拉取、运行、管理模型

Qwen3.5:cloud：阿里云开源的轻量高性能大语言模型，对话效果强、适配本地部署，作为主力使用

Qwen3:0.6b：阿里云开源的超轻量大语言模型，占用内存极低（1GB左右），适合8GB内存低配电脑，作为备选模型

OpenClaw：美观好用的本地AI可视化交互界面

特点：免费、离线、隐私安全、低配置可运行

二、环境准备

操作系统：Windows 10 / Windows 11

内存：最低 8GB（推荐 16GB 更流畅）

无需独立显卡，CPU 即可运行

网络：仅在下载模型时需要，运行时可完全断网

三、详细安装步骤

安装 Ollama

Ollama 是运行模型的核心，安装非常简单。

打开官网：https://ollama.com/
点击 Download 下载 Windows 版本
双击安装，一路下一步
安装完成后，Ollama 会自动在后台运行

验证是否安装成功：

打开 CMD 或 PowerShell，输入：

ollama --version

出现版本号即成功。

使用 Ollama 下载并运行模型（Qwen3.5:cloud + Qwen3:0.6b）

我实际下载了两个模型，可根据自身电脑配置选择运行，优先推荐 Qwen3.5:cloud（效果更好），8GB内存低配电脑推荐 Qwen3:0.6b（更流畅）。

2.1 下载并运行 Qwen3.5:cloud（主力模型）

继续在命令行输入以下命令，
第一次运行会自动下载模型，下载完成后出现 >>> 即启动成功，可直接输入问题测试，适配低配电脑，运行流畅无压力。

ollama run qwen3.5:cloud

出现 >>> 表示模型已启动成功。

你可以直接在这里输入问题测试：

你好，介绍一下自己

模型能正常回答，说明 Qwen3.5:cloud 部署成功。

2.2 下载并运行 Qwen3:0.6b（轻量备选模型）

若电脑内存较低（8GB及以下），运行 Qwen3.5:cloud 卡顿，可下载 Qwen3:0.6b 超轻量模型，命令行输入：

ollama run qwen3:0.6b

出现 >>> 表示模型已启动成功。

你可以直接在这里输入问题测试：
你好，介绍一下自己

模型能正常回答，说明部署成功一半。

安装 OpenClaw 可视化界面

OpenClaw 让你不用敲命令，直接像 ChatGPT 一样聊天。

打开 OpenClaw 发布页：https://github.com/sqzw-x/OpenClaw
找到最新版本下载 Windows 安装包
解压或安装后打开软件
连接 OpenClaw 与本地 Ollama

打开 OpenClaw 后：

右上角进入设置
模型选择：根据自身需求选择，主力推荐 qwen3.5:cloud，低配电脑选择 qwen3:0.6b
Ollama 地址保持默认：

http://localhost:11434

保存设置

回到主界面，即可开始聊天。

四、效果展示

与AI对话的效果截图
任务管理器内存占用展示（打开任务管理器，切换到“性能-内存”页面，同步显示AI运行状态）

示例说明：

OpenClaw 连接成功界面（截图包含设置页面、模型选择（可分别展示 qwen3.5:cloud 和 qwen3:0.6b 选择界面）、地址配置）

模型启动速度：约 3～10 秒

回答速度：流畅，可日常使用

五、常见问题与解决方法（非常重要）

内存占用：Qwen3.5:cloud 约 2GB～4GB，Qwen3:0.6b 约 1GB～1.5GB

模型启动速度：Qwen3.5:cloud 约 3～10 秒，Qwen3:0.6b 约 1～3 秒

回答速度：均流畅可日常使用，Qwen3:0.6b 适配低配电脑，卡顿更少

模型下载特别慢

解决方法：

先暂停下载重新开始，进度不会变

或等待半夜下载（网络高峰期避开）

OpenClaw 连接失败 / 连不上 127.0.0.1:11434

解决方法：

确保 Ollama 正在后台运行（任务栏右下角查看 Ollama 图标）

重启 Ollama：任务栏右键 Ollama → Restart

检查地址是否为：http://localhost:11434（切勿多写/少写字符）

电脑卡顿、内存不足

解决方法：

关闭其他软件（尤其是浏览器、视频软件、后台下载工具）

关闭其他软件（尤其是浏览器、视频软件、后台下载工具），释放内存

解决方法：

切换/运行 Qwen3:0.6b 命令：

切换至超轻量模型：若运行 Qwen3.5:cloud 卡顿，可切换到 Qwen3:0.6b 模型，占用内存极低，适配8GB及以下低配电脑

ollama run qwen3:0.6b

命令：

使用更小参数模型（若 qwen3.5:cloud 卡顿）：qwen3.5:4b

OpenClaw 不显示模型（qwen3.5:cloud 或 qwen3:0.6b）

ollama run qwen3.5:4b

解决方法：

重启 OpenClaw 软件，重新加载模型列表

解决方法：

重新进入 OpenClaw 设置，根据自身需求选择 qwen3.5:cloud 或 qwen3:0.6b 模型并保存

重启 OpenClaw 软件

确认 Ollama 已成功拉取模型（命令行输入 ollama list 可查看已拉取的 qwen3.5:cloud 和 qwen3:0.6b 模型）

确认 Ollama 已成功拉取模型（命令行输入 ollama list 可查看已拉取模型）

六、项目总结

通过 Ollama + Qwen3.5:cloud + OpenClaw，我们轻松实现了：

通过 Ollama + Qwen3.5:cloud（主力）+ Qwen3:0.6b（备选）+ OpenClaw，我们轻松实现了：

本地离线运行大模型

完全免费、无流量限制

可视化界面，使用体验接近在线AI

数据不上传，隐私百分百安全

适合人群：

想学习AI本地部署的新手

想学习AI本地部署的新手

注重隐私、不想数据上传云端

学生、开发者、日常办公使用；8GB内存低配电脑也能轻松适配（选择 Qwen3:0.6b 模型）

注重隐私、不想数据上传云端

学生、开发者、日常办公使用

SkyWalking - 告警通知渠道集成：Webhook、Slack、钉钉、企业微信

👋 大家好，欢迎来到我的技术博客！ 📚 在这里，我会分享学习笔记、实战经验与技术思考，力求用简单的方式讲清楚复杂的问题。 🎯 本文将围绕SkyWalking这个话题展开，希望能为你带来一些启发或实用的参考。 🌱 无论你是刚入门的新手，还是正在进阶的开发者，希望你都能有所收获！文章目录 * SkyWalking - 告警通知渠道集成：Webhook、Slack、钉钉、企业微信 * 🚨 SkyWalking 告警机制基础 * 告警规则（Alarm Rules） * 通知渠道（Notifiers） * 🔗 Webhook：最通用的集成方式 * 配置 SkyWalking 使用 Webhook * Webhook 接收端开发（Java 示例） * Webhook 集成的优势与注意事项 * 💬 集成 Slack 通知 * 在 Slack 中创建 Incoming Webhook * 配置 SkyWalking * 自定义 Slack

快速搭建个人AI知识库教程（超详细+实战）从零入门到精通，一篇全掌握！

本文详细介绍了一款名为PandaWiki的开源个人知识库工具，它结合传统文档管理与AI检索增强生成技术。文章演示了如何在Linux系统上通过Docker一键部署PandaWiki，配置各类模型，以及从飞书等平台导入文档创建个人AI知识库。该工具支持离线文件上传、AI生成摘要、文档分类管理等功能，并提供多种问答机器人接入方式，是个人知识管理和AI学习的理想解决方案。最近有点忙，拖更比较久了，大家见谅… 今天我们一起来聊聊知识库。当下，RAG 技术已经非常成熟了，市面上的各种 AI 知识库产品也很丰富。在这个 AI 时代的浪潮下，如果你还用传统的笔记软件来管理个人知识，就有点显得 Out 了。不过，想要选到一款称心如意的知识库工具，似乎也不是那么简单。首先是数据隐私上的考虑，虽然现在很多在线 AI 平台似乎都支持了知识库上传的能力，但有些 “私密” 的知识我们可能不想上传到 “云端”。另外，虽然有很多大厂直接提供了非常全面的私有化部署方案，但是动辄几万的费用让人望而却步。那就只能从开源工具上下手了，作为个人的知识库管理工具，我希望使用一款 “小而美” 的产品，

前端国际化实现：别再只支持中文了

前端国际化实现：别再只支持中文了毒舌时刻这代码写得跟网红滤镜似的——仅供参考。各位前端同行，咱们今天聊聊前端国际化。别告诉我你的应用只支持中文，那感觉就像只卖一种口味的冰淇淋——单调又无趣。为什么你需要国际化最近看到一个项目，所有文本都硬编码在代码里，要支持英文时傻眼了，我差点当场去世。我就想问：你是在开发应用还是在开发中文专用软件？反面教材 // 反面教材：硬编码文本 function LoginForm() { return ( <form> <h1>登录</h1> <input placeholder="请输入邮箱" /> <input placeholder="请输入密码" type="password"

浏览器 XPath 深度解析：为什么 90% 的前端高手都在用它？

浏览器 XPath 深度解析：为什么 90% 的前端高手都在用它？你是否遇到过这些崩溃时刻：动态 ID 每次刷新都变、元素藏得比忍者还深、CSS 选择器写到怀疑人生？XPath 可能就是你的救命稻草。文章目录 * 浏览器 XPath 深度解析：为什么 90% 的前端高手都在用它？ * 一、什么是 XPath？为什么它能成为元素定位的"瑞士军刀"？ * 1.1 XPath 的本质定义 * 1.2 XPath vs CSS 选择器：谁才是你的真命天子？ * 二、为什么必须用 XPath？这些场景让你"不得不服" * 2.1 场景一：

2.1 下载并运行 Qwen3.5:cloud（主力模型）

2.2 下载并运行 Qwen3:0.6b（轻量备选模型）

Read more

SkyWalking - 告警通知渠道集成：Webhook、Slack、钉钉、企业微信

快速搭建个人AI知识库教程（超详细+实战）从零入门到精通，一篇全掌握！

前端国际化实现：别再只支持中文了

浏览器 XPath 深度解析：为什么 90% 的前端高手都在用它？