本地离线部署AI大模型：OpenClaw + Ollama + Qwen3.5:cloud/Qwen3:0.6b 超详细教程（无需GPU）

优质文章学习记录

08 Apr 2026 — 7 min read

前言

随着开源大模型越来越成熟，我们完全可以在自己电脑上本地运行AI，不联网、不上传数据、免费使用，隐私性极强。

今天这篇文章，我会一步步带你完成：Ollama + Qwen3.5:cloud（主力模型）+ Qwen3:0.6b（轻量备选）+ OpenClaw 的本地部署，实现一个属于自己的本地聊天AI，兼顾效果与低配置适配。

一、项目介绍

本项目实现本地离线运行阿里通义千问系列大模型（Qwen3.5:cloud 主力模型 + Qwen3:0.6b 轻量备选模型），全程不需要云端API，不需要高性能显卡，普通电脑就能跑，可根据自身电脑配置选择对应模型。

用到的工具：

Ollama：最简单的本地大模型管理工具，一键拉取、运行、管理模型

Qwen3.5:cloud：阿里云开源的轻量高性能大语言模型，对话效果强、适配本地部署，作为主力使用

Qwen3:0.6b：阿里云开源的超轻量大语言模型，占用内存极低（1GB左右），适合8GB内存低配电脑，作为备选模型

OpenClaw：美观好用的本地AI可视化交互界面

特点：免费、离线、隐私安全、低配置可运行

二、环境准备

操作系统：Windows 10 / Windows 11

内存：最低 8GB（推荐 16GB 更流畅）

无需独立显卡，CPU 即可运行

网络：仅在下载模型时需要，运行时可完全断网

三、详细安装步骤

安装 Ollama

Ollama 是运行模型的核心，安装非常简单。

打开官网：https://ollama.com/
点击 Download 下载 Windows 版本
双击安装，一路下一步
安装完成后，Ollama 会自动在后台运行

验证是否安装成功：

打开 CMD 或 PowerShell，输入：

ollama --version

出现版本号即成功。

使用 Ollama 下载并运行模型（Qwen3.5:cloud + Qwen3:0.6b）

我实际下载了两个模型，可根据自身电脑配置选择运行，优先推荐 Qwen3.5:cloud（效果更好），8GB内存低配电脑推荐 Qwen3:0.6b（更流畅）。

2.1 下载并运行 Qwen3.5:cloud（主力模型）

继续在命令行输入以下命令，
第一次运行会自动下载模型，下载完成后出现 >>> 即启动成功，可直接输入问题测试，适配低配电脑，运行流畅无压力。

ollama run qwen3.5:cloud

出现 >>> 表示模型已启动成功。

你可以直接在这里输入问题测试：

你好，介绍一下自己

模型能正常回答，说明 Qwen3.5:cloud 部署成功。

2.2 下载并运行 Qwen3:0.6b（轻量备选模型）

若电脑内存较低（8GB及以下），运行 Qwen3.5:cloud 卡顿，可下载 Qwen3:0.6b 超轻量模型，命令行输入：

ollama run qwen3:0.6b

出现 >>> 表示模型已启动成功。

你可以直接在这里输入问题测试：
你好，介绍一下自己

模型能正常回答，说明部署成功一半。

安装 OpenClaw 可视化界面

OpenClaw 让你不用敲命令，直接像 ChatGPT 一样聊天。

打开 OpenClaw 发布页：https://github.com/sqzw-x/OpenClaw
找到最新版本下载 Windows 安装包
解压或安装后打开软件
连接 OpenClaw 与本地 Ollama

打开 OpenClaw 后：

右上角进入设置
模型选择：根据自身需求选择，主力推荐 qwen3.5:cloud，低配电脑选择 qwen3:0.6b
Ollama 地址保持默认：

http://localhost:11434

保存设置

回到主界面，即可开始聊天。

四、效果展示

与AI对话的效果截图
任务管理器内存占用展示（打开任务管理器，切换到“性能-内存”页面，同步显示AI运行状态）

示例说明：

OpenClaw 连接成功界面（截图包含设置页面、模型选择（可分别展示 qwen3.5:cloud 和 qwen3:0.6b 选择界面）、地址配置）

模型启动速度：约 3～10 秒

回答速度：流畅，可日常使用

五、常见问题与解决方法（非常重要）

内存占用：Qwen3.5:cloud 约 2GB～4GB，Qwen3:0.6b 约 1GB～1.5GB

模型启动速度：Qwen3.5:cloud 约 3～10 秒，Qwen3:0.6b 约 1～3 秒

回答速度：均流畅可日常使用，Qwen3:0.6b 适配低配电脑，卡顿更少

模型下载特别慢

解决方法：

先暂停下载重新开始，进度不会变

或等待半夜下载（网络高峰期避开）

OpenClaw 连接失败 / 连不上 127.0.0.1:11434

解决方法：

确保 Ollama 正在后台运行（任务栏右下角查看 Ollama 图标）

重启 Ollama：任务栏右键 Ollama → Restart

检查地址是否为：http://localhost:11434（切勿多写/少写字符）

电脑卡顿、内存不足

解决方法：

关闭其他软件（尤其是浏览器、视频软件、后台下载工具）

关闭其他软件（尤其是浏览器、视频软件、后台下载工具），释放内存

解决方法：

切换/运行 Qwen3:0.6b 命令：

切换至超轻量模型：若运行 Qwen3.5:cloud 卡顿，可切换到 Qwen3:0.6b 模型，占用内存极低，适配8GB及以下低配电脑

ollama run qwen3:0.6b

命令：

使用更小参数模型（若 qwen3.5:cloud 卡顿）：qwen3.5:4b

OpenClaw 不显示模型（qwen3.5:cloud 或 qwen3:0.6b）

ollama run qwen3.5:4b

解决方法：

重启 OpenClaw 软件，重新加载模型列表

解决方法：

重新进入 OpenClaw 设置，根据自身需求选择 qwen3.5:cloud 或 qwen3:0.6b 模型并保存

重启 OpenClaw 软件

确认 Ollama 已成功拉取模型（命令行输入 ollama list 可查看已拉取的 qwen3.5:cloud 和 qwen3:0.6b 模型）

确认 Ollama 已成功拉取模型（命令行输入 ollama list 可查看已拉取模型）

六、项目总结

通过 Ollama + Qwen3.5:cloud + OpenClaw，我们轻松实现了：

通过 Ollama + Qwen3.5:cloud（主力）+ Qwen3:0.6b（备选）+ OpenClaw，我们轻松实现了：

本地离线运行大模型

完全免费、无流量限制

可视化界面，使用体验接近在线AI

数据不上传，隐私百分百安全

适合人群：

想学习AI本地部署的新手

想学习AI本地部署的新手

注重隐私、不想数据上传云端

学生、开发者、日常办公使用；8GB内存低配电脑也能轻松适配（选择 Qwen3:0.6b 模型）

注重隐私、不想数据上传云端

学生、开发者、日常办公使用

【AI】coze的简单入门构建智能体

前言：最近扣子很火，我来学习一下！扣子时新一代的AI应用平台。在扣子上搭建AI应用，只需要在界面上点击下一步下一步，做些配置，就可以快速去搭建一个AI应用。让我来看看，扣子是何方神圣吧~ 一、什么是coze？扣子是新一代AI应用开发平台。无论你是否有编程基础，都可以在扣子上快速搭建基于大模型的各类AI应用，并将AI应用发布到各个社交平台，也可以通过API或SDK将AI应用集成到你的业务系统中。二、coze能做什么？扣子提供可视化设计与编排工具，通过零代码或低代码方式，快速搭建基于大模型的各类AI项目。（登录到扣子官网，进入到商店，有各种应用、插件等） * 智能体：智能体是基于对话的AI项目，能理解自然语言，调用知识库与插件，通过可视化工作流完成复杂任务，并可发布到多端使用，如智能客服、虚拟伴侣等 * 应用：利用大模型技术开发的应用程序。在扣子中搭建的AI应用具备完整业务逻辑和可视化用户界面，是一个独立的AI项目，如AI搜索、翻译工具等 * 插件：是一个工具集，一个插件内可以包括一个或多个工具（API）。用于扩展智能体 / Bot 的功能，通过标准化接口与工作

传统制图VS AI制图：一线产区标准图效率对比

快速体验 1. 打开 InsCode(快马)平台 https://www.inscode.net 2. 输入框内输入如下内容：开发一个效率对比工具，分别用传统方法和AI方法生成一线产区标准图。传统方法模拟人工绘制流程，AI方法使用机器学习分类。统计两种方法的时间消耗和准确率，用图表展示结果。技术栈包括Python、Pandas和Matplotlib。 3. 点击'项目生成'按钮，等待项目生成完整后预览效果传统制图VS AI制图：一线产区标准图效率对比最近在工作中遇到了一个需求：需要快速生成一线产区和二线产区的标准图。传统的人工绘制方法耗时耗力，于是我开始探索AI辅助制图的可能性。经过一番尝试，发现AI在数据处理、分类和可视化方面的效率提升确实令人惊喜。传统制图流程的痛点 1. 数据收集与整理传统方法需要人工从各种渠道收集产区数据，包括产量、地理位置、气候条件等。这个过程往往需要几天甚至几周时间，而且容易出错。 2. 分类标准制定一线产区和二线产区的划分标准需要专家团队反复讨论确定，每次调整都需要重新处理数据。

opencode+Git集成：版本控制中AI辅助操作指南

opencode+Git集成：版本控制中AI辅助操作指南 1. 开篇：当Git遇见AI编程助手你是否曾经在Git提交时纠结于怎么写好提交信息？或者在代码合并冲突时头疼不已？又或者想要重构代码却担心破坏现有功能？今天我们要介绍的opencode，正是为了解决这些痛点而生。这是一个开源的AI编程助手框架，特别适合与Git版本控制系统配合使用。它能在你编码的每个环节提供智能辅助，从代码编写到提交信息生成，从冲突解决到代码审查。最棒的是，opencode支持本地部署的模型，比如我们将要使用的Qwen3-4B-Instruct-2507，这意味着你的代码永远不会离开你的本地环境，完全保障了隐私和安全。 2. opencode是什么？ 2.1 核心特点 opencode是一个2024年开源的AI编程助手框架，用Go语言编写，主打"终端优先、多模型、隐私安全"的理念。它把大语言模型包装成可插拔的智能体，支持在终端、IDE和桌面三端运行。你可以把它理解为你的编程副驾驶，但它比一般的代码补全工具强大得多。opencode支持代码补全、重构、调试、项目规划等全流程辅助，而且可以

【AI】2026年AI学习路线（从入门到精通）重点版

一、2026年AI学习知识图谱（从入门到精通）（一）入门阶段（0-6个月）：建立认知，夯实基础核心目标：掌握AI基础概念、必备数学与编程能力，能实现简单机器学习模型，建立系统的AI认知框架。核心内容： * AI通识：AI发展史、核心概念、主要学派、经典案例，了解2026年AI前沿趋势（如多模态、具身智能）。 * 数学基础：微积分、线性代数、概率论与统计、优化理论，掌握AI算法所需的数学工具。 * 编程基础：Python核心语法、数据结构与算法、CUDA基础，能熟练使用Python处理数据、编写简单代码。 * 传统机器学习入门：监督/无监督学习基础、线性回归、决策树、模型评估方法，入门Scikit-learn工具。 * 基础实践：完成鸢尾花分类、房价预测等简单项目，参与Kaggle入门赛，积累基础实战经验。（二）进阶阶段（6-12个月）：掌握核心算法，

2.1 下载并运行 Qwen3.5:cloud（主力模型）

2.2 下载并运行 Qwen3:0.6b（轻量备选模型）

Read more

【AI】coze的简单入门构建智能体

传统制图VS AI制图：一线产区标准图效率对比

opencode+Git集成：版本控制中AI辅助操作指南

【AI】2026年AI学习路线（从入门到精通）重点版