OpenClaw + Ollama：在 macOS 上部署本地大模型的完整实践指南

Ne0inhk

16 Mar 2026 — 9 min read

**摘要**：本文详细记录了在 MacBook Pro（M1 Pro / 32GB）上，通过 Ollama 部署本地大模型并接入 OpenClaw AI 平台的全过程。涵盖环境准备、Ollama 安装与模型拉取、OpenClaw 配置修改、模型性能基准测试，以及本地模型与 OpenClaw 的通信架构原理。

一、背景与目标

1.1 为什么要本地部署？

| 维度 | 云端 API | 本地部署 |

|----------------------|---------------------------------------------|-------------------------------|

| **隐私性** | ⚠️ 数据上传到云端 | ✅ 数据完全不出本机 |

| **网络依赖** | 需要稳定网络 + 可能需要代理 | 无需网络，离线可用 |

| **延迟** | 100-500ms 网络延迟 | ~0ms 网络延迟 |

| **成本** | 按 token 计费 | 一次下载，永久免费推理 |

| **模型规模** | 无限制 | 受限于本地硬件 |

1.2 硬件环境

| 项目 | 配置 |

|------------|---------------------------------------------------------|

| **设备** | MacBook Pro (2021) |

| **芯片** | Apple M1 Pro（10核 CPU + 16核 GPU） |

| **内存** | 32GB 统一内存（CPU/GPU 共享） |

| **存储** | 1TB SSD |

| **系统** | macOS Sonoma 14.5 |

1.3 软件环境

| 组件 | 版本 |

|--------------------|-----------------|

| **OpenClaw** | v2026.2.15 |

| **Ollama** | v0.16.1 |

| **Node.js** | v22.x |

| **pnpm** | v10.x |

二、Ollama 安装与模型准备

2.1 安装 Ollama

推荐使用 Homebrew 安装，便于后续升级管理：

```bash # 安装 Homebrew（如果尚未安装） /bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)" # 通过 Homebrew 安装 Ollama brew install --cask ollama # 验证安装 ollama --version # 输出: ollama version is 0.16.1

> **提示**：国内网络环境下，可使用清华/中科大镜像安装 Homebrew：

> ```bash > /bin/bash -c "$(curl -fsSL https://mirrors.ustc.edu.cn/misc/brew-install.sh)" > ```

2.2 拉取模型

根据硬件条件（32GB 统一内存），选择以下两个模型：

```bash # 模型 1：gpt-oss:20b（13GB，支持推理链） ollama pull gpt-oss:20b # 模型 2：qwen3-coder（18GB，擅长编程和中文） ollama pull qwen3-coder ```

2.3 验证模型可用性

```bash # 查看已下载的模型 ollama list # 输出： # NAME ID SIZE MODIFIED # gpt-oss:20b xxxxxxxxxxxx 13 GB 2 hours ago # qwen3-coder:latest xxxxxxxxxxxx 18 GB 2 hours ago # 快速测试 ollama run gpt-oss:20b "Say hello" ```

### 2.4 验证 API 端点

Ollama 启动后会在 `127.0.0.1:11434` 提供服务，同时暴露 OpenAI 兼容 API：

# 测试 Ollama API curl http://127.0.0.1:11434/api/tags | python3 -m json.tool # 测试 OpenAI 兼容端点 curl http://127.0.0.1:11434/v1/chat/completions \ -H "Content-Type: application/json" \ -d '{ "model": "gpt-oss:20b", "messages": [{"role":"user","content":"Hello"}], "stream": false, "max_tokens": 50 }'

三、OpenClaw 配置修改

将本地 Ollama 模型接入 OpenClaw，总共需要修改 **2 个文件、4 处配置**。

3.1 配置文件总览

``` ~/.openclaw/ ├── openclaw.json ← 主配置文件（改 3 处） │ ├── auth.profiles["ollama:default"] ← ① 认证声明 │ ├── models.providers.ollama ← ② 模型提供商定义 │ └── agents.defaults.model ← ③ 默认模型 + 回退链 │ └── agents/main/agent/ └── auth-profiles.json ← 密钥文件（改 1 处） └── profiles["ollama:default"] ← ④ 认证凭据 ```

3.2 修改主配置文件 `~/.openclaw/openclaw.json`

① 新增认证 Profile

在 `auth.profiles` 中添加 Ollama 的认证声明：

```json { "auth": { "profiles": { "zai:default": { "provider": "zai", "mode": "api_key" }, "ollama:default": { "provider": "ollama", "mode": "api_key" } } } } ```

② 新增模型提供商

在 `models.providers` 中添加 Ollama 提供商及模型定义：

```json { "models": { "mode": "merge", "providers": { "ollama": { "baseUrl": "http://127.0.0.1:11434/v1", "api": "openai-completions", "models": [ { "id": "gpt-oss:20b", "name": "GPT-OSS 20B (Local)", "reasoning": true, "input": ["text"], "contextWindow": 131072, "maxTokens": 8192 }, { "id": "qwen3-coder", "name": "Qwen3 Coder (Local)", "reasoning": false, "input": ["text"], "contextWindow": 131072, "maxTokens": 8192 }

**关键字段说明**：

| 字段 | 值 | 说明 |

|------------------------|------------------------------------|---------------------------------------------------|

| `baseUrl` | `http://127.0.0.1:11434/v1` | Ollama 的 OpenAI 兼容 API 端点 |

| `api` | `openai-completions` | 使用 OpenAI Chat Completions 协议 |

| `reasoning` | `true` / `false` | 模型是否支持推理链（thinking） |

| `contextWindow` | `131072` | 最大上下文窗口（tokens） |

| `maxTokens` | `8192` | 单次生成最大 token 数 |

③ 设置默认模型与回退策略

在 `agents.defaults` 中配置模型优先级：

```json { "agents": { "defaults": { "model": { "primary": "ollama/gpt-oss:20b", "fallbacks": ["ollama/qwen3-coder", "zai/glm-4.5-air"] }, "models": { "ollama/gpt-oss:20b": { "alias": "GPT-OSS 20B (Local)" }, "ollama/qwen3-coder": { "alias": "Qwen3 Coder (Local)" }, "zai/glm-4.5-air": {} } } } }

模型回退链**：

gpt-oss:20b (本地) → qwen3-coder (本地) → glm-4.5-air (云端智谱) 主模型 第一备用 第二备用（兜底）

3.3 修改密钥文件 `~/.openclaw/agents/main/agent/auth-profiles.json`

④ 新增 Ollama 认证条目

```json { "version": 1, "profiles": { "ollama:default": { "type": "api_key", "provider": "ollama", "key": "ollama" } } } ```

**说明**：Ollama 本地运行无需真实 API Key，但 OpenClaw 框架要求每个 provider 都有认证条目，此处 `key` 填写任意非空字符串即可。

3.4 重启 Gateway 使配置生效

```bash # 停止现有 Gateway openclaw gateway stop # 清除旧的会话记录（避免 Context overflow） echo '{}' > ~/.openclaw/agents/main/sessions/sessions.json # 重新启动 Gateway openclaw gateway # 验证健康状态 openclaw health ```

> ⚠️ 重要提示**：如果环境中设置了 `http_proxy` / `https_proxy`，在启动 Gateway 前需要清除，否则对本地 Ollama 的请求会被转发到代理导致失败：

> ```bash > unset http_proxy https_proxy HTTP_PROXY HTTPS_PROXY > openclaw gateway > ```

四、模型性能基准测试

4.1 模型基本信息

4.2 速度测试

4.3 综合对比结论

五、通信架构原理

5.1 整体架构

5.2 通信协议与端口

5.3 请求处理全流程

5.4 Apple Silicon 硬件加速原理

5.5 模型回退（Failover）机制

这种三级回退策略确保了：

 **优先本地**：省成本、低延迟、保隐私 - **本地备用**：主模型不可用时切换到另一个本地模型 - **云端兜底**：本地全部不可用时，仍可通过云端 API 提供服务

5.6 本地模型 vs 云端模型的数据路径对比

六、常见问题与排障

6.1 Gateway 启动报 "gateway already running"

```bash # 先停止旧进程 openclaw gateway stop # 如果仍然报错，强制 kill kill $(lsof -ti :18789) # 重新启动 openclaw gateway ```

6.2 "Context overflow: prompt too large for the model"

会话历史过多导致上下文溢出，清除会话记录：

 ```bash echo '{}' > ~/.openclaw/agents/main/sessions/sessions.json openclaw gateway stop && openclaw gateway ```

6.3 "Failed to discover Ollama models: fetch failed"

通常是因为设置了 `http_proxy` 环境变量，导致对本地 Ollama 的请求被转发到代理：

 ```bash # 启动 Gateway 前清除代理 unset http_proxy https_proxy HTTP_PROXY HTTPS_PROXY openclaw gateway ```

6.4 Ollama 版本不匹配（client/server version mismatch）

 ```bash # 检查版本 ollama --version # 如果提示 server/client 版本不一致，重启 Ollama 服务 pkill -f "ollama serve" # 等待 Ollama 自动重启（macOS LaunchAgent 会自动拉起），或手动启动： ollama serve & ```

6.5 如何查看当前 Ollama 运行状态

 ```bash # 查看正在运行的模型 ollama ps # 查看所有已下载模型 ollama list # 测试 API 连通性 curl -s http://127.0.0.1:11434/api/tags | python3 -m json.tool ```

七、关键技术点总结

【MCP】详细了解MCP协议：和function call的区别何在？如何使用MCP？

本文介绍了MCP大模型上下文协议的的概念，并对比了MCP协议和function call的区别，同时用python sdk为例介绍了mcp的使用方式。 1. 什么是MCP？官网：https://modelcontextprotocol.io/introduction 2025年，Anthropic提出了MCP协议。MCP全称为Model Context Protocol，翻译过来是大模型上下文协议。这个协议的主要为AI大模型和外部工具（比如让AI去查询信息，或者让AI操作本地文件）之间的交互提供了一个统一的处理协议。我们常用的USB TypeC接口（USB-C）统一了USB接口的样式，MCP协议就好比AI大模型中的USB-C，统一了大模型与工具的对接方式。 MCP协议采用了C/S架构，也就是服务端、客户端架构，能支持在客户端设备上调用远程Server提供的服务，同时也支持stdio流式传输模式，也就是在客户端本地启动mcp服务端。只需要在配置文件中新增MCP服务端，就能用上这个MCP服务器提供的各种工具，大大提高了大模型使用外部工具的便捷性。 MCP是开源协议，能让所有A

【大模型系列篇】大模型基建工程：基于 FastAPI 自动构建 SSE MCP 服务器

今天我们将使用FastAPI来构建 MCP 服务器，Anthropic 推出的这个MCP 协议，目的是让 AI 代理和你的应用程序之间的对话变得更顺畅、更清晰。FastAPI 基于 Starlette 和 Uvicorn，采用异步编程模型，可轻松处理高并发请求，尤其适合 MCP 场景下大模型与外部系统的实时交互需求，其性能接近 Node.js 和 Go，在数据库查询、文件操作等 I/O 密集型任务中表现卓越。开始今天的正题前，我们来回顾下相关的知识内容：《高性能Python Web服务部署架构解析》、《使用Python开发MCP Server及Inspector工具调试》、《构建智能体MCP客户端：完成大模型与MCP服务端能力集成与最小闭环验证》 FastAPI基础知识安装依赖 pip install uvicorn, fastapi FastAPI服务代码示例 from fastapi import FastAPI app

超详细图文教程：用vscode+copilot(代理模式)便捷使用mcp+一个范例：用自然语言进行3d建模

在vscode使用claude mcp吧！在vscode更新到最新版本（注意，这是前提）后，内置的copilot可以使用mcp了！！！关于mcp（Model Context Protocol 模型上下文协议），可以参考我的上一篇文章： MCP个人理解+示例+集成管理+在python中调用示例，给AI大模型装上双手-ZEEKLOG博客以下是使用教程： 1.点击左下角的齿轮状设置按钮，点击设置 2.在输入面板输入chat.agent.enabled，勾上勾选框 3.点击Ctrl+shift+P，输入reload，点击重新加载窗口，刷新窗口 4.打开copilot后，在右下角将模式改为代理即可。 5.点击工具按钮，开始安装mcp 先去github找到自己想要添加的mcp服务，以blender MCP为例，打开https://github.com/ahujasid/blender-mcp，可以在readme文档里看到详细的安装过程。可以看到，

02-mcp-server案例分享-Excel 表格秒变可视化图表 HTML 报告，就这么简单

1.前言 MCP Server（模型上下文协议服务器）是一种基于模型上下文协议（Model Context Protocol，简称MCP）构建的轻量级服务程序，旨在实现大型语言模型（LLM）与外部资源之间的高效、安全连接。MCP协议由Anthropic公司于2024年11月开源，其核心目标是解决AI应用中数据分散、接口不统一等问题，为开发者提供标准化的接口，使AI模型能够灵活访问本地资源和远程服务，从而提升AI助手的响应质量和工作效率。 MCP Server 的架构与工作原理 MCP Server 采用客户端-服务器（Client-Server）架构，其中客户端（MCP Client）负责与服务器建立连接，发起请求，而服务器端则处理请求并返回响应。这种架构确保了数据交互的高效性与安全性。例如，客户端可以向服务器发送请求，如“查询数据库中的某个记录”或“调用某个API”，而服务器则根据请求类型，调用相应的资源或工具，完成任务并返回结果。 MCP Server 支持动态发现和实时更新机制。例如，当新的资源或工具被添加到服务器时，

Read more

【MCP】详细了解MCP协议：和function call的区别何在？如何使用MCP？

【大模型系列篇】大模型基建工程：基于 FastAPI 自动构建 SSE MCP 服务器

超详细图文教程：用vscode+copilot(代理模式)便捷使用mcp+一个范例：用自然语言进行3d建模

02-mcp-server案例分享-Excel 表格秒变可视化图表 HTML 报告，就这么简单