Ollama for macOS 完全指南：零配置本地运行 Llama、DeepSeek 等大模型，私享安全高效的 AI 能力

优质文章学习记录

07 Apr 2026 — 6 min read

Ollama for macOS 完全指南：零配置本地运行 Llama、DeepSeek 等大模型，私享安全高效的 AI 能力

🎯 核心摘要
💻 安装 Ollama
🚀 快速开始：运行你的第一个模型
- 1. 运行一个流行模型
- 2. 常用模型管理命令
🧠 模型选择建议
🎨 进阶使用：超越命令行
- 1. 使用图形化界面（Open WebUI）
- 2. 通过代码调用（API）
⚙️ 实用技巧与故障排除

🎯 核心摘要

这份指南将帮你快速在 macOS 上搭建起本地的 AI 助手。
《macOS上零配置运行本地AI模型指南》介绍了使用 Ollama 在Mac电脑上快速部署Llama3、DeepSeek等大语言模型的方法。文章详细讲解了两种安装方式（官方脚本和Homebrew）、模型管理命令，并针对不同Mac硬件配置提供了模型选择建议。此外，还介绍了图形界面(Open WebUI)和API调用等进阶用法，包括Python集成示例。指南涵盖从基础安装到故障排除的全流程，帮助用户安全高效地在本地运行AI模型。

整个过程可以概括为以下几个关键阶段，你可以一目了然地看到全貌：

准备阶段

安装Ollama

选择安装方式

官方一键脚本
推荐

Homebrew
可选

验证安装

获取与运行模型

基础使用
命令行对话

进阶应用

图形化界面
（Open WebUI）

API接口调用

Python集成

熟练使用

下面，我们就来详细讲解每个步骤的具体操作。

💻 安装 Ollama

在 macOS 上安装 Ollama 非常简单，主要有以下两种方式。

安装方式	适用情况	操作步骤
官方一键脚本（推荐）	绝大多数用户，最直接	打开终端，粘贴并执行：`curl -fsSL https://ollama.com/install.sh
Homebrew	习惯使用包管理器的用户	在终端中执行：`brew install --cask ollama` 。

验证安装：安装完成后，重启终端，然后输入以下命令，如果显示版本号则说明安装成功。

ollama --version

安装后，Ollama 服务会自动在后台启动，并为后续使用做好准备。

🚀 快速开始：运行你的第一个模型

Ollama 的核心是 run 命令。它会自动下载（如果本地没有）并运行模型，进入交互式聊天界面。

1. 运行一个流行模型

比如，要运行 Meta 发布的 Llama 3 模型，只需在终端输入：

ollama run llama3

首次运行需要下载模型文件，耗时取决于你的网速和模型大小（Llama 3 8B 参数版本约 4.7GB ）。下载完成后，会出现 >>> 提示符，你就可以开始对话了。

2. 常用模型管理命令

掌握以下几个命令，就能高效管理你的本地“模型库” ：

命令	作用	示例
`ollama list`	查看本地已下载的所有模型	`ollama list`
`ollama pull`	只下载模型，不立即运行	`ollama pull gemma:2b`
`ollama rm`	删除不再需要的模型，释放空间	`ollama rm mistral`
`ollama ps`	查看当前正在运行的模型	`ollama ps`

🧠 模型选择建议

根据你的 Mac 硬件配置选择合适的模型，是关键的一步。

硬件配置	推荐模型（参数量）	说明
Apple Silicon（M1/M2/M3系列）	Llama 3 (8B, 70B), Gemma (7B), Qwern (7B)	强烈推荐！ Ollama 对 Apple Silicon 芯片（M1/M2/M3）的 GPU 加速优化得极好，即使是 70B 的大模型也能流畅运行。
Intel 芯片 Mac	Gemma (2B), Phi (2.7B), Llama 3 (8B)	优先选择 7B 及以下的模型。运行速度取决于 CPU 性能和内存大小。
内存（统一内存）	8GB：可尝试 1B-7B 模型 16GB 或以上：可流畅运行 13B-70B 参数模型	模型运行时会完全加载到内存中，内存容量是主要限制。

简单来说：如果你的 Mac 是 M 系列芯片，可以直接从 llama3:8b 开始，体验会很好。如果是 Intel 芯片或内存较小，可以从 gemma:2b 或 phi 开始尝试。

🎨 进阶使用：超越命令行

虽然命令行简单直接，但通过以下方式可以获得更佳体验。

1. 使用图形化界面（Open WebUI）

Open WebUI 能为你提供一个类似 ChatGPT 的友好网页界面，管理对话和历史记录都非常方便。
通过 Docker 安装（推荐）：

docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

安装完成后，在浏览器中访问 http://localhost:3000，初始化账号后即可使用。Open WebUI 通常能自动发现本地运行的 Ollama 服务。

2. 通过代码调用（API）

Ollama 在本地 11434 端口提供了兼容 OpenAI 格式的 REST API，方便你用任何编程语言集成。
Python 调用示例：

首先安装官方库：pip install ollama 。

import ollama response = ollama.chat(model='llama3', messages=[{'role':'user','content':'为什么天空是蓝色的？请用简单的话解释。',},])print(response['message']['content'])

直接使用 curl 测试：

curl -X POST http://localhost:11434/api/generate -d '{ "model": "llama3", "prompt": "请用Python写一个计算斐波那契数列的函数。", "stream": false }'

⚙️ 实用技巧与故障排除

修改模型默认存储路径：模型默认下载到 ~/.ollama/models/ 目录。如果想更改位置（比如移到外接硬盘），可以在启动 Ollama 服务前设置环境变量：export OLLAMA_MODELS="/你的/新/路径" 。
Ollama 服务未启动：如果遇到连接错误，可以尝试在终端输入 ollama serve 来手动启动服务。
如何彻底卸载：要将 Ollama 及其所有模型数据完全清除，只需将应用程序目录中的 “Ollama” 应用拖到废纸篓并清空即可。模型文件位于 ~/.ollama 目录，可一并删除。

希望这份详细的指南能帮助你在 macOS 上顺利开启本地 AI 之旅！如果你在具体操作中遇到任何问题，欢迎随时提出。

FPGA图像处理之：图像畸变矫正原理及matlab与fpga实现

一、概述图像畸变矫正（Image Distortion Correction）是图像处理中的重要任务，通常用于纠正因镜头畸变、拍摄角度等原因造成的图像失真。它的核心原理涉及几何变换，通过对图像进行变换，使其恢复到理想状态。（一）图像畸变的类型 1.径向畸变（Radial Distortion）：主要表现为图像中心到边缘的失真，常见的有“桶形畸变”（Barrel Distortion）和“枕形畸变”（Pincushion Distortion）。桶形畸变：图像的边缘向外膨胀。枕形畸变：图像的边缘向内收缩。 2.切向畸变（Tangential Distortion）：由于相机镜头的装配不精确，可能会导致图像出现某些不规则的切向失真。（二）畸变矫正的原理图像畸变矫正的目标是通过数学模型来恢复图像的真实几何结构。一般采用如下的模型来进行畸变建模与矫正：（1）径向畸变模型：径向畸变模型通常采用以下公式：

OpenDroneMap实战教程：10分钟从无人机照片到专业地图

OpenDroneMap实战教程：10分钟从无人机照片到专业地图【免费下载链接】ODMA command line toolkit to generate maps, point clouds, 3D models and DEMs from drone, balloon or kite images. 📷 项目地址: https://gitcode.com/gh_mirrors/od/ODM OpenDroneMap是一款革命性的开源无人机数据处理工具，能够将普通的航拍照片自动转换为专业级的地理空间产品。无论您是测绘新手、农业从业者，还是城市规划师，都能通过这个强大的工具包实现从图像到地图的完整工作流。快速入门：10分钟启动项目最简单部署方案使用Docker容器是最推荐的安装方式，只需几个简单命令： git clone https://gitcode.com/gh_mirrors/od/ODM

论文阅读“Vision-Language-Action (VLA) Models: Concepts, Progress, Applications and Challenges“

目录 * 一、**研究背景与动机** * 1.1 背景 * 1.2 动机 * 二、**VLA模型的核心概念** * 2.1 定义 * 2.2 三大发展阶段 * 三、**核心技术分析** * 3.1 多模态融合 * 3.2 统一Token化 * 3.3 学习策略 * 四、**代表性模型总结** * 五、**应用场景分析** * 5.1 人形机器人 * 5.2 自动驾驶 * 5.3 工业制造 * 5.4 医疗与农业 * 5.5 增强现实导航 * 六、**挑战与局限** * 七、

飞书机器人插件开发：让HunyuanOCR自动识别群聊图片

飞书机器人插件开发：让HunyuanOCR自动识别群聊图片在企业协作越来越依赖即时通讯工具的今天，飞书早已不仅是聊天软件，而是组织内部信息流转、任务协同和知识沉淀的核心枢纽。然而一个长期被忽视的问题是：每天成千上万张在群聊中流转的图片——合同截图、发票照片、会议白板、产品原型图——它们所承载的关键信息，却像孤岛一样“沉睡”着。这些图像无法被搜索、难以归档、更无法参与自动化流程。要提取其中的文字内容，往往还得靠人工逐字抄录。效率低不说，还容易出错。有没有可能让系统自己“看懂”这些图片？答案是肯定的。随着多模态大模型的发展，OCR（光学字符识别）技术已经从传统的“检测+识别”两阶段流水线，进化为端到端的智能理解引擎。腾讯推出的 HunyuanOCR 正是这一趋势下的代表性成果：它基于混元大模型架构，仅用约10亿参数就实现了业界领先的识别精度，且支持复杂文档解析、字段抽取、多语言识别等全场景能力。更重要的是，这款模型可以部署在单卡4090D上，意味着中小企业也能低成本拥有自己的“视觉大脑”。如果再将它接入飞书机器人，就能实现这样一个理想场景：用户上传一张发票截图，

Ollama for macOS 完全指南：零配置本地运行 Llama、DeepSeek 等大模型，私享安全高效的 AI 能力

🎯 核心摘要

💻 安装 Ollama

🚀 快速开始：运行你的第一个模型

1. 运行一个流行模型

2. 常用模型管理命令

🧠 模型选择建议

🎨 进阶使用：超越命令行

1. 使用图形化界面（Open WebUI）

2. 通过代码调用（API）

⚙️ 实用技巧与故障排除

Read more

FPGA图像处理之：图像畸变矫正原理及matlab与fpga实现

OpenDroneMap实战教程：10分钟从无人机照片到专业地图

论文阅读“Vision-Language-Action (VLA) Models: Concepts, Progress, Applications and Challenges“

飞书机器人插件开发：让HunyuanOCR自动识别群聊图片