破除各种限制，手把手教你本地部署大语言模型,打造私人AI

优质文章学习记录

09 Apr 2026 — 10 min read

随着 AI 应用的快速普及，它已经悄然融入了人们的日常生活。相信大家对 ChatGPT、豆包、元宝这些 AI 应用已经不再陌生，并且几乎离不开它们了。但是，随着这些商用 AI 的广泛应用，一些问题也随之而来。由于监管日益严格，商用大模型的“输出限制”越来越多，动不动就触发拦截；另一方面，很多人也担心自己的敏感信息（比如商业机密、个人敏感信息，或者一些不便于给别人知道的对话）被大厂收集导致隐私泄露。这就导致很多时候，虽然 AI 很智能，但在某些特定场景下却显得非常“鸡肋”。那么，在自己的电脑上本地部署一个完全受自己控制的大语言模型的需求对个人用户就变得非常迫切。本文就将一步一步教你在本地电脑上部署一个专属于你自己的AI。

第一步：认识并安装 Ollama

简单来说，Ollama 是一个开源的本地大模型运行框架。在过去，想要在自己的电脑上运行一个几十亿参数的大语言模型（LLM），你需要懂 Python、配置复杂的代码环境、处理各种让人头疼的报错。而 Ollama 的出现彻底打破了这个技术壁垒，它将极其复杂的底层逻辑进行了封装，让普通用户能够像安装普通电脑软件一样，轻松下载并运行各种顶级的开源大模型（如 deepseek、Qwen 、GLM等）。

因此要想在本地部署一个大语言模型，首先就需要在安装一下ollama这个软件。

1. 下载 Ollama

首先来到 Ollama 官网：https://ollama.com/
点击右上角的 Download 按钮，选择自己电脑对应的操作系统版本进行下载（本文将以 Windows 系统做演示）

下载好后，点击 .exe 文件进行安装。程序默认会直接安装到 C 盘，且在安装时无法更改，同时我也建议各位尽量不要用别的方式更改避免后续报错。

安装完成后打开ollama应用程序点击settings按钮

然后将Model location 改成除C盘以外的固态盘分区内，不然后续大模型都会装在你C盘里给你C盘撑爆(当然你C盘要是分了1T就当我没说)

第二步：下载开源大模型到本地

回到 Ollama 官网，点击顶部的 Models，你就能看到海量的开源大语言模型，比如 DeepSeek、Qwen（通义千问）、GLM 等等。我们这里以 DeepSeek-R1 模型为例给大家做演示。

点击进去我们可以看到有不同版本的 deepseek R1 模型以及下载安装该模型的命令代码

为什么同一个模型会有 7b、14b 等这么多版本？我们到底应该怎么选？

很多新手在这里会感到一头雾水，其实理解起来非常简单：这里的字母“b”代表的是英文 Billion（十亿）。所谓的 7b，就是指这个模型包含了 70 亿个参数；14b 就是 140 亿个参数。你可以把“参数量”直接理解为这个 AI 大脑的“脑细胞数量”参数量越大（如 32b、70b）：模型的“脑细胞”越多，它就越聪明，逻辑推理能力越强，能处理更复杂的长文本和专业问题。但代价是，它非常“吃”你电脑的硬件资源（主要是运行内存和显卡的显存），如果你的电脑配置不够，强行运行会要么根本跑不动，要么一个简单的对话它会需要好几分钟才能给出回答。参数量越小（如 1.5b、7b）：模型相对轻量级，虽然在极其复杂的逻辑问题上可能不如大参数版本聪明，但它对普通电脑非常友好，运行速度极快，用来做日常的文本润色、简单的代码辅助或闲聊已经完全足够了。

这里给大家一些建议

7b 版本（入门首选）：如果你的电脑的内存是8-16GB，显存是4-8GB，建议你选择 7b（或更小参数）的版本。

14b - 32b 版本（进阶体验）：如果你的电脑内存达到了 16GB 到 32GB，显存在12-16GB之间，那么你就可以尝试下载这个14b-32b区间段的版本，我自己电脑的配置是32G内存+16G显存，勉强能带的动32b的版本，但是体验并不好，更多的还是使用14b或27b的版本

那么如何查看自己电脑的配置呢？

点击电脑Windows 开始按钮搜索“设置” 进入设置页面

然后点击系统

然后点击 系统信息

然后显卡这里的 16GB 就是你的显存容量 机带RAM 32GB 就是你的内存容量啦

现在知道了你电脑的配置后就可以选择适合的模型进行下载安装了。

执行下载与运行命令

首先我们同时按键盘上的 Win + R 键，输入 cmd 按回车，调出黑色控制台窗口

这个时候我们就得去复制这个 ollama run deepseek -r1 这个命令到控制台了，复制完后记得在后面加上 :模型参数来指定具体模型

例如你要下载 7b 版本那就是 ollama run deepseek-r1:7b 然后按回车你就会看到模型开始下载啦

接下来请耐心等待模型下载，当屏幕上出现 success 时，就说明下载成功了

然后我们重新打来ollama 客户端点击模型选择处，找到我们刚才下载的模型并选择然后在旁边的输入框就可以使用本地模型啦

看到这里，相信你已经完整掌握了下载并安装开源大模型的方法。那么回到文章标题：如何解决AI模型的各种限制呢？

安装“破限版本”的AI大语言模型

我们要明白一件事情：即使是各大科技公司免费开源出来的大语言模型，在出厂训练时，也已经对它的输出做了严格的安全对齐和限制。这主要是为了避免大模型被不法分子滥用。那你可能就要说了：“那你前面吹了半天本地部署破限版本的AI 干啥，最后不还是做不到吗？”

朋友，我知道你很急，但是你先别急。

虽然官方原版有限制，但架不住开源社区里有一大批技术极客！他们为了学术研究或追求更自由的 AI 体验，会专门去对这些官方大模型进行“解除限制”的技术处理（常被称为“破限”），并将处理后的版本重新发布到开源社区供大家交流。

我们只需要下载这种“破限版本”就可以了。

那么该如何寻找破限版本的模型呢？

1.首先我们依旧来到 Ollama 官网的 Models 搜索界面。输入你想要找的模型名，这里以 Qwen 为例

2.然后我们找到后缀带有abliterated 后缀字样的模型这种的就是破限后的版本啦

3.找到后，同样复制它的下载命令（例如 ollama run ...），在 cmd 控制台中运行下载。

至此，大功告成！现在，一个完全属于你、且去除了各种限制的私人本地 AI，就已经部署好了。

虽然我们通过本地部署获得了极大的自由，破除了很多不必要的束缚，但在这里还是要特别提醒大家：即便是本地部署的模型，也绝对不要用来从事任何违法乱纪或违背社会公序良俗的事情。 “本地部署”绝不是法外之地。技术本身是中立的，但使用技术的人必须有底线。AI 的安全、健康与合理使用，需要我们每一个人的共同维护。希望大家都能让 AI 成为提升自己工作和学习效率的利器，而不是用来做坏事的工具！

OpenClaw + cpolar + 蓝耘MaaS：把家里的 AI 变成“随身数字员工”，出门也能写代码、看NAS电影、远程桌面

目录前言 1 OpenClaw和cpolar是什么？ 1.1 OpenClaw：跑在你自己电脑上的本地 AI 智能体 1.2 cpolar：打通内网限制的内网穿透桥梁 2 下载安装cpolar 2.1 下载cpolar 2.2 蓝耘 MaaS 平台：给 OpenClaw 装上“最强大脑” 2.3 注册及登录cpolar web ui管理界面 2.4 一键安装 OpenClaw 并对接蓝耘 MaaS 3 OpenClaw + cpolar 的 N 种玩法 3.1 出门在外也能看家里 NAS

人工智能：多模态大模型原理与跨模态应用实战

人工智能：多模态大模型原理与跨模态应用实战 1.1 本章学习目标与重点 💡 学习目标：掌握多模态大模型的核心原理、跨模态特征融合方法，以及基于多模态模型的图文生成与理解任务实战流程。 💡 学习重点：理解多模态模型的架构设计，学会使用 Hugging Face 生态工具调用 CLIP 与 BLIP-2 模型，完成图文检索与图像描述生成任务。 1.2 多模态大模型的核心概念与发展背景 1.2.1 什么是多模态大模型 💡 多模态大模型是指能够同时处理文本、图像、音频、视频等多种不同类型数据的人工智能模型。它打破了传统单模态模型的信息壁垒，实现了跨模态的理解与生成。多模态大模型的核心能力体现在两个方面： * 跨模态理解：实现不同模态数据之间的关联分析，例如根据文本描述查找对应图像、根据图像内容生成文字摘要。 * 跨模态生成：以一种模态数据为输入，生成另一种模态的数据，例如文本生成图像、图像生成文本、语音生成视频等。与单模态大模型相比，多模态大模型更贴近人类的认知方式。人类在认识世界的过程中，本身就是通过视觉、听觉、语言等多种感官渠道接收和处理信息的。

深度解析 MySQL 与 MCP 集成：从环境构建到 AI 驱动的数据交互全流程

前言在当前大语言模型（LLM）应用开发的浪潮中，MCP（Model Context Protocol）协议正在成为连接 AI 模型与本地数据设施的关键桥梁。本文将以 MySQL 数据库为例，详细拆解如何通过 MCP 协议让 AI 模型直接操作关系型数据库，涵盖从服务器发现、数据库架构设计、数据初始化、MCP 配置文件编写到复杂自然语言查询与写入的全过程。第一部分：MCP 服务器的发现与配置获取在进行任何数据交互之前，首要任务是确立连接协议与服务源。通过蓝耘 MCP 广场，开发者可以快速检索并获取所需的 MCP 服务器配置。在搜索栏输入 mysql 关键字，系统会立即检索出相关的 MCP 服务器资源。如下图所示，搜索结果中清晰展示了 MySQL 对应的 MCP 服务卡片。点击选中该 MCP 服务器后，

本地化部署方案：GraphRAG+LangChain+Ollama 驱动 LLaMa 3.1 集成 Neo4j 实战

本文将带您从零开始，用不到50行核心代码实现基于本地大模型 LLaMa 3.1 的 GraphRAG 应用开发。我们将整合 LangChain 工作流、Ollama 模型管理工具与 Neo4j 图数据库，构建一套支持实体关系挖掘与混合检索的增强生成系统，全程无需依赖云端 API，兼顾数据安全与开发效率。一、先搞懂核心概念：什么是 GraphRAG？传统 RAG（检索增强生成）依赖向量数据库的语义相似度匹配，容易丢失实体间的关联信息。而 GraphRAG（图检索增强生成）则通过"节点-关系"的图结构建模数据，将分散的文本块转化为结构化知识网络，让 LLM 能基于实体关联进行推理，输出更具逻辑性的答案。其核心价值在于： * 结构化上下文：将"蒂姆·库克""苹果公司&