解锁DeepSeek潜能：Docker+Ollama打造本地大模型部署新范式

Ne0inhk

16 Mar 2026 — 6 min read

🐇明明跟你说过：个人主页

🏅个人专栏：《深度探秘：AI界的007》 🏅

🔖行路有良友，便是天堂🔖

一、引言

1、什么是Docker

Docker：就像一个“打包好的App”

想象一下，你写了一个很棒的程序，在自己的电脑上运行得很好。但当你把它发给别人，可能会遇到各种问题：

“这个软件需要 Python 3.8，但我只有 Python 3.6！”
“我没有你用的那个库，安装失败了！”
“你的程序要跑在 Linux，我的电脑是 Windows！”

💡 Docker 的作用：它就像一个“打包好的 App”，把你的软件、依赖、环境、系统配置等 全部封装到一个“容器” 里，别人拿到这个容器，就能直接运行，而不用关心它内部的细节。

🚀 把 Docker 想象成“集装箱”

传统运输 vs. 集装箱运输

以前（传统部署）：

货物（程序）需要不同的包装方式（运行环境）
货物可能损坏（环境不兼容）
装卸麻烦（程序迁移难）

有了 Docker（容器部署）：

货物装进标准化集装箱（Docker 容器）
不管运到哪里，集装箱里东西不变（程序环境一致）
码头和船只可以直接装卸（轻松部署到不同系统）

Docker 让软件像“集装箱”一样标准化、可移植、易部署！ 🚢

2、什么是Ollama

Ollama 是一个本地运行大语言模型（LLM）的工具，它可以让你 在自己的电脑上直接运行 AI 模型，而不需要连接云端服务器。

💡 简单来说：Ollama 让你像运行普通软件一样，轻松在本地使用 ChatGPT、Llama、Mistral、Gemma 等大语言模型。

🚀 Ollama 的核心特点

本地运行 🏠
- 你不需要联网，也不用担心隐私问题，所有计算都在你的电脑上完成。
支持多种开源模型 📚
- 可以运行 Llama 3、Mistral、Gemma、Code Llama 等不同的大模型。
易于安装和使用 🔧
- 只需要几条命令，就能下载并运行 AI 模型。
轻量化优化 ⚡
- 适配 Mac（Apple Silicon）、Linux 和 Windows，支持 GPU 加速，让模型运行更快。
离线推理 🔒
- 适合不想依赖 OpenAI API 或其他云端 AI 服务的用户。

二、准备工作

1、操作系统

这里我们使用的操作系统为Centos 7.9，配置为4核8G，大家也可以使用其他的Linux发行版本，或者使用Windows。

2、镜像准备

如果已经安装了Docker，可以提前准备好镜像，ollama/ollama，镜像比较大，拉取会耗一些时间

三、安装

1、安装Docker

1.关闭防火墙

systemctl stop firewalld && systemctl disabled firewalld

2.关闭SELinux

setenforce 0

3.更换yum源

rm -f /etc/yum.repos.d/* curl -o /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-7.repo yum clean all && yum makecache

4.安装依赖项

yum install -y yum-utils device-mapper-persistent-data lvm2

5. 添加Docker源

yum-config-manager --add-repo http://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo

6.安装Docker

yum install docker-ce -y

7.添加Docker镜像加速器

vim /etc/docker/daemon.json # 添加如下内容 { "registry-mirrors": [ "https://docker.m.daocloud.io", "https://noohub.ru", "https://huecker.io", "https://dockerhub.timeweb.cloud", "https://0c105db5188026850f80c001def654a0.mirror.swr.myhuaweicloud.com", "https://5tqw56kt.mirror.aliyuncs.com", "https://docker.1panel.live", "http://mirrors.ustc.edu.cn/", "http://mirror.azure.cn/", "https://hub.rat.dev/", "https://docker.ckyl.me/", "https://docker.chenby.cn", "https://docker.hpcloud.cloud", "https://docker.m.daocloud.io" ] }

8.启动Docker

systemctl start docker

2、启动Ollama

1.启动Ollama容器

docker run -itd -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama

docker run 运行一个新的 Docker 容器
-itd 组合多个选项：
- ✅ -i（保持标准输入）
- ✅ -t（分配终端）
- ✅ -d（后台运行容器）
-v ollama:/root/.ollama 挂载数据卷，把 ollama 这个 Docker 数据卷绑定到容器的 /root/.ollama 目录，确保数据持久化（如下载的模型不会丢失）。
-p 11434:11434 端口映射，把宿主机（本机）的 11434 端口映射到容器内部的 11434 端口，这样宿主机可以通过 http://localhost:11434 访问 Ollama 服务。
--name ollama 指定容器名称为 ollama，方便管理和启动。
ollama/ollama 使用的 Docker 镜像，这里是官方的 Ollama 镜像。

如果是使用GPU运行，则用下面的命令启动

docker run -itd --name ollama --gpus=all -v ollama:/root/.ollama -p 11434:11434 ollama/ollama

2.查看Ollama容器

docker ps

3、拉取Deepseek大模型

1.进入到容器中

docker exec -it ollama /bin/bash

2.拉取模型

ollama pull deepseek-r1:7b

在官网中，有许多Deepseek的模型，这里主要是演示，所以拉取了一个较小的模型

官网地址：deepseek-r1

3.查看模型

ollama list

4、启动Deepseek

ollama run deepseek-r1:7b

💕💕💕每一次的分享都是一次成长的旅程，感谢您的陪伴和关注。希望这些文章能陪伴您走过技术的一段旅程，共同见证成长和进步！😺😺😺

🧨🧨🧨让我们一起在技术的海洋中探索前行，共同书写美好的未来！！！

【大模型系列篇】大模型基建工程：基于 FastAPI 自动构建 SSE MCP 服务器

今天我们将使用FastAPI来构建 MCP 服务器，Anthropic 推出的这个MCP 协议，目的是让 AI 代理和你的应用程序之间的对话变得更顺畅、更清晰。FastAPI 基于 Starlette 和 Uvicorn，采用异步编程模型，可轻松处理高并发请求，尤其适合 MCP 场景下大模型与外部系统的实时交互需求，其性能接近 Node.js 和 Go，在数据库查询、文件操作等 I/O 密集型任务中表现卓越。开始今天的正题前，我们来回顾下相关的知识内容：《高性能Python Web服务部署架构解析》、《使用Python开发MCP Server及Inspector工具调试》、《构建智能体MCP客户端：完成大模型与MCP服务端能力集成与最小闭环验证》 FastAPI基础知识安装依赖 pip install uvicorn, fastapi FastAPI服务代码示例 from fastapi import FastAPI app

超详细图文教程：用vscode+copilot(代理模式)便捷使用mcp+一个范例：用自然语言进行3d建模

在vscode使用claude mcp吧！在vscode更新到最新版本（注意，这是前提）后，内置的copilot可以使用mcp了！！！关于mcp（Model Context Protocol 模型上下文协议），可以参考我的上一篇文章： MCP个人理解+示例+集成管理+在python中调用示例，给AI大模型装上双手-ZEEKLOG博客以下是使用教程： 1.点击左下角的齿轮状设置按钮，点击设置 2.在输入面板输入chat.agent.enabled，勾上勾选框 3.点击Ctrl+shift+P，输入reload，点击重新加载窗口，刷新窗口 4.打开copilot后，在右下角将模式改为代理即可。 5.点击工具按钮，开始安装mcp 先去github找到自己想要添加的mcp服务，以blender MCP为例，打开https://github.com/ahujasid/blender-mcp，可以在readme文档里看到详细的安装过程。可以看到，

02-mcp-server案例分享-Excel 表格秒变可视化图表 HTML 报告，就这么简单

1.前言 MCP Server（模型上下文协议服务器）是一种基于模型上下文协议（Model Context Protocol，简称MCP）构建的轻量级服务程序，旨在实现大型语言模型（LLM）与外部资源之间的高效、安全连接。MCP协议由Anthropic公司于2024年11月开源，其核心目标是解决AI应用中数据分散、接口不统一等问题，为开发者提供标准化的接口，使AI模型能够灵活访问本地资源和远程服务，从而提升AI助手的响应质量和工作效率。 MCP Server 的架构与工作原理 MCP Server 采用客户端-服务器（Client-Server）架构，其中客户端（MCP Client）负责与服务器建立连接，发起请求，而服务器端则处理请求并返回响应。这种架构确保了数据交互的高效性与安全性。例如，客户端可以向服务器发送请求，如“查询数据库中的某个记录”或“调用某个API”，而服务器则根据请求类型，调用相应的资源或工具，完成任务并返回结果。 MCP Server 支持动态发现和实时更新机制。例如，当新的资源或工具被添加到服务器时，

将现有 REST API 转换为 MCP Server工具 -higress

Higress 是一款云原生 API 网关，集成了流量网关、微服务网关、安全网关和 AI 网关的功能。它基于 Istio 和 Envoy 开发，支持使用 Go/Rust/JS 等语言编写 Wasm 插件。提供了数十个通用插件和开箱即用的控制台。 Higress AI 网关支持多种 AI 服务提供商，如 OpenAI、DeepSeek、通义千问等，并具备令牌限流、消费者鉴权、WAF 防护、语义缓存等功能。 MCP Server 插件配置 higress 功能说明 * mcp-server 插件基于 Model Context Protocol (MCP)，专为 AI 助手设计，

一、引言

1、什么是Docker

2、什么是Ollama

二、准备工作

1、操作系统

2、镜像准备

三、安装

1、安装Docker

2、启动Ollama

3、拉取Deepseek大模型

4、启动Deepseek

Read more

【大模型系列篇】大模型基建工程：基于 FastAPI 自动构建 SSE MCP 服务器

超详细图文教程：用vscode+copilot(代理模式)便捷使用mcp+一个范例：用自然语言进行3d建模

02-mcp-server案例分享-Excel 表格秒变可视化图表 HTML 报告，就这么简单

将现有 REST API 转换为 MCP Server工具 -higress