基于 Docker 和 Ollama 本地部署 DeepSeek 大模型 | 极客日志

Shell / BashAI算法

基于 Docker 和 Ollama 本地部署 DeepSeek 大模型

通过 Docker 和 Ollama 工具，在本地 CentOS 系统上部署 DeepSeek 大语言模型。文章涵盖 Docker 与 Ollama 基础概念、环境准备、Docker 安装配置、Ollama 容器启动及 DeepSeek 模型拉取运行步骤，实现了无需联网即可在本地进行 AI 推理的目标，并提供验证与退出方法。

灵魂摆渡发布于 2026/2/7更新于 2026/4/186K 浏览

基于 Docker 和 Ollama 本地部署 DeepSeek 大模型

基于 Docker 和 Ollama 本地部署 DeepSeek 大模型

一、引言

1. 什么是 Docker

Docker 就像一个'打包好的 App'。想象一下，你写了一个很棒的程序，在自己的电脑上运行得很好。但当你把它发给别人，可能会遇到各种问题：

'这个软件需要 Python 3.8，但我只有 Python 3.6！'
'我没有你用的那个库，安装失败了！'
'你的程序要跑在 Linux，我的电脑是 Windows！'

Docker 的作用：它把你的软件、依赖、环境、系统配置等全部封装到一个'容器'里，别人拿到这个容器，就能直接运行，而不用关心它内部的细节。

把 Docker 想象成'集装箱'

传统运输（传统部署）：货物需要不同的包装方式，可能损坏，装卸麻烦。
有了 Docker（容器部署）：货物装进标准化集装箱，不管运到哪里，集装箱里东西不变，码头和船只可以直接装卸。

Docker 让软件像'集装箱'一样标准化、可移植、易部署！

文章配图

2. 什么是 Ollama

Ollama 是一个本地运行大语言模型（LLM）的工具，它可以让你在自己的电脑上直接运行 AI 模型，而不需要连接云端服务器。

简单来说：Ollama 让你像运行普通软件一样，轻松在本地使用 ChatGPT、Llama、Mistral、Gemma 等大语言模型。

核心特点

本地运行：不需要联网，也不用担心隐私问题，所有计算都在你的电脑上完成。
支持多种开源模型：可以运行 Llama 3、Mistral、Gemma、Code Llama 等不同的大模型。
易于安装和使用：只需要几条命令，就能下载并运行 AI 模型。
轻量化优化：适配 Mac（Apple Silicon）、Linux 和 Windows，支持 GPU 加速，让模型运行更快。
离线推理：适合不想依赖 OpenAI API 或其他云端 AI 服务的用户。

文章配图

二、准备工作

1. 操作系统

这里我们使用的操作系统为 CentOS 7.9，配置为 4 核 8G，大家也可以使用其他的 Linux 发行版本，或者使用 Windows。

2. 镜像准备

如果已经安装了 Docker，可以提前准备好镜像 ollama/ollama，镜像比较大，拉取会耗一些时间。

文章配图

三、安装

极客日志微信公众号二维码

更多推荐文章

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online

关闭防火墙

systemctl stop firewalld && systemctl disable firewalld

关闭 SELinux
```
setenforce 0
```

更换 yum 源

rm -f /etc/yum.repos.d/* \
curl -o /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-7.repo \
yum clean all && yum makecache

安装依赖项

yum install -y yum-utils device-mapper-persistent-data lvm2

文章配图

添加 Docker 源

yum-config-manager --add-repo http://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo

安装 Docker
```
yum install docker-ce -y
```

添加 Docker 镜像加速器

vim /etc/docker/daemon.json

添加如下内容：

{
  "registry-mirrors": [
    "https://docker.m.daocloud.io",
    "https://noohub.ru",
    "https://huecker.io",
    "https://dockerhub.timeweb.cloud",
    "https://0c105db5188026850f80c001def654a0.mirror.swr.myhuaweicloud.com",
    "https://5tqw56kt.mirror.aliyuncs.com",
    "https://docker.1panel.live",
    "http://mirrors.ustc.edu.cn/",
    "http://mirror.azure.cn/",
    "https://hub.rat.dev/",
    "https://docker.ckyl.me/",
    "https://docker.chenby.cn",
    "https://docker.hpcloud.cloud"
  ]
}

启动 Docker
```
systemctl start docker
```

启动 Ollama 容器
```
docker run -itd -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama
```
- docker run：运行一个新的 Docker 容器。
- -itd：组合多个选项（保持标准输入、分配终端、后台运行容器）。
- -v ollama:/root/.ollama：挂载数据卷，确保数据持久化。
- -p 11434:11434：端口映射，宿主机可通过 http://localhost:11434 访问 Ollama 服务。
- --name ollama：指定容器名称。
- ollama/ollama：使用的 Docker 镜像。
如果是使用 GPU 运行，则用下面的命令启动：
```
docker run -itd --name ollama --gpus=all -v ollama:/root/.ollama -p 11434:11434 ollama/ollama
```
查看 Ollama 容器
```
docker ps
```

进入到容器中
```
docker exec -it ollama /bin/bash
```
拉取模型
```
ollama pull deepseek-r1:7b
```
在官网中，有许多 DeepSeek 的模型，这里主要是演示，所以拉取了一个较小的模型。官网地址：deepseek-r1
查看模型
```
ollama list
```

ollama run deepseek-r1:7b

退出交互模式：输入 /bye 或按 Ctrl+D 即可退出容器内的 shell。

API 调用：Ollama 默认监听 11434 端口，也可以通过 HTTP API 进行调用，例如：

curl http://localhost:11434/api/generate -d '{"model": "deepseek-r1:7b", "prompt": "你好"}'