解锁DeepSeek潜能：Docker+Ollama打造本地大模型部署新范式

Ne0inhk

15 Mar 2026 — 6 min read

🐇明明跟你说过：个人主页

🏅个人专栏：《深度探秘：AI界的007》 🏅

🔖行路有良友，便是天堂🔖

一、引言

1、什么是Docker

Docker：就像一个“打包好的App”

想象一下，你写了一个很棒的程序，在自己的电脑上运行得很好。但当你把它发给别人，可能会遇到各种问题：

“这个软件需要 Python 3.8，但我只有 Python 3.6！”
“我没有你用的那个库，安装失败了！”
“你的程序要跑在 Linux，我的电脑是 Windows！”

💡 Docker 的作用：它就像一个“打包好的 App”，把你的软件、依赖、环境、系统配置等 全部封装到一个“容器” 里，别人拿到这个容器，就能直接运行，而不用关心它内部的细节。

🚀 把 Docker 想象成“集装箱”

传统运输 vs. 集装箱运输

以前（传统部署）：

货物（程序）需要不同的包装方式（运行环境）
货物可能损坏（环境不兼容）
装卸麻烦（程序迁移难）

有了 Docker（容器部署）：

货物装进标准化集装箱（Docker 容器）
不管运到哪里，集装箱里东西不变（程序环境一致）
码头和船只可以直接装卸（轻松部署到不同系统）

Docker 让软件像“集装箱”一样标准化、可移植、易部署！ 🚢

2、什么是Ollama

Ollama 是一个本地运行大语言模型（LLM）的工具，它可以让你 在自己的电脑上直接运行 AI 模型，而不需要连接云端服务器。

💡 简单来说：Ollama 让你像运行普通软件一样，轻松在本地使用 ChatGPT、Llama、Mistral、Gemma 等大语言模型。

🚀 Ollama 的核心特点

本地运行 🏠
- 你不需要联网，也不用担心隐私问题，所有计算都在你的电脑上完成。
支持多种开源模型 📚
- 可以运行 Llama 3、Mistral、Gemma、Code Llama 等不同的大模型。
易于安装和使用 🔧
- 只需要几条命令，就能下载并运行 AI 模型。
轻量化优化 ⚡
- 适配 Mac（Apple Silicon）、Linux 和 Windows，支持 GPU 加速，让模型运行更快。
离线推理 🔒
- 适合不想依赖 OpenAI API 或其他云端 AI 服务的用户。

二、准备工作

1、操作系统

这里我们使用的操作系统为Centos 7.9，配置为4核8G，大家也可以使用其他的Linux发行版本，或者使用Windows。

2、镜像准备

如果已经安装了Docker，可以提前准备好镜像，ollama/ollama，镜像比较大，拉取会耗一些时间

三、安装

1、安装Docker

1.关闭防火墙

systemctl stop firewalld && systemctl disabled firewalld

2.关闭SELinux

setenforce 0

3.更换yum源

rm -f /etc/yum.repos.d/* curl -o /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-7.repo yum clean all && yum makecache

4.安装依赖项

yum install -y yum-utils device-mapper-persistent-data lvm2

5. 添加Docker源

yum-config-manager --add-repo http://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo

6.安装Docker

yum install docker-ce -y

7.添加Docker镜像加速器

vim /etc/docker/daemon.json # 添加如下内容 { "registry-mirrors": [ "https://docker.m.daocloud.io", "https://noohub.ru", "https://huecker.io", "https://dockerhub.timeweb.cloud", "https://0c105db5188026850f80c001def654a0.mirror.swr.myhuaweicloud.com", "https://5tqw56kt.mirror.aliyuncs.com", "https://docker.1panel.live", "http://mirrors.ustc.edu.cn/", "http://mirror.azure.cn/", "https://hub.rat.dev/", "https://docker.ckyl.me/", "https://docker.chenby.cn", "https://docker.hpcloud.cloud", "https://docker.m.daocloud.io" ] }

8.启动Docker

systemctl start docker

2、启动Ollama

1.启动Ollama容器

docker run -itd -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama

docker run 运行一个新的 Docker 容器
-itd 组合多个选项：
- ✅ -i（保持标准输入）
- ✅ -t（分配终端）
- ✅ -d（后台运行容器）
-v ollama:/root/.ollama 挂载数据卷，把 ollama 这个 Docker 数据卷绑定到容器的 /root/.ollama 目录，确保数据持久化（如下载的模型不会丢失）。
-p 11434:11434 端口映射，把宿主机（本机）的 11434 端口映射到容器内部的 11434 端口，这样宿主机可以通过 http://localhost:11434 访问 Ollama 服务。
--name ollama 指定容器名称为 ollama，方便管理和启动。
ollama/ollama 使用的 Docker 镜像，这里是官方的 Ollama 镜像。

如果是使用GPU运行，则用下面的命令启动

docker run -itd --name ollama --gpus=all -v ollama:/root/.ollama -p 11434:11434 ollama/ollama

2.查看Ollama容器

docker ps

3、拉取Deepseek大模型

1.进入到容器中

docker exec -it ollama /bin/bash

2.拉取模型

ollama pull deepseek-r1:7b

在官网中，有许多Deepseek的模型，这里主要是演示，所以拉取了一个较小的模型

官网地址：deepseek-r1

3.查看模型

ollama list

4、启动Deepseek

ollama run deepseek-r1:7b

💕💕💕每一次的分享都是一次成长的旅程，感谢您的陪伴和关注。希望这些文章能陪伴您走过技术的一段旅程，共同见证成长和进步！😺😺😺

🧨🧨🧨让我们一起在技术的海洋中探索前行，共同书写美好的未来！！！

基于ASR的语音切分与说话人区分实战：从算法选型到生产环境部署

快速体验在开始今天关于基于ASR的语音切分与说话人区分实战：从算法选型到生产环境部署的探讨之前，我想先分享一个最近让我觉得很有意思的全栈技术挑战。我们常说 AI 是未来，但作为开发者，如何将大模型（LLM）真正落地为一个低延迟、可交互的实时系统，而不仅仅是调个 API？这里有一个非常硬核的动手实验：基于火山引擎豆包大模型，从零搭建一个实时语音通话应用。它不是简单的问答，而是需要你亲手打通 ASR（语音识别）→ LLM（大脑思考）→ TTS（语音合成）的完整 WebSocket 链路。对于想要掌握 AI 原生应用架构的同学来说，这是个绝佳的练手项目。从0到1构建生产级别应用，脱离Demo，点击打开从0打造个人豆包实时通话AI动手实验基于ASR的语音切分与说话人区分实战：从算法选型到生产环境部署背景痛点：为什么语音切分与说话人区分如此困难？在处理连续语音流时，开发者常遇到两个核心问题：语音切分不准和说话人混淆。想象一个会议录音场景，当多人快速交替发言时，传统方法很难准确判断一句话的起止时间以及谁在说话。通过FFT频谱图可以直观看到挑战： *

数据结构——跳表

目录 1.什么是跳表-skiplist 2.skiplist的效率如何保证？ 3.skiplist的实现 4.skiplist跟平衡搜索树和哈希表的对比 1.什么是跳表-skiplist skiplist本质上也是一种查找结构，用于解决算法中的查找问题，跟平衡搜索树和哈希表的价值是一样的，可以作为key或者key/value的查找模型。那么相比而言它的优势是什么的呢？这么等我们学习完它的细节实现，我们再来对比 skiplist是由William Pugh发明的，最早出现于他在1990年发表的论文《Skip Lists: A Probabilistic Alternative to Balanced Trees》 skiplist，顾名思义，首先它是一个list。实际上，它是在有序链表的基础上发展起来的。如果是一个有序的链表，查找数据的时间复杂度是O(N) William Pugh开始的优化思路： 1. 假如我们每相邻两个节点升高一层，增加一个指针，让指针指向下下个节点，如下图b所示。这样所有新增加的指针连成了

数据结构之图论详解

找往期文章包括但不限于本期文章中不懂的知识点：个人主页：我要学编程(ಥ_ಥ)-ZEEKLOG博客所属专栏：数据结构（Java版）目录图的基本概念图的存储结构邻接矩阵邻接表图的遍历广度优先遍历（BFS）深度优先遍历（DFS）最小生成树 Kruskal算法（克鲁斯卡尔算法） Prim算法（普利姆算法）最短路径单源最短路径 — Dijkstra算法单源最短路径—Bellman-Ford算法多源最短路径—Floyd-Warshall算法图的基本概念图是由顶点集合及顶点间的关系组成的一种数据结构：G=(V，E)，其中顶点集合V={x|x属于某个数据对象集}是有穷非空集合；E = {(x,y)|x,y属于V}或者E = {<x, y>

【算法】二分查找算法详解与模板总结：从原理到变体，一篇就够了

目录 * 二分查找算法详解 * 基本原理 * 算法步骤 * 代码实现 * 基础版本（查找精确值） * 时间复杂度分析 * 二分查找的变体 * 1. 查找第一个等于目标的位置 * 2. 查找最后一个等于目标的位置 * 3. 查找第一个大于等于目标的位置 * 常见应用场景 * 注意事项和常见错误 * 二分算法模板总结 * 实战练习题目（含链接）二分查找算法详解二分查找（Binary Search）是一种在有序数组中查找特定元素的高效算法。它的核心思想是分而治之，每次将搜索范围缩小一半。基本原理想象你在查英语字典找"apple"这个词： 1. 翻开字典的中间 2. 如果这一页的单词在"apple"之前，就往后翻 3. 如果这一页的单词在"apple"之后，就往前翻 4.

一、引言

1、什么是Docker

2、什么是Ollama

二、准备工作

1、操作系统

2、镜像准备

三、安装

1、安装Docker

2、启动Ollama

3、拉取Deepseek大模型

4、启动Deepseek

Read more

基于ASR的语音切分与说话人区分实战：从算法选型到生产环境部署

数据结构——跳表

数据结构之图论详解

【算法】二分查找算法详解与模板总结：从原理到变体，一篇就够了