DeepSeek-OCR-WebUI 部署实战：7 种模式与 GPU 加速多语言识别

DeepSeek-OCR-WebUI 部署实战：7 种模式与 GPU 加速多语言识别 | 极客日志

组件	技术选型	说明
推理引擎	`transformers`	Hugging Face 官方库，稳定性强
模型来源	`deepseek-ai/DeepSeek-OCR`	支持 ModelScope 自动切换
GPU 运行时	NVIDIA Container Toolkit	实现容器内 GPU 访问
部署方式	Docker Compose	多容器编排，一键启动
数据预处理	OpenCV/Pillow	图像解码与格式转换

特性	transformers	vLLM
稳定性	⭐⭐⭐⭐⭐	⭐⭐⭐
兼容性	⭐⭐⭐⭐⭐	⭐⭐⭐
推理速度	⭐⭐⭐⭐	⭐⭐⭐⭐⭐
功能完整性	⭐⭐⭐⭐⭐	⭐⭐⭐⭐
部署复杂度	⭐⭐⭐⭐⭐	⭐⭐

# 更新软件包索引
sudo apt-get update
# 安装必要依赖
sudo apt-get install -y apt-transport-https ca-certificates curl software-properties-common
# 添加 Docker 官方 GPG 密钥
curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo apt-key add -
# 添加 Docker 稳定仓库
sudo add-apt-repository "deb [arch=amd64] https://download.docker.com/linux/ubuntu $(lsb_release -cs) stable"
# 再次更新索引
sudo apt-get update
# 安装 Docker CE
sudo apt-get install -y docker-ce
# 启动并设置开机自启
sudo systemctl enable docker && sudo systemctl start docker
# 验证安装
sudo docker --version

# 将当前用户加入 docker 组
sudo usermod -aG docker ${USER}
# 提示用户重新登录以生效
echo "请退出 SSH 并重新连接以应用权限变更"

sudo tee /etc/docker/daemon.json <<-'EOF'
{
  "data-root": "/data/docker",
  "exec-opts":["native.cgroupdriver=systemd"],
  "registry-mirrors": [
    "https://docker.m.daocloud.io",
    "https://mirror.ccs.tencentyun.com",
    "https://4hxooktm.mirror.aliyuncs.com"
  ],
  "log-driver":"json-file",
  "log-opts": {
    "max-size":"100m",
    "max-file":"3"
  }
}
EOF
# 重启 Docker 服务
sudo systemctl daemon-reload
sudo systemctl restart docker

nvidia-smi

# 安装基础依赖
sudo apt-get update && sudo apt-get install -y --no-install-recommends curl gnupg2
# 添加 GPG 密钥和 APT 源
curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg
curl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list | \
 sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' | \
 sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list
# 启用 experimental 源（可选）
sudo sed -i -e '/experimental/ s/^#//g' /etc/apt/sources.list.d/nvidia-container-toolkit.list
# 更新索引并安装组件
export NVIDIA_CONTAINER_TOOLKIT_VERSION=1.18.0-1
sudo apt-get update
sudo apt-get install -y \
 nvidia-container-toolkit=${NVIDIA_CONTAINER_TOOLKIT_VERSION} \
 nvidia-container-toolkit-base=${NVIDIA_CONTAINER_TOOLKIT_VERSION} \
 libnvidia-container-tools=${NVIDIA_CONTAINER_TOOLKIT_VERSION} \
 libnvidia-container1=${NVIDIA_CONTAINER_TOOLKIT_VERSION}

# 设置 nvidia 为默认 runtime
sudo nvidia-ctk runtime configure --runtime=docker
# 查看配置是否写入 daemon.json
sudo cat /etc/docker/daemon.json

{
  "runtimes": {
    "nvidia": {
      "path": "nvidia-container-runtime",
      "args": []
    }
  }
}

sudo systemctl restart docker

docker run --rm --gpus all nvidia/cuda:13.0.1-runtime-ubuntu22.04 nvidia-smi

cd ~
git clone https://github.com/neosun100/DeepSeek-OCR-WebUI.git
cd DeepSeek-OCR-WebUI

# 安装 OpenCV 等依赖库
RUN apt-get update && apt-get install -y \
 libgl1 \
 libglib2.0-0 \
 pkg-config \
 python3-dev \
 build-essential \
 && rm -rf /var/lib/apt/lists/*
# 配置 pip 国内镜像
RUN pip config set global.index-url https://mirrors.huaweicloud.com/repository/pypi/simple/

# 构建并后台启动容器
docker compose up -d
# 查看服务状态
docker compose ps --format "table {{.Name}}\t{{.Status}}\t{{.Ports}}"

watch -n 1 nvidia-smi

# 查看日志（跟踪启动过程）
docker logs -f deepseek-ocr-webui
# 重启服务
docker restart deepseek-ocr-webui
# 重建并重启
docker compose up -d --build
# 停止服务
docker compose down
# 查看资源占用
docker stats deepseek-ocr-webui

慢慢来，你又不差 你所有的压力，都是因为你太想要了， 你所有的痛苦，都是因为你太较真了。 有些事，不能尽你心意，就是在提醒了该转变了。 ...

An outdoor winter scene where snow is falling gently... 一幅冬日户外场景：雪花轻柔飘落，背景是清澈的蓝天。前景中站着一位年轻女子，她穿着保暖的冬装——一件黑色外套...

DeepSeek-OCR-WebUI 部署实战：7 种模式与 GPU 加速多语言识别

DeepSeek-OCR-WebUI 部署实战：7 种模式与 GPU 加速多语言识别

1. 引言

2. 核心功能与技术架构

2.1 功能亮点概览

2.2 技术架构分析

架构组成

推理引擎选择：transformers vs vLLM

3. 环境准备与依赖安装

3.1 基础环境要求

3.2 安装 Docker

3.3 配置非 root 用户权限

3.4 设置 Docker 镜像加速与存储路径

4. 安装 NVIDIA Container Toolkit

4.1 验证 GPU 驱动状态

4.2 安装 NVIDIA Container Toolkit

4.3 配置 Docker 默认 Runtime

4.4 重启 Docker 服务

4.5 测试 GPU 容器运行

5. 部署 DeepSeek-OCR-WebUI 服务

5.1 克隆项目代码

5.2 优化 Dockerfile（可选）

5.3 启动服务

5.4 监控与管理

实时 GPU 监控

容器操作命令

6. 功能测试与使用示例

6.1 通用 OCR 模式测试

6.2 图像描述模式测试

6.3 查找定位模式（Find Mode）

7. 总结

更多推荐文章

相关免费在线工具

DeepSeek-OCR-WebUI 部署实战：7 种模式与 GPU 加速多语言识别

DeepSeek-OCR-WebUI 部署实战：7 种模式与 GPU 加速多语言识别

1. 引言

2. 核心功能与技术架构

2.1 功能亮点概览

2.2 技术架构分析

架构组成

推理引擎选择：transformers vs vLLM

3. 环境准备与依赖安装

3.1 基础环境要求

3.2 安装 Docker

3.3 配置非 root 用户权限

3.4 设置 Docker 镜像加速与存储路径

4. 安装 NVIDIA Container Toolkit

4.1 验证 GPU 驱动状态

4.2 安装 NVIDIA Container Toolkit

4.3 配置 Docker 默认 Runtime

4.4 重启 Docker 服务

4.5 测试 GPU 容器运行

5. 部署 DeepSeek-OCR-WebUI 服务

5.1 克隆项目代码

5.2 优化 Dockerfile（可选）

5.3 启动服务

5.4 监控与管理

实时 GPU 监控

容器操作命令

6. 功能测试与使用示例

6.1 通用 OCR 模式测试

6.2 图像描述模式测试

6.3 查找定位模式（Find Mode）

7. 总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具