DeepSeek-OCR-WEBUI 私有化部署指南

DeepSeek-OCR-WEBUI 私有化部署指南 | 极客日志

Frontend: Gradio UI 
Inference Engine: HuggingFace Transformers 
Model: deepseek-ai/DeepSeek-OCR 
Runtime: Docker + nvidia-container-toolkit 
Hardware Support: NVIDIA GPU (CUDA >= 11.8), Apple Silicon (MPS)

功能	描述
7 种识别模式	支持文档解析、通用 OCR、图表提取、查找定位、图像描述、纯文本提取、自定义提示
边界框可视化	在'Find'模式下自动标注文字位置，便于结构化信息提取
PDF 自动转换	上传 PDF 文件后自动转为图片序列进行逐页识别
多语言支持	简体中文、繁体中文、英文、日文混合识别
GPU 加速推理	利用 NVIDIA GPU 实现 bfloat16 精度推理，显著提升吞吐量
ModelScope 自动切换	当 Hugging Face 不可达时，自动从魔搭社区下载模型

# 更新软件包索引
sudo apt-get update
# 安装必要依赖
sudo apt-get install -y apt-transport-https ca-certificates curl software-properties-common
# 添加 Docker 官方 GPG 密钥
curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo apt-key add -
# 添加 Docker 稳定版仓库
sudo add-apt-repository "deb [arch=amd64] https://download.docker.com/linux/ubuntu $(lsb_release -cs) stable"
# 再次更新并安装 Docker CE
sudo apt-get update
sudo apt-get install -y docker-ce
# 将当前用户加入 docker 组，避免每次使用 sudo
sudo usermod -aG docker ${USER}

sudo tee /etc/docker/daemon.json <<-'EOF'
{
  "data-root": "/data/docker",
  "exec-opts":["native.cgroupdriver=systemd"],
  "registry-mirrors": [
    "https://docker.m.daocloud.io",
    "https://mirror.ccs.tencentyun.com",
    "https://hub-mirror.c.163.com"
  ],
  "log-driver":"json-file",
  "log-opts": {"max-size":"100m", "max-file":"3"}
}
EOF
# 重启 Docker 服务
sudo systemctl daemon-reload
sudo systemctl restart docker
sudo systemctl enable docker

nvidia-smi

# 安装基础依赖
sudo apt-get update && sudo apt-get install -y --no-install-recommends curl gnupg2
# 添加 NVIDIA 容器工具链 GPG 密钥和源
curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg
curl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list | \
sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' | \
sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list
# 启用 experimental 源（可选）
sudo sed -i -e '/experimental/ s/^#//g' /etc/apt/sources.list.d/nvidia-container-toolkit.list
# 更新并安装工具包
sudo apt-get update
export NVIDIA_CONTAINER_TOOLKIT_VERSION=1.18.0-1
sudo apt-get install -y \
  nvidia-container-toolkit=${NVIDIA_CONTAINER_TOOLKIT_VERSION} \
  nvidia-container-toolkit-base=${NVIDIA_CONTAINER_TOOLKIT_VERSION} \
  libnvidia-container-tools=${NVIDIA_CONTAINER_TOOLKIT_VERSION} \
  libnvidia-container1=${NVIDIA_CONTAINER_TOOLKIT_VERSION}

sudo nvidia-ctk runtime configure --runtime=docker
sudo cat /etc/docker/daemon.json

{
  "runtimes": {
    "nvidia": {
      "path": "nvidia-container-runtime"
    }
  }
}

sudo systemctl restart docker

docker run --rm --gpus all nvidia/cuda:13.0.1-runtime-ubuntu22.04 nvidia-smi

git clone https://github.com/neosun100/DeepSeek-OCR-WebUI.git
cd DeepSeek-OCR-WebUI

# 在安装系统依赖后添加 pip 国内源
RUN pip config set global.index-url https://mirrors.huaweicloud.com/repository/pypi/simple/
# 可提前安装 flash-attn whl 包以避免编译失败
COPY flash_attn-2.7.3+cu11torch2.6cxx11abiFALSE-cp312-cp312-linux_x86_64.whl .
RUN pip install flash_attn-2.7.3+cu11torch2.6cxx11abiFALSE-cp312-cp312-linux_x86_64.whl

docker compose up -d

docker compose ps --format "table {{.Name}}\t{{.Status}}\t{{.Ports}}"

NAME STATUS PORTS
deepseek-ocr-webui Up 2 minutes (health: starting) 6006/tcp, 8888/tcp, 0.0.0.0:8001->8001/tcp

docker logs -f deepseek-ocr-webui

# 查看日志（实时）
docker logs -f deepseek-ocr-webui
# 重启服务（适用于代码更新后）
docker restart deepseek-ocr-webui
# 完全重建服务（重新构建镜像）
docker compose down && docker compose up -d --build
# 查看资源占用情况
docker stats deepseek-ocr-webui
# 进入容器内部调试
docker exec -it deepseek-ocr-webui bash

# docker-compose.yml 片段
volumes:
  - ./models:/app/models

http://<your-server-ip>:8001/

curl -X POST "http://<ip>:8001/ocr" \ 
-H "Content-Type: multipart/form-data" \ 
-F "[email protected]" \ 
-F "mode=ocr"

{
  "text": "不被嘲笑的梦想\n是不值得去实现的",
  "boxes": [[x1,y1,x2,y2], ...],
  "success": true
}

不被嘲笑的夢想 是不值得去實現的 The dream of not being laughed at Is not worth achieving 锤子科技創始人 羅永浩 RiTOP 锐拓 昵享网 www.nipic.cn ID:33621067NO:20221012112425239106

此图片采用卡通艺术风格绘制，描绘了四位长者并排站立，背景是点缀着白云的蓝天。 ... 底部中央处写有短语'欢迎您回来，大小姐！'

DeepSeek-OCR-WEBUI 私有化部署指南

1. 背景与需求分析

2. 技术架构与核心优势

2.1 系统整体架构

2.2 核心功能亮点

3. 部署环境准备

3.1 基础环境要求

3.2 安装 Docker 运行时

3.3 配置 Docker 镜像加速与存储路径

4. 部署 NVIDIA 容器工具包

4.1 验证 GPU 驱动状态

4.2 安装 NVIDIA Container Toolkit

4.3 配置 Docker 默认使用 NVIDIA 运行时

4.4 测试 GPU 容器支持

5. 拉取并构建 DeepSeek-OCR-WEBUI 镜像

5.1 克隆项目代码

5.2 优化 Dockerfile（可选）

5.3 使用 Docker Compose 启动服务

6. 服务管理与日常运维

6.1 常用容器操作命令

6.2 模型缓存路径说明

7. 功能测试与接口调用

7.1 Web 界面访问

7.2 API 文档与健康检查

7.3 实际识别效果示例

示例 1：中文海报识别

示例 2：卡通图像描述

8. 总结

更多推荐文章

相关免费在线工具

DeepSeek-OCR-WEBUI 私有化部署指南

1. 背景与需求分析

2. 技术架构与核心优势

2.1 系统整体架构

2.2 核心功能亮点

3. 部署环境准备

3.1 基础环境要求

3.2 安装 Docker 运行时

3.3 配置 Docker 镜像加速与存储路径

4. 部署 NVIDIA 容器工具包

4.1 验证 GPU 驱动状态

4.2 安装 NVIDIA Container Toolkit

4.3 配置 Docker 默认使用 NVIDIA 运行时

4.4 测试 GPU 容器支持

5. 拉取并构建 DeepSeek-OCR-WEBUI 镜像

5.1 克隆项目代码

5.2 优化 Dockerfile（可选）

5.3 使用 Docker Compose 启动服务

6. 服务管理与日常运维

6.1 常用容器操作命令

6.2 模型缓存路径说明

7. 功能测试与接口调用

7.1 Web 界面访问

7.2 API 文档与健康检查

7.3 实际识别效果示例

示例 1：中文海报识别

示例 2：卡通图像描述

8. 总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具