使用Docker安装Ollama及Open-WebUI完整教程

优质文章学习记录

10 Apr 2026 — 5 min read

作者：吴业亮
博客：wuyeliang.blog.ZEEKLOG.net

一、Ollama 简介及工作原理

1. Ollama 简介及原理

简介：Ollama 是一款轻量级、开源的大语言模型（LLM）运行工具，旨在简化本地部署和运行大语言模型的流程。它支持 Llama 3、Mistral、Gemini 等主流开源模型，用户无需复杂配置即可在本地设备（CPU 或 GPU）上快速启动模型，适用于开发测试、本地智能应用搭建等场景。
工作原理：
- 采用模型封装机制，将大语言模型的运行环境、依赖库及推理逻辑打包为标准化格式，实现模型的一键下载、启动和版本管理。
- 通过优化的推理引擎适配硬件架构，支持 CPU 基础运行和 GPU 加速（如 NVIDIA CUDA），减少资源占用并提升响应速度。
- 提供简洁的 REST API 和命令行接口，降低开发者集成门槛，无需深入了解模型底层细节即可调用。
- 支持容器化部署，确保跨环境一致性，避免依赖冲突问题。

2. Open-WebUI 简介及原理

简介：Open-WebUI 是一款开源的可视化界面工具，专为 Ollama 设计，提供直观的交互界面用于管理和使用大语言模型。它支持模型切换、对话历史记录、参数调整等功能，让本地大语言模型的使用更便捷。
工作原理：
- 作为前端交互层，通过 API 与 Ollama 后端通信，接收用户输入并将其转发给 Ollama 进行模型推理。
- 解析 Ollama 返回的结果并以自然语言对话形式展示给用户，同时记录对话历史并支持上下文关联。
- 提供模型管理功能，可直接在界面中下载、启动、停止 Ollama 支持的模型，简化模型运维流程。
- 支持容器化部署，与 Ollama 容器通过网络互通，实现快速搭建完整的本地大语言模型交互系统。

二、安装Docker

1. 安装Docker依赖

apt-getinstall ca-certificates curl gnupg lsb-release

2. 添加阿里云Docker软件源

curl -fsSL http://mirrors.aliyun.com/docker-ce/linux/ubuntu/gpg |sudo apt-key add -

3. 配置系统软件源

编辑/etc/apt/sources.list文件，添加以下内容（清华大学Ubuntu镜像源）：

# 默认注释了源码镜像以提高 apt update 速度，如有需要可自行取消注释 deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ focal main restricted universe multiverse # deb-src https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ focal main restricted universe multiverse deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ focal-updates main restricted universe multiverse # deb-src https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ focal-updates main restricted universe multiverse deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ focal-backports main restricted universe multiverse # deb-src https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ focal-backports main restricted universe multiverse # 安全更新软件源 deb http://security.ubuntu.com/ubuntu/ focal-security main restricted universe multiverse # deb-src http://security.ubuntu.com/ubuntu/ focal-security main restricted universe multiverse # 预发布软件源，不建议启用 # deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ focal-proposed main restricted universe multiverse # # deb-src https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ focal-proposed main restricted universe multiverse

4. 添加Docker软件源并更新密钥

add-apt-repository "deb [arch=amd64] http://mirrors.aliyun.com/docker-ce/linux/ubuntu $(lsb_release -cs) stable"sudo apt-key adv --keyserver keyserver.ubuntu.com --recv-keys DDCAE044F796ECB0

5. 安装Docker

apt-getinstall docker-ce docker-ce-cli containerd.io

6. 验证Docker安装

docker -v

7. 配置Docker国内镜像源

7.1 编辑配置文件`/etc/docker/daemon.json`

{"registry-mirrors":["https://docker.mirrors.ustc.edu.cn","https://hub-mirror.c.163.com","https://docker.m.daocloud.io","https://ghcr.io","https://mirror.baidubce.com","https://docker.nju.edu.cn"]}

7.2 重新加载并重启Docker

systemctl daemon-reload systemctl restart docker

三、安装英伟达显卡驱动（GPU支持）

1. 配置存储库

curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey |sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg

2. 设置源

创建并编辑nvidia-container-toolkit.list文件：

# 内容如下 deb https://mirrors.ustc.edu.cn/libnvidia-container/stable/deb/$(ARCH) / deb https://mirrors.ustc.edu.cn/libnvidia-container/stable/ubuntu18.04/$(ARCH) / #deb https://mirrors.ustc.edu.cn/libnvidia-container/experimental/deb/$(ARCH) /#deb https://mirrors.ustc.edu.cn/libnvidia-container/experimental/ubuntu18.04/$(ARCH) /

3. 更新包列表

sudoapt-get update

4. 安装NVIDIA Container Toolkit

apt-getinstall -y nvidia-container-toolkit

5. 配置Docker以支持Nvidia驱动

nvidia-ctk runtime configure --runtime=docker

6. 重启Docker服务

systemctl restart docker.service

四、使用Docker安装Ollama

1. 拉取Ollama镜像

官方镜像：

docker pull ollama/ollama:latest

国内镜像（推荐）：

docker pull dhub.kubesre.xyz/ollama/ollama:latest

2. 启动Ollama容器

docker run -d \ --gpus=all \ --restart=always \ -v /root/project/docker/ollama:/root/project/.ollama \ -p 11434:11434 \ --name ollama \ ollama/ollama

说明：此配置会让Ollama将模型保持加载在内存（显存）中

五、使用Docker安装Open-WebUI

1. 安装Main版本

docker run -d \ -p 15027:8080 \ --gpus all \ --add-host=host.docker.internal:host-gateway \ -v open-webui:/app/backend/data \ --name open-webui \ --restart always \ ghcr.nju.edu.cn/open-webui/open-webui:main

2. 安装CUDA版本（GPU加速）

docker run -d \ -p 15027:8080 \ --gpus all \ --add-host=host.docker.internal:host-gateway \ -v open-webui:/app/backend/data \ --name open-webui \ --restart always \ ghcr.nju.edu.cn/open-webui/open-webui:cuda

3. 访问Open-WebUI

打开浏览器访问以下地址进行登录：

http://192.168.1.129:15027/auth

LLaMA Factory训练可视化管理：Loss曲线解析与性能优化

作者：吴业亮博客：wuyeliang.blog.ZEEKLOG.net 在日常的大模型微调工作中，你是否经常遇到这些困扰：训练过程像个黑盒子，不知道模型到底学到了什么；损失曲线突然异常，却找不到问题根源；多轮实验参数混乱，无法有效对比效果？今天我们就来全面介绍LLaMA Factory这一强大的大模型微调框架，重点讲解如何在Ubuntu 22.04系统上使用四种可视化工具监控训练过程，让你的模型训练透明可控、调优有据。一、LLaMA Factory训练监控体系概览 LLaMA Factory通过模块化设计实现了全面的指标监控功能，主要覆盖训练稳定性、模型性能和资源利用三大维度。系统默认在src/llamafactory/train/sft/metric.py中实现基础评估逻辑，同时支持通过配置文件扩展自定义指标。核心监控指标包括： * 训练稳定性：损失值、梯度范数、学习率变化 * 模型性能：准确率、困惑度、ROUGE分数 * 文本质量：生成内容的流畅性和相关性 * 资源利用：GPU内存占用、训练速度

一文读懂UGC、PGC、PUGC、OGC、MGC、BGC与AIGC

一文读懂UGC、PGC、PUGC、OGC、MGC、BGC与AIGC 在当今这个信息爆炸的数字时代，我们无时无刻不被各种形式的内容所包围——从短视频、直播到图文资讯、专业评测。你或许经常听到UGC、PGC、AIGC这些听起来很“高级”的缩写，但它们究竟代表什么？彼此之间又有什么区别和联系？今天，就让我们一次性说清楚内容创作领域的各种“GC”（Generated Content）。文章目录 * 一文读懂UGC、PGC、PUGC、OGC、MGC、BGC与AIGC * 1 核心区别：是“谁”在创作内容？ * 2 UGC (User Generated Content) - 用户生成内容 * 3 PGC (Professionally Generated Content) - 专业生成内容 * 4

TRAE vs Qoder vs Cursor vs GitHub Copilot：谁才是真正的“AI 工程师”？

引言：工具选择 = 成本 + 效率 + 风险的综合权衡 2026 年，AI 编程工具已从“玩具”走向“生产主力”。但面对 TRAE、Qoder、Cursor、GitHub Copilot 等选项，开发者不仅要问： * 它能写 Rust 吗？支持中文需求吗？ * 更要问：一个月多少钱？团队用得起吗？代码安全有保障吗？本文将从五大核心维度深度剖析四大主流 AI IDE： 1. 核心理念与自主性 2. 多语言与跨生态支持能力 3. 工程化与交付闭环能力 4. 中文本地化与业务适配 5. 收费模式、定价策略与企业成本帮你做出技术可行、经济合理、风险可控的决策。一、核心理念：

低成本运行 Claude Code：通过 LiteLLM 接入 GitHub Copilot Chat API 的完整指南

阅读原文一、背景与动机 Claude Code 是 Anthropic 推出的编程 Agent 工具，很多人会用它做 “vibe coding”：一边写代码一边提问，在对话中重构、重组、查 bug，体验非常接近“和聪明同事结对编程”。但在实际使用中，它有两个比较现实的问题： 1. 成本高：频繁的对话请求，会很快消耗你的 Anthropic API 配额； 2. 网络不稳：在一些网络环境下，直接请求 Anthropic API 可能经常超时或失败。与此同时，很多开发者已经在使用 GitHub Copilot。GitHub 在 Copilot 背后接入了包括 Claude 在内的多种大模型（具体组合会随时间调整），而你已经为这部分算力付过费了。于是，一个很自然的问题出现了：