在Ubuntu 20.04上安装Ollama并部署大型语言模型:含Open WebUI图形界面教程

在Ubuntu 20.04上安装Ollama并部署大型语言模型:含Open WebUI图形界面教程

在Ubuntu 20.04上安装Ollama并部署大型语言模型:含Open WebUI图形界面教程


引言

在人工智能浪潮席卷全球的今天,大型语言模型(LLM)不再是遥不可及的云端技术。借助 Ollama,每一位开发者都能轻松地将强大的模型部署在自己的本地计算机上,实现无缝、私密且可定制的AI体验。本文将带领您一步步在 Ubuntu 20.04 系统上完成 Ollama 的安装与模型部署,并最终搭建美观易用的图形化界面(Open webui)。

Ollama 是什么?

Ollama 是一个开源项目,专为在本地运行、管理和部署大型语言模型(如 Llama 3、Mistral、Gemma 等)而设计。

它的核心概念与优势非常清晰:

  • 简单易用:通过简单的命令行工具,即可完成模型的下载(pull)、运行(run)和管理。一条命令就能启动与模型的对话。
  • 丰富的模型库:它提供了官方支持的模型库(Ollama Search),包含deep-seek、qwen等数十种经过优化的大型语言模型,满足从代码生成到创意写作的各种需求。
  • “开箱即用”:它自动处理了模型运行所需的大部分复杂配置和环境依赖,用户无需关心繁琐的底层细节。
展示 Ollama 使用效果

想象一下,在您的终端中,直接与一个几十亿参数的大模型进行流畅的对话和代码编写,是一种怎样的体验?以下是在 Ubuntu 终端中运行 ollama run deepseek-coder:6.7b 后的截图:

命令行交互


OpenWebui交互
本地部署语言模型的好处与局限性

选择在本地运行 Ollama,意味着选择了一种新的 AI 交互方式,但它也并非完美无缺。

优势 (Benefits)
  • 数据隐私与安全:您的所有对话提示(Prompts)和模型生成的内容完全在本地处理,不会离开您的计算机。这对于处理敏感代码、商业数据或个人信息的用户至关重要。
  • 完全离线可用:一旦模型下载完成,您就无需依赖互联网连接或担心API服务宕机,可以在任何没有网络的环境中使用。
  • 可定制性:您可以尝试各种不同规模和专长的模型,甚至可以根据需要加载自定义模型(Modelfiles),灵活性远超固定的云端API。
  • 无使用成本:除了电费和硬件成本外,没有按次收费或订阅费用,您可以无限次地与模型交互。
局限性 (Limitations)
  • 硬件要求高:本地部署对计算机硬件,尤其是内存(RAM)和显存(VRAM) 有较高要求。运行大型模型可能需要数十GB的资源。
  • 性能差异:虽然本地推理延迟低,但模型的能力和响应速度通常无法与 OpenAI GPT-4 这类顶级付费API相提并论,尤其是在复杂推理任务上。
  • 知识陈旧:本地部署的模型知识库是静态的,其知识截止日期取决于它被训练的时间点,无法像一些云端模型那样实时获取最新信息。

环境准备

设备信息
lsb_release -a 
在这里插入图片描述
检查储存空间及显存大小
  • 储存空间至少预留十几G,因为一个模型的大小都在几个G左右
  • 检查显存大小,显存大小决定了能运行模型的参数量
nvidia-smi 
在这里插入图片描述

Ollama 下载与安装

1. 下载链接:
  • 官网: https://ollama.com/
  • GitHub: https://github.com/ollama/ollama
2. 运行安装脚本:
curl -fsSL https://ollama.com/install.sh |sh
3. 管理Ollama服务:
# 启动 Ollama 服务sudo systemctl start ollama # 停止 Ollama 服务sudo systemctl stop ollama # 重启 Ollama 服务sudo systemctl restart ollama # 设置开机自启sudo systemctl enable ollama # 查看服务日志sudo journalctl -u ollama -f 
4. 常用Ollama命令:
# 查看所有命令帮助 ollama --help # 运行模型(如果不存在会自动下载) ollama run <model-name># 运行模型并直接提问 ollama run <model-name>"你的问题"# 拉取(下载)模型 ollama pull <model-name># 列出已下载的模型 ollama list # 删除模型 ollama rm<model-name># 查看已下载模型的详细信息 ollama show llama3 # 查看模型配置 ollama show llama3 --modelfile 

Ollama 部署并运行模型

现在 Ollama 已经安装完成,接下来是下载和运行各种大型语言模型

查看可用模型
  • 通过命令行查看
# 查看本地已下载的模型 ollama list 
在这里插入图片描述

通过模型库查看
访问Ollama官方的模型库:模型库,选择自己感兴趣的模型,注意参数量大小,一般先选择参数少一些的模型进行试验

在这里插入图片描述
下载模型

下载并运行deepseek-r1:7b模型

ollama run deepseek-r1:7b 
在这里插入图片描述
运行模型

如果已经下载了deepseek-r1:7b,就不会重复下载而是启动命令行交互对话

ollama run deepseek-r1:7b 
在这里插入图片描述
对话控制命令

在交互模式下,可以使用一些特殊命令:

# 退出对话 /bye 或者按 Ctrl + D # 清空对话上下文(开始新对话) /clear 
设置参数

可以调整模型生成参数以获得不同效果:

# 设置温度(控制随机性,0-1) ollama run deepseek-r1:7b --temperature 0.7# 限制输出token数量 ollama run deepseek-r1:7b --num-predict 100# 指定随机种子(确保可重复性) ollama run deepseek-r1:7b --seed 42

安装Open WebUI 图形化界面

虽然命令行交互已经很强大,但对于日常使用来说,一个美观的图形界面能极大提升体验。Open WebUI(原名 Ollama WebUI)提供了一个类似 ChatGPT 的现代化 Web 界面,让您可以通过浏览器与本地模型进行交互。

Open WebUI 是什么?

Open WebUI 是一个功能强大的开源 Web 界面,专为 Ollama 和其他本地语言模型设计。它具有以下特点:

  • 类ChatGPT体验:熟悉的聊天界面,支持多轮对话、对话历史管理
  • 多模型支持:轻松切换不同的语言模型
  • 可视化操作:图形化的模型管理和设置界面
  • 高级功能:支持 RAG(检索增强生成)、文档上传、角色预设等
  • 多用户支持:可注册多个账户,每个用户有自己的对话历史
  • 完全本地化:所有数据仍然保存在本地,保障隐私安全
先决条件:安装 Docker

Open WebUI 通过 Docker 容器部署,因此需要先安装 Docker。参考以下安装教程Ubuntu 20.04 安装Docker 全过程

启动Docker 服务
# 确保Docker服务已启动sudo systemctl start docker sudo systemctl enable docker # 检查Docker服务状态sudo systemctl status docker 
使用 Docker 一键部署 Open WebUI

安装好 Docker 后,只需一条命令即可部署 Open WebUI:

docker run -d --network="host" -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main 

部署完成后,检查容器状态:

docker ps
在这里插入图片描述
访问并使用Open WebUI

容器正常运行后,即可通过浏览器访问:

  1. 打开浏览器,访问:http://localhost:8080
  2. 首次注册:
  • 点击 “Sign Up” 注册新账户
  • 输入邮箱和密码(无需真实邮箱,仅用于本地识别)
  • 确认密码并完成注册
  1. 登录系统:
  • 使用刚才注册的邮箱和密码登录
  • 首次登录会自动检测本地的 Ollama 服务
  1. 开始使用:
  • 在左侧模型选择器中选择要使用的模型(如 llama3)
  • 在输入框中开始对话

右侧可以查看对话历史、切换模型、调整参数等

[图片]

Read more

OpenTiny NEXT 前端智能化系列直播征文开启,带你系统学习 AI 前端与 WebAgent

OpenTiny NEXT 前端智能化系列直播征文开启,带你系统学习 AI 前端与 WebAgent

🔥 个人主页:杨利杰YJlio❄️ 个人专栏:《Sysinternals实战教程》《Windows PowerShell 实战》《WINDOWS教程》《IOS教程》《微信助手》《锤子助手》《Python》《Kali Linux》《那些年未解决的Windows疑难杂症》🌟 让复杂的事情更简单,让重复的工作自动化 文章目录 * 在这里插入图片描述 1. AI 前端,不该只是“把聊天框接到页面里” * 在这里插入图片描述 2. 这次活动,为什么我觉得值得参加 * 2.1 不只是听概念,而是逼着自己把概念落地 * 2.2 技术范围很新,但切入点并不空泛 * 2.3 对写作者也很友好 * 在这里插入图片描述 3. 我理解的“前端智能化”,到底在变什么 * 3.1 第一层:前端从“固定界面”走向“

GLM-4.6V-Flash-WEB实战:打造会‘看’的AI助手

GLM-4.6V-Flash-WEB实战:打造会‘看’的AI助手 你有没有试过拍一张办公室角落的旧电路板照片,然后问:“这上面标着‘U7’的芯片是做什么用的?”——三秒后,手机屏幕跳出一段清晰解释:“这是一颗TPS54302DCQ降压稳压器,用于将12V输入转换为3.3V输出,为MCU供电;右侧丝印‘C12’为输入滤波电容,容值10μF。”这不是实验室Demo,也不是云端调用延迟两秒的API,而是你在本地GPU上跑起来的 GLM-4.6V-Flash-WEB 正在实时“看图说话”。 过去几年,我们习惯了让AI“写”、让AI“说”、让AI“画”,但真正让它“看懂”一张真实世界里的照片,并给出准确、专业、带上下文的判断,始终是个门槛不低的事。要么模型太大,单卡跑不动;要么部署太重,要配向量库、消息队列、微服务网关;要么接口不统一,前端工程师得专门学一套新协议。直到

HTML入门指南:从零开始学前端

第一章 初识 HTML & JavaWeb 前端学习方向 一、HTML 的定义 定义:HTML 全称超文本标记语言 1.HTML 的核心是给文本赋予机器可解析的语义结构,而非 “做网页”,网页只是其最常见的应用场景; 2.HTML 是声明式标记语言,无编程逻辑,底层通过 DOM 树实现与浏览器的交互; 3.HTML 的 “超文本” 本质是构建信息的非线性关联,是万维网的基础数据格式。 二、JavaWeb前端学习的方向 1.前端核心基础三剑客 HTML:负责搭建网页的骨架,决定页面有什么内容 CSS:负责搭建网页的骨架,决定页面有什么内容 JavaScript:负责给网页加交互,决定页面能做什么(点击按钮、表单验证、轮播图等) 2.进阶技术栈 前端框架:

Gemma-3-270m Vue.js前端集成:浏览器端AI应用开发

Gemma-3-270m Vue.js前端集成:浏览器端AI应用开发 1. 为什么要在浏览器里跑AI模型 你有没有想过,当用户打开一个网页,不需要下载App、不用配置环境、甚至不联网也能和AI对话?这听起来像未来科技,但其实已经可以实现了。最近Google发布的Gemma-3-270m模型,只有270M参数,轻量得像一张高清图片,却能在浏览器里完成文本生成、问答、代码辅助等任务。 过去我们总以为AI必须跑在服务器上,前端只是个“花瓶”界面。但现实是,很多场景根本不需要把数据传到云端——比如个人笔记里的智能摘要、设计稿旁的文案建议、学习资料的即时问答。这些需求对响应速度敏感,对隐私要求高,还希望离线可用。 Vue.js作为国内最常用的前端框架之一,生态成熟、上手简单、文档友好,特别适合快速搭建这类轻量AI应用。它不像React那样需要大量配置,也不像Svelte那样学习曲线陡峭,而是用一种“写HTML就能动起来”的直觉方式,让开发者能把精力集中在AI能力本身,而不是框架折腾上。 实际测试中,一个基于Vue的Gemma-3-270m应用,在普通笔记本上首次加载模型约8秒,后续推