【AI】——结合Ollama、Open WebUI和Docker本地部署可视化AI大语言模型

【AI】——结合Ollama、Open WebUI和Docker本地部署可视化AI大语言模型

🎼个人主页:【Y小夜】

😎作者简介:一位双非学校的大三学生,编程爱好者,

专注于基础和实战分享,欢迎私信咨询!

🎆入门专栏:🎇【MySQLJavawebRustpython

🎈热门专栏:🎊【SpringbootRedisSpringsecurityDockerAI】 

感谢您的点赞、关注、评论、收藏、是对我最大的认可和支持!❤️

目录

🎈本地部署模型

🎉安装Ollama

🎉安装 Open WebUI

🎊安装Docker

🥞启动 Hyper-v

🥞 安装 WSL(适用于Linux的Windows的子系统):

🥞安装Docker

 🎊Docker 部署 Open WebUI


🎈本地部署模型

🎉安装Ollama

官网:​Ollama

然后进行一下下载

安装完成之后是没有提示的,然后我们需要去测试一下。(这里我是以QWen为例子,大家可以尝试其他的模型)

打开一个终端,然后输入一个命令,进行测试

ollama run qwen 

 现在是正在进行下载,默认是保存在(C 盘,C:\Users<username>.ollama\models 如果想更改默认路径,可以通过设置OLLAMA_MODELS进行修改,然后重启终端,重启 ollama 服务。或者在环境变量中修改OLLAMA_MODELS的位置

setx OLLAMA_MODELS "D:" 

下载完成后,可以进行测试:

查看都安装了什么模型

ollma list命令显示所有安装模型 ollama rm 模型名称 删除指定模型

但这个现在就只可以在终端中使用 ,那么我问现在就搞一个web页面进行交互,增加体验。

🎉安装 Open WebUI

🎊安装Docker

如果你本地已经有了Docker了,那就可以直接看下面的内容。

🥞启动 Hyper-v

但是如果你这里没有Hyper-V,那么恭喜你,博主也没有,博主已经踩过这个坑了。

我们首先在桌面上建立一个文件,命名为Hyper.cmd,然后填入内容

pushd "%~dp0" dir /b %SystemRoot%\servicing\Packages\*Hyper-V*.mum >hyper-v.txt for /f %%i in ('findstr /i . hyper-v.txt 2^>nul') do dism /online /norestart /add-package:"%SystemRoot%\servicing\Packages\%%i" del hyper-v.txt Dism /online /enable-feature /featurename:Microsoft-Hyper-V-All /LimitAccess /ALL

然后使用管理员身份运行这个文件,运行完毕后,重启电脑,再打开,就可以找到Hyper-V了。

🥞 安装 WSL(适用于Linux的Windows的子系统):
wsl --update 

然后进行安装

wsl --install 

 

🥞安装Docker

官网: Windows | Docker Docs

然后进行下载:

然后双击进行安装

这里咱们先不注册,直接进行登录即可

左下角是绿色,就代表运行成功了

 🎊Docker 部署 Open WebUI

打开命令行,然后输入docker

展示内容,说明我们的docker安装成功了

然后开始用docker安装open webUI

然后,安装完成够就可以,打开Docker Desktop,访问http://localhost:3000端口了

然后点击登录网址,

就是你会发现,点击上方选择一个模型旁边的加号+可以增加大模型,点击下拉按钮可以选择当前使用哪一个已安装的模型,但是,你可能会出现一个错误,就是找不到你自己安装的模型,这个原因是因为你的ollama没有启动,我们启动一下ollama

然后再重新,加载一下网页,再选择一下模型

提问一下问题,模型进行回答。这样我们本地的模型就部署好了

Read more

AR交互设计新范式:虚拟按钮与手势控制在教育类应用中的创新融合

AR交互设计新范式:虚拟按钮与手势控制在教育类应用中的创新融合 当孩子们第一次用手指在空中旋转恐龙模型时,他们的眼睛会发光——这正是教育科技产品最珍贵的时刻。作为AR内容创作者,我们正站在交互设计革命的起点:虚拟按钮的精确性与手势控制的自然性正在教育场景中产生奇妙的化学反应。这种融合不仅改变了知识传递的方式,更重塑了学习体验的本质。 1. 教育场景下的AR交互设计原则 儿童教育类AR应用的特殊性在于,它需要同时满足两个看似矛盾的需求:交互必须足够简单直观,让孩子无需指导就能上手;同时又要具备足够的精确性,确保教学目标的准确达成。这就像设计一个既能让三岁孩童轻松玩耍,又能让专业钢琴家演奏交响乐的键盘。 认知负荷理论告诉我们,儿童的注意力资源有限。根据剑桥大学的研究,5-8岁儿童的平均专注时长仅为12-18分钟。因此,我们的交互设计必须遵循以下黄金法则: * 即时反馈原则:任何操作都应在300ms内给予明确响应 * 容错设计:错误操作不应导致系统崩溃或流程中断 * 多通道反馈:同时激活视觉、听觉和触觉反馈通道 * 渐进式复杂度:交互难度随学习进度动态调整 芝加哥儿童博

Qwen3-TTS-Tokenizer-12Hz应用场景:AR眼镜实时语音交互token流低延迟传输

Qwen3-TTS-Tokenizer-12Hz应用场景:AR眼镜实时语音交互token流低延迟传输 1. AR眼镜语音交互的技术挑战 AR眼镜作为下一代人机交互终端,正面临着一个核心难题:如何在有限的硬件资源下实现高质量的实时语音交互。传统音频传输方案存在几个关键痛点: 带宽瓶颈问题:高清音频流需要占用大量带宽,在无线传输环境下容易造成延迟和卡顿。一段1分钟的16kHz采样音频就需要近2MB的传输量,这对于AR眼镜的电池续航和网络稳定性都是巨大挑战。 实时性要求:语音交互需要极低的端到端延迟,理想情况下应该控制在100毫秒以内。传统编解码器由于计算复杂,往往难以在资源受限的AR设备上实现这样的性能。 音质保真度:在压缩传输过程中,语音质量容易受损,影响语音识别准确率和用户体验。特别是在嘈杂环境中,低质量的音频会让AR眼镜的语音助手变得"耳背"。 这些挑战催生了对新一代音频编解码技术的需求,而Qwen3-TTS-Tokenizer-12Hz正是为此而生。 2. Qwen3-TTS-Tokenizer-12Hz技术原理 2.1 超低采样率编码 Qwen3-TTS-T

人脸识别核心算法深度解析:FaceNet与ArcFace从原理到实战

本文深入剖析人脸识别领域两大里程碑算法——Google的FaceNet和InsightFace的ArcFace,从数学原理、损失函数设计到完整PyTorch实现,帮你彻底理解现代人脸识别技术的核心。 一、引言:人脸识别的本质问题 1.1 人脸识别 ≠ 图像分类 初学者常有的误解:把人脸识别当作分类问题。 ❌ 错误思路:分类方法 输入人脸 → CNN → Softmax → 输出"这是第1532号人" 问题: 1. 类别数巨大(十亿级身份) 2. 无法处理新注册的人(需要重新训练) 3. 每个人样本极少(很难训练好分类器) ✅ 正确思路:度量学习方法 输入人脸 → CNN → 特征向量(embedding) → 与数据库比对 优势: 1. 只需学习"什么是相似",不需要预定义类别 2. 新人注册只需提取特征,无需重新训练

RS485收发器在FPGA中的应用及注意事项

RS485收发器在FPGA中的应用及注意事项

1 前言 明确设计思路,精准定位问题,对于我们后期理解迭代工程有很大的帮助。 这就是我们常说的40%设计,20%编写和剩下的40%时间进行调试优化。 今天为大家带来的是如何解决RS485收发器使能转变引起的毛刺。 2 问题 Q1:什么时候需要用到RS485收发器? Q2:为何RS485收发器使能转变会引起毛刺? Q3:如何处理毛刺规避FPGA时序判断? 3 RS485收发器 3.1 硬件基础 3.1.1 标准收发器 RS485收发器是一类集成电路芯片,它的核心作用是在微控制器(如FPGA、MCU)的逻辑电平(如TTL电平,通常是0V/3.3V或0V/5V)与RS485差分信号之间进行双向转换。大多数RS485收发器还具备使能控制引脚(DE或RE),允许主控芯片灵活地切换其工作模式——发送或接收,从而支持半双工通信架构。 在实际应用中,微控制器输出的信号属于低电压、低电流的逻辑电平,适合短距离、高精度的内部电路通信,但无法直接用于长距离传输,