Ubuntu DeepSeek R1本地化部署 Ollama+Docker+OpenWebUI

1 显卡安装

#查看显卡型号 llh@study:~/soft$ lspci | grep -i nvidia 10:00.0 VGA compatible controller: NVIDIA Corporation TU116 [GeForce GTX 1660 SUPER] (rev a1) 10:00.1 Audio device: NVIDIA Corporation TU116 High Definition Audio Controller (rev a1) 10:00.2 USB controller: NVIDIA Corporation TU116 USB 3.1 Host Controller (rev a1) 10:00.3 Serial bus controller: NVIDIA Corporation TU116 USB Type-C UCSI Controller (rev a1 #查看推荐驱动 llh@study:~/soft$ sudo ubuntu-drivers devices 
sudo apt install nvidia-driver-580 #安装完成 重启服务器 sudo reboot
#验证驱动是否安装成功 llh@study:~$ nvidia-smi 

2 安装docker

curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo apt-key add - sudo add-apt-repository "deb [arch=amd64] https://download.docker.com/linux/ubuntu $(lsb\_release -cs) stable" sudo apt-get update sudo apt-get install docker-ce # sudo systemctl start docker # docker --version

3 安装 Ollama

#下载自动安装脚本 wget https://ollama.com/install.sh . #安装 sudo sh install.sh
#验证服务 sudo systemctl status ollama #查看版本 ollama --version
#配置局域网访问 sudo vim /etc/systemd/system/ollama.service [Service] Environment="OLLAMA_HOST=0.0.0.0:11434" # 监听所有网卡 Environment="OLLAMA_ORIGINS=*" # 允许跨域请求,测试环境 # sudo systemctl daemon-reload sudo systemctl restart ollama

4 模型下载

ollama pull deepseek-r1:7b #查看本地模型 llh@study:~/soft$ ollama list NAME ID SIZE MODIFIED deepseek-r1:7b 755ced02ce7b 4.7 GB About a minute ago #删除 ollama rm deepseek-r1:7b

5 运行模型

ollama run deepseek-r1:7b

Read more

告别 Copilot 时代:Cursor, Kiro 与 Google Antigravity 如何重新定义编程?

如果说 GitHub Copilot 开启了 AI 辅助编程的“副驾驶”时代,那么 2024-2025 年则是 AI Agent(智能体) 全面接管 IDE 的元年。 现在的开发者不再满足于简单的代码补全,我们需要的是能理解整个项目架构、能自主规划任务、甚至能像真人同事一样工作的“编程搭子”。 今天,我们盘点三款目前最受瞩目、处于风口浪尖的 AI 编程工具:Cursor、Kiro 以及 Google 的重磅新品 Antigravity。无论你是想提升效率,还是想尝鲜最前沿的 Agentic Workflow,这三款神器都不容错过。 1. Cursor:当下体验最好的 AI 代码编辑器 定位:目前最成熟、最流畅的 VS Code 替代者 Cursor

LLaMA Factory全解析:让大模型“改装”像组装电脑一样简单

引言:当每个人都能定制自己的专属AI 朋友们,想象一下这样的场景:你拿到了一台性能强大的通用电脑(好比ChatGPT、LLaMA这样的通用大模型),但它运行的是标准操作系统,装的是通用软件。现在,你需要它变成一台专业的视频剪辑工作站,或者一台金融数据分析服务器——该怎么办? 传统方法是“重装系统”(全量微调):耗时耗力,需要专业团队,而且可能把原来好用的功能搞坏。 现代方法是“加装专业配件”(参数高效微调):不改变核心系统,只增加特定的硬件模块或软件插件。 今天我要介绍的LLaMA Factory,就是大模型领域的“专业改装工具箱”。它让微调百亿参数的大模型,变得像给电脑加内存、装显卡一样简单可控。无论你是只有一张消费级显卡的个人开发者,还是需要定制企业级AI的团队,这个工具都可能改变你的工作方式。 技术原理:理解LLaMA Factory的“增效不增负”哲学 核心理念:为什么我们不需要“重装整个系统”? 要理解LLaMA Factory的价值,首先要明白大模型微调的一个关键发现:当大模型适应新任务时,只需要调整很小一部分参数就够了。 一个生动的类比: 假设你是一位精

远程配置 VsCode:Github Copilot 安装成功却无法使用?细节避坑

远程配置 VsCode 使用 GitHub Copilot 的避坑指南 当 Copilot 安装后无法正常使用时,常见问题集中在账户授权、网络环境、配置冲突三方面。以下是关键排查步骤和避坑细节: 一、账户授权问题(最常见) 1. 检查登录状态 * 在 VsCode 左下角点击账号图标 → 确认已登录 GitHub 账户 * 若显示 Sign in to use GitHub Copilot,需重新授权 * 避坑点:确保登录账户与 Copilot 订阅账户一致(个人版/企业版) * 选择 GitHub.com → 登录方式选 HTTPS → 完成设备授权流程 * 避坑点:企业用户需开启 SSO 授权(登录后执行 gh

【AIGC】Claude Code的三大模式

Claude Code 主要有三大核心权限/执行模式(默认、自动编辑、计划),以及思考强度模式、危险模式等辅助模式。 一、三大核心执行模式(权限控制) 这是最常用的三种模式,控制 Claude 对文件与命令的自动化程度,可通过 Shift+Tab 循环切换。 1. 默认模式(Normal / Manual Approval) * 状态栏:? for shortcuts * 行为:每次文件编辑、命令执行前都需要你手动批准(Y/N/跳过) * 适用:学习阶段、不熟悉的项目、重要/敏感修改、需要精细控制 * 特点:最安全、掌控感最强,但效率较低 2. 自动编辑模式(Auto-Accept / Accept Edits) * 状态栏: