MS-S1 MAX,AI MAX 395在Ubuntu24利用Vulkan版llama.cpp运行gpt-oss 120b

MS-S1 MAX,AI MAX 395在Ubuntu24利用Vulkan版llama.cpp运行gpt-oss 120b

1、安装amd gpu驱动和Rocm

wget https://repo.radeon.com/amdgpu-install/7.1.1/ubuntu/noble/amdgpu-install_7.1.1.70101-1_all.deb sudo apt install ./amdgpu-install_7.1.1.70101-1_all.deb sudo apt update sudo apt install "linux-headers-$(uname -r)" "linux-modules-extra-$(uname -r)" sudo apt install amdgpu-dkms sudo apt install python3-setuptools python3-wheel sudo usermod -a -G render,video $LOGNAME sudo apt install rocm 

参考官网

2、通过GTT解锁96G显存

1、进入bios->setup->advanced->NBIO common options->GFX configuration->UMA Frame buffer size改显存
2、修改grub

vim /etc/default/grub #设置保存 GRUB_CMDLINE_LINUX_DEFAULT="quiet splash amd_iommu=off ttm.pages_limit=27648000 ttm.page_pool_size=27648000 amdttm.pages_limit=27648000 amdttm.page_pool_size=27648000 apparmor=0" update-grub 

重启生效
参考b站大佬

3、安装vulkan

sudo apt install vulkan-tools 

4、下载llama.cpp release,硬要自己编译也可以

下载页

wget https://github.com/ggml-org/llama.cpp/releases/download/b7503/llama-b7503-bin-ubuntu-vulkan-x64.tar.gz #进入目录 #去https://hf-mirror.com/ggml-org/collections中找自己想要部署的模型,里边有运行命令 ./llama-server -hf ggml-org/gpt-oss-120b-GGUF -c 0 --jinja #文件下载到~/.cache/llama.cpp/目录中 

5、安装amdgpu_top

sudo dpkg -i amdgpu-top_0.11.0-1_amd64.deb sudo amdgpu_top 

6、最终效果

如果你的token速度只有二十几,那就是纯cpu算的没跑了

在这里插入图片描述


amdgpu_top验证

在这里插入图片描述


注意,如果你要用其他电脑访问,需要增加参数–host 0.0.0.0,具体参考文档

Read more

【前沿解析】2026年3月2日AI双重突破:MWC IQ时代与DeepSeek V4多模态革命

摘要:本文深入解析2026年3月2日AI领域两大标志性突破:巴塞罗那MWC 2026大会开启的"IQ时代"与DeepSeek V4多模态大模型的发布。文章涵盖技术原理、架构设计、Go/Python代码实现及产业影响分析,为开发者提供全面的前沿技术参考。 关键词:MWC 2026, DeepSeek V4, 多模态大模型, Agentic AI, 端侧AI代理, 国产算力适配, 100万Token上下文, mHC架构, Engram记忆 一、引言:AI技术演进的双重里程碑 2026年3月2日,将成为人工智能发展史上的重要坐标。这一天,两大突破性事件同步发生:在西班牙巴塞罗那,世界移动通信大会(MWC 2026)正式开幕,主题定为"IQ时代"(The IQ Era),标志着智能终端从被动响应向主动服务的范式转移;与此同时,深度求索(DeepSeek)

AI如何帮你解决NPM配置警告:UNKNOWN USER CONFIG

快速体验 1. 打开 InsCode(快马)平台 https://www.inscode.net 2. 输入框内输入如下内容: 创建一个Node.js项目,使用AI分析当前NPM配置文件(.npmrc),检测是否存在UNKNOWN USER CONFIG警告。自动生成修复建议,更新配置文件以兼容未来NPM版本。提供详细的修复步骤和验证方法,确保配置正确无误。 1. 点击'项目生成'按钮,等待项目生成完整后预览效果 最近在维护一个Node.js项目时,遇到了一个看似不起眼但可能埋下隐患的警告信息:"NPM WARN UNKNOWN USER CONFIG \HOME\". THIS WILL STOP WORKING IN THE NEXT MAJO"

【MCP探索实践】Google GenAI Toolbox:Google开源的企业级AI数据库中间件、5分钟搞定LLM-SQL安全互联

【MCP探索实践】Google GenAI Toolbox:Google开源的企业级AI数据库中间件、5分钟搞定LLM-SQL安全互联

系列篇章💥 No.文章1【MCP探索实践】Cherry Studio+MCP实战:3步让AI自动抓网页/读文件/调API2【MCP探索实践】FastAPI + MCP:2025年最火的后端与AI集成方案3【MCP探索实践】GitHub MCP Server:为开发者打造的高效自动化工具4【MCP探索实践】MoLing:零依赖跨平台办公自动化神器,3分钟搞定文件+浏览器双核操作5【MCP探索实践】3分钟搭建AI服务器!FastMCP让开发效率飙升10倍6【MCP探索实践】MindsDB:借助 MCP 协议,让 AI 大模型秒变 SQL 专家7【MCP探索实践】Web Search MCP Server:无需 API 密钥的免费网络搜索服务8【MCP探索实践】百度地图 MCP Server:告别繁琐集成、

【AI领域】OpenClaw 实战指南:手把手教你更新大模型

【AI领域】OpenClaw 实战指南:手把手教你更新大模型

OpenClaw 作为轻量高效的 AI Agent 调度平台,凭借灵活的扩展性成为开发者连接多模型的首选工具。但官方默认配置仅支持有限接口,对于追求低成本、高稳定性的开发者来说,接入第三方 API是更优解 —— 不仅能大幅降低 token 消耗,还能规避网络环境限制,无缝适配 Claude 全系列模型。本文将从「配置逻辑→实操步骤→问题排查」全程拆解,即使是新手也能快速上手。 一、前置准备 1. 已安装 OpenClaw(版本 ≥ 1.8.0,低于该版本请先执行 brew upgrade openclaw 升级); 2. 已获取  API Key(【Claude】获取Claude API Key的多种方式全攻略:从入门到精通,再到详解教程!); 3. 熟悉基础的