MS-S1 MAX，AI MAX 395在Ubuntu24利用Vulkan版llama.cpp运行gpt-oss 120b

优质文章学习记录

11 Apr 2026 — 2 min read

1、安装amd gpu驱动和Rocm

wget https://repo.radeon.com/amdgpu-install/7.1.1/ubuntu/noble/amdgpu-install_7.1.1.70101-1_all.deb sudo apt install ./amdgpu-install_7.1.1.70101-1_all.deb sudo apt update sudo apt install "linux-headers-$(uname -r)" "linux-modules-extra-$(uname -r)" sudo apt install amdgpu-dkms sudo apt install python3-setuptools python3-wheel sudo usermod -a -G render,video $LOGNAME sudo apt install rocm

2、通过GTT解锁96G显存

1、进入bios->setup->advanced->NBIO common options->GFX configuration->UMA Frame buffer size改显存
2、修改grub

vim /etc/default/grub #设置保存 GRUB_CMDLINE_LINUX_DEFAULT="quiet splash amd_iommu=off ttm.pages_limit=27648000 ttm.page_pool_size=27648000 amdttm.pages_limit=27648000 amdttm.page_pool_size=27648000 apparmor=0" update-grub

重启生效
参考b站大佬

3、安装vulkan

sudo apt install vulkan-tools

4、下载llama.cpp release，硬要自己编译也可以

wget https://github.com/ggml-org/llama.cpp/releases/download/b7503/llama-b7503-bin-ubuntu-vulkan-x64.tar.gz #进入目录 #去https://hf-mirror.com/ggml-org/collections中找自己想要部署的模型，里边有运行命令 ./llama-server -hf ggml-org/gpt-oss-120b-GGUF -c 0 --jinja #文件下载到~/.cache/llama.cpp/目录中

5、安装amdgpu_top

sudo dpkg -i amdgpu-top_0.11.0-1_amd64.deb sudo amdgpu_top

6、最终效果

如果你的token速度只有二十几，那就是纯cpu算的没跑了

在这里插入图片描述

amdgpu_top验证

在这里插入图片描述

注意，如果你要用其他电脑访问，需要增加参数–host 0.0.0.0，具体参考文档

Read more

除了 OpenClaw，今天 AI 热榜还有什么值得看？我把 5 个重点方向讲清楚了

除了 OpenClaw，今天 AI 热榜还有什么值得看？我把 5 个重点方向讲清楚了

🔥 个人主页：杨利杰YJlio❄️ 个人专栏：《Sysinternals实战教程》《Windows PowerShell 实战》《WINDOWS教程》《IOS教程》《微信助手》《锤子助手》《Python》《Kali Linux》《那些年未解决的Windows疑难杂症》🌟 让复杂的事情更简单，让重复的工作自动化除了 OpenClaw，今天 AI 热榜还有什么值得看？我把 5 个重点方向讲清楚了 * 除了 OpenClaw，今天 AI 热榜还有什么值得看？我把 5 个重点方向讲清楚了 * 1. 我先说结论：今天这波 AI 热榜，最重要的不是“谁最火”，而是“风向变了” * 2. GoogleCloudPlatform / generative-ai：平台生态正在成为真正的护城河 * 3. MiroFish：群体智能和多智能体，开始从概念走向更具体的产品叙事

告别复杂配置！Z-Image-Turbo开箱即用的AI绘画体验

告别复杂配置！Z-Image-Turbo开箱即用的AI绘画体验 1. 引言：为什么你需要关注 Z-Image-Turbo？在当前 AI 图像生成技术飞速发展的背景下，用户对文生图模型的要求已不再局限于“能画出来”，而是追求高质量、高速度、低门槛和强可控性。然而，许多开源模型仍面临部署复杂、显存占用高、推理缓慢等问题，极大限制了普通开发者和创作者的实际使用。正是在这一背景下，阿里巴巴通义实验室推出的 Z-Image-Turbo 成为一股清流。作为 Z-Image 系列的蒸馏版本，它以仅需 8 步推理即可生成照片级图像的能力，结合出色的中英文提示理解与消费级显卡友好性（16GB 显存可运行），重新定义了高效文生图的标准。更关键的是，ZEEKLOG 镜像构建团队推出的 Z-Image-Turbo 开源镜像实现了真正的“开箱即用”——内置完整模型权重、无需联网下载、集成 WebUI 与 API、支持进程守护，大幅降低了部署成本。本文将带你全面了解该模型的技术优势，

用AIGC生成测试周报：从Jira、Git、CI日志中自动提炼关键指标

用AIGC生成测试周报：从Jira、Git、CI日志中自动提炼关键指标

测试周报自动化转型的迫切性‌ 每周一，对于许多测试工程师而言，可能都是从整理上周的“数据残骸”开始：打开不同的浏览器标签页，登录Jira查看新增缺陷和待关闭的BUG，翻阅Git提交记录寻找与测试关联的代码变更，再到CI/CD平台（如Jenkins、GitLab CI）的日志海洋中，搜寻失败的构建和测试用例执行报告。这个过程耗时耗力，且容易出错。更重要的是，这种碎片化的数据罗列，难以直观呈现测试工作的核心价值与项目风险的动态变化。 AIGC的引入，为破解这一困境提供了全新范式。它并非简单地“复制粘贴”数据，而是通过自然语言处理（NLP）、数据挖掘与智能分析，理解数据背后的上下文，自动汇总、关联、解读并生成一份内容丰富、重点突出、具备可读性和行动指引的测试周报。核心：构建自动化数据管道与指标提炼模型‌ 一个有效的AIGC测试周报生成系统的核心在于‌数据源整合‌与‌智能指标提炼‌。 1. 数据源的接入与结构化‌ 首先，需要建立与三个核心系统的自动化数据连接： Jira连接‌：通过Jira REST API，定期拉取指定项目、

AIGC视频生成成本优化实战：文字+图片输入下20秒与30秒视频的模型选型与价格对比

快速体验在开始今天关于 AIGC视频生成成本优化实战：文字+图片输入下20秒与30秒视频的模型选型与价格对比的探讨之前，我想先分享一个最近让我觉得很有意思的全栈技术挑战。我们常说 AI 是未来，但作为开发者，如何将大模型（LLM）真正落地为一个低延迟、可交互的实时系统，而不仅仅是调个 API？这里有一个非常硬核的动手实验：基于火山引擎豆包大模型，从零搭建一个实时语音通话应用。它不是简单的问答，而是需要你亲手打通 ASR（语音识别）→ LLM（大脑思考）→ TTS（语音合成）的完整 WebSocket 链路。对于想要掌握 AI 原生应用架构的同学来说，这是个绝佳的练手项目。从0到1构建生产级别应用，脱离Demo，点击打开从0打造个人豆包实时通话AI动手实验 AIGC视频生成成本优化实战：文字+图片输入下20秒与30秒视频的模型选型与价格对比背景痛点：被浪费的每一秒都在烧钱最近在做一个短视频自动生成项目时，发现一个扎心现象：用AIGC生成的30秒视频，实际有效内容往往只有20秒左右。多出来的10秒黑屏或重复画面，不仅让用户观感下降，