MS-S1 MAX，AI MAX 395在Ubuntu24利用Vulkan版llama.cpp运行gpt-oss 120b

优质文章学习记录

06 Apr 2026 — 2 min read

1、安装amd gpu驱动和Rocm

wget https://repo.radeon.com/amdgpu-install/7.1.1/ubuntu/noble/amdgpu-install_7.1.1.70101-1_all.deb sudo apt install ./amdgpu-install_7.1.1.70101-1_all.deb sudo apt update sudo apt install "linux-headers-$(uname -r)" "linux-modules-extra-$(uname -r)" sudo apt install amdgpu-dkms sudo apt install python3-setuptools python3-wheel sudo usermod -a -G render,video $LOGNAME sudo apt install rocm

2、通过GTT解锁96G显存

1、进入bios->setup->advanced->NBIO common options->GFX configuration->UMA Frame buffer size改显存
2、修改grub

vim /etc/default/grub #设置保存 GRUB_CMDLINE_LINUX_DEFAULT="quiet splash amd_iommu=off ttm.pages_limit=27648000 ttm.page_pool_size=27648000 amdttm.pages_limit=27648000 amdttm.page_pool_size=27648000 apparmor=0" update-grub

重启生效
参考b站大佬

3、安装vulkan

sudo apt install vulkan-tools

4、下载llama.cpp release，硬要自己编译也可以

wget https://github.com/ggml-org/llama.cpp/releases/download/b7503/llama-b7503-bin-ubuntu-vulkan-x64.tar.gz #进入目录 #去https://hf-mirror.com/ggml-org/collections中找自己想要部署的模型，里边有运行命令 ./llama-server -hf ggml-org/gpt-oss-120b-GGUF -c 0 --jinja #文件下载到~/.cache/llama.cpp/目录中

5、安装amdgpu_top

sudo dpkg -i amdgpu-top_0.11.0-1_amd64.deb sudo amdgpu_top

6、最终效果

如果你的token速度只有二十几，那就是纯cpu算的没跑了

在这里插入图片描述

amdgpu_top验证

在这里插入图片描述

注意，如果你要用其他电脑访问，需要增加参数–host 0.0.0.0，具体参考文档

Read more

手机上也能运行Stable Diffusion？Github上开源且完全免费的AI生图软件！斩获1.4K Stars

手机上也能运行Stable Diffusion？Github上开源且完全免费的AI生图软件！斩获1.4K Stars

Hello，大家好！今天给大家分享一款GitHub上1.4k星标的开源神器——手机端AI绘画工具，软件已经整理在文末，有需要的朋友记得获取保存哦～链接：https://pan.quark.cn/s/fa5abdb93460 一、软件打开方式这款工具为安卓APK安装包，共提供两个版本：带过滤器版本和不带过滤器版本，大家可以根据自己的需求选择。下载后直接安装到手机上即可运行，无需复杂配置。二、软件的功能介绍这是一款让安卓手机直接运行Stable Diffusion的AI绘画工具，主要特色包括：全功能AI绘画支持文生图：输入提示词一键生成图像支持图生图：导入参考图片二次创作支持图像修复：模糊图片一键变清晰多模式加速支持CPU/GPU/NPU三种运行模式高通骁龙处理器可启用NPU加速，生成速度极快非骁龙处理器也可用CPU/GPU流畅运行开源免费 GitHub开源项目，完全免费无限制模型可自由下载切换三、使用指南第一步：安装与首次设置

小白必看：手把手教你用麦橘超然做AI绘画，效果超预期

小白必看：手把手教你用麦橘超然做AI绘画，效果超预期 1. 麦橘超然是什么？为什么适合新手玩AI绘画？你是不是也经常看到别人生成的AI图片又酷又精致，自己一上手却总是“翻车”？要么显存爆了，要么画面怪异，根本不知道从哪改起。别急，今天我要带你用一个特别适合新手的工具——麦橘超然 - Flux 离线图像生成控制台，轻松做出高质量AI画作。这个工具最大的亮点就是：对设备要求低、界面简单、出图质量高。它基于强大的 DiffSynth-Studio 框架，集成了“麦橘超然”模型（majicflus_v1），还用了先进的 float8 量化技术，让原本需要大显存才能跑动的模型，在普通电脑甚至中低端GPU上也能流畅运行。更重要的是，它的操作界面非常直观，就像在用一个画画APP，输入你想画的内容，点一下按钮，几秒钟就能看到结果。而且支持自定义提示词、种子（seed）和步数（steps），让你不仅能“随机出图”，还能精准复现喜欢的画面。

七大AIGC测试工具横向评测：赋能软件测试的AI利器

七大AIGC测试工具横向评测：赋能软件测试的AI利器

在AI技术迅猛发展的2025年，AIGC（人工智能生成内容）工具已深度融入软件测试领域，显著提升测试效率和质量。本次评测聚焦七大主流工具：CodeWhisperer、GitHub Copilot、Testim、Selenium AI、Test.ai、Mabl和Functionize。评测基于实际测试场景（如Web/API测试、移动端兼容性验证），从核心功能、优缺点、适用性及成本四维度展开。目标是为测试工程师提供数据驱动的决策参考。评测方法包括工具实测（使用Python/Java测试脚本）、用户反馈分析（来源Stack Overflow和GitHub议题）及性能基准测试（错误检测率、执行速度）。以下是详细横向比较。一、工具核心功能与评测结果 1. Amazon CodeWhisperer * 功能亮点：基于AWS的AI代码助手，专精于测试脚本生成。支持Python、Java等语言，能自动补全测试用例（如Selenium脚本），并集成漏洞扫描。实测中，生成100行测试代码的平均时间仅5秒，错误率低于5%。 * 优点：

从一句话到一张图：看懂 Stable Diffusion 的“潜空间扩散”生成流程（配图详解）

Stable Diffusion Pipeline Source: Aayush’s Blog, “Stable Diffusion using Hugging Face – Putting everything together” (2022).Used with attribution. 当你输入一句 “A dog wearing a hat（戴帽子的狗）”，模型最后输出一张高清图片。中间到底发生了什么？这张图展示的，其实就是 Stable Diffusion 这类潜空间扩散模型（Latent Diffusion Model）最核心的工作流：文本 → 语义向量 → 潜空间噪声 → 逐步去噪 → VAE 解码成图像。本文将按图逐块拆解，并补充它背后的关键概念与工程细节，让你真正理解扩散模型是如何“画画”的。 1. 这张图在讲什么？