零刻AI Max395(Ubuntu 24.04)AMD 显卡监控工具(amdgpu_top)部署手册

零刻AI Max395(Ubuntu 24.04)AMD 显卡监控工具(amdgpu_top)部署手册

       同事购置一台零刻AI Max395,已装Ubuntu 24.04,拿来玩耍,打算部署GLM-4.7,需要设置显存突破96GB限制(因Max 395 BIOS中可分配的最大显存为96G,为能够运行101G的模型权重,需通过Linux GTT来设置显存突破96G的限制)。rocm-smi回显信息有限,安装amdgpu_top监控工具。

rocm-smi回显如下:

设置显存突破96GB限制

vim /etc/default/grub #编辑grub文件,修改参数 ######## GRUB_CMDLINE_LINUX_DEFAULT="quiet splash amd_iommu=off ttm.pages_limit=31457280 ttm.page_pool_size=31457280 amdttm.pages_limit=31457280 amdttm.page_pool_size=31457280 apparmor=0 zswap.enabled=1 zswap.compressor=zstd zswap.zpool=zsmalloc zswap.max_pool_percent=5" ######## :wq update-grub #编辑完成后运行,运行完毕重启 amdgpu_top #回显如下 ____________________________________________________ (base) root@lisinan-GTR:~# amdgpu_top amdgpu_top:未找到命令 (base) root@lisinan-GTR:~# ^C

amdgpu_top监控工具部署:

amdgpu_top是专门用于监控 AMD 显卡(适配 amdgpu 驱动)状态的工具,Ubuntu 24.04 默认 apt 软件源中没有该工具,无法直接通过apt install安装,需要通过源码编译或 AMD 官方工具包安装,其中源码编译是最稳定、适配性最强的方式。

安装编译amdgpu_top所需的基础工具和依赖库,以 root 身份执行以下命令

apt update && apt upgrade -y # 更新系统软件源 apt install -y git cmake g++ libdrm-dev libncurses-dev libncursesw5-dev pkg-config # 安装核心编译依赖和依赖库

源码编译安装

git clone https://github.com/Umio-Yasuno/amdgpu_top.git #克隆amdgpu_top官方源码仓库

进入源码目录,创建构建目录并配置编译环境

cd amdgpu_top # 进入源码目录 mkdir build && cd build # 创建构建目录(规范编译流程,避免污染源码文件)

amdgpu_top采用 Rust 开发,需通过cargo工具构建,而非cmake;

上图是过程中,Rust 已存在导致的 rustup 安装报错

终端提示你系统/usr/bin目录下已经预装了 Rust,而rustup是 Rust 的官方版本管理工具,默认希望成为系统的「唯一 Rust 环境」,因此触发了路径检查警告,最终报错cannot install while Rust is installed。

解决方案:跳过路径检查,直接安装 rustup。无需卸载系统预装的 Rust,通过添加参数跳过路径检查,直接完成安装,后续可通过rustup管理 Rust 版本,避免冲突。

执行带跳过参数的安装命令

curl --proto '=https' --tlsv1.2 -sSf https://sh.rustup.rs | sh -s -- -y #添加 -y 参数,忽略所有可跳过的检查(包括路径检查) ls -l #验证 amdgpu_top 项目文件完整性,查看当前目录下的项目文件(核心文件包括Cargo.toml、src/目录,缺一不可)

配置 Rust 环境变量(安装完成后必须执行)

安装完成后,需要加载环境变量,让系统识别rustup和cargo(Rust 的包管理工具):

source "$HOME/.cargo/env" # 加载环境变量(临时生效,当前终端窗口有效) echo "source $HOME/.cargo/env" >> ~/.bashrc #(可选)配置永久生效(后续新开终端也能直接使用) source ~/.bashrc

验证安装是否成功

rustup --version # 查看rustup版本 rustc --version # 查看rust版本 cargo --version # 查看cargo版本

Release 模式编译,如果后续需要长期使用amdgpu_top监控硬件,推荐用 Release 模式编译

cargo build --release #优化编译,去除调试信息,运行效率提升30%以上,编译耗时,耐心等待即可,提示"Finished `release` profile [optimized] target(s) in 1m 27s"即表示编译成功

安装到全局路径(可直接输入amdgpu_top运行)

将可执行文件安装到~/.cargo/bin目录(该目录已配置到环境变量,系统可全局识别),后续在任何目录下输入amdgpu_top即可运行,无需指定路径。

# cargo install --path .(--path . 表示当前项目目录) # 该命令会将编译后的Release版本文件复制到~/.cargo/bin,实现全局调用 cargo install --path . #安装成功后,全局运行amdgpu_top(任何目录下都可执行) amdgpu_top

amdgpu_top回显如下:

Read more

Android WebRTC 屏幕共享实战:低延迟传输与权限管理最佳实践

快速体验 在开始今天关于 Android WebRTC 屏幕共享实战:低延迟传输与权限管理最佳实践 的探讨之前,我想先分享一个最近让我觉得很有意思的全栈技术挑战。 我们常说 AI 是未来,但作为开发者,如何将大模型(LLM)真正落地为一个低延迟、可交互的实时系统,而不仅仅是调个 API? 这里有一个非常硬核的动手实验:基于火山引擎豆包大模型,从零搭建一个实时语音通话应用。它不是简单的问答,而是需要你亲手打通 ASR(语音识别)→ LLM(大脑思考)→ TTS(语音合成)的完整 WebSocket 链路。对于想要掌握 AI 原生应用架构的同学来说,这是个绝佳的练手项目。 从0到1构建生产级别应用,脱离Demo,点击打开 从0打造个人豆包实时通话AI动手实验 Android WebRTC 屏幕共享实战:低延迟传输与权限管理最佳实践 背景痛点分析 在Android端实现WebRTC屏幕共享时,开发者通常会遇到以下几个典型问题: 1. 跨版本兼容性问题:从Android

双剑破天门:攻防世界Web题解之独孤九剑心法(七)

双剑破天门:攻防世界Web题解之独孤九剑心法(七)

免责声明:用户因使用公众号内容而产生的任何行为和后果,由用户自行承担责任。本公众号不承担因用户误解、不当使用等导致的法律责任 **本文以攻防世界部分题为例进行演示,后续会对攻防世界大部分的web题目进行演示,如果你感兴趣请关注** 目录 一:Newscenter 二:upload1 三:Xff_referer 四:Command_execution 五:总结 1. Newscenter(SQL注入) 2. upload1(文件上传漏洞) 3. Xff_referer(HTTP头伪造) 4. Command_execution(命令注入) 一:Newscenter 打开为如下所示 经过尝试,得知在输入框中输入数字可得到不同内容 输入23就没有新闻 所以我们得知这个输入框和数据库有交互,那这题考察的可能就是SQL注入 发现将数据库中所有的内容都查询了出来,那这个题考察的就是SQL注入 字段长度为3 23' order by

小白入门:前端前端调用 AI 接口全流程(附具体案例)

很多前端新手在调用 AI 接口时会犯怵:不知道 “怎么怎么传参数?”“流式响应怎么处理?”“不同功能(润色 / 扩写)调用方式不一样吗?” 其实很简单!本文以 “智能文本处理工具” 为例,手把手教你从 0 到 1 调用 AI 接口,包含润色、扩写等功能,看完就能上手。 准备工作:先看懂这 3 个核心文件 在开始前,我们需要明确项目中 3 个关键文件的作用(这些文件你可能已经有了,只是不知道怎么用): * vite.config.js:配置后端接口代理,解决跨域问题 * apiClient.js:封装好的 HTTP 请求工具,帮你发请求 * aiService.js:封装好的 AI 功能函数(

Java Web 开发环境搭建:IDEA+Tomcat 安装与部署超详细教程

Java Web 开发环境搭建:IDEA+Tomcat 安装与部署超详细教程

在 Java Web 开发中,IDEA 作为主流的集成开发工具,搭配 Tomcat 轻量级 Web 服务器是入门首选。本文将基于 Java Web 基础开发要求,从 JDK 环境配置、Tomcat 安装配置、IDEA 安装、Web 项目创建,到 Tomcat 在 IDEA 中的部署运行,进行一步一图式详细讲解,零基础也能轻松上手。 一、前置准备:JDK 环境配置 Java Web 开发的核心基础是 JDK,Tomcat 和 IDEA 的运行都依赖 JDK 环境,需先完成 JDK 的安装与环境变量配置。 1. 下载与安装