MS-S1 MAX,AI MAX 395在Ubuntu24利用Vulkan版llama.cpp运行gpt-oss 120b

MS-S1 MAX,AI MAX 395在Ubuntu24利用Vulkan版llama.cpp运行gpt-oss 120b

1、安装amd gpu驱动和Rocm

wget https://repo.radeon.com/amdgpu-install/7.1.1/ubuntu/noble/amdgpu-install_7.1.1.70101-1_all.deb sudo apt install ./amdgpu-install_7.1.1.70101-1_all.deb sudo apt update sudo apt install "linux-headers-$(uname -r)" "linux-modules-extra-$(uname -r)" sudo apt install amdgpu-dkms sudo apt install python3-setuptools python3-wheel sudo usermod -a -G render,video $LOGNAME sudo apt install rocm 

参考官网

2、通过GTT解锁96G显存

1、进入bios->setup->advanced->NBIO common options->GFX configuration->UMA Frame buffer size改显存
2、修改grub

vim /etc/default/grub #设置保存 GRUB_CMDLINE_LINUX_DEFAULT="quiet splash amd_iommu=off ttm.pages_limit=27648000 ttm.page_pool_size=27648000 amdttm.pages_limit=27648000 amdttm.page_pool_size=27648000 apparmor=0" update-grub 

重启生效
参考b站大佬

3、安装vulkan

sudo apt install vulkan-tools 

4、下载llama.cpp release,硬要自己编译也可以

下载页

wget https://github.com/ggml-org/llama.cpp/releases/download/b7503/llama-b7503-bin-ubuntu-vulkan-x64.tar.gz #进入目录 #去https://hf-mirror.com/ggml-org/collections中找自己想要部署的模型,里边有运行命令 ./llama-server -hf ggml-org/gpt-oss-120b-GGUF -c 0 --jinja #文件下载到~/.cache/llama.cpp/目录中 

5、安装amdgpu_top

sudo dpkg -i amdgpu-top_0.11.0-1_amd64.deb sudo amdgpu_top 

6、最终效果

如果你的token速度只有二十几,那就是纯cpu算的没跑了

在这里插入图片描述


amdgpu_top验证

在这里插入图片描述


注意,如果你要用其他电脑访问,需要增加参数–host 0.0.0.0,具体参考文档

Read more

宏智树AI——ChatGPT学术版驱动,一站式论文写作智能解决方案

宏智树AI——ChatGPT学术版驱动,一站式论文写作智能解决方案

在学术创作日益精细化、规范化的今天,每一位科研学子、研究者都曾面临论文写作的多重困境:大纲难立、文献繁杂、数据难析、格式繁琐,耗费大量时间在机械性工作上,难以聚焦核心研究价值。宏智树AI应运而生,作为一款专为论文写作量身打造的学术写作辅助平台,依托ChatGPT学术版模型驱动,搭载先进AI5.0技术架构,构建起覆盖“大纲生成到定稿答辩”的全流程学术智能解决方案,重新定义学术创作效率与质量边界,让每一份学术成果都能高效落地、彰显专业。 宏智树AI的核心竞争力,源于其深耕学术场景的技术沉淀与功能布局。不同于通用型AI写作工具,平台以ChatGPT学术版为核心驱动,结合AI5.0技术架构的迭代优势,针对学术写作的逻辑特性、规范要求进行千万级学术语料训练,精准适配各学科论文写作范式,实现“智能赋能不越界,专业辅助不缺位”,既保留研究者的核心思考,又高效解决写作中的各类痛点,让学术创作更轻松、更合规、更具深度。 硬核技术底座:ChatGPT学术版+AI5.0,解锁学术智能新高度 技术是学术辅助的核心支撑,宏智树AI以双重技术优势,筑牢学术创作的智能根基。依托ChatGPT学术版模型的强大

临床智能体AI与环境感知AI的融合:基于python的医疗自然语言处理深度分析

临床智能体AI与环境感知AI的融合:基于python的医疗自然语言处理深度分析

引言 医疗领域的数智化进程正以前所未有的速度推进,人工智能技术的应用尤为显著。随着大型语言模型(LLMs)的迅猛发展,医疗AI已从简单的辅助工具升级为复杂的智能体系统。临床智能体AI与环境感知AI的融合代表了医疗AI的最新发展方向,为重塑医疗运营自然语言处理提供了全新视角。 本研究聚焦于临床智能体AI与环境感知AI的融合技术,深入探讨其在医疗运营自然语言处理中的应用。我们将详细分析spaCy、BERT-Med、Whisper、Kaldi、Drools、AWS Lex、PySyft和Intel SGX等先进工具在这一领域的应用,并提供完整的Python代码实现。 临床智能体AI与环境感知AI的基本概念 临床智能体AI的定义与特征 临床智能体AI(Clinical AI Agents)是指在临床环境中运行,能够感知医疗场景、理解患者需求、做出诊断决策并执行医疗相关任务的人工智能系统。这类智能体具备以下核心特征: 1. 感知能力:能够通过多种传感器和数据源获取医疗相关信息 2. 理解能力:能够理解复杂的医学知识和患者需求 3. 决策能力:能够基于医学知识和患者数据做出合理

人工智能:自然语言处理在社交媒体分析领域的应用与实战

人工智能:自然语言处理在社交媒体分析领域的应用与实战

人工智能:自然语言处理在社交媒体分析领域的应用与实战 学习目标 💡 理解自然语言处理(NLP)在社交媒体分析领域的应用场景和重要性 💡 掌握社交媒体分析领域NLP应用的核心技术(如文本挖掘、情感分析、主题建模) 💡 学会使用前沿模型(如BERT、GPT-3、Transformer)进行社交媒体文本分析 💡 理解社交媒体领域的特殊挑战(如数据噪声、实时性要求高、用户意图多样性) 💡 通过实战项目,开发一个社交媒体情感分析应用 重点内容 * 社交媒体分析领域NLP应用的主要场景 * 核心技术(文本挖掘、情感分析、主题建模) * 前沿模型(BERT、GPT-3、Transformer)在社交媒体分析领域的使用 * 社交媒体领域的特殊挑战 * 实战项目:社交媒体情感分析应用开发 一、社交媒体分析领域NLP应用的主要场景 1.1 文本挖掘 1.1.1 文本挖掘的基本概念 文本挖掘是对社交媒体文本进行挖掘和分析的过程。在社交媒体分析领域,文本挖掘的主要应用场景包括: * 用户行为分析:分析用户的行为(如“

Draw.io 官方 MCP 实测:AI 自动生成架构图,丝滑到离谱

Draw.io 官方 MCP 实测:AI 自动生成架构图,丝滑到离谱

最近绘图神器 draw.io 发布了官方 MCP Server。真是喜大普奔(喜闻乐见、大快人心、普天同庆、奔走相告)。 我们现在可以在 Cursor、Claude Desktop 等支持 MCP 的编辑器里让 draw.io 帮忙画图,画完后,它会直接弹出网页编辑器,我们可以基于已绘制的图进行再次编辑,体验非常酷。 接下来我们一起看看怎么使用它。 安装与配置 一、在 Cursor 中配置 MCP server: 1. 打开 Cursor,进入 Settings → Cursor Settings → MCP(或直接 Cmd + Shift + J) 2. 点击 + Add new global