全球顶级AI大模型最新排名出炉！Gemini 3.1 Pro与GPT-5.4智能并列第一，中国 GLM-5强势杀入前 5，DeepSeek V3.2 成性价比之王！

优质文章学习记录

09 Apr 2026 — 5 min read

你好，我是杰哥

刚刚，权威 AI 评测平台Artificial Analysis 发布了全球最新大模型三维排名：智能指数（Intelligence）、**输出速度（Output Tokens per Second）**和 价格（USD per 1M Tokens）。

这次排名亮点满满：

中美模型继续霸榜智能顶端，Gemini 3.1 Pro Preview 和 GPT-5.4（xhigh）并列57分第一！
中国模型表现亮眼：GLM-5 智能第5（50分），DeepSeek V3.2虽然智能中等，但价格+速度综合性价比极高，继续展现“中国力量”！

GLM-5 是由中国领先的 AI 公司智谱AI（Zhipu AI）于 2026年2月11日（春节前夕）正式发布的新一代开源旗舰大模型，也被视为国产大模型在2026年开年的重磅作品。它在全球权威评测平台 Artificial Analysis 的 Intelligence Index 中获得 50分，位居全球第 5、开源模型第一，成为中国模型首次突破这一分数线的重要里程碑。

速度王被 NVIDIA Nemotron 3 Super 夺走，价格最便宜的仍是开源/中国系模型。

下面我们一起具体来看。

一、智能指数（Intelligence）

核心能力排名，代表模型的综合推理、知识、创造力水平。

排行榜如下图（前10名）：

Gemini 3.1 Pro Preview（Google）：57分（并列第1）
GPT-5.4 (xhigh) （OpenAI）：57分（并列第1）
Claude Opus 4.6 (max) （Anthropic）：53分
Claude Sonnet 4.6 (max) （Anthropic）：52分
GLM-5（智谱AI）：50分 （中国模型第1，全球第5！）
Grok 4.20 Beta 0309（xAI）：48分
Gemini 3 Flash（Google）：46分
DeepSeek V3.2：42分
Nemotron 3 Super（NVIDIA）：36分
gpt-oss-120B (high) ：33分

杰哥点评：
Gemini 和 GPT-5.4 再次并驾齐驱，智能天花板被拉到新高度！中国 GLM-5 从上期榜单继续前进，稳居前 5，证明国产大模型在核心能力上已与国际顶级阵营并肩。DeepSeek V3.2 虽未进前 5，但作为开源/低成本代表，仍有不俗表现。Claude 双子星依然稳健，但已被中美模型拉开小差距。

二、输出速度（Speed）

每秒输出Token数，直接决定聊天、写作、代码生成的流畅度。

排行榜如下图（前10名）：

NVIDIA Nemotron 3 Super：455 tokens/s（第1！）
gpt-oss-120B (high) ：279 tokens/s（第2）
Grok 4.20 Beta 0309 ：216 tokens/s
Gemini 3 Flash：166 tokens/s
Gemini 3.1 Pro Preview ：125 tokens/s
GPT-5.4 (xhigh) ：73 tokens/s
GLM-5：67 tokens/s
Claude Sonnet 4.6 (max) ：55 tokens/s
Claude Opus 4.6 (max) ：48 tokens/s
DeepSeek V3.2：28 tokens/s

杰哥点评：
速度王彻底易主！NVIDIA Nemotron 3 Super 以 455 tokens/s 碾压，成为“闪电侠”。Grok 4.20 和 Gemini Flash 也进入前 4，日常使用体验极佳。GPT-5.4 和 GLM-5 速度中等偏上，DeepSeek V3.2 速度偏慢，但胜在后面价格优势巨大——适合不追求极致速度的场景。

三、价格（Price）

每百万Token美元价格（输入+输出综合参考），直接影响大规模使用成本。

排行榜如下图（从低到高）：

gpt-oss-120B：0.3美元
DeepSeek V3.2：0.3美元（并列最便宜！）
Nemotron 3 Super：0.4美元
Gemini 3 Flash：1.1美元
GLM-5：1.6美元
Grok 4.20 Beta 0309：3美元
Gemini 3.1 Pro Preview：4.5美元
GPT-5.4 (xhigh) ：5.6美元
Claude Sonnet 4.6 (max) ：6美元
Claude Opus 4.6 (max) ：10美元

杰哥点评：
性价比之王诞生！DeepSeek V3.2 和 gpt-oss-120B 以 0.3美元/百万Token 并列最低，NVIDIA Nemotron 仅 0.4 美元——这三款几乎是“白菜价”。而顶级智能模型（Gemini/GPT-5.4/Claude Opus）价格明显更高，适合需要极致能力的场景。中国模型再次在成本控制上领先全球！

总结：怎么选才是最优解？

追求最强智能（写作、推理、复杂任务）：Gemini 3.1 Pro Preview 或 GPT-5.4（57分天花板）
追求极致速度（实时聊天、代码生成）：NVIDIA Nemotron 3 Super（455 tokens/s）
追求性价比（日常高频使用、创业/企业）：DeepSeek V3.2 或 gpt-oss-120B（0.3美元+可用速度）
中国用户优选：GLM-5（智能前5+价格合理）、DeepSeek V3.2（最便宜）

AI时代，没有绝对最强，只有最适合。根据你的使用场景（智能/速度/预算）灵活选择，就能事半功倍！

你最看好哪款模型？是在用 Gemini、GPT 还是国产 DeepSeek/GLM？欢迎评论区告诉我～

关注【AI信息风向】后，回复 666，即可获取更多 AI 行业报告。

AI 技术正以前所未有的速度发展，它将如何塑造我们的未来？让我们拭目以待。

OpenClaw“小龙虾”爆火！这个项目让 12 个顶级 AI 全部变成“免费 API”|如何解决OpenClaw费Token的问题?

📢 免责声明本文所述技术仅用于合法授权的安全研究、教学演示及防御机制开发。作者及发布平台不承担因读者误用、滥用本内容所导致的任何法律责任。请严格遵守《中华人民共和国网络安全法》及相关法律法规。 🦞 OpenClaw“小龙虾”爆火！这个项目把 12 个 AI 全变成免费 API 最近 AI Agent 圈最火的开源项目之一就是 OpenClaw。很多开发者给它起了一个很形象的外号： AI Agent 界的小龙虾 🦞 为什么这么说？因为它有三个特点： * • 越用越上头 * • 生态越来越大 * • 能自动执行各种复杂任务 OpenClaw 本身只是 Agent 框架，并不自带模型，需要连接 Claude、ChatGPT、DeepSeek 等大模型才能运行。但问题来了： API 太贵。于是一个非常“疯狂”的项目火了—— openclaw-zero-token 它可以把网页版

[2026年03月15日] AI 深度早报

📅 [2026年03月15日] AI 深度早报：GTC 开幕日，AI Agent 平台与具身世界模型双线引爆 👋 晨间导读今天是 NVIDIA GTC 2026 的开幕日，也是本周 AI 圈最密集的一个爆发点。三件事同时发生：NVIDIA 用 NemoClaw 宣示进入 Agent 基础设施赛道；微软开源 AgentRx，把 AI Agent 的调试工程化带上台面；与此同时，来自中国的大晓机器人悄悄开源了一个端侧运行的具身世界模型，推理速度比前代快 72 倍。AI Coding 走向"平台化"，具身智能走向"可部署"——变化正在加速，今天的早报将带你抓住最关键的信号。 1. 🚀 NVIDIA GTC

Harness Engineering：给 AI 套上缰绳的工程学（通俗易懂）

🐴 Harness Engineering：给 AI 套上缰绳的工程学 AI 写代码的速度已经超过了人类能"擦屁股"的速度。Harness Engineering，就是那根让烈马变战马的缰绳。目录 * 🐴 Harness Engineering：给 AI 套上缰绳的工程学 * 一、前言：当 AI 开始"飙车" * 二、名词急救包——先扫盲再上路 * 🐎 Harness Engineering（驾驭工程） * 🧠 Context Engineering（上下文工程） * 🎵 Vibe Coding（氛围编程） * 🤖 Coding Agent（编码智能体） * 📋 AGENTS.md（AI 工作手册） * 🔌 MCP / ACP / A2A（

AI 编程助手价格与体验对比：Claude Code vs 国产替代（通义灵码 / 文心快码 / MarsCode / 腾讯系）

目录 * 1. 为什么要做这篇对比：开发效率正在被“定价”重塑 * 2. Claude Code 要不要付费？费用结构如何理解 * 3. 国产替代有哪些：定位差异与适用人群 * 4. 对比表格：价格、能力、生态、适配场景一张看懂 * 5. 实战：同一组任务对比补全 / 重构 / 测试 / 审查 * 6. 选型建议：按场景快速决策 * 7. 总结：把“工作流收益”放进预算里 1. 为什么要做这篇对比：开发效率正在被“定价”重塑 AI 编程助手已经从“写几行代码的尝鲜工具”，变成了能够影响交付节奏、代码质量与团队协作方式的生产力组件。Claude Code 代表了国际一线模型能力与工程体验；国产阵营（通义灵码、文心快码、