全球顶级AI大模型最新排名出炉!Gemini 3.1 Pro与GPT-5.4智能并列第一,中国 GLM-5强势杀入前 5,DeepSeek V3.2 成性价比之王!

全球顶级AI大模型最新排名出炉!Gemini 3.1 Pro与GPT-5.4智能并列第一,中国 GLM-5强势杀入前 5,DeepSeek V3.2 成性价比之王!

你好,我是杰哥

刚刚,权威 AI 评测平台Artificial Analysis 发布了全球最新大模型三维排名:智能指数(Intelligence)、**输出速度(Output Tokens per Second)**和 价格(USD per 1M Tokens)

这次排名亮点满满:

  • 中美模型继续霸榜智能顶端,Gemini 3.1 Pro Preview 和 GPT-5.4(xhigh)并列57分第一
  • 中国模型表现亮眼GLM-5 智能第5(50分),DeepSeek V3.2虽然智能中等,但价格+速度综合性价比极高,继续展现“中国力量”!
GLM-5 是由中国领先的 AI 公司智谱AI(Zhipu AI)于 2026年2月11日(春节前夕)正式发布的新一代开源旗舰大模型,也被视为国产大模型在2026年开年的重磅作品。它在全球权威评测平台 Artificial AnalysisIntelligence Index 中获得 50分,位居全球第 5、开源模型第一,成为中国模型首次突破这一分数线的重要里程碑。
  • 速度王被 NVIDIA Nemotron 3 Super 夺走,价格最便宜的仍是开源/中国系模型。

下面我们一起具体来看。

一、智能指数(Intelligence)

核心能力排名,代表模型的综合推理、知识、创造力水平。

排行榜如下图(前10名):

  • Gemini 3.1 Pro Preview(Google):57分(并列第1)
  • GPT-5.4 (xhigh) (OpenAI):57分(并列第1)
  • Claude Opus 4.6 (max) (Anthropic):53分
  • Claude Sonnet 4.6 (max) (Anthropic):52分
  • GLM-5(智谱AI):50分 (中国模型第1,全球第5!)
  • Grok 4.20 Beta 0309(xAI):48分
  • Gemini 3 Flash(Google):46分
  • DeepSeek V3.2:42分
  • Nemotron 3 Super(NVIDIA):36分
  • gpt-oss-120B (high) :33分

杰哥点评
GeminiGPT-5.4 再次并驾齐驱,智能天花板被拉到新高度!中国 GLM-5 从上期榜单继续前进,稳居前 5,证明国产大模型在核心能力上已与国际顶级阵营并肩。DeepSeek V3.2 虽未进前 5,但作为开源/低成本代表,仍有不俗表现。Claude 双子星依然稳健,但已被中美模型拉开小差距。

二、输出速度(Speed)

每秒输出Token数,直接决定聊天、写作、代码生成的流畅度。

排行榜如下图(前10名):

  • NVIDIA Nemotron 3 Super:455 tokens/s(第1!)
  • gpt-oss-120B (high) :279 tokens/s(第2)
  • Grok 4.20 Beta 0309 :216 tokens/s
  • Gemini 3 Flash:166 tokens/s
  • Gemini 3.1 Pro Preview :125 tokens/s
  • GPT-5.4 (xhigh) :73 tokens/s
  • GLM-5:67 tokens/s
  • Claude Sonnet 4.6 (max) :55 tokens/s
  • Claude Opus 4.6 (max) :48 tokens/s
  • DeepSeek V3.2:28 tokens/s

杰哥点评
速度王彻底易主!NVIDIA Nemotron 3 Super455 tokens/s 碾压,成为“闪电侠”。Grok 4.20Gemini Flash 也进入前 4,日常使用体验极佳。GPT-5.4GLM-5 速度中等偏上,DeepSeek V3.2 速度偏慢,但胜在后面价格优势巨大——适合不追求极致速度的场景

三、价格(Price)

每百万Token美元价格(输入+输出综合参考),直接影响大规模使用成本。

排行榜如下图(从低到高):

  • gpt-oss-120B:0.3美元
  • DeepSeek V3.2:0.3美元(并列最便宜!)
  • Nemotron 3 Super:0.4美元
  • Gemini 3 Flash:1.1美元
  • GLM-5:1.6美元
  • Grok 4.20 Beta 0309:3美元
  • Gemini 3.1 Pro Preview:4.5美元
  • GPT-5.4 (xhigh) :5.6美元
  • Claude Sonnet 4.6 (max) :6美元
  • Claude Opus 4.6 (max) :10美元

杰哥点评
性价比之王诞生DeepSeek V3.2gpt-oss-120B 以 0.3美元/百万Token 并列最低,NVIDIA Nemotron 仅 0.4 美元——这三款几乎是“白菜价”。而顶级智能模型(Gemini/GPT-5.4/Claude Opus)价格明显更高,适合需要极致能力的场景。中国模型再次在成本控制上领先全球

总结:怎么选才是最优解?

  • 追求最强智能(写作、推理、复杂任务):Gemini 3.1 Pro PreviewGPT-5.4(57分天花板)
  • 追求极致速度(实时聊天、代码生成):NVIDIA Nemotron 3 Super(455 tokens/s)
  • 追求性价比(日常高频使用、创业/企业):DeepSeek V3.2gpt-oss-120B(0.3美元+可用速度)
  • 中国用户优选:GLM-5(智能前5+价格合理)、DeepSeek V3.2(最便宜)

AI时代,没有绝对最强,只有最适合。根据你的使用场景(智能/速度/预算)灵活选择,就能事半功倍!

你最看好哪款模型?是在用 GeminiGPT 还是国产 DeepSeek/GLM?欢迎评论区告诉我~

关注【AI信息风向】后,回复 666,即可获取更多 AI 行业报告。

AI 技术正以前所未有的速度发展,它将如何塑造我们的未来?让我们拭目以待。

Read more

OpenClaw“小龙虾”爆火!这个项目让 12 个顶级 AI 全部变成“免费 API”|如何解决OpenClaw费Token的问题?

OpenClaw“小龙虾”爆火!这个项目让 12 个顶级 AI 全部变成“免费 API”|如何解决OpenClaw费Token的问题?

📢 免责声明 本文所述技术仅用于合法授权的安全研究、教学演示及防御机制开发。作者及发布平台不承担因读者误用、滥用本内容所导致的任何法律责任。请严格遵守《中华人民共和国网络安全法》及相关法律法规。 🦞 OpenClaw“小龙虾”爆火!这个项目把 12 个 AI 全变成免费 API 最近 AI Agent 圈最火的开源项目之一就是 OpenClaw。 很多开发者给它起了一个很形象的外号: AI Agent 界的小龙虾 🦞 为什么这么说? 因为它有三个特点: * • 越用越上头 * • 生态越来越大 * • 能自动执行各种复杂任务 OpenClaw 本身只是 Agent 框架,并不自带模型,需要连接 Claude、ChatGPT、DeepSeek 等大模型才能运行。 但问题来了: API 太贵。 于是一个非常“疯狂”的项目火了—— openclaw-zero-token 它可以把 网页版

[2026年03月15日] AI 深度早报

[2026年03月15日] AI 深度早报

📅 [2026年03月15日] AI 深度早报:GTC 开幕日,AI Agent 平台与具身世界模型双线引爆 👋 晨间导读 今天是 NVIDIA GTC 2026 的开幕日,也是本周 AI 圈最密集的一个爆发点。三件事同时发生:NVIDIA 用 NemoClaw 宣示进入 Agent 基础设施赛道;微软开源 AgentRx,把 AI Agent 的调试工程化带上台面;与此同时,来自中国的大晓机器人悄悄开源了一个端侧运行的具身世界模型,推理速度比前代快 72 倍。AI Coding 走向"平台化",具身智能走向"可部署"——变化正在加速,今天的早报将带你抓住最关键的信号。 1. 🚀 NVIDIA GTC

Harness Engineering:给 AI 套上缰绳的工程学(通俗易懂)

Harness Engineering:给 AI 套上缰绳的工程学(通俗易懂)

🐴 Harness Engineering:给 AI 套上缰绳的工程学 AI 写代码的速度已经超过了人类能"擦屁股"的速度。Harness Engineering,就是那根让烈马变战马的缰绳。 目录 * 🐴 Harness Engineering:给 AI 套上缰绳的工程学 * 一、前言:当 AI 开始"飙车" * 二、名词急救包——先扫盲再上路 * 🐎 Harness Engineering(驾驭工程) * 🧠 Context Engineering(上下文工程) * 🎵 Vibe Coding(氛围编程) * 🤖 Coding Agent(编码智能体) * 📋 AGENTS.md(AI 工作手册) * 🔌 MCP / ACP / A2A(

AI 编程助手价格与体验对比:Claude Code vs 国产替代(通义灵码 / 文心快码 / MarsCode / 腾讯系)

目录 * 1. 为什么要做这篇对比:开发效率正在被“定价”重塑 * 2. Claude Code 要不要付费?费用结构如何理解 * 3. 国产替代有哪些:定位差异与适用人群 * 4. 对比表格:价格、能力、生态、适配场景一张看懂 * 5. 实战:同一组任务对比补全 / 重构 / 测试 / 审查 * 6. 选型建议:按场景快速决策 * 7. 总结:把“工作流收益”放进预算里 1. 为什么要做这篇对比:开发效率正在被“定价”重塑 AI 编程助手已经从“写几行代码的尝鲜工具”,变成了能够影响交付节奏、代码质量与团队协作方式的生产力组件。Claude Code 代表了国际一线模型能力与工程体验;国产阵营(通义灵码、文心快码、