AI 一周大事件：万亿硬件订单、模型套壳与生态变局解读

1、前言

2026 年 3 月第三周（3/17–3/23），可能是今年 AI 行业信息密度最高的一周。

NVIDIA GTC 大会抛出万亿美元级硬件路线图；OpenAI 收购 Python 核心工具链；Anthropic 把 Claude Code 接入 Telegram 和 Discord；小米一个"匿名模型"搞得全球开发者以为是 DeepSeek V4；Cursor 被曝底层跑的是 Kimi K2.5——十余条重磅新闻接连引爆。

一个清晰的信号浮出水面：AI 正在从"聊天工具"全面切换到"自主 Agent"。

本文是我对这一周所有重要事件的梳理与解读，既有新闻事实，也有我的个人分析。不废话，直接开始。

2、一周大事件时间线

先上一张总览图，方便大家快速定位本周发生了什么：

信息量很大，下面逐个展开。

3、NVIDIA GTC 2026：万亿美元的 AI 硬件帝国

3.1、Vera Rubin 平台发布

3 月 16 日，GTC 2026 在圣何塞开幕，Jensen Huang 的主题演讲再次刷新了行业对 AI 基础设施规模的认知。

Vera Rubin 是 Blackwell 之后的下一代 AI 计算平台，核心是NVL72 机架——一个 5 机架、7 芯片的集成系统，内含 72 颗 Rubin GPU、36 颗 Vera CPU（ARM 架构）和超过 130 万个组件，通过 NVLink 6 高速互联。完整的 Vera Rubin POD 由 40 个这样的机架组成，共 1152 颗 GPU，总算力达 60 exaFLOPS。

关键性能指标：

训练性能较 Blackwell 提升4 倍
每瓦推理性能提升10 倍
预计 2026 年下半年通过 Azure 和 Google Cloud 交付

Jensen Huang 同时把 Blackwell + Vera Rubin 的合计采购订单预期从 5000 亿美元翻倍至1 万亿美元。

3.2、Groq 3 LPU：专用推理芯片首秀

另一个重头戏是Groq 3 LPU——NVIDIA 在 2025 年圣诞夜以 200 亿美元收购 Groq 后的首款芯片。这是一颗基于 SRAM 的推理加速器：

每颗芯片 512MB 片上 SRAM
内存带宽 150 TB/s
三星 4nm 工艺
LPX 机架可容纳 256 颗 LPU

核心卖点：与 NVL72 配合使用时，每兆瓦推理吞吐量提升 35 倍。这是 NVIDIA 首次在其平台中加入专用推理硬件，信号很明确——推理（inference）已经和训练（training）一样重要了。

3.3、软件生态：NemoClaw、Nemotron 联盟

硬件之外，NVIDIA 的软件生态布局同样值得关注：

NemoClaw：面向企业的 OpenClaw 安全部署栈。Jensen Huang 在演讲中称 OpenClaw 为"个人 AI 的操作系统"，NemoClaw 就是让企业能安全地大规模部署它。

Nemotron Coalition：由 Mistral AI、Perplexity、Cursor、LangChain、Black Forest Labs 等参与的开放模型联盟，将在 DGX Cloud 上共同开发开源前沿模型。

Nemotron 3 Super：1200 亿参数、120 亿活跃的混合 Mamba-Transformer MoE 模型，在 SWE-Bench Verified 上拿到 60.47%——开源模型第一。

我的看法：NVIDIA 的战略已经从"卖 GPU"进化为"卖 AI 全栈平台"。Groq 3 LPU 的加入意味着它不再只做训练硬件——Agent 时代推理需求爆炸，NVIDIA 在补这块拼图。Nemotron Coalition 更是直接把生态伙伴绑在了 DGX Cloud 上，软硬件闭环越来越紧。

4、OpenAI：GPT-5.4 轻量家族 + 收购 Astral

4.1、GPT-5.4 mini 和 nano

3 月 17 日，OpenAI 发布了 GPT-5.4 系列的两款轻量模型：

GPT-5.4 mini：面向免费和 Go 用户通过"Thinking"模式提供，在 SWE-Bench Pro 等基准上接近完整版 GPT-5.4 的 95% 水平，速度快 2 倍以上。

GPT-5.4 nano：最小最便宜，API 定价$0.20/百万输入 token、$1.25/百万输出 token，面向高吞吐场景。

同时，ChatGPT 的模型选择器被简化为三层：Instant（快速日常）、Thinking（推理优先）、Pro（最强能力），支持自动路由。

4.2、收购 Astral：拿下 Python 基础设施

3 月 19 日的收购 Astral 才是本周 OpenAI 最值得关注的动作。

Astral 开发了 Python 社区最受欢迎的三个工具：包管理器uv、代码检查器Ruff、类型检查器Ty。这三个工具基本上是 2025–2026 年 Python 开发者的标配。Astral 团队将加入 OpenAI 的Codex 团队。

背景数据：Codex 现在的周活跃用户超过 200 万，自 2026 年 1 月以来用户增长 3 倍、使用量增长 5 倍。

OpenAI 承诺继续维护这些开源工具，但社区反应很复杂——知名开发者 Simon Willison 发表长文分析了担忧点，核心是：当一家 AI 公司控制了编程语言的核心工具链，开源社区的独立性怎么保证？

4.3、IPO 准备与扩张

OpenAI 本周还被曝出多条扩张消息：

最新估值8400 亿美元（1100 亿融资：亚马逊 500 亿、软银 300 亿、NVIDIA 300 亿）
ChatGPT 周活跃用户超9 亿，付费订阅5000 万
计划年底前员工从 4500 人扩至8000 人
2026 年 Q4 启动 IPO

我的看法：收购 Astral 是 OpenAI 从"AI 模型公司"向"AI 开发者平台"转型的关键一步。控制了 uv/ruff 这样的基础工具意味着 OpenAI 可以深度整合到开发者日常工作流中——这比任何 API 定价战都更有战略价值。不过社区担忧是合理的，Python 生态的中立性确实值得关注。

5、Anthropic：Claude Code Channels 与五角大楼之争

5.1、Claude Code Channels：把 AI 编程搬进聊天 App

3 月 20 日，Anthropic 发布了Claude Code Channels——这可能是本周最具想象力的产品发布。

它的核心思路很简单：把 Claude Code 连接到 Discord 和 Telegram。用户可以在手机上通过聊天 App 直接给 Claude Code 发编程指令，实现异步自主编程。不需要打开 IDE，不需要坐在电脑前——你在地铁上给它发条消息，到公司的时候代码已经写好了。

技术上，它基于 MCP（Model Context Protocol）协议构建，通过--channels标志启动后，Claude Code 作为轮询服务运行在持久化服务器上。VentureBeat 直接称其为"OpenClaw 杀手"。

此外，Claude Code 在 3 月还更新了：

按键说话语音模式（/voice，支持 15+ 语言）
/loop循环监控命令
100 万 token 上下文窗口全面开放
新的 MCP 引导交互功能

5.2、vs 五角大楼：AI 伦理红线之争

另一条线是 Anthropic 与美国国防部的法律对峙。

五角大楼把 Anthropic 列为"供应链风险"——原因是公司拒绝让 Claude 被不受限制地用于自主武器和大规模监控。3 月 18 日国防部提交反驳文件，3 月 20 日 Anthropic 回击，声称政府的论据基于"技术误解"。

有意思的是，微软、Google 和 OpenAI 的员工（包括 Google 首席科学家 Jeff Dean）都提交了支持 Anthropic 的法庭简报。CNN 报道这场争端反而提升了 Anthropic 的品牌认知度——员工留存率 80%、offer 接受率 88%。

听证会定于 3 月 24 日（也就是明天）在旧金山举行。

我的看法：Claude Code Channels 的意义在于——它验证了"AI 编程不一定要发生在 IDE 里"这个假设。对于我们做 NewClaw 这种 AI 伴侣产品的人来说，这条路已经被 Anthropic 官方跑通了。五角大楼事件则可能成为 AI 行业安全伦理的标志性案例。

6、小米 MiMo-V2：手机厂商的万亿参数"猎人"

6.1、匿名测试霸榜

本周中国 AI 最炸裂的新闻是小米。

3 月 11 日，一个叫"Hunter Alpha"的匿名模型出现在 OpenRouter 平台，一周内消耗超过 1 万亿 token，多日霸榜第一。全球开发者都在猜——这是 DeepSeek V4 吧？

3 月 18–19 日，路透社确认：不是 DeepSeek V4，而是小米 MiMo-V2-Pro。

6.2、核心参数

MiMo-V2-Pro 的参数相当亮眼：

总参数1 万亿，每次推理激活420 亿
MoE 架构 + Hybrid Attention（7:1 比率）+ 多 Token 预测
100 万 token 上下文窗口
全球排名第 8，中国排名第 2（仅次于智谱 GLM-5）
编程/Agent 能力接近 Claude Opus 4.6，整体超过 Claude Sonnet 4.6
定价$1/百万输入、$3/百万输出——Claude Opus 4.6 的五分之一

同期还发布了 MiMo-V2-Omni（全模态 Agent 模型）和 MiMo-V2-TTS（支持粤语、四川话等方言的语音合成）。

该项目由前 DeepSeek 核心研究员罗福莉领衔。雷军宣布小米 2026 年 AI 研发 + 资本开支将超过1600 亿元人民币。

我的看法：小米这波操作很聪明——匿名测试先让市场验证产品力，再揭面收获最大关注度。"被误认为 DeepSeek V4"本身就是最好的背书。更深层的信号是：中国 AI 竞争已经不只是互联网公司的游戏了，硬件厂商正在凭借资金和工程能力强势入场。

7、Cursor"套壳"Kimi K2.5：中国模型的硅谷征途

7.1、事件始末

这是本周最具戏剧性的故事。

3 月 20 日，估值 293 亿美元的 AI 编程工具 Cursor 发布"Composer 2"，宣称自研模型。数小时内，开发者@fynnso 发现模型 ID 写着kimi-k2p5-rl-0317-s515-fast——直指月之暗面的 Kimi K2.5。

Elon Musk 亲自评论确认了这一点。月之暗面预训练负责人杜玉伦公开指控 Cursor 违反许可协议（帖子后来删除）。

7.2、反转与真相

事情很快反转：

Kimi 官方发布祝贺声明，确认 Cursor 通过Fireworks AI 的授权商业协议获取 K2.5
Cursor 承认 K2.5 是基础（约占 25% 算力），75% 来自自行的继续预训练 + 强化学习
Composer 2 在内部评测中得分61.3，超过 Claude Opus 4.6 的 58.2

7.3、更深的意义

Kimi K2.5 于 1 月 27 日发布，20 天内收入即超过 2025 全年。Stripe 数据显示订阅量环比增长8280%。目前月之暗面正以 1800 亿美元估值进行 100 亿美元新融资，阿里和腾讯均参与。

Kimi 团队还在本周发表了"Attention Residuals"论文——提出替代 Transformer 残差连接的方案，训练效率提升约 25%。论文联合作者中包括一名17 岁的深圳高中生。Andrej Karpathy 和前 OpenAI VP Jerry Tworek 均给予高度评价。

我的看法：中国开源模型正在成为硅谷产品的底层基础设施。 这句话放在一年前说出来，大多数人会觉得不可思议。Kimi K2.5 驱动着全球最火的 AI 编程工具——这个事实比任何 benchmark 都有说服力。同时这也提醒我们：模型供应链的透明度正在成为新的行业议题。

8、腾讯 AI 重组：AI Lab 解散，27 岁首席科学家接棒

3 月 20 日，腾讯正式解散运营 10 年的 AI Lab，全部人员并入混元（Hunyuan）团队。新团队由 27 岁的前 OpenAI 研究员姚顺雨领导，直接向总裁刘炽平汇报。

几个关键数字：

2025 年总收入7518 亿元（+14%）
2025 年混元 + 元宝 AI 投入约 1800 亿元
2026 年 AI 投入承诺翻倍至 3600 亿+
资本开支 792 亿元、研发费用 857.5 亿元均创新高
元宝 App 月活超1 亿
混元 3.0 确认 4 月发布

另外，DeepSeek 核心成员郭大亚据报已离开，加入字节跳动 Seed 团队。

我的看法：腾讯这次重组的力度很大。把独立的 AI Lab 并入产品线（混元），说明腾讯要的不是论文产出，而是 AI 产品化落地。27 岁的首席科学家也打破了传统——AI 行业的竞争已经快到不能靠论资排辈了。混元 3.0 四月发布，值得持续关注。

9、全球 AI 生态：Mistral、Midjourney、白宫立法

9.1、Mistral Small 4：60 亿活跃参数的 MoE 新标杆

Mistral AI 在 GTC 期间发布了Mistral Small 4：

128 个专家、每 token 激活 4 个的 MoE 架构
总参数 1190 亿，活跃参数仅60 亿
25.6 万 token 上下文窗口
首次统一了推理（Magistral）、多模态（Pixtral）和 Agent 编程（Devstral）三大能力
延迟降低 40%，每秒请求量提升 3 倍
Apache 2.0开源

同时发布的Mistral Forge是一个企业定制平台，支持在私有数据上进行预训练、微调和强化学习。早期客户包括爱立信、ESA、ASML 等。

9.2、Midjourney V8 Alpha

Midjourney V8 Alpha 是 V5 以来最大的升级：

生成速度提升 5 倍
原生2K 分辨率输出
文字渲染准确度大幅提升
复杂构图的空间、光照、纹理遵循度显著增强
新增--q 4质量模式
全新代码库和 GPU 基础设施

目前仅在 alpha.midjourney.com 可用。

9.3、白宫 AI 立法框架

3 月 20 日，白宫发布国家 AI 立法框架，七大支柱包括保护儿童、社区安全、知识产权、反审查、创新、劳动力、以及联邦法律取代各州 AI 法律。

核心立场：反对设定开放式 AI 责任，反对创建新的联邦 AI 监管机构，主张行业自律。已遭 50 多位共和党议员和 AI 监管组织反对。

同期，欧盟理事会同意将 AI 法案高风险系统规则推迟最多 16 个月执行。美国司法部指控三人涉嫌将 AI GPU 服务器非法转运至中国。

10、开发者生态变局：MCP 协议、AI IDE 竞争

10.1、MCP 成为事实标准

MCP（Model Context Protocol）由 Anthropic 于 2024 年 11 月创建，2025 年 12 月捐赠给 Linux 基金会的 Agentic AI Foundation。

截至 2026 年 3 月：

SDK 月下载量超9700 万次
活跃公共 MCP 服务器超1 万个
被 ChatGPT、Cursor、Claude Code、Windsurf、Codex CLI、VS Code 全部支持
配套 A2A 协议形成三层架构：MCP（工具层）→ A2A（Agent 层）→ WebMCP（Web 访问层）

10.2、AI IDE 最新格局

2026 年 3 月 AI IDE 排名：

Windsurf：Arena Mode + 5 路并行 Agent
Google Antigravity：免费 Agent 优先 IDE
Cursor 2.0：Composer 模型 4 倍加速、8 路并行
Claude Code：终端优先、SWE-bench 80.9%
OpenAI Codex：重返前五

一个惊人的数字：92% 的美国开发者每日使用 AI 编程工具，41–46% 的代码现在由 AI 生成。

10.3、OpenClaw 生态继续膨胀

OpenClaw 的 GitHub Star 突破21 万，成为 GitHub 史上增长最快的项目。支持 WhatsApp、Telegram、Slack 等全渠道，社区已构建 5700+ 技能。创始人 Peter Steinberger 已加入 OpenAI，项目正在向开源基金会过渡。

11、竞争格局一览

12、其他值得关注的动态

字节豆包内测 AI 购物功能（App 内直接浏览下单），2 月 MAU 3.15 亿（+87%），中国第一
阿里通义App 2 月 MAU 从 3100 万暴增至2.03 亿（+553%），阿里成立 ATH 事业群提升至一级 BU
MiniMax发布全球首份大模型公司财报：2025 年收入 7900 万美元（+159%），2 月 ARR 突破 1.5 亿
DeepSeek V4截至 3/23 仍未正式发布，多个预期窗口已过
行业交易：Meta 与 Nebius 签 270 亿美元 AI 基础设施协议、IBM 完成收购 Confluent、Accenture 收购 Faculty
AI 安全融资：Xbow 1.2 亿美元（估值超 10 亿）、Oasis Security 1.2 亿美元、AMI Labs 10.3 亿美元种子轮（欧洲史上最大）

13、总结：Agent 时代全面到来

回顾这一周，一个共同主线清晰而明确：AI 正在从"回答问题"全面转向"执行任务"。

每一家主要公司的核心发布都围绕 Agent 能力展开——NVIDIA 的 NemoClaw、OpenAI 的 Codex+Astral、Anthropic 的 Claude Code Channels、小米的 MiMo Agent 评测领先。行业基准也在从传统的 MMLU、HumanEval 转向 Agent 导向的 PinchBench、ClawEval。

中国 AI 力量本周展现了前所未有的影响力：小米万亿参数模型性价比碾压式入场，Kimi K2.5 成为硅谷顶级编程工具的底层，腾讯 3600 亿 AI 投入承诺。中美模型性能差距已从 7 个月缩短至约 3 个月，而在成本效率上中国模型已全面领先。

对开发者而言，现在面对的不再是"是否使用 AI"的选择，而是"如何在多模型、多 Agent、多协议的生态中构建最优工作流"。MCP+A2A 协议栈的标准化、AI IDE 的激烈竞争、Agent 框架的快速迭代——这些正在重塑软件开发的每一个环节。

这是新范式确立的关键时刻。

AI 一周大事件：万亿硬件订单、模型套壳与生态变局解读

1、前言

2、一周大事件时间线

3、NVIDIA GTC 2026：万亿美元的 AI 硬件帝国

3.1、Vera Rubin 平台发布

3.2、Groq 3 LPU：专用推理芯片首秀

3.3、软件生态：NemoClaw、Nemotron 联盟

4、OpenAI：GPT-5.4 轻量家族 + 收购 Astral

4.1、GPT-5.4 mini 和 nano

4.2、收购 Astral：拿下 Python 基础设施

4.3、IPO 准备与扩张

5、Anthropic：Claude Code Channels 与五角大楼之争

5.1、Claude Code Channels：把 AI 编程搬进聊天 App

5.2、vs 五角大楼：AI 伦理红线之争

6、小米 MiMo-V2：手机厂商的万亿参数"猎人"

6.1、匿名测试霸榜

6.2、核心参数

7、Cursor"套壳"Kimi K2.5：中国模型的硅谷征途

7.1、事件始末

7.2、反转与真相

7.3、更深的意义

8、腾讯 AI 重组：AI Lab 解散，27 岁首席科学家接棒

9、全球 AI 生态：Mistral、Midjourney、白宫立法

9.1、Mistral Small 4：60 亿活跃参数的 MoE 新标杆

9.2、Midjourney V8 Alpha

9.3、白宫 AI 立法框架

10、开发者生态变局：MCP 协议、AI IDE 竞争

10.1、MCP 成为事实标准

10.2、AI IDE 最新格局

10.3、OpenClaw 生态继续膨胀

11、竞争格局一览

12、其他值得关注的动态

13、总结：Agent 时代全面到来

更多推荐文章

相关免费在线工具

AI 一周大事件：万亿硬件订单、模型套壳与生态变局解读

1、前言

2、一周大事件时间线

3、NVIDIA GTC 2026：万亿美元的 AI 硬件帝国

3.1、Vera Rubin 平台发布

3.2、Groq 3 LPU：专用推理芯片首秀

3.3、软件生态：NemoClaw、Nemotron 联盟

4、OpenAI：GPT-5.4 轻量家族 + 收购 Astral

4.1、GPT-5.4 mini 和 nano

4.2、收购 Astral：拿下 Python 基础设施

4.3、IPO 准备与扩张

5、Anthropic：Claude Code Channels 与五角大楼之争

5.1、Claude Code Channels：把 AI 编程搬进聊天 App

5.2、vs 五角大楼：AI 伦理红线之争

6、小米 MiMo-V2：手机厂商的万亿参数"猎人"

6.1、匿名测试霸榜

6.2、核心参数

7、Cursor"套壳"Kimi K2.5：中国模型的硅谷征途

7.1、事件始末

7.2、反转与真相

7.3、更深的意义

8、腾讯 AI 重组：AI Lab 解散，27 岁首席科学家接棒

9、全球 AI 生态：Mistral、Midjourney、白宫立法

9.1、Mistral Small 4：60 亿活跃参数的 MoE 新标杆

9.2、Midjourney V8 Alpha

9.3、白宫 AI 立法框架

10、开发者生态变局：MCP 协议、AI IDE 竞争

10.1、MCP 成为事实标准

10.2、AI IDE 最新格局

10.3、OpenClaw 生态继续膨胀

11、竞争格局一览

12、其他值得关注的动态

13、总结：Agent 时代全面到来

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具