1、前言
2026 年 3 月第三周(3/17–3/23),可能是今年 AI 行业信息密度最高的一周。
NVIDIA GTC 大会抛出万亿美元级硬件路线图;OpenAI 收购 Python 核心工具链;Anthropic 把 Claude Code 接入 Telegram 和 Discord;小米一个"匿名模型"搞得全球开发者以为是 DeepSeek V4;Cursor 被曝底层跑的是 Kimi K2.5——十余条重磅新闻接连引爆。
一个清晰的信号浮出水面:AI 正在从"聊天工具"全面切换到"自主 Agent"。
本文是我对这一周所有重要事件的梳理与解读,既有新闻事实,也有我的个人分析。不废话,直接开始。
2、一周大事件时间线
先上一张总览图,方便大家快速定位本周发生了什么:
信息量很大,下面逐个展开。
3、NVIDIA GTC 2026:万亿美元的 AI 硬件帝国
3.1、Vera Rubin 平台发布
3 月 16 日,GTC 2026 在圣何塞开幕,Jensen Huang 的主题演讲再次刷新了行业对 AI 基础设施规模的认知。
Vera Rubin 是 Blackwell 之后的下一代 AI 计算平台,核心是NVL72 机架——一个 5 机架、7 芯片的集成系统,内含 72 颗 Rubin GPU、36 颗 Vera CPU(ARM 架构)和超过 130 万个组件,通过 NVLink 6 高速互联。完整的 Vera Rubin POD 由 40 个这样的机架组成,共 1152 颗 GPU,总算力达 60 exaFLOPS。
关键性能指标:
- 训练性能较 Blackwell 提升4 倍
- 每瓦推理性能提升10 倍
- 预计 2026 年下半年通过 Azure 和 Google Cloud 交付
Jensen Huang 同时把 Blackwell + Vera Rubin 的合计采购订单预期从 5000 亿美元翻倍至1 万亿美元。
3.2、Groq 3 LPU:专用推理芯片首秀
另一个重头戏是Groq 3 LPU——NVIDIA 在 2025 年圣诞夜以 200 亿美元收购 Groq 后的首款芯片。这是一颗基于 SRAM 的推理加速器:
- 每颗芯片 512MB 片上 SRAM
- 内存带宽 150 TB/s
- 三星 4nm 工艺
- LPX 机架可容纳 256 颗 LPU
核心卖点:与 NVL72 配合使用时,每兆瓦推理吞吐量提升 35 倍。这是 NVIDIA 首次在其平台中加入专用推理硬件,信号很明确——推理(inference)已经和训练(training)一样重要了。
3.3、软件生态:NemoClaw、Nemotron 联盟
硬件之外,NVIDIA 的软件生态布局同样值得关注:
NemoClaw:面向企业的 OpenClaw 安全部署栈。Jensen Huang 在演讲中称 OpenClaw 为"个人 AI 的操作系统",NemoClaw 就是让企业能安全地大规模部署它。
Nemotron Coalition:由 Mistral AI、Perplexity、Cursor、LangChain、Black Forest Labs 等参与的开放模型联盟,将在 DGX Cloud 上共同开发开源前沿模型。
Nemotron 3 Super:1200 亿参数、120 亿活跃的混合 Mamba-Transformer MoE 模型,在 SWE-Bench Verified 上拿到 60.47%——开源模型第一。
我的看法:NVIDIA 的战略已经从"卖 GPU"进化为"卖 AI 全栈平台"。Groq 3 LPU 的加入意味着它不再只做训练硬件——Agent 时代推理需求爆炸,NVIDIA 在补这块拼图。Nemotron Coalition 更是直接把生态伙伴绑在了 DGX Cloud 上,软硬件闭环越来越紧。
4、OpenAI:GPT-5.4 轻量家族 + 收购 Astral
4.1、GPT-5.4 mini 和 nano
3 月 17 日,OpenAI 发布了 GPT-5.4 系列的两款轻量模型:
GPT-5.4 mini:面向免费和 Go 用户通过"Thinking"模式提供,在 SWE-Bench Pro 等基准上接近完整版 GPT-5.4 的 95% 水平,速度快 2 倍以上。
GPT-5.4 nano:最小最便宜,API 定价$0.20/百万输入 token、$1.25/百万输出 token,面向高吞吐场景。
同时,ChatGPT 的模型选择器被简化为三层:Instant(快速日常)、Thinking(推理优先)、Pro(最强能力),支持自动路由。
4.2、收购 Astral:拿下 Python 基础设施
3 月 19 日的收购 Astral 才是本周 OpenAI 最值得关注的动作。
Astral 开发了 Python 社区最受欢迎的三个工具:包管理器uv、代码检查器Ruff、类型检查器Ty。这三个工具基本上是 2025–2026 年 Python 开发者的标配。Astral 团队将加入 OpenAI 的Codex 团队。
背景数据:Codex 现在的周活跃用户超过 200 万,自 2026 年 1 月以来用户增长 3 倍、使用量增长 5 倍。
OpenAI 承诺继续维护这些开源工具,但社区反应很复杂——知名开发者 Simon Willison 发表长文分析了担忧点,核心是:当一家 AI 公司控制了编程语言的核心工具链,开源社区的独立性怎么保证?
4.3、IPO 准备与扩张
OpenAI 本周还被曝出多条扩张消息:
- 最新估值8400 亿美元(1100 亿融资:亚马逊 500 亿、软银 300 亿、NVIDIA 300 亿)
- ChatGPT 周活跃用户超9 亿,付费订阅5000 万
- 计划年底前员工从 4500 人扩至8000 人
- 2026 年 Q4 启动 IPO
我的看法:收购 Astral 是 OpenAI 从"AI 模型公司"向"AI 开发者平台"转型的关键一步。控制了 uv/ruff 这样的基础工具意味着 OpenAI 可以深度整合到开发者日常工作流中——这比任何 API 定价战都更有战略价值。不过社区担忧是合理的,Python 生态的中立性确实值得关注。
5、Anthropic:Claude Code Channels 与五角大楼之争
5.1、Claude Code Channels:把 AI 编程搬进聊天 App
3 月 20 日,Anthropic 发布了Claude Code Channels——这可能是本周最具想象力的产品发布。
它的核心思路很简单:把 Claude Code 连接到 Discord 和 Telegram。用户可以在手机上通过聊天 App 直接给 Claude Code 发编程指令,实现异步自主编程。不需要打开 IDE,不需要坐在电脑前——你在地铁上给它发条消息,到公司的时候代码已经写好了。
技术上,它基于 MCP(Model Context Protocol)协议构建,通过--channels标志启动后,Claude Code 作为轮询服务运行在持久化服务器上。VentureBeat 直接称其为"OpenClaw 杀手"。
此外,Claude Code 在 3 月还更新了:
- 按键说话语音模式(
/voice,支持 15+ 语言) /loop循环监控命令- 100 万 token 上下文窗口全面开放
- 新的 MCP 引导交互功能
5.2、vs 五角大楼:AI 伦理红线之争
另一条线是 Anthropic 与美国国防部的法律对峙。
五角大楼把 Anthropic 列为"供应链风险"——原因是公司拒绝让 Claude 被不受限制地用于自主武器和大规模监控。3 月 18 日国防部提交反驳文件,3 月 20 日 Anthropic 回击,声称政府的论据基于"技术误解"。
有意思的是,微软、Google 和 OpenAI 的员工(包括 Google 首席科学家 Jeff Dean)都提交了支持 Anthropic 的法庭简报。CNN 报道这场争端反而提升了 Anthropic 的品牌认知度——员工留存率 80%、offer 接受率 88%。
听证会定于 3 月 24 日(也就是明天)在旧金山举行。
我的看法:Claude Code Channels 的意义在于——它验证了"AI 编程不一定要发生在 IDE 里"这个假设。对于我们做 NewClaw 这种 AI 伴侣产品的人来说,这条路已经被 Anthropic 官方跑通了。五角大楼事件则可能成为 AI 行业安全伦理的标志性案例。
6、小米 MiMo-V2:手机厂商的万亿参数"猎人"
6.1、匿名测试霸榜
本周中国 AI 最炸裂的新闻是小米。
3 月 11 日,一个叫"Hunter Alpha"的匿名模型出现在 OpenRouter 平台,一周内消耗超过 1 万亿 token,多日霸榜第一。全球开发者都在猜——这是 DeepSeek V4 吧?
3 月 18–19 日,路透社确认:不是 DeepSeek V4,而是小米 MiMo-V2-Pro。
6.2、核心参数
MiMo-V2-Pro 的参数相当亮眼:
- 总参数1 万亿,每次推理激活420 亿
- MoE 架构 + Hybrid Attention(7:1 比率)+ 多 Token 预测
- 100 万 token 上下文窗口
- 全球排名第 8,中国排名第 2(仅次于智谱 GLM-5)
- 编程/Agent 能力接近 Claude Opus 4.6,整体超过 Claude Sonnet 4.6
- 定价$1/百万输入、$3/百万输出——Claude Opus 4.6 的五分之一
同期还发布了 MiMo-V2-Omni(全模态 Agent 模型)和 MiMo-V2-TTS(支持粤语、四川话等方言的语音合成)。
该项目由前 DeepSeek 核心研究员罗福莉领衔。雷军宣布小米 2026 年 AI 研发 + 资本开支将超过1600 亿元人民币。
我的看法:小米这波操作很聪明——匿名测试先让市场验证产品力,再揭面收获最大关注度。"被误认为 DeepSeek V4"本身就是最好的背书。更深层的信号是:中国 AI 竞争已经不只是互联网公司的游戏了,硬件厂商正在凭借资金和工程能力强势入场。
7、Cursor"套壳"Kimi K2.5:中国模型的硅谷征途
7.1、事件始末
这是本周最具戏剧性的故事。
3 月 20 日,估值 293 亿美元的 AI 编程工具 Cursor 发布"Composer 2",宣称自研模型。数小时内,开发者@fynnso 发现模型 ID 写着kimi-k2p5-rl-0317-s515-fast——直指月之暗面的 Kimi K2.5。
Elon Musk 亲自评论确认了这一点。月之暗面预训练负责人杜玉伦公开指控 Cursor 违反许可协议(帖子后来删除)。
7.2、反转与真相
事情很快反转:
- Kimi 官方发布祝贺声明,确认 Cursor 通过Fireworks AI 的授权商业协议获取 K2.5
- Cursor 承认 K2.5 是基础(约占 25% 算力),75% 来自自行的继续预训练 + 强化学习
- Composer 2 在内部评测中得分61.3,超过 Claude Opus 4.6 的 58.2
7.3、更深的意义
Kimi K2.5 于 1 月 27 日发布,20 天内收入即超过 2025 全年。Stripe 数据显示订阅量环比增长8280%。目前月之暗面正以 1800 亿美元估值进行 100 亿美元新融资,阿里和腾讯均参与。
Kimi 团队还在本周发表了"Attention Residuals"论文——提出替代 Transformer 残差连接的方案,训练效率提升约 25%。论文联合作者中包括一名17 岁的深圳高中生。Andrej Karpathy 和前 OpenAI VP Jerry Tworek 均给予高度评价。
我的看法:中国开源模型正在成为硅谷产品的底层基础设施。 这句话放在一年前说出来,大多数人会觉得不可思议。Kimi K2.5 驱动着全球最火的 AI 编程工具——这个事实比任何 benchmark 都有说服力。同时这也提醒我们:模型供应链的透明度正在成为新的行业议题。
8、腾讯 AI 重组:AI Lab 解散,27 岁首席科学家接棒
3 月 20 日,腾讯正式解散运营 10 年的 AI Lab,全部人员并入混元(Hunyuan)团队。新团队由 27 岁的前 OpenAI 研究员姚顺雨领导,直接向总裁刘炽平汇报。
几个关键数字:
- 2025 年总收入7518 亿元(+14%)
- 2025 年混元 + 元宝 AI 投入约 1800 亿元
- 2026 年 AI 投入承诺翻倍至 3600 亿+
- 资本开支 792 亿元、研发费用 857.5 亿元均创新高
- 元宝 App 月活超1 亿
- 混元 3.0 确认 4 月发布
另外,DeepSeek 核心成员郭大亚据报已离开,加入字节跳动 Seed 团队。
我的看法:腾讯这次重组的力度很大。把独立的 AI Lab 并入产品线(混元),说明腾讯要的不是论文产出,而是 AI 产品化落地。27 岁的首席科学家也打破了传统——AI 行业的竞争已经快到不能靠论资排辈了。混元 3.0 四月发布,值得持续关注。
9、全球 AI 生态:Mistral、Midjourney、白宫立法
9.1、Mistral Small 4:60 亿活跃参数的 MoE 新标杆
Mistral AI 在 GTC 期间发布了Mistral Small 4:
- 128 个专家、每 token 激活 4 个的 MoE 架构
- 总参数 1190 亿,活跃参数仅60 亿
- 25.6 万 token 上下文窗口
- 首次统一了推理(Magistral)、多模态(Pixtral)和 Agent 编程(Devstral)三大能力
- 延迟降低 40%,每秒请求量提升 3 倍
- Apache 2.0开源
同时发布的Mistral Forge是一个企业定制平台,支持在私有数据上进行预训练、微调和强化学习。早期客户包括爱立信、ESA、ASML 等。
9.2、Midjourney V8 Alpha
Midjourney V8 Alpha 是 V5 以来最大的升级:
- 生成速度提升 5 倍
- 原生2K 分辨率输出
- 文字渲染准确度大幅提升
- 复杂构图的空间、光照、纹理遵循度显著增强
- 新增
--q 4质量模式 - 全新代码库和 GPU 基础设施
目前仅在 alpha.midjourney.com 可用。
9.3、白宫 AI 立法框架
3 月 20 日,白宫发布国家 AI 立法框架,七大支柱包括保护儿童、社区安全、知识产权、反审查、创新、劳动力、以及联邦法律取代各州 AI 法律。
核心立场:反对设定开放式 AI 责任,反对创建新的联邦 AI 监管机构,主张行业自律。已遭 50 多位共和党议员和 AI 监管组织反对。
同期,欧盟理事会同意将 AI 法案高风险系统规则推迟最多 16 个月执行。美国司法部指控三人涉嫌将 AI GPU 服务器非法转运至中国。
10、开发者生态变局:MCP 协议、AI IDE 竞争
10.1、MCP 成为事实标准
MCP(Model Context Protocol)由 Anthropic 于 2024 年 11 月创建,2025 年 12 月捐赠给 Linux 基金会的 Agentic AI Foundation。
截至 2026 年 3 月:
- SDK 月下载量超9700 万次
- 活跃公共 MCP 服务器超1 万个
- 被 ChatGPT、Cursor、Claude Code、Windsurf、Codex CLI、VS Code 全部支持
- 配套 A2A 协议形成三层架构:MCP(工具层)→ A2A(Agent 层)→ WebMCP(Web 访问层)
10.2、AI IDE 最新格局
2026 年 3 月 AI IDE 排名:
- Windsurf:Arena Mode + 5 路并行 Agent
- Google Antigravity:免费 Agent 优先 IDE
- Cursor 2.0:Composer 模型 4 倍加速、8 路并行
- Claude Code:终端优先、SWE-bench 80.9%
- OpenAI Codex:重返前五
一个惊人的数字:92% 的美国开发者每日使用 AI 编程工具,41–46% 的代码现在由 AI 生成。
10.3、OpenClaw 生态继续膨胀
OpenClaw 的 GitHub Star 突破21 万,成为 GitHub 史上增长最快的项目。支持 WhatsApp、Telegram、Slack 等全渠道,社区已构建 5700+ 技能。创始人 Peter Steinberger 已加入 OpenAI,项目正在向开源基金会过渡。
11、竞争格局一览
12、其他值得关注的动态
- 字节豆包内测 AI 购物功能(App 内直接浏览下单),2 月 MAU 3.15 亿(+87%),中国第一
- 阿里通义App 2 月 MAU 从 3100 万暴增至2.03 亿(+553%),阿里成立 ATH 事业群提升至一级 BU
- MiniMax发布全球首份大模型公司财报:2025 年收入 7900 万美元(+159%),2 月 ARR 突破 1.5 亿
- DeepSeek V4截至 3/23 仍未正式发布,多个预期窗口已过
- 行业交易:Meta 与 Nebius 签 270 亿美元 AI 基础设施协议、IBM 完成收购 Confluent、Accenture 收购 Faculty
- AI 安全融资:Xbow 1.2 亿美元(估值超 10 亿)、Oasis Security 1.2 亿美元、AMI Labs 10.3 亿美元种子轮(欧洲史上最大)
13、总结:Agent 时代全面到来
回顾这一周,一个共同主线清晰而明确:AI 正在从"回答问题"全面转向"执行任务"。
每一家主要公司的核心发布都围绕 Agent 能力展开——NVIDIA 的 NemoClaw、OpenAI 的 Codex+Astral、Anthropic 的 Claude Code Channels、小米的 MiMo Agent 评测领先。行业基准也在从传统的 MMLU、HumanEval 转向 Agent 导向的 PinchBench、ClawEval。
中国 AI 力量本周展现了前所未有的影响力:小米万亿参数模型性价比碾压式入场,Kimi K2.5 成为硅谷顶级编程工具的底层,腾讯 3600 亿 AI 投入承诺。中美模型性能差距已从 7 个月缩短至约 3 个月,而在成本效率上中国模型已全面领先。
对开发者而言,现在面对的不再是"是否使用 AI"的选择,而是"如何在多模型、多 Agent、多协议的生态中构建最优工作流"。MCP+A2A 协议栈的标准化、AI IDE 的激烈竞争、Agent 框架的快速迭代——这些正在重塑软件开发的每一个环节。
这是新范式确立的关键时刻。


