一、引言:AI 领域迎来双重里程碑
2026 年 3 月的最后一周,人工智能领域再次迎来密集的技术爆破。就在 3 月 29 日深夜,OpenAI 突袭式发布全新推理模型 o3 和 o4-mini,专门针对 ARC-AGI 这类反刷榜测试进行优化,在 ARC-AGI-3 测试中得分从 GPT-5.4 的 0.26% 直接飙升至 2.8%,实现 10 倍突破。几乎同一时间,全球权威大模型盲测平台 LMArena 发布最新榜单,阿里巴巴通义千问 Qwen3.5-Max-Preview 以 1464 分的综合成绩强势登顶国产大模型榜首,首次在匿名盲测中超越 OpenAI GPT-5.4、Anthropic Claude 4.5 等海外顶流旗舰模型。

