2 月 4 日,上海人工智能实验室开源基于'通专融合'技术架构 SAGE 打造的万亿参数科学多模态大模型 Intern-S1-Pro,为 AI4S 从'工具革命'的 1.0 阶段迈向以'革命的工具'驱动科学发现的 2.0 时代,提供创新的系统性开源基座。
作为当前全球开源社区中参数规模最大的科学多模态模型,Intern-S1-Pro 的核心科学能力实现了质的跃升,高难度综合学科评测稳居 AI4S 领域国际领先水平,复杂数理逻辑推理能力达奥赛金牌水平,面向真实科研流程的智能体能力位居开源模型第一梯队。
此次发布的 Intern-S1-Pro 是通过 SAGE 实现'可深度专业化通用模型'的关键实践。该模型基于混合专家架构(MoE),共拥有 512 个专家,总参数达 1T,每次调用仅激活 8 个专家、22B 参数。其通用能力和科学能力协同演进,并在底层架构实现了两大核心突破:在 SAGE 的基础模型层,通过引入傅里叶位置编码并重构时序编码器,赋予模型统一理解从微观生命信号到宏观宇宙波动的'物理直觉';通过高效路由机制,系统攻克了训练万亿参数 MoE 模型在稳定性与算力效率上的瓶颈,为超大规模模型的训练提供了关键的工程基础。
与此同时,Intern-S1-Pro 验证了从原创模型架构到国产算力基座自主技术的完整链路,为构建开放共享的 AGI4S 基础设施奠定了坚实底座。通过开源开放,Intern-S1-Pro 旨在降低全球科研门槛,与学术界和产业界共同推动以通用人工智能驱动科学发现的范式革命。
资源链接:
- GitHub: https://github.com/InternLM/Intern-S1
- HuggingFace: https://huggingface.co/internlm/Intern-S1-Pro

Intern-S1-Pro 在评测基准中的表现:通用能力表现出色,科学能力达国际领先水平。
创新底层架构:突破万亿参数科学模型边界
上海人工智能实验室主任、首席科学家周伯文提出:可深度专业化通用模型(Specializable Generalist)是实现 AGI 的可行路径,其关键挑战在于:专家化模型在训练过程中需要低成本、能规模化的密集反馈;能够持续不断地学习与主动探索,并具备为同一个问题提供多视角、多种解决方案的能力;并能引入对物理世界规律的考量,兼顾多项差异化能力的学习效率与性能。
Intern-S1-Pro 通过多项 SAGE 基础模型层的技术创新,拓宽了模型应用边界、提升了超大规模训练可行性,推进了可深度专业化通用模型的探索。
为构建能更深层次理解物理世界规律的科学大模型,研究团队引入了傅里叶位置编码(FoPE)并重构时序编码器。FoPE 为 AI 赋予双重视角:既能像看'粒子'一样捕捉文字之间的相对距离,又能像分析'波'一样把握科学信号的整体规律与频率。科学数据与语言的差异还体现在多尺度上,基于能自动适应数据密度的时序编码器,模型首次能统一处理从寥寥数个到百万级采样的各类信号,支持的分析对象从天文、地理直接拓展至生理信号、生物声学等领域,从而实现感知能力的重大跃迁。
为了高效训练承载这些能力的万亿参数超大规模模型,研究团队革新了其内部的'路由机制'。传统方法存在训练低效和算力浪费两大痛点。新技术通过'路由稠密估计',让模型在高效运行的同时能进行更充分的学习,提升了稳定性;进而通过'分组路由'策略,像智能交通系统一样使海量计算芯片实现负载均衡,避免了资源闲置。通过算法与系统的协同创新,同时攻克了超大规模模型训练在'学习效率'和'资源调度'上的核心瓶颈,为高效、稳健地训练下一代万亿参数模型提供了关键基础。
通过上述底层架构的创新,Intern-S1-Pro 不仅在规模上刷新了科学多模态模型的参数规模上限,也为 SAGE 架构所提出的'通用能力与专业能力协同演进'提供了可落地的实现路径。
科学能力再进化,通用能力协同演进
得益于创新的底层架构设计与万亿参数超大规模训练策略,Intern-S1-Pro 的科学能力进一步升级。
在国际数学奥林匹克 IMO-Answer-Bench 和国际物理奥林匹克 IPhO2025 两大权威基准测试中,Intern-S1-Pro 均展现出竞赛级别的解题能力。
在 AI4S 关键垂类领域,Intern-S1-Pro 成功构建了一个跨越化学、材料、生命、地球、物理五大核心学科的全谱系能力矩阵,涵盖 100 多个专业子任务,不仅在 Mol-Instruction、Biology-Instruction 等单学科垂类评测中表现优异,更在 SciReasoner 等高难度的综合学科评测基准中,取得了与闭源商业大模型及垂类 SOTA 模型相当,甚至更优的成绩,稳居 AI4S 领域的第一梯队。
在基础理解维度,Intern-S1-Pro 基于高精度多模态感知能力,能够精准解析复杂的分子结构图及各类实验图表,深入到逻辑推理层面,Intern-S1-Pro 能够处理高阶科学问答,如反应条件推断、理化性质预测,精准捕捉数据背后的因果规律等。随着理解与推理能力的持续增强,Intern-S1-Pro 的能力边界不断向真实科研场景延伸,其应用范围从微观层面的化学逆合成、蛋白质序列生成,拓展至宏观尺度的遥感图像分析等复杂任务。通过 XLRS-Bench 等真实科研场景评测,模型展现出从'解题'迈向'解决问题'的科研生产力价值,为前沿科学探索提供了坚实支撑。


