ai scientist:MOSS孙天祥新公司要让AI自己写100篇论文,还要全网直播一个月

 

硅星人Pro·2026年02月12日 17:48

一场持续一个月的直播,让AI研究AI自己。

一场持续一个月的直播,让AI研究AI自己。

明天上午11点,一场持续约一个月的直播即将上线。

屏幕里将没有主播,只有一个名为FARS的AI系统在工作。它将从零开始,自主完成科研全流程:调研文献、提出假设、设计实验、编写和执行代码、分析数据、撰写论文,目标是连续产出100篇完整的研究论文。全程自动,没有人类介入。

做这件事的公司叫Analemma(日行迹智能),成立不到一年,已获得红杉中国、高榕创投、光源资本、嘉程资本、美团龙珠等机构数千万美元的天使轮融资。创始人孙天祥是三年前引爆国内大模型热潮的MOSS的核心开发者。

据硅星人了解,以公开直播的方式部署全自动科研系统,此前在全球范围内尚无先例。

四个智能体,一座科研工厂

FARS,全称Fully Automated Research System,全自动研究系统。

FARS技术架构图

技术架构上,FARS是一个多智能体系统,由四个模块构成:Ideation(构思)负责文献调研和假设生成,Planning(规划)负责实验方案设计,Experiment(实验)负责代码编写和执行,Writing(写作)负责论文撰写。四个智能体在一个共享文件系统中协作,这个文件系统同时承担工作空间和持久记忆的角色。

模型层面,FARS调用了Claude、GPT、Gemini等多家闭源模型的API,部分链路使用后训练的自研模型。换言之,FARS的核心能力在Agent系统工程层面:如何编排多个智能体协同完成一个跨越数天的长链条任务,如何让系统在没有人类干预的情况下持续可靠地运转。硬件上,团队将一个包含160张NVIDIA GPU的集群封装成工具,供实验智能体调度和调用。

Fars

设计理念上,FARS和传统学术论文的逻辑有明显区别。按照团队的说法,FARS的设计基于研究系统的第一性原理:高效、可靠地拓展知识边界。它的产出以“短论文”形式呈现,每篇聚焦一个边界清晰的研究贡献,鼓励报告失败结果,不要求遵循传统学术论文的篇幅和结构限制。

FARS团队认为,此前的AI科研系统“仍然在按照现代学术出版的惯例来生产论文”,而FARS选择跳出这个框架,回到科研的基本单元:一个清晰的假设,加上对它的可靠验证。无论验证结果是正向还是负向,都构成有意义的知识。

本次直播中,FARS将从9个预设研究方向出发,涵盖当前AI研究的多个热点:强化学习从可验证奖励中学习(RLVR)、小语言模型后训练、前沿LLM自动化评估、超越Transformer的模型架构、持续学习、扩散语言模型、AI Agent记忆机制、测试时计算缩放(Test-Time Scaling)、世界模型。系统也被允许自由探索预设方向之外的课题。

FARS目前聚焦的研究领域是AI本身。孙天祥在Google Scholar上标注的研究关键词中有一个"AI4AI",即用AI来研究AI。选择这个领域有务实考量:AI领域的实验可以完全在计算机上完成,不需要物理实验室,天然适合自动化。当然,局限也很明显:FARS暂时无法进行极度消耗算力的实验(如大规模预训练),也无法完成需要人类直接参与的实验(如人工标注或专家评估)。

关于产出质量的把控,团队设置了一道门槛:FARS生产的每篇论文在上传arXiv之前,将经过至少3位具有五年以上研究经验的团队成员审核,论文首页也会被明确标注为AI生成。据了解,团队不打算将这些论文投稿到传统学术会议,而是会邀请同行评审,更关注论文的实际引用和结果价值。

那为什么要做成公开直播,而且目标定在100篇?

团队给出的解释是:规模是评估自动化研究系统的关键。几篇看上去不错的论文说明不了什么,但100篇的连续产出,会让系统的真实能力充分暴露。他们也坦言,此前从未大规模部署过FARS,对它的实际工作过程和产出结果“感到同样的未知和好奇”。

在FARS之前,Analemma已经上线了一个名为Lemma的产品(lemma.analemma.ai),提供快速文献调研、深度调研报告和代码实验三项功能。孙天祥告诉硅星人,Lemma是辅助驾驶,定位是生产力工具;FARS是自动驾驶,定位是基础设施。

从MOSS走出来的创业者

孙天祥,2019年从西安电子科技大学毕业后直博进入复旦大学,师从邱锡鹏和黄萱菁两位教授,2024年获得计算机科学博士学位。读博期间,他以第一作者在ICML、ACL、NAACL、AAAI等AI顶会发表论文十余篇,Google Scholar引用超4200次,曾获字节跳动奖学金(全国13人)、WAIC云帆奖明日之星(全球15人)、复旦学术之星(全校STEM研究生仅10人)等荣誉。

但让他被更多人知道的,是MOSS。

2023年2月20日,复旦大学自然语言处理实验室发布了MOSS,国内首个面向公众的类ChatGPT对话式大语言模型。消息当天冲上知乎热榜第一、微博多个热搜,服务器瞬间被挤爆。在各大公司还在宣布“即将推出”自家大模型的时候,一个8人学生团队抢先交出了答卷。两个月后,MOSS全面开源代码、数据和模型参数,成为国内首个开源的对话式大语言模型。

孙天祥是MOSS的主开发者。他的导师邱锡鹏后来在接受采访时说过一句话:“一个学术研究的实验室无法做出和ChatGPT能力相近的模型。”MOSS的意义也确实不在于追平ChatGPT,而在于用极度有限的资源验证了这条技术路线的可行性,为后来国内大模型的快速跟进提供了开源基础。

MOSS走红时,孙天祥还在读博。据了解,当时国内几位知名的大模型创业者都曾邀请他加入,但彼时博士还没毕业。2024年毕业后,VC也接踵而至。他最终选择了自己创业:2025年3月创办Analemma(日行迹智能),同期加入上海创智学院担任助理教授,走了一条学术和创业并行的路。

据了解,Analemma目前团队约15人,其中一半是研究团队,核心成员来自复旦MOSS团队和InternLM(书生大模型)项目。公司名取自天文学术语“日行迹”,指太阳在一年中于天空划出的8字形轨迹。Slogan是“在一个问题无限的世界里,我们需要构建无限心智”。从名字到定位,都指向一个研究驱动的长期目标。

一条正在升温的赛道

FARS并非第一个试图让AI自主做科研的系统。过去一年半,这个方向出现了密集进展。

2024年8月,日本AI公司Sakana AI发布了AI Scientist,被称为首个端到端全自动科研系统。它可以从idea到论文全程自动完成,每篇成本约15美元,代码完全开源。但后续的第三方评估相当不客气:有研究者指出AI Scientist生成的论文中位引用仅5篇,存在幻觉数字、占位符文本、重复章节等问题,整体质量被描述为"相当于一个赶deadline的、没什么动力的本科生"。

2025年4月,Sakana AI发布了升级版AI Scientist v2,引入基于树搜索的实验策略。这一版出现了标志性突破:一篇AI生成的论文成功通过了ICLR 2025 Workshop的同行评审,这也是AI生成的科研论文首次被学术会议接收。不过这只是Workshop级别,距离主会议论文还有距离。

同期,香港大学Chao Huang团队发布了AI-Researcher,获得NeurIPS 2025 Spotlight论文,覆盖计算机视觉、NLP、数据挖掘等多个领域,并已推出产品化版本Novix。

在大公司一侧,OpenAI在2025年10月公布了路线图:计划在2026年9月前开发出"AI研究实习生",能有意义地加速研究者的工作;到2028年3月,目标是完全自主的AI研究员,可独立完成端到端研究。首席科学家Jakub Pachocki的表态很有分量:为了重大科学突破,值得把整个数据中心的算力投入到单一问题上。

FARS在这个赛道里处于什么位置?

技术路线上,它和AI Scientist、AI-Researcher属于同一类端到端全自动科研系统,FARS也明确提到了上述所有竞品并逐一做了对标。但FARS也有自己的差异点:它跳出了学术出版的惯例,回到研究本身的逻辑,以可验证的假设为单位来组织产出。

更关键的差异在展示方式。之前的系统公开了代码和样例论文,发布了benchmark,但没有人做过实时、大规模、全透明的公开部署。这是一个大胆的选择。团队也直言,他们无法独立评估自己系统的产出,需要更广泛的学术社区参与评价。

起步领域的选择同样值得关注。AI4AI和此前Sakana AI Scientist选择机器学习子领域的逻辑类似,AI研究的实验门槛最低,只需要代码和算力,迭代最快,也最容易被同行评估。但这也意味着,距离“AI做生物学研究、物理学研究”的愿景还有相当距离。团队也承认,AI4AI是当前阶段的选择,而非方法论本身的限制。

明天上午11点,FARS的直播将在analemma.ai/fars上线,同时在多个社媒平台同步播出。在接下来约一个月里,这个系统将在公众面前从零开始做科研,所有产出通过其GitHub账号(github.com/fars-analemma)实时公开。

三年前,孙天祥和8个同学做出了MOSS,在资源极度有限的条件下抢先交了一份答卷。现在他想验证的命题更大:AI能不能自己做科研。这个问题的答案,最终取决于那100篇论文的质量。论文会公开,所有人都可以去读、去评。

FARS只聚焦在AI领域,离"AI做所有学科的科研"还很远。但这个方向本身正在快速升温。智源研究院在其2026年趋势预测中指出,AI for Science正在从Copilot角色向AI Scientist角色迁移,开始具备自主执行"假设提出、实验设计、数据分析、结论推断"完整科研链路的能力。OpenAI把"全自主AI研究员"写进了2028年的路线图。DeepMind去年底宣布将在英国建设首个AI自动化研究实验室。

在这场围绕自动化科研的全球竞赛中,FARS可能是来自中国的第一个公开实验。它的结果值得关注。

Read more

直击复杂 SQL 瓶颈:基于代价的连接条件下推技术落地

直击复杂 SQL 瓶颈:基于代价的连接条件下推技术落地

一、引言 在数据库理论的学习过程中,我们常常接触到简洁优美的SQL示例——单表查询、简单连接、基础过滤,这些案例清晰地展示了关系代数的基本原理。然而,当我们步入真实的业务系统,面对的SQL语句往往如同缠绕的线团:公用表表达式(CTE)层层嵌套,子查询彼此交织,窗口函数与聚集计算随处可见。 这种复杂性并非开发人员的炫技,而是业务逻辑的自然映射。遗憾的是,这种为提升可读性而组织的SQL结构,却给查询优化器带来了严峻考验。在众多性能瓶颈中,有一个问题尤为突出:高选择性的连接条件无法穿透复杂的子查询结构,导致数据过滤发生在错误的时间点。本文将深入探讨这一问题的本质,并介绍一种基于代价模型的连接条件下推解决方案,展示如何让优化器既懂“安全”,又知“成本”。 二、性能困境:过滤迟到的代价 2.1 真实场景的切面分析 在大量客户业务系统中,一种常见的SQL编写模式反复出现:开发人员习惯先在子查询或CTE中完成复杂的预处理逻辑——去重、排序、窗口计算,然后再将这些预处理结果与其它表进行连接,最后施加过滤条件。从业务语义角度看,这种写法清晰自然;但从执行效率角度看,却暗藏危机。 考虑

By Ne0inhk
PHP常见中高面试题汇总

PHP常见中高面试题汇总

一、 PHP部分 1、PHP如何实现静态化 PHP的静态化分为:纯静态和伪静态。其中纯静态又分为:局部纯静态和全部纯静态。 PHP伪静态:利用Apache mod_rewrite实现URL重写的方法; PHP纯静态,就是生成HTML文件的方式,我们须要开启PHP自带的缓存机制,即ob_start来开启缓存。 2、PHP经典四大排序算法 PHP的四种基本排序算法为:冒泡排序、插入排序、选择排序和快速排序。 冒泡排序:对数组进行多轮冒泡,每一轮对数组中的元素两两比较,调整位置,冒出一个最大的数来。 插入排序:假设组前面的元素是排好序的,遍历数组后面的元素,在已排好序的元素队列中找到合适的位置,插入其中。 选择排序:进行多次选择,每次选出最大元素放入指定位置。 快速排序:递归算法。先选择数组的第一个元素作为标准,然后把小于或等于它和大于它的数分别放入两个数组中,对这两个数组也进行相同的处理,最后合并这两个数组和第一个元素。 3、PHP常见运行模式 1)CGI(通用网关接口/ Common Gateway Interface)

By Ne0inhk
Flutter 第三方库 spa 的鸿蒙适配实战 - 打造单页应用架构、动态渲染路由状态及鸿蒙大屏多窗体验优化方案

Flutter 第三方库 spa 的鸿蒙适配实战 - 打造单页应用架构、动态渲染路由状态及鸿蒙大屏多窗体验优化方案

欢迎加入开源鸿蒙跨平台社区:https://openharmonycrossplatform.ZEEKLOG.net Flutter 第三方库 spa 的鸿蒙适配实战 - 打造单页应用架构、动态渲染路由状态及鸿蒙大屏多窗体验优化方案 前言 随着移动端交互的日益复杂,用户对 App 的流畅度要求已不仅仅停留在“帧率”上,更多的是关于页面切换的“无缝感”。单页应用(Single Page Application, SPA)模式,通过在一个长生命周期的视图内动态替换内容节点,有效地避免了频繁的页面推栈(Push/Pop)带来的布局重绘开销。 spa 库是 Flutter 生态中一个非常独特且高效的路由增强工具。它将路由状态抽象为一套可观察的树状结构,让开发者能像管理 Web 应用一样管理 Flutter 的页面状态。 在鸿蒙系统(OpenHarmony)适配实战中,面对折叠屏的灵活切换和平板的多窗协同,spa 提供了一种天然的“响应式分发”基座。

By Ne0inhk
基于Rust实现爬取 GitHub Trending 热门仓库

基于Rust实现爬取 GitHub Trending 热门仓库

基于Rust实现爬取 GitHub Trending 热门仓库 这个实战项目将使用 Rust 实现一个爬虫,目标是爬取 GitHub Trending 页面的热门 Rust 仓库信息(仓库名、描述、星标数、作者等),并将结果输出为 JSON 文件。本次更新基于优化后的代码,重点提升了错误处理容错性和 CSS 选择器稳定性。 技术栈 * HTTP 请求:reqwest( Rust 最流行的 HTTP 客户端,支持异步) * HTML 解析:scraper(基于 selectors 库,支持 CSS 选择器,轻量高效) * JSON 序列化:serde + serde_json( Rust 标准的序列化

By Ne0inhk