这篇文章最初是在 2022 年 12 月写的,当时我正在思考我工作的未来。我搁置了这篇文章,因为我不确定在受雇于 Google Brain 时发表这样的文章是否合适。
但是,他们在一月份解雇了我,这使我的决定变得更加容易。我拿到了我的赔偿金,上周,他们和 DeepMind 合并为一个新部门,取消了 Google Brain,取而代之的是'Google DeepMind'。作为一个拥有独特视角和自由来分享它的人,我希望我能阐明这个团队存在的问题。我将列出 Google Brain 存在的众多原因,并评估它们在当今经济条件下的持续有效性。
工业研究实验室
我想首先准确描述一下需要解释的悖论。
学术界的研究者一直面临着在学术界的研究自由与在工业界的高薪的两难选择。作为一个 ML 专家,Google 会付给你丰厚的报酬来做 ML 研究,这并不令人惊讶。换来的结果通常是,你不得不从事推荐系统、广告优化、搜索排名等工作,而不是纯粹的研究。
说白了,Google Brain 拥有许多研究人员和项目,其中许多是直接或间接盈利的。例如,许多研究人员专注于改进优化器、架构搜索和超参数搜索。这种研究是直接盈利的,因为它降低了计算成本,以达到一定的性能水平。
需要解释的是,Google Brain(与 DeepMind、OpenAI、FAIR 和其他公司一起)资助数百名 ML 研究人员从事纯研究,似乎只是为了研究而研究,同时能比在学术界拿到更多的报酬。例如,我的团队致力于嗅觉的机器学习。Google 在做什么,资助关于嗅觉的研究?有什么好处呢?这是我想回答的问题。
声望
大多数学者认为,Brain 团队正在争取声望:'Brain 正在与其他工业研究实验室竞争,以聘请最好的研究人员,这样他们就可以成为最负盛名的研究小组,这反过来又会帮助他们聘请最好的研究人员'。毕竟,这就是美国学术界的运作方式:资金、学生/博士后和首席研究员(PI)三位一体。原则上,资金流向最有才华的 PI 和学生/博士后;学生/博士后去最有才华的 PI 和有资金的地方;PI 会去他们能找到有才华的学生/博士后和资金的地方。
大学被直接激励去最大限度地提高声望,因为他们从所有研究经费中的抽成(大得惊人)。行业研究实验室没有相同的激励结构。与其说维持一个有声望的实验室可以获利,不如说是为了防止顶级研究人员叛逃而付出了更多代价。Uber 人工智能实验室似乎完全是为了声望(自我?)而存在的,在 Dara Khosrowshahi 接替 Uber 创始人 Travis Kalanick 后被正式取消。
声望带来两个主要影响:在消费者领域树立积极的品牌形象,以及在纯研究和应用 ML 中更容易招聘。例如,几年前我在求职期间甚至没有考虑过申请 Apple,因为他们没有 ML 的相关工作!或许 Apple 没有招聘 ML 专家的原因是他们不需要 ML 专家——这是一个符合 Apple 成长理念的明智决定。但如果你确实需要雇佣几千名 ML 工程师,那么资助少数顶级 ML 研究人员作为一种声望游戏是有意义的。我相信,我的团队之所以存在,在一定程度上是为了一种声望。
将以声望为导向的研究作为一种招聘策略,在今天仍然有意义,但考虑到该行业正在集体削减招聘预算,声望支出也必然会减少。
MBA 文化和'下金蛋的鹅'
Google 投资纯研究的另一个明显原因是,它已经取得并将继续取得突破性发现。
作为一个基本的'贡献表',Brain 团队为 Google 贡献了 TensorFlow、TPU、显著改进的 Google Translate、JAX 和 Transformer。这些当初只是作为纯研究的项目,在今天产生了巨额的利润。如果我把任何一个条件放宽,这个列表将会更长,比如用于医学成像的 ML 项目和 AutoML 等。
Brain 团队随心所欲、自下而上、以研究人员为中心的文化可以说是产生这些突破的原因。由 Jeff Dean 来负责研究,正是因为他代表了这些理念。
相反,如果由追求短期利润最大化和效率提升等目标而忽略长期投资和创新的 MBA 们来控制,MBA 文化就会慢慢渗透,破坏公司的创新能力和长期价值,摧毁那些'下金蛋的鹅'。因此,最好还是让研究人员自由发挥,等到他们获得成果后,再让管理人员介入进来。
随着时间的推移,两种趋势使 MBA 们获得更大的主动权。首先是经济上的原因:随着经济趋紧以及来自 OpenAI/VC 资助的 AI 初创公司的竞争加剧,Google 认为需要对其研究投资更加负责任和有方向性。另一个趋势是人们对 ML 能力的熟悉程度增加。在 ML 的早期,没有人知道它能做什么,研究人员有特许制定研究愿景。如今,思想领袖们随意地对 ML 如何以及在何处发挥作用发表意见,而 MBA 们觉得这是专家意见的可接受'替代品'。其结果是减少了研究人员的自由,出现了更多自上而下的领导。
说一个有趣的事,Google 研究人员的晋升标准一度与外界对研究重要性的认可有关。如果由高级研究人员组成的 Google 宣传委员会甚至无法确定自己的研究是否很重要,那 MBA 们还有什么机会呢?
在不久的将来,我预计研究人员的晋升标准将转向交付的商业价值,而不是外界对研究影响的认可度。
今天,我在 LLM 研究者身上也看到了类似的情况,除了他们自己之外,没有人能够真正权威地发表有关 LLMs 能力的看法。即便如此,现在每个 LLM 研究者也都会感受到来自 MBA 们的压力,这在过去并不是这样的。
51% 攻击
Google 资助开放式研究的另一个原因,是为了保持其在 ML 领域的领先地位。
十多年来,Google 在大规模系统编程方面一直处于行业领先地位。像 MapReduce、Spanner 和 Zanzibar 这样的系统,解决了业界才刚刚开始意识到的问题,可行的对应替代方案,Hadoop、CockroachDB、AuthZed,则花了 5-10 年的时间才出现。


