黄仁勋公开发文:传统软件开发模式终结,参与AI不必非得拥有计算机博士学位

黄仁勋公开发文:传统软件开发模式终结,参与AI不必非得拥有计算机博士学位

AI 究竟是什么?在 NVIDIA CEO 黄仁勋看来,它早已不只是聊天机器人或某个大模型,而是一种正在迅速成形的“新型基础设施”。

近日,黄仁勋在英伟达官网发布了一篇长文,提出一个颇具形象的比喻——AI 就像一块“五层蛋糕”。从最底层的能源,到芯片、基础设施、模型,再到最上层的应用,人工智能正在形成一整套完整的产业技术栈,并像电力和互联网一样,逐渐成为现代社会的底层能力。

这也是黄仁勋自 2016 年以来公开发表的第七篇长文。在这篇文章中,他从计算机发展史与第一性原理出发,试图解释 AI 技术栈为何会演化成如今的形态,以及为什么全球正在掀起一场规模空前的 AI 基础设施建设。

在他看来,过去几十年的软件大多是预先编写好的程序:人类设计好算法,计算机按指令执行,数据被结构化存储在数据库中,通过精确查询调用。而 AI 的出现打破了这一模式——计算机开始能够理解图像、文本和声音,并根据上下文实时生成答案、推理结果甚至新的内容。

正因为智能不再是预先写好的代码,而是实时生成的能力,支撑它运行的整个计算体系也必须被重新设计。从能源供应、芯片架构到数据中心建设,AI 正在推动一轮规模空前的基础设施建设。

不过,黄仁勋也提醒,这场变革仍处于早期阶段:大量基础设施尚未建成,大量人才尚未完成培训,大量机会也尚未被真正释放。

来源:https://blogs.nvidia.cn/blog/ai-5-layer-cake/

编译 | 苏宓

出品 | ZEEKLOG(ID:ZEEKLOGnews)

以下为黄仁勋分享全文:

AI 是当今塑造世界最强大的力量之一。它并非仅仅是一款巧妙的应用程序,也不是某个单一的模型,而是一种就像电力和互联网一样的基础设施。

AI 依赖真实的硬件、真实的能源以及真实的经济体系运行。它可以把原材料大规模地转化为智能。未来,每家公司都会使用 AI,每个国家/地区都会建设 AI。

要理解 AI 为什么会以这样的方式发展,最好的方法是从第一性原理出发,看看计算领域究竟发生了哪些根本性的变化。

从预先编写的软件,到实时生成的智能

在计算机发展的绝大多数历史中,软件都是预先写好的。人类先描述算法,然后由计算机执行。数据必须被精心组织与设计,存储在表格中,再通过精确的查询进行检索。

因此,SQL 成为不可或缺的工具,因为它让这种计算模式变得可行。

而 AI 打破了这一模式。

我们首次拥有了一台能够理解非结构化信息的计算机。它可以识别图像、阅读文本、理解声音,并理解其中的含义。它能够根据上下文和意图进行推理。更重要的是,它能够实时生成智能。

每一次回答都是全新的。每一次回应都取决于你提供的上下文。这不再是软件从数据库中取出预先存储的指令。而是软件在实时推理,并按需生成智能。

正因为智能是实时产生的,支撑它的整个计算技术栈也必须被重新设计。

AI 即基础设施

如果从工业视角看 AI,它可以被拆分为一个五层技术栈。

第一层:能源

最底层是能源。实时生成智能需要实时提供电力。每一个生成的 token,本质上都是电子在流动、热量被管理、能源被转化为计算能力的结果。

在这一层之下,没有任何抽象。能源是 AI 基础设施的第一性原理,也是决定系统能产生多少智能的硬性约束。

第二层:芯片

能源之上是芯片。芯片是专门设计的处理器,用于高效地把能源转化为计算能力,并且能够在极大规模下运行。AI 工作负载需要极高的并行度、高带宽内存以及高速互联。芯片层的进步,决定了 AI 扩展的速度,也决定了智能的成本能降低到什么程度。

第三层:基础设施

芯片之上是基础设施。这一层包括土地、电力输送、散热系统、建筑、网络,以及能够把数万颗处理器组织成一台机器的系统。这些系统本质上是AI 工厂。

它们的设计目标不是存储信息,而是制造智能。

第四层:模型

基础设施之上是模型。

AI 模型能够理解多种类型的信息:语言、生物、化学、物理、金融、医学,以及现实世界本身。语言模型只是其中的一类。目前最具变革性的进展,很多发生在以下领域,包括蛋白质 AI、化学 AI、物理仿真、机器人、自动驾驶系统。

第五层:应用

最顶层是应用,也是创造经济价值的地方。例如:药物研发平台、工业机器人、法律助手、自动驾驶汽车。一辆自动驾驶汽车,本质上是嵌入在机器中的 AI 应用。一台人形机器人,则是嵌入在身体中的 AI 应用。底层技术栈相同,但最终形态不同。

这就是 AI 的五层蛋糕结构:能源 → 芯片 → 基础设施 → 模型 → 应用。

每一个成功的应用,都会拉动下方的每一层需求,一直延伸到为整个系统提供电力的发电厂。

AI 的建设才刚刚开始。目前的投入规模只有几千亿美元,而未来仍需要建设数万亿美元的基础设施。

在全球范围内,我们正在看到,芯片工厂、计算机组装工厂和 AI 工厂以前所未有的规模建设。这正在成为人类历史上最大的基础设施建设之一。

支撑这场建设所需要的劳动力规模非常庞大。AI 工厂需要电工、管道工、管线安装工、钢结构工人、网络技术人员、安装人员和运维人员等。

这些都是技能型、高收入的工作岗位,而且目前供不应求。参与这场变革,并不需要计算机科学博士学位。

与此同时,AI 也在推动知识经济的生产力提升。以放射学为例。AI 现在已经可以帮助医生读取医学影像,但放射科医生的需求仍在持续增长。这并非矛盾现象。

放射科医生的使命是照顾患者,而解读扫描影像只是其中的一项任务。

当 AI 承担更多重复性工作时,医生可以把时间用于判断、沟通和患者护理。医院的效率因此提升,能够服务更多患者,也需要雇佣更多人员。

生产力提升会带来更多能力,而能力会带来增长。

过去一年发生了什么变化

在过去一年里,AI 跨越了一个重要门槛——模型性能显著提升,可以在大规模场景中真正发挥作用。推理能力提高了,幻觉显著减少,落地应用能力大幅提升。基于 AI 构建的应用首次开始创造真实的经济价值。

药物研发、物流、客户服务、软件开发和制造业领域的应用已经展现出强大的产品市场契合度。这些应用正在强烈拉动底层技术栈的需求。

开源模型在这一过程中发挥着关键作用。全球绝大多数模型都是免费开放的。研究人员、初创公司、企业,甚至整个国家,都依赖开源模型参与先进 AI 的发展。

当开源模型达到前沿水平时,它们带来的变化不仅发生在软件领域,还会激活整个技术栈的需求。

DeepSeek-R1 就是一个很好例子。当一个强大的推理模型被广泛开放时,它会加速应用层的采用,并带动了底层对训练、基础设施、芯片和能源的需求增长。

这意味着什么

如果把 AI 看作一种基础设施,其影响就会变得非常清晰。

AI 始于 Transformer 架构的 LLM,但其意义远不止于此。这是一场工业级的变革,正在重塑能源生产与消费方式、工厂的建造模式、工作的组织形式以及经济的增长路径。

如今,AI 工厂正在兴建,是因为智能现在是实时生成的。芯片之所以被重新设计,是因为效率决定了智能扩展的速度。能源变得至关重要,因为它决定了智能产出的上限。而应用层正在加速发展,是因为底层模型已经跨越了真正可用的门槛。

每一层都会强化其他层的发展。

这就是为什么 AI 基础设施的建设规模如此庞大,这也是为什么它会同时影响如此多的行业。AI 不会局限于某个国家或某个行业。每家公司都会使用 AI。每个国家都会建设 AI。

我们仍然处于早期阶段。大量基础设施尚未建设、大量人才尚未培训、大量机会尚未被实现。

但方向已经非常清晰。

人工智能正在成为现代世界的基础性基础设施。而我们现在做出的选择、构建速度、参与广度以及如何负责任地部署 AI,都将决定这个时代最终会变成什么样子。

推荐阅读:

一天开13个会、一个Bug要修200天!前亚马逊L7爆料:这轮大裁员,AI只是“背锅侠”

为省5-10美元差点毁库!Claude一条指令删光200万条数据、网站停摆24小时,创始人坦言:全是我的错

全球26w+用户在线「养虾」:OpenClaw这一波泼天流量,到底让谁接住了?

未来没有前后端,只有 AI Agent 工程师。

这场十倍速的变革已至,你的下一步在哪?

4 月 17-18 日,由 ZEEKLOG 与奇点智能研究院联合主办「2026 奇点智能技术大会」将在上海隆重召开,大会聚焦 Agent 系统、世界模型、AI 原生研发等 12 大前沿专题,为你绘制通往未来的认知地图。

成为时代的见证者,更要成为时代的先行者。

奇点智能技术大会上海站,我们不见不散!

Read more

深挖 DeepSeek 隐藏玩法·智能炼金术2.0版本

深挖 DeepSeek 隐藏玩法·智能炼金术2.0版本

前引:屏幕前的你还在AI智能搜索框这样搜索吗?“这道题怎么写”“苹果为什么红”“怎么不被发现翘课” ,。看到此篇文章的小伙伴们!请准备好你的思维魔杖,开启【霍格沃茨模式】,看我如何更新秘密的【知识炼金术】,我们一起来解锁更加刺激的剧情!友情提醒:《《《前方高能》》》 目录 在哪使用DeepSeek 如何对提需求  隐藏玩法总结 几个高阶提示词 职场打工人 自媒体创作 电商实战 程序员开挂 非适用场地 “服务器繁忙”如何解决 (1)硅基流动平台 (2)Chatbox + API集成方案 (3)各大云平台 搭建个人知识库 前置准备 下载安装AnythingLLM 选择DeepSeek作为AI提供商 创作工作区 导入文档 编辑  编辑 小编寄语 ——————————————————————————————————————————— 在哪使用DeepSeek 我们解锁剧情前,肯定要知道在哪用DeepSeek!咯,为了照顾一些萌新朋友,它的下载方式我放在下面了,拿走不谢!  (1)

By Ne0inhk
【AI大模型】DeepSeek + 通义万相高效制作AI视频实战详解

【AI大模型】DeepSeek + 通义万相高效制作AI视频实战详解

目录 一、前言 二、AI视频概述 2.1 什么是AI视频 2.2 AI视频核心特点 2.3 AI视频应用场景 三、通义万相介绍 3.1 通义万相概述 3.1.1 什么是通义万相 3.2 通义万相核心特点 3.3 通义万相技术特点 3.4 通义万相应用场景 四、DeepSeek + 通义万相制作AI视频流程 4.1 DeepSeek + 通义万相制作视频优势 4.1.1 DeepSeek 优势 4.1.2 通义万相视频生成优势 4.2

By Ne0inhk
【DeepSeek微调实践】DeepSeek-R1大模型基于MS-Swift框架部署/推理/微调实践大全

【DeepSeek微调实践】DeepSeek-R1大模型基于MS-Swift框架部署/推理/微调实践大全

系列篇章💥 No.文章01【DeepSeek应用实践】DeepSeek接入Word、WPS方法详解:无需代码,轻松实现智能办公助手功能02【DeepSeek应用实践】通义灵码 + DeepSeek:AI 编程助手的实战指南03【DeepSeek应用实践】Cline集成DeepSeek:开源AI编程助手,终端与Web开发的超强助力04【DeepSeek开发入门】DeepSeek API 开发初体验05【DeepSeek开发入门】DeepSeek API高级开发指南(推理与多轮对话机器人实践)06【DeepSeek开发入门】Function Calling 函数功能应用实战指南07【DeepSeek部署实战】DeepSeek-R1-Distill-Qwen-7B:本地部署与API服务快速上手08【DeepSeek部署实战】DeepSeek-R1-Distill-Qwen-7B:Web聊天机器人部署指南09【DeepSeek部署实战】DeepSeek-R1-Distill-Qwen-7B:基于vLLM 搭建高性能推理服务器10【DeepSeek部署实战】基于Ollama快速部署Dee

By Ne0inhk

DeepSeek各版本说明与优缺点分析_deepseek各版本区别

DeepSeek各版本说明与优缺点分析 DeepSeek是最近人工智能领域备受瞩目的一个语言模型系列,其在不同版本的发布过程中,逐步加强了对多种任务的处理能力。本文将详细介绍DeepSeek的各版本,从版本的发布时间、特点、优势以及不足之处,为广大AI技术爱好者和开发者提供一份参考指南。 1. DeepSeek-V1:起步与编码强劲 DeepSeek-V1是DeepSeek的起步版本,这里不过多赘述,主要分析它的优缺点。 发布时间: 2024年1月 特点: DeepSeek-V1是DeepSeek系列的首个版本,预训练于2TB的标记数据,主打自然语言处理和编码任务。它支持多种编程语言,具有强大的编码能力,适合程序开发人员和技术研究人员使用。 优势: * 强大编码能力:支持多种编程语言,能够理解和生成代码,适合开发者进行自动化代码生成与调试。 * 高上下文窗口:支持高达128K标记的上下文窗口,能够处理较为复杂的文本理解和生成任务。 缺点: * 多模态能力有限:该版本主要集中在文本处理上,缺少对图像、语音等多模态任务的支持。 * 推理能力较弱:尽管在自然语言

By Ne0inhk