英伟达黄仁勋罕见长文：AI五层架构全景，逐层现状拆解

2026-03-11 17:51:40

大模型

智能体（Agent）

3月10日，黄仁勋发了一篇极度罕见的长文。

这是他自 2016 年以来发表的第七篇公开长文，他抛出了一个“五层蛋糕”架构：能源、芯片、基础设施、模型、应用。每一层相互强化，每一个成功的应用都会向下拉动所有层，一直拉到发电厂。他说我们仍处于极早期，数千亿只是开始，数万亿才是终点。

CES 2026 全栈主题演讲幻灯片

第一层能源

位于最底层的是能源。实时生成的智能需要实时产生的电力。生成的每一个 Token（词元）都是电子移动、热量管理以及能源转化为计算能力的结果。在此之下没有任何抽象层。能源是 AI 基础设施的第一性原理，也是系统能产生多少智能的绝对约束条件。

到2030年，全球数据中心电力消耗预计翻倍达到945太瓦时，略高于日本全年总用电量。摩根士丹利预计2025到2028年美国数据中心累计电力缺口将达47吉瓦，相当于9个迈阿密的总用电量。三峡大坝满负荷产出22.5吉瓦，填上这个缺口需要两座三峡。

黄仁勋说能源是AI智能总量的绝对上限。这句话的内涵是：算力竞赛最终会变成电网竞赛。

中国在这一层的动作比大多数人意识到的更激进。贵州互联网数据服务2025年用电量同比飙升95%，杭州数据中心用电量同比增长47%。2026年底，中国太阳能发电装机规模预计将首次超过煤电。AI军备竞赛在芯片层面打得最响，但决定谁能跑得更远的是电网。

第二层芯片：三年内Token成本降到百分之一

在能源之上是芯片。这些处理器旨在以大规模、高效的方式将能源转化为计算能力。AI 工作负载需要极其庞大的并行计算能力、高带宽内存以及快速的互连。芯片层的进步决定了 AI 的扩展速度，以及智能成本的下降程度。

Hopper到Blackwell，单位Token成本降至十分之一。Blackwell到Rubin，再降十分之一。Rubin计划2026年下半年量产。三年内Token成本从1降到0.01。

成本降低一百倍在历史上意味着什么，移动流量给过一次答案。每MB流量从几块钱降到接近免费，直接催生了短视频和直播整个行业。现在因为太贵而无法商业化的AI应用，三年后全部变得可行。

英伟达2026财年全年营收2159亿美元，数据中心业务占91%，净利润1200亿美元。主权AI单项带来超过300亿美元收入，同比暴增三倍，主要客户来自加拿大、法国、荷兰、新加坡和英国。各国政府在用真金白银押注这件事。

第三层基础设施：9吉瓦已经在转，出货排到2027年

芯片之上是基础设施。这包括土地、电力输送、冷却系统、建筑施工、网络，以及将成千上万个处理器协同编排为一台机器的系统。这些系统就是“AI 工厂”。它们的设计初衷不是为了存储信息，而是为了制造智能。

英伟达CFO在财报里披露，主要客户已部署并消耗近9吉瓦基于Blackwell的基础设施，出货计划排到2027年。9吉瓦接近三峡大坝满负荷产出的40%，这些算力此刻正在运转，正在消耗电力，正在生成Token。

英伟达最近几个月的动作把"建设才刚开始"这句话落成了具体数字。2026年1月，英伟达向CoreWeave投资20亿美元，协助其到2030年建设超过5吉瓦的AI工厂。9月，英伟达向英特尔投资50亿美元，由英特尔专门为英伟达定制x86 CPU，集成进AI基础设施平台。11月，英伟达向Anthropic投资100亿美元，Anthropic同步承诺采购英伟达未来的Grace Blackwell和Vera Rubin系统。

这是一个闭环结构：英伟达投出去的钱，通过芯片采购订单回来。钱出去，订单回来，飞轮转起来了。

第四层模型：开源是英伟达最好的销售员

基础设施之上是模型。AI 模型可以理解多种类型的信息：语言、生物学、化学、物理学、金融、医学以及物理世界本身。语言模型仅仅是其中的一个类别。一些最具变革性的工作正发生在蛋白质 AI、化学 AI、物理模拟、机器人技术以及自主系统等领域。

黄仁勋在长文里专门提到DeepSeek-R1，把它作为开源模型激活整个架构栈需求的例证。很多人以为开源模型是英伟达的威胁，他的判断正好相反：开源让更多人用得起AI，用的人越多，推理请求越多，Token消耗越大，算力需求反而上升。DeepSeek让推理变便宜，结果整体算力需求比DeepSeek之前更高。

同期英伟达在推理层补了一块缺口。2025年12月，英伟达斥资200亿美元收购Groq的低延迟推理技术与核心工程团队，这是英伟达历史上规模最大的一笔交易。Groq的LPU在大语言模型文本生成场景有极低延迟优势，英伟达买的是推理端的速度，把训练和推理两个场景全部打通，构成从生产到交付的完整闭环。

第五层应用：92%想投，1%跑通

位于最顶层的是应用，这里也是创造经济价值的地方。药物发现平台、工业机器人、法律助手、自动驾驶汽车。一辆自动驾驶汽车就是具身于机器中的 AI 应用，而一个类人机器人则是具身于躯体中的 AI 应用。同样的底层架构，不同的应用输出。

这是五层里最混乱也最值得看的一层。

Gartner预测到2026年底，约40%的企业应用将集成任务型AI Agent，而2025年这个数字不足5%。Anthropic对500多位技术领导者的调研显示，80%的受访组织表示AI Agent已经带来可衡量的投资回报。黄仁勋在财报电话会里说，智能体AI的拐点在过去两三个月已经到来。

但麦肯锡的数据戳出了另一面：92%的企业计划增加AI投资，只有1%的领导者认为其公司在AI部署上已经达到成熟阶段。92%想投，1%跑通。这个剪刀差是五层架构里唯一没有被黄仁勋正面处理的问题。

黄仁勋在长文里用放射科医生举例，说AI承担了读片工作之后，放射科医生的需求反而增长。逻辑是：AI提高了生产力，医院能服务更多患者，于是雇佣更多人员。但这个逻辑有一个前提条件——医院本身得先学会用AI读片。那些92%想投AI但只有1%跑通的企业，卡住的是组织能力跟不上。

企业侧卡在组织能力，消费者侧的变化却已经在发生，而且方向更清晰。传统APP不会消失，会被包裹。用户不再需要打开十个APP分别操作，而是告诉智能体完成一件事，智能体在后台调用所有工具。APP退到后台，成为智能体的工具库，入口迁移了。OpenClaw三周内普及速度超过Linux三十年，就是入口从APP界面迁移到指令界面的那一刻。

五层都在建，但速度不一样

黄仁勋的五层蛋糕是一张方向正确的地图。能源在追赶，芯片在加速，基础设施在堆叠，模型在开源，应用在起跑，每一层的方向都没有错。

但五层的建设速度是不对称的。基础设施的建设周期是三年，应用的爆发可能是三个月。英伟达CFO预计从2026年年初到年底，Blackwell和Rubin平台的收入将达到5000亿美元。这5000亿对应的算力在2026年全部交付，遇上还没跑通的应用层，会发生什么？

黄仁勋在长文最后写道，我们现在所做的选择——建设的速度有多快、参与的范围有多广、部署的方式有多负责任——将最终塑造这个时代的未来。

五层蛋糕是一张完整的地图。芯片可以设计，电厂可以建，模型可以训练。地图上没有标注的，是那92%计划投入AI的企业里只有1%真正跑通了。剩下的91%在哪里卡住的，五层里没有一层给出答案。

以上内容不代表本平台立场，仅供读者参考