英伟达黄仁勋罕见长文:AI五层架构全景,逐层现状拆解

2026-03-11 16:56:02

3月10日,黄仁勋发了一篇极度罕见的长文。

这是他自 2016 年以来发表的第七篇公开长文,他抛出了一个“五层蛋糕”架构:能源、芯片、基础设施、模型、应用。每一层相互强化,每一个成功的应用都会向下拉动所有层,一直拉到发电厂。他说我们仍处于极早期,数千亿只是开始,数万亿才是终点。

CES 2026 全栈主题演讲幻灯片




第一层能源


位于最底层的是能源。实时生成的智能需要实时产生的电力。生成的每一个 Token(词元)都是电子移动、热量管理以及能源转化为计算能力的结果。在此之下没有任何抽象层。能源是 AI 基础设施的第一性原理,也是系统能产生多少智能的绝对约束条件。


到2030年,全球数据中心电力消耗预计翻倍达到945太瓦时,略高于日本全年总用电量。摩根士丹利预计2025到2028年美国数据中心累计电力缺口将达47吉瓦,相当于9个迈阿密的总用电量。三峡大坝满负荷产出22.5吉瓦,填上这个缺口需要两座三峡。


黄仁勋说能源是AI智能总量的绝对上限。这句话的内涵是:算力竞赛最终会变成电网竞赛。


中国在这一层的动作比大多数人意识到的更激进。贵州互联网数据服务2025年用电量同比飙升95%,杭州数据中心用电量同比增长47%。2026年底,中国太阳能发电装机规模预计将首次超过煤电。AI军备竞赛在芯片层面打得最响,但决定谁能跑得更远的是电网。



第二层芯片:三年内Token成本降到百分之一


在能源之上是芯片。这些处理器旨在以大规模、高效的方式将能源转化为计算能力。AI 工作负载需要极其庞大的并行计算能力、高带宽内存以及快速的互连。芯片层的进步决定了 AI 的扩展速度,以及智能成本的下降程度。


Hopper到Blackwell,单位Token成本降至十分之一。Blackwell到Rubin,再降十分之一。Rubin计划2026年下半年量产。三年内Token成本从1降到0.01。


成本降低一百倍在历史上意味着什么,移动流量给过一次答案。每MB流量从几块钱降到接近免费,直接催生了短视频和直播整个行业。现在因为太贵而无法商业化的AI应用,三年后全部变得可行。


英伟达2026财年全年营收2159亿美元,数据中心业务占91%,净利润1200亿美元。主权AI单项带来超过300亿美元收入,同比暴增三倍,主要客户来自加拿大、法国、荷兰、新加坡和英国。各国政府在用真金白银押注这件事。



第三层基础设施:9吉瓦已经在转,出货排到2027年


芯片之上是基础设施。这包括土地、电力输送、冷却系统、建筑施工、网络,以及将成千上万个处理器协同编排为一台机器的系统。这些系统就是“AI 工厂”。它们的设计初衷不是为了存储信息,而是为了制造智能。


英伟达CFO在财报里披露,主要客户已部署并消耗近9吉瓦基于Blackwell的基础设施,出货计划排到2027年。9吉瓦接近三峡大坝满负荷产出的40%,这些算力此刻正在运转,正在消耗电力,正在生成Token。


英伟达最近几个月的动作把"建设才刚开始"这句话落成了具体数字。2026年1月,英伟达向CoreWeave投资20亿美元,协助其到2030年建设超过5吉瓦的AI工厂。9月,英伟达向英特尔投资50亿美元,由英特尔专门为英伟达定制x86 CPU,集成进AI基础设施平台。11月,英伟达向Anthropic投资100亿美元,Anthropic同步承诺采购英伟达未来的Grace Blackwell和Vera Rubin系统。


这是一个闭环结构:英伟达投出去的钱,通过芯片采购订单回来。钱出去,订单回来,飞轮转起来了。



第四层模型:开源是英伟达最好的销售员


基础设施之上是模型。AI 模型可以理解多种类型的信息:语言、生物学、化学、物理学、金融、医学以及物理世界本身。语言模型仅仅是其中的一个类别。一些最具变革性的工作正发生在蛋白质 AI、化学 AI、物理模拟、机器人技术以及自主系统等领域。


黄仁勋在长文里专门提到DeepSeek-R1,把它作为开源模型激活整个架构栈需求的例证。很多人以为开源模型是英伟达的威胁,他的判断正好相反:开源让更多人用得起AI,用的人越多,推理请求越多,Token消耗越大,算力需求反而上升。DeepSeek让推理变便宜,结果整体算力需求比DeepSeek之前更高。



同期英伟达在推理层补了一块缺口。2025年12月,英伟达斥资200亿美元收购Groq的低延迟推理技术与核心工程团队,这是英伟达历史上规模最大的一笔交易。Groq的LPU在大语言模型文本生成场景有极低延迟优势,英伟达买的是推理端的速度,把训练和推理两个场景全部打通,构成从生产到交付的完整闭环。



第五层应用:92%想投,1%跑通



位于最顶层的是应用,这里也是创造经济价值的地方。药物发现平台、工业机器人、法律助手、自动驾驶汽车。一辆自动驾驶汽车就是具身于机器中的 AI 应用,而一个类人机器人则是具身于躯体中的 AI 应用。同样的底层架构,不同的应用输出。


这是五层里最混乱也最值得看的一层。

Gartner预测到2026年底,约40%的企业应用将集成任务型AI Agent,而2025年这个数字不足5%。Anthropic对500多位技术领导者的调研显示,80%的受访组织表示AI Agent已经带来可衡量的投资回报。黄仁勋在财报电话会里说,智能体AI的拐点在过去两三个月已经到来。


但麦肯锡的数据戳出了另一面:92%的企业计划增加AI投资,只有1%的领导者认为其公司在AI部署上已经达到成熟阶段。92%想投,1%跑通。这个剪刀差是五层架构里唯一没有被黄仁勋正面处理的问题。


黄仁勋在长文里用放射科医生举例,说AI承担了读片工作之后,放射科医生的需求反而增长。逻辑是:AI提高了生产力,医院能服务更多患者,于是雇佣更多人员。但这个逻辑有一个前提条件——医院本身得先学会用AI读片。那些92%想投AI但只有1%跑通的企业,卡住的是组织能力跟不上。



企业侧卡在组织能力,消费者侧的变化却已经在发生,而且方向更清晰。传统APP不会消失,会被包裹。用户不再需要打开十个APP分别操作,而是告诉智能体完成一件事,智能体在后台调用所有工具。APP退到后台,成为智能体的工具库,入口迁移了。OpenClaw三周内普及速度超过Linux三十年,就是入口从APP界面迁移到指令界面的那一刻。



五层都在建,但速度不一样


黄仁勋的五层蛋糕是一张方向正确的地图。能源在追赶,芯片在加速,基础设施在堆叠,模型在开源,应用在起跑,每一层的方向都没有错。


但五层的建设速度是不对称的。基础设施的建设周期是三年,应用的爆发可能是三个月。英伟达CFO预计从2026年年初到年底,Blackwell和Rubin平台的收入将达到5000亿美元。这5000亿对应的算力在2026年全部交付,遇上还没跑通的应用层,会发生什么?


黄仁勋在长文最后写道,我们现在所做的选择——建设的速度有多快、参与的范围有多广、部署的方式有多负责任——将最终塑造这个时代的未来。


五层蛋糕是一张完整的地图。芯片可以设计,电厂可以建,模型可以训练。地图上没有标注的,是那92%计划投入AI的企业里只有1%真正跑通了。剩下的91%在哪里卡住的,五层里没有一层给出答案。


声明:该内容由作者自行发布,观点内容仅供参考,不代表平台立场;如有侵权,请联系平台删除。
标签:
大模型
智能体(Agent)