xAI 用掉旧金山全城的电,马斯克 6 万亿参数的 Grok 5 在训

2026-01-22 10:59:19
文章摘要
马斯克用“Macro-hard”的涂鸦向世界宣告了算力霸权。在孟菲斯,Colossus 2 以 1 GW 的功率和 55 万张 GPU 正在日夜轰鸣,只为训练 6 万亿参数 的 Grok 5。这是一场关于速度、能源与未来的豪赌。

马斯克又一次站在了世界屋顶上,这一次,他是字面意义上的站在屋顶

1月17日,当他在推特(X)上宣布 Colossus 2 现已运行,还顺便附上了一张卫星视角的照片。

照片中,位于孟菲斯的数据中心屋顶上,赫然印着巨大的的涂鸦——MACROHARD


图 1:高清卫星视角,孟菲斯数据中心屋顶清晰显示“MACROHARD”字样

这是一个只有科技圈老炮儿才懂的恶毒玩笑。

将“Micro-soft(微-软)”反义为“Macro-hard(巨-硬)”,马斯克用这种充满了恶趣味的挑衅,向他在 AI 领域最大的宿敌——微软和 OpenAI 的联盟——竖起了中指。


图 2:推特网友恶搞,调侃马斯克对微软联盟的“竖中指”行为

但比起这个玩笑,更让微软和 OpenAI 感到脊背发凉的,是这条推文背后的数据:

1 GW(吉瓦)。

这是 Colossus 2 现在的运行功率。如果这个数字对你来说太抽象,那么换一个说法:这相当于旧金山全市在用电高峰期的总负荷。

这里躺着 55 万张 英伟达最新的 Blackwell GPU,这是一个让谷歌看了沉默,扎克伯格看了流泪的数字。当其他科技巨头还在为拿到几千张显卡而开香槟庆祝时,马斯克已经把数十万张显卡连成了一座长城。

马斯克的人生几十年来一贯如此,在别人还在起草 2027 年的发展路线图时,他已经把那东西造出来了,并且正在以不可思议的速度让它满负荷运转。

这一次,他更是为了训练一个划时代的 AI——6 万亿参数的 Grok 5


01
基建狂人:122 天的奇迹

在硅谷,时间通常是以“季度”为单位。但在马斯克的世界里,时间是以“小时”来计算的。

让我们把时钟拨回几个月前。那时候,Colossus 1 所在的孟菲斯工厂还只是一片尘土飞扬的泥地。按照行业标准,建设一个容纳 10 万张 H100 GPU 的超算集群,通常需要 12 到 18 个月 的时间。你需要规划电网、铺设光纤、安装冷却系统、调试网络架构。

但马斯克给了团队一个死命令:122 天。

这听起来像是天方夜谭。但 122 天后,Colossus 1 奇迹般地上线了。就连英伟达的 CEO 黄仁勋在参观后都忍不住惊叹:“这是超人般的速度。除了马斯克,地球上没人能做到。”

这种“马斯克速度”的背后,是极致的垂直整合暴力美学

在 Colossus 2 的建设中,这种暴力美学被推向了巅峰。为了解决数千台服务器同时运行产生的恐怖热量,xAI 没有采用传统的风冷系统,而是直接上了液冷。数吨的冷却液在管道中奔流,像血液一样带走芯片的高温。


图 3:Supermicro 液冷服务器机架,高效散热的核心

为了解决美国电网那众所周知的拉胯稳定性,马斯克直接拉来了自己的另一支王牌——特斯拉能源。

600 个 Tesla Megapack 巨型储能电池被部署在数据中心周围。这些白色的巨型盒子储存了超过 2.3 GWh 的电量,它们就像是心脏起搏器,确保在电网波动时,这台价值数百亿美元的超算不会心脏骤停。


图 4:Tesla Megapack 储能军团环绕 Colossus,提供电力稳压

马斯克的战略意图非常清晰:自己掌握算力主权。

在 2023 年创办 xAI 之初,马斯克就受够了这种日子:买显卡要看黄仁勋脸色,租服务器要看微软和甲骨文的脸色。对于一个立志要通过 AI 探索宇宙真理的人来说,这种“寄人篱下”的感觉是不可接受的。

于是,他选决定:不租了,我自己造。而且要造世界上最大的。

现在,Colossus 2 已经突破了 1 GW 的障碍,并且计划在今年 4 月升级到 1.5 GW,最终目标直指 2 GW。这意味着 xAI 将拥有比任何竞争对手都高出一个数量级的算力储备。


图 5:Blackwell GPU 密集机架,算力的物理具象化

02
Grok 5 的诞生:划时代的数字巨兽

马斯克如此疯狂地堆砌算力,当然不是为了用来挖比特币。这台消耗着一座城市电量的机器,目前只有一个任务:日夜不停地训练 Grok 5。

在 AI 领域,有一条规模定律

简单来说,就是大力出奇迹。当你的模型参数量越大、训练数据越多、使用的算力越强,模型的智能水平就会呈线性甚至指数级上升。

  • GPT-4 的参数量据传在 1.8 万亿左右。
  • Grok 5 的目标是:6 万亿参数。

量变引起质变。马斯克在最近的访谈中透露,Grok 5 将具备原生视频理解能力,并且拥有更高的智能密度


图 6:马斯克近期访谈画面,正式宣布 Grok 5 计划

这构成了一个令竞争对手绝望的生态闭环

  1. X(推特): 提供全球最新鲜、最实时的文本和视频数据,喂给 Grok。
  2. 特斯拉(Tesla): 提供数百万辆车在物理世界采集的驾驶视频,教 Grok 理解物理定律。
  3. Colossus(超算): 提供处理这些海量数据的算力心脏。

当这三个齿轮咬合在一起时,Grok 5 就有机会触碰到那个所有 AI 科学家梦寐以求的东西——AGI(通用人工智能)

在马斯克的愿景里,未来的牌桌上只会剩下两个玩家:谷歌xAI。至于其他的,可能只是历史的注脚。


03
从“代码较量”到“基建战争”

Colossus 2 的点火,像是一声发令枪,彻底引爆了硅谷巨头们的竞赛。在此之前,大家比拼的是谁的算法更优、谁的人才更多。但现在,它变成了一场基建战争

OpenAI 慌了。

作为行业的领头羊,山姆·奥特曼显然感受到了来自孟菲斯的寒意。据报道,OpenAI 正在联合微软和甲骨文,策划一个代号为**星际之门(Stargate)**的计划。他们号称要投入 1000 亿甚至 5000 亿美元,建设一个 10 GW 甚至更大的超算集群。

但问题是,星际之门项目还停留在 PPT 阶段,最早也要到 2028 年才能落地。而马斯克的 Colossus 2,今天已经在嗡嗡作响。


图 7:星际之门(Stargate)项目概念图,德州数据中心

Meta 也坐不住了。

扎克伯格虽然在大搞开源,但在基建上一点也不手软。他的普罗米修斯计划,同样瞄准了吉瓦级的规模。Meta 甚至专门组建了团队,去和核电站签长期合同,因为他们发现靠普通的电网已经喂不饱自家的 AI 了。


图 8:Meta Prometheus AI 数据中心,扎克伯格的基建野心

Anthropic 选择了抱大腿。

这家主打“安全 AI”的公司,虽然没有马斯克那么狂野的基建能力,但它转身就向 Google Cloud 下了订单,要扩容到 100 万个 TPU

现在的硅谷圈,弥漫着算力焦虑。CEO 们见面打招呼不再是“你的模型跑多少分?”,而是:
“你拿到多少张卡?”
“你搞到了多少电?”

因为在 AI 战场上,算力就是兵力。谁的 GPU 多,谁的电多,谁就是王。


04
算力的阴暗面:吸血的 AI

然而,在 Colossus 2 运行的轰鸣声中,不仅诞生了 Grok 5 ,也诞生了美国电网的噩梦。

当我们把目光从孟菲斯那个宏伟的数据中心移开,投向周围的社区,你会看到一副截然不同的景象。对于住在 Colossus 附近的居民来说,这是一个日夜轰鸣的邻居


图 9:航拍镜头下,燃气涡轮机正在排放废气

数据中心为了散热,数千个巨大的风扇和冷却塔 24 小时不停运转,产生的低频噪音穿透墙壁,让周围的居民夜不能寐。

更让他们愤怒的是电费账单

虽然数据中心承诺会带来经济繁荣,但现实恰恰相反的。AI 数据中心是高度自动化的,它不需要成千上万的工人,只需要几十个维护工程师和一堆机器人。它没有带来大量的就业,只带来了飙升的电力需求。

根据美国能源信息署(EIA)的数据,自 2022 年 AI 爆发以来,美国居民电价的涨幅已经超过了通胀率。在新泽西州,电费甚至在一年内涨了 20%。


图 10:德勤(Deloitte)数据:AI 数据中心电力消耗呈爆发式增长

这就是 AI 背后的隐形成本

为了喂饱这些 GPU,为了让 Grok 5 多写一首打油诗,美国正在透支原本就脆弱的电网。戴尔奥罗集团的高级研究总监 Baron Fung 一针见血的指出:

“未来 AI 发展的瓶颈,根本不是算力,也不是芯片,而是电力插座。”

据统计,2026 年,仅科技巨头们在 AI 基础设施上的资本支出就将超过 6000 亿美元。这笔钱里,很大一部分将变成钢筋混凝土和高压电线。

这是一个前所未有的电力黑洞。这个黑洞不仅吞噬着数千亿美元的资金,也在吞噬着地球的能源资源。

马斯克在孟菲斯不仅使用了电网的电,为了弥补电力缺口,xAI 还被指控在没有获得完整许可的情况下,安装了多台燃气涡轮发电机。这导致当地的氮氧化物排放激增,引发了环保组织的强烈抗议。

马斯克这把火实在太旺了,周围人已经感受到了炎热。


05
结语

站在 2026 年的开端,看着 Colossus 2 屋顶上那个巨大的“MACROHARD”,我们不得不承认,埃隆·马斯克依然是这个星球上最会描绘故事、也最能把故事变成现实的人。

他用 122 天的时间,羞辱了所有按部就班的竞争对手。
他用吉瓦级的算力,向世界宣告了硅基智能时代的正式降临。

但是,每一个未来都标好了价格。

Grok 5 或许真的能让我们触摸到 AGI 的裙角,或许真的能解开宇宙的奥秘。但为了这一刻,整座城市的电量正在消耗,普通人正在为这场科技狂欢买单。

在这个狂人引领的时代,我们都是那艘飞向火星飞船上的乘客。

只是,千万别问燃料费是谁出的。

声明:该内容由作者自行发布,观点内容仅供参考,不代表平台立场;如有侵权,请联系平台删除。
标签:
生成式大模型
企业级大模型
模型训练
模型部署
性能优化