黄仁勋提议“发Token当工资”:当硅谷卷起刷量大赛,算力正在成为第四种薪酬
在硅谷的工程师圈子里,衡量一个人“身价”的标准正在发生剧烈的变迁。过去,大家比拼的是职级和股票期权;而现在,最硬核的炫耀资本变成了你的Token消耗量。
最近,硅谷兴起了一个名为“Tokenmaxxing”的新现象,直译过来就是“Token刷量大赛”。在这个语境下,Token这个AI处理文本的最小单位,已经从一个晦涩的技术术语,变成了硅谷的通用货币。
根据OpenAI内部流出的数据信息,一位匿名员工在上周处理了惊人的2100亿个Tokens,位居公司内部消耗排行榜首位。2100亿个Tokens是什么概念?它足够把整个维基百科的所有文字内容填满33遍。而在隔壁的Anthropic,一位使用Claude Code进行辅助开发的工程师,单月产生的Token账单竟然超过了15万美元。
这种近乎疯狂的算力消耗,引起了英伟达CEO黄仁勋的关注。在GTC 2026大会上,黄仁勋抛出了一个让所有职场人竖起耳朵的提议:他愿意在工程师几十万美元的基础薪资之上,额外提供相当于一半年薪的Token预算。
黄仁勋认为,这些Token预算能够让员工的个人能力放大10倍。自此,Token正式被推上了台面,成为了继工资、奖金、期权之后的“第四种薪酬”。

为什么人类突然能“烧”掉这么多Token?
对于普通用户来说,即便每天频繁使用ChatGPT,也很难想象一个人如何能消耗掉几十个维基百科的数据量。
一年前,当AI还主要停留在“聊天框”形态时,Token的消耗速度受到人类打字和阅读速度的物理限制。一个学生撰写并反复修改一篇论文,顶多消耗1万个Token,这大约相当于7500个英文单词。这种交互模式就像是“手摇式水井”,只有人类摇一下柄(下达指令),水(Token)才会出一口。
但2026年爆火的Coding Agent(编程智能体)彻底重构了这一逻辑。
以Claude Code、OpenAI Codex以及开源界爆火的OpenClaw(全网戏称“龙虾”)为代表的智能体,不再是等待指令的被动工具,而是具备了“无人值守、自主循环”的能力。你只要给出一句模糊的意图,Agent就会自动拆解任务,疯狂读取成千上万行的代码库,并不断进行自我纠错和推理。

图:Tokscale全球Token消耗排行榜,Tokscale是一个开源Token使用量追踪和排行榜工具,支持Claude Code、Cursor、OpenCode、Codex等多个平台,用户可以提交数据参与全球排名
这就像是给水井装上了自动抽水机。Agent在后台工作一小时所产生的Token吞吐量,比一个人类手动输入一年还要多。当数万个Agent在硅谷的服务器里7x24小时连轴转时,Token的消耗量自然呈现出指数级的爆炸。
支撑这股“刷量”热潮的,还有大厂之间的补贴大战。目前,OpenAI和Anthropic都在其200美元/月的专业订阅计划中,内置了价值近1000美元的Token额度。这种策略与早年网约车、外卖大战时期的“发优惠券”异曲同工——通过巨额补贴让用户形成对特定AI工作流的肌肉记忆,以此抢占未来的生态入口。

被异化的KPI与“古德哈特定律”
当Token消耗量成为一种身份象征时,大厂的管理层开始试图将其转化为衡量生产力的标尺。
Shopify和Meta已经率先将AI工具的使用频率写进了员工的绩效考核标准(KPI)。在这些公司,如果你不使用AI,可能会在季度评审中面临“缺乏创新”的批评;而那些重度使用的员工,则会获得额外的算力额度奖励。
然而,这种基于“消耗量”的考核方式,正让硅谷陷入一种全新的管理悖论。
在经济学中有一个著名的古德哈特定律:当一个指标变成衡量成功的标准时,它就不再是一个好指标了。
这让老一辈科技从业者想起了软件工程史上的一个经典教训。早年间,某些科技公司曾尝试用“代码行数(Lines of Code)”来考核程序员。结果显而易见:程序员们为了达标,开始在代码中疯狂加入冗余的注释、毫无意义的空行,甚至故意写出极其臃肿的代码块。虽然指标好看了,但软件质量却一落千丈。
现在的“Token排行榜”正面临类似的风险。一位匿名OpenAI员工在社交平台吐槽称,这种竞赛看起来并不可持续。排行榜只能衡量你的Agent跑得有多欢,却无法衡量这些Agent到底产出了多少有效价值。为了冲榜,员工完全可以启动一个Agent去解决一个根本不需要解决的死循环问题。这种“虚假繁荣”正在抽干公司的研发预算,却未必能换回同比例的技术突破。

图:黄仁勋在GTC演讲中展示了Token成本与收入关系的图表,将数据中心分为免费层、中级层、高级层和Premium层来分配算力,并展示Vera Rubin芯片相比Grace Blackwell带来5倍收入提升的预测

薪酬重构:当算力成为核心招聘筹码
尽管存在争议,但“Token预算”作为一种员工福利,确实正在改变硅谷的招聘规则。
OpenAI Codex工程负责人Thibault Sottiaux最近公开表示,候选人在面试时关注的重点已经发生了位移。比起免费午餐或健身房会员,顶级工程师现在更在乎:“入职后,我能拥有多少专属的推理算力预算?”

根据薪酬追踪网站Levels.fyi的最新数据,硅谷头部软件工程师的年薪中位数约在37.5万美元。如果按照黄仁勋的提议,额外增加10万美元的Token预算,这部分非现金福利将占据总包(Package)的20%以上。

这种薪酬结构的演变,背后是企业服务市场计费模式的翻转。传统的SaaS(软件即服务)是典型的“按人头收费(Seat-based)”,无论你用不用,每个月交固定的月租费。但AI时代正在加速转向“按消耗收费(Consumption-based)”。
对于企业CFO(首席财务官)而言,这种转变意味着他们对“人头费”的算法必须进行重写。
在传统的逻辑里,雇佣一名员工的成本主要是薪水和社保。但在AI Agent时代,当一个人的Token消耗账单开始接近甚至超越他的现金薪水时,这名员工实际上变成了一个“算力协调员”。企业支付的不再仅仅是人类的智力溢价,更多的是在为人类指令驱动下的机器产出买单。

算力自由与人力溢价的博弈
黄仁勋公开谈论公司Token预算,不仅是在推销英伟达的芯片,更是对未来组织形态的一次预判。
发Token当工资,表面上看是赋予员工一种“算力自由”,让他们能够无视成本地去探索技术的边界。但从深层产业视角来看,这标志着劳动力市场的定价逻辑正在发生位移:单纯的执行力已经彻底贬值,而那种能够高效调配算力、将10万美元Token预算转化为百万美元商业价值的“算力调度能力”,正在成为新的稀缺资产。
在这场硅谷的刷量大赛中,喧嚣的排行榜终会散去,但那张关于“算力与人力如何配比”的账本,已经递到了每一位职场人和管理者的面前。当算力成为工资的一部分,你准备好成为那个放大10倍能力的“超级个体”了吗?



