别管“日活”了!一天烧掉140万亿Token,大厂赚钱的规矩全变了
如果你最近留意过各大互联网公司的财报会,会发现高管们的话术悄悄变了。
放在前几年,大家碰头第一句话肯定是:“兄弟,你们App现在日活(DAU)多少了?”腾讯坐拥10亿微信用户,阿里覆盖10亿买家,抖音手里捏着8亿老铁。那时候,只要你把人圈进来,不管是塞广告、卖东西还是推游戏,闭着眼睛都能赚钱。流量,就是硅谷和中关村唯一的通行证。
但到了2026年3月,这套玩了十几年的游戏规则变了。
现在的科技圈,大家比拼的是另一个词:Token(大模型处理文本的基本单位)。根据最新数据,中国AI大模型的日均Token调用量已经突破了140万亿。字节跳动的豆包大模型,一家就占了120万亿,拿下了中国第一、全球第三。


涨价83%还有人抢着买,这生意到底有多赚?
咱们先来算算,按Token收钱这门生意,到底有多香。
看看智谱交出的最新成绩单就知道了。它的MaaS API平台(也就是专门给企业卖Token接口的业务),年度经常性收入(ARR)达到了17亿元,比去年翻了60倍。更提气的是,今年一季度,智谱硬气地把API价格往上提了83%。
按理说,涨价肯定得掉粉吧?结果调用量反倒蹭蹭往上涨了400%,实现了量价齐飞。
这说明什么?说明只要你的模型脑子够好使,大家是愿意掏钱的。以前的AI是个只会陪聊的玩具,现在的AI能直接进公司干活。无论是审合同、写标书还是看视频,只要它能实打实地替老板省下人工费,企业掏起Token费来连眼皮都不会眨。难怪智谱CEO张鹏敢在台上放话:当模型足够强,API本身就是最好的商业模式。
这也是为什么最近全球最大的API聚合平台OpenRouter的榜单上,前六名全被中国大模型包揽了。DeepSeek之前公布过一个数据,理论成本利润率能达到545%。

云巨头两头通吃,美团滴滴安静吃瓜
Token消耗量暴涨,最高兴的是谁?肯定是家里开着“发电厂”的云服务巨头。
比如字节跳动。火山引擎总裁谭待透露,字节的Token消耗量在这两年里猛增了1000倍。这里面有两个大功臣:一是各种短剧、营销动画带来的视频生成需求;二是像OpenClaw这种智能体(Agent)产品的全网大流行。以前大家还分这是医疗AI还是金融AI,现在员工拿Agent写周报、做市场分析,场景早就按不住了。
阿里和腾讯的反应也非常真实。阿里直接成立了由CEO吴泳铭亲自挂帅的Alibaba Token Hub事业群,吴泳铭放话,未来MaaS收入会成为阿里云最大的进账。腾讯紧随其后,在3月底把自家的平台也升级成了TokenHub。
大家都在抢什么?云厂商在这个局里,拥有让人眼红的“双重身份”:一方面,他们自己做大模型,生产Token卖钱;另一方面,像智谱、MiniMax这些独立的大模型公司,要生产Token就得租大量的显卡算力,这钱最后还是得交到云厂商手里。只要大家还在疯狂折腾AI,云厂商就能两头稳赚。
不过,不同生态位的悲喜并不相通。对于滴滴、美团这种手里没有庞大云业务的互联网厂商来说,Token经济跟他们关系不大。大家各司其职,美团只关心怎么用AI把外卖路线算得更准,并没有必要去凑建大模型的这个热闹。

别光盯着消耗量,水面下藏着不少“废油”
看到这儿,你可能会觉得,那只要拼命把Token消耗量刷上去,公司就能躺赢了?
腾讯的李强及时倒了一盆冷水。他打了个特别妙的比方:如果把Token看作是汽车的“油耗”,那大家千万别只盯着油耗看,你得看看这台“引擎”的经济性行不行。

现在表面上那140万亿的Token消耗里,其实掺了不少“水分”。谭待也举了个例子,比如让AI去解一道数学题,如果模型不够聪明,它就会用最笨的穷举法去算。这就像是一辆排量巨大的破车,一脚油门下去,烧掉了十几万个Token,最后可能还没算对。而真正优秀的大模型,可能只需要五句话、一千个Token就能给出漂亮解法。
企业花钱买Token,买的是生产力。如果模型总是用这种“智障的努力”在后台空转,白白烧掉老板的预算,客户迟早会翻脸走人。
而且,现在大厂都在靠送免费额度、大搞补贴来抢地盘,这跟当年网约车大战发打车券是一个路数。如果没有核心壁垒,哪天你不发“红包”了,客户拍拍屁股就换下一家。
另外,大家别忘了,除了公有云上统计到的这些数据,水面之下还藏着一个庞大的“网”。
很多金融机构为了保密,车企为了保护隐私,或者工厂为了毫秒级的响应速度,根本不会去调用大厂公开的API。他们直接把开源模型下载到自己的本地机房或者车机里跑。业内人士估算,这部分看不见的调用量,至少是公有云的5到10倍。所以,Token这张牌桌,远比表面上看起来的要大得多。

谁还管你耗多少油,我只为“结果”买单
我们聊了这么多Token,但很多从业者心里其实跟明镜一样:按Token计费,只是AI发展初期的一个过渡形态。
硬件采购确实很贵,一张高端GPU动辄几十万,跑起来的电费也是天文数字。但随着芯片算力的提升和基础设施的规模效应,Token的价格只会越来越便宜,甚至在一些简单的闲聊场景下会直接走向免费。
便宜的Token不等于好用的AI。未来的竞争,根本不是拼谁家的Token卖得更贱,而是拼谁能把事情办得更漂亮。
这就像咱们平时打滴滴。你上车之前,会在乎这辆车百公里耗多少升汽油吗?你在乎的只是司机能不能用最快的时间,安全把你送到目的地。
未来的企业级AI服务,也必然会走向“按结果付费(Pay for Outcome)”。
就像百度千帆的产品负责人预测的那样,几年以后,Token这个词可能会从普通用户的账单里彻底消失。大家只按“任务结果”结账。
在AI这波大浪里,谁能最高效地把问题解决掉,谁才能真正把钱挣了。至于现在满天飞的调用量榜单,就当是看个热闹吧。
关注塔猴公众号,扫码下载塔猴APP,查看更多干货

扫码加入官方社群

