我国日均词元(Token)调用量突破 140 万亿,官方定调!国产AI如何引领全球
《人民日报》昨日报道:
2024 年初,中国日均词元(Token)调用量为 1000 亿;至 2025 年底,跃升至 100 万亿;今年 3 月,已突破 140 万亿,两年增长超千倍。
“日均词元调用量的大量增加,充分表明中国的人工智能发展进入了快速增长阶段。”国家数据局局长刘烈宏表示,我国数据集的建设工作取得了阶段性成效,截止到2025年底,全国已建成的高质量数据集超过10万个,总体量超过890PB。
两年时间,调用量增长一千多倍,高质量数据集超过10万个。这AI的泼天富贵,我国是彻底接住了。

Token为什么翻译成词元
Token作为文本的最小处理单位,是AI领域最常见的单词,所以对Token该翻译,大家各执己见。
“模元”“智元”“灵符”“令牌”“偷啃”……媒体隔段时间就会掀起一轮争论,每次都以各说各话收场,大家都在比谁更有灵气、更有意境。
而官方穿透了这些表象,从意义出发,命名为词元。词,指向语言属性;元,指向最小粒度。两个字,非常贴切。
其实早在学术文献里,Token作为文本的最小处理单位,就长期被译为“词元”。苹果也采用了这个译法,打开 Apple 中国官网,产品详情页赫然写着“词元响应速度”。要知道,苹果的中文本地化团队是出了名的较真,AirDrop 叫隔空投送,Live Text叫实况文本,每个词要经过反复推敲。准确、简洁、美感缺一不可。

无独有偶,在央视新闻的各类AI科普节目里,Token同样被译作词元。当苹果和央视不约而同选了同一个中文翻译,其实已经形成了标准的雏形,只差官方的最终盖章。
官方(国家数据局、人民日报、中国政府网)最终统一采用“词元”,标志着AI核心术语在中文语境下的正式确立。拒绝花里胡哨,追求实用主义。

140万亿的震撼
名字敲定的背后,隐藏着国产AI算力与应用生态的爆发。
2024年初,中国日均词元调用量为1000亿;2025年底100万亿;到了2026年,仅过去三个月,已突破140万亿。一年增长了1000多倍,2026年三个月内增长了40%多,这在人类科技史上都极为罕见。
140万亿是什么概念?这就相当于每天、每个中国网民,都在向AI发出几十万个指令。
对比一下2013年4G网络普及时,或者早期的双十一时期,现在的词元调用量暴增,和当年一模一样。程序员用AI生成上万行的代码;金融分析师让AI提取财报的关键数据;工厂的机器视觉系统每秒钟都在向云端发送指令进行瑕疵检测。这些动作,每天都在默默消耗着海量的词元。这说明,国产AI正迅速融入生产环境,成了生产力基础设施之一。

正如刘烈宏局长在大会上所言:“日均词元调用量的大量增加,充分表明中国的人工智能发展进入了快速增长阶段。人工智能应用场景在不断深化,从能对话到能决策执行的智能体。”

我国是如何驱动AI发展的?
那为什么只有中国的词元调用量增长这么快?要理解这个问题,得先了解政策与高质量数据供给。
“巧妇难为无米之炊”,大模型不管算法多先进,算力多庞大,要想聪明、要能干活,必须喂好数据。国家数据局明确了两大核心举措。首先就是高质量数据集建设。截至2025年底,全国已建成超过10万个高质量数据集,总体量超890PB。
这10万个数据集都是经过清洗、标注、脱敏的优质行业数据,它们涵盖了医疗影像、工业制造、气象水文、自动驾驶等千行百业。这些数据集直接支撑了大模型的训练和推理,是140万亿词元调用量爆发的坚实底座。
同时,国家正在以场景需求为牵引,先行先试,打造AI-Ready高质量数据集,实现供给的量质提升,数据要素市场化改革正在纵深推进。在商业方面,现在的中国AI市场已经不是盲目烧钱的阶段了,部分头部模型企业,甚至出现了“20天收入超越2025年全年”的夸张现象。以词元计费为基础的新型商业模式正在快速成熟,企业赚到了钱,反过来又投入到更大规模的算力建设中。
一句话总结,中国AI已经开始良性循环,这是就是“集中力量办大事”的优势。

如何引领全球?
这还只是国内的爆发,真正的重头戏是国产AI正在重塑全球版图。
近期,全球知名的AI模型聚合平台OpenRouter等数据显示,中国AI大模型的周调用量,已经连续多周超越美国。在全球前五大模型中,中国占据了多数席位,小米、阶跃星辰、MiniMax、DeepSeek等中国企业赫然在列,并且排名极其靠前。

刘烈宏局长在发布会上特别强调了一个新概念:词元出海。他指出,词元出海是中国AI产业竞争力显著增强的体现,意味着中国模型不仅在国内应用爆发,还在国际市场获得了广泛认可。
这不仅仅是一家公司,这是全行业的内卷与突围。过去,我国企业出海我的是衬衫、袜子;后来,我们卖充电宝、智能手机、新能源汽车等硬件;再后来,我们靠短视频App、跨境电商等软件席卷全球。但今天,我们出海卖的是词元,这是智能算力,是数字基础设施。
中国依靠庞大的工程师红利、丰富的落地场景,硬生生把大模型的调用成本打了下来。去年国内爆发的“百模大战”和“价格战”,直接将词元的价格打到了“白菜价”甚至免费。极低的试错成本,彻底释放了开发者的创造力。
中国AI产业进入了“技术迭代—成本下降—应用爆发”的正向循环,当我们的模型在中文处理上做到极致,在代码生成、逻辑推理上并跑甚至反超,且价格只有海外巨头的十分之一时,全球的开发者自然会理智选择。

词元将成为新时代的“国家电网”
抛开宏大叙事,落到企业和开发者上,词元到底意味着什么?
刘烈宏局长给出了定义:“词元具有智能时代可计量、可定价、可交易的特征。它不仅是智能时代的价值锚点,更是连接技术供给与商业需求的‘结算单位’,为商业模式的落地提供了可量化的可能。”
过去,买软件要么是买断制,要么是SaaS时代的包月/包年订阅制。这种模式下,无论你用得多少,付的钱是固定的。但大模型时代,算力昂贵,传统的收费模式失效了。这时候,词元站了出来。
围绕词元的调用、分发与结算,一套新的价值体系正在形成。今天,一家企业用智能体处理一份100页的商业报告。大模型阅读报告、提取核心数据、生成可视化图表,总共消耗了5000个输入词元和2000个输出词元。那么,企业就只为这7000个词元买单,多用多付,少用少付。
词元成了“结算单位”。就像第二次工业革命时期的“电表”,在电表发明之前,电力很难作为一种商品被广泛交易,因为无法精确计量,没有电表,电力就无法商业化。有了“词元”这个智能时代的电表,AI算力才能真正像水和电一样,输送到千行百业。
在这个体系下,提供模型的厂商是“发电厂”,提供场景应用的企业是“用电器”,而“词元”就是流淌在其中的“电流”。
“九层之台,起于累土”。要建立起一个输出全球的万亿级AI应用,就离不开微小而基础的词元。而“词元”这个中文名的最终确立,正是我国迈向新进程的最坚实一步。(微信公众号:Tahou_2025)
关注塔猴公众号,回复“1”加入专属社群
扫码下载塔猴APP,查看更多干货


