别再盯着大模型第一股，关键看谁先跑通Anthropic模式

今天星期几

2025-12-29 16:58:43

大模型

文章摘要

在追求AGI的路途上，中美两国的资本市场，正为大模型公司提供两条截然不同的路径。

文章转载自[白鲸实验室 ]

原创柳嘉

在追求AGI的路途上，中美两国的资本市场，正为大模型公司提供两条截然不同的路径。

2025年12月17日，被业内视为最早系统性对标OpenAI的智谱和另一家模型厂商MiniMax，传出参与港交所上市聆讯。两天后，智谱正式宣布通过港交所聆讯并递交招股书。21日，MiniMax也递交招股书。

这意味着国产大模型公司冲刺中国大模型第一股的同时，也正在探索一条不同于OpenAI的资本路径，不再依赖单一战略投资方，而是通过公开市场，构建更长期、更多元的结构。

奔赴AGI是一个极其漫长的周期。当模型厂商首次将自身置于公开市场之下，接受持续的信息披露与公众审视，也意味着行业正从早期以叙事驱动为主的阶段，迈入以财务表现和商业兑现为核心的“资本定价期”。

从已披露的信息和行业共识来看，智谱与MiniMax的核心商业逻辑，都高度集中于MaaS的API调用服务，也是大模型独角兽Anthropic的主要盈利模式。

这家巨无霸在过去的短短的8个月时间里（1-8月），收入暴涨5倍，达到50亿美元，被视为OpenAI最强劲的对手之一。

对于国产模型厂商，一个更现实的问题也随之浮现。是不是第一股不重要，能否持续卖出模型、获得稳定且可预期的收入，才是资本市场真正关心的问题。

在基座模型厂商与互联网大厂高度竞争的格局下，独立初创公司的生存空间究竟在哪里？以MaaS为主流的商业模式，是否足以支撑模型公司在长期、高投入研发周期下的资本估值？谁会先跑通Anthropic的商业模式？

关于独立模型厂商MaaS的两大误解

想要理解模型公司的估值，得先搞清楚模型公司的MaaS模式。

MaaS模式是近年来云业务从基础设施，向上层应用服务延伸的新形态，指模型服务厂商依托自有或租用的算力，将预训练模型封装成标准化产品提供给中小企业，帮助其省去购置芯片、构建昂贵算力设施、组建AI人才团队以及模型适配调试等环节。

也就是说，MaaS是为了帮助企业用户更方便地使用模型能力，模型厂商们相当于把房子建好，企业以及开发者可以直接拎包入住。

如何理解MaaS模式？很多人是有误解的。有人认为相比云厂商的MaaS，独立厂商的MaaS没有算力成本和生态产品优势，也就意味着MaaS模式在模型厂商这里根本不成立。

智谱高级副总裁吴玮杰此前曾对我们说，“这种观点有失偏颇。如果按照这个人的逻辑，今天国内市值前10的互联网公司几乎都在通过MaaS API的方式调用智谱的模型，既然智谱GLM4.6也是开源模型，他们为什么不选择在自己的云上部署并调用呢？”

实际上，这里主要有两个原因。

一是，模型开源并不意味着模型直接部署后，可以高并发、稳定、便宜、快速地跑起来，这背后需要有强大的工程化能力做支撑。模型厂商提供的API，不只是模型本身，还封装了相关优化推理能力，比如无损量化、芯片适配、混合精度等。

另一个原因是，独立厂商将模型作为核心产品，持续快速迭代，而互联网大厂，会更关注在特定场景下模型的效果和服务的可用性。客户希望能在第一时间用到最好的模型，为其用户带来更好的体验，如果没有模型厂商支持，云厂商无法在短时间内提供与原厂一样的服务体验。

模型更新很快，以智谱GLM为例，从4.5版本迭代到4.6，只有两个月左右，也会导致模型部署和开源跟不上模型迭代速度，云厂商想一直用最强的模型，只能从原厂去调用API。

因此，直接调用独立模型公司的API，对他们来说反而是最优选择。

云厂商也有自己的限制。大厂之间存在竞争关系，正像阿里不会使用字节的豆包模型，小红书也不会调用抖音的模型一样，这就给独立模型厂商营造了生存空间。也就是说，模型产商的MaaS能为云厂商之间的竞争提供了一个缓冲带，而随着大厂在AI方面的投入日益增加，这个缓冲带必然是会长期存在的。

但这并不说明模型厂商只是个“替代品”，大厂、企业以及开发者最终选择哪家MaaS 平台，更多的仍然是基于模型性能，和模型厂商在服务层面提供的工程化能力。

另一个误解是，不少人认为在云厂商的价格战下，大模型token价格下降，MaaS收入很难有高溢价收费。

实际上，人们忽视了MaaS的规模效应。MaaS是目前模型厂商最能够实现规模化的商业模式，它可以续费，而不是一次性收入。这是模型公司第一次能获得类似阿里云、AWS 那种“高续费、高黏性”的收入结构。

很多情况下，如果一家企业一旦在某个场景使用了一家公司模型，稳定运营一段时间后，轻易不会迁移。因为成本太大了。

长远来看，MaaS的规模效应会带来对模型性能的反哺。通常情况下，模型使用量越大，不仅能大幅降低模型推理的单位成本，而且收到更多真实场景需求反馈，加速模型迭代。

如果将目标聚焦到海外，Anthropic就是MaaS规模化效应的最好例证。2024年，Anthropic的收入只有3.8亿美元，而今年11月，Anthropic上调了营收预期为47亿美元，其中38亿来自MaaS收入，相当于OpenAI预测的同期API收入的两倍。

Anthropic的毛利率更是从去年的-95%，上涨至今年50%。Anthropic预计，最早在2027年实现现金流转正，比OpenAI盈利时间表还要提前三年。

Anthropic正是凭借Claude模型在编程能力的卓越表现，成为全球独立模型厂商里 MaaS收入最大的一家。也是支撑其估值在大半年时间翻升6倍的重要原因。

而国内模型厂商MaaS模式的规模效应，才刚刚开始。

独特的MaaS样本：纯API调用和私有化部署

国内MaaS商业化也开始进入加速期。IDC最新数据显示，2025年上半年，中国公有云上大模型调用量达536.7万亿Tokens，较2024年全年增加近4倍。

下半年增速更明显，尤其是基础模型能力大幅提升后。在智谱的公开报道中，其旗舰模型GLM4.5发布后，token调用量和模型API收入出现十倍增长。

资本对国产模型公司的重新估值，与这股需求侧的快速跃升密切相关——模型行业正在从“故事期”正式迈入“落地期”。

智谱的收入，主要来自两部分，一是面向政府、大企业的本地化部署业务，一是提供API调用服务的MaaS业务。根据招股书披露，智谱2024年收入3.12亿，相当于2022年的两倍，三年营收复合增长率高达130%。在弗若斯特沙利文数据中，以2024年收入计算，智谱已是中国最大的独立大模型厂商，同时在所有通用大模型厂商中位列第二，甚至超过阿里巴巴和商汤科技。

来自智谱招股书

当前智谱的收入结构，还依赖第一类本地化部署业务，这一业务占比8成。不过，轻量化的MaaS业务收入占比已经大幅提升。据悉，智谱的目标是将MaaS收入占比提升至50%。

收入结构的变化背后，受益于智谱已初具规模的MaaS收入增长。招股书披露，智谱云端MaaS和订阅业务呈现指数级增长趋势，付费流量收入超所有国产模型之和。

实际上，早在2021年，智谱就提出MaaS业务，其在云端提供三类标准化产品：通用模型API、垂类模型API 和Coding订阅。推理能力、智能体能力成为今年各家模型公司的“标配功能”，也是推动 MaaS 收入激增的主因。

其中最能说明问题的，是智谱的Coding能力。智谱CEO张鹏此前对媒体披露，面向全球开发者的模型服务业务（GLM Coding Plan）年度经常性收入（ARR）已突破1亿元人民币，折合美元约1400万。

这个增长数据乍看似乎不起眼，但却是一个极有想象力的信号。国内拥有超过1000万开发者，此前因为模型能力的代际差，大多数开发者在使用开发工具时，会优先使用国外顶级模型。

但随着国内模型能力提升，在大部分任务完成度上，国内第一梯队的模型能力和国外模型能力相差无几。而AI Coding工具的门槛越来越低，大量的泛开发者群体涌入，会不断放大用户对更有性价比优势的国内AI编程模型的需求。

在中美AI主权争夺的叙事下，类似海外模型厂商Anthropic断供风波，加剧海内外开发者的反感，给具有性价比优势的国内模型厂商带来了利好机会。

据悉，智谱的海外收入增速最快。海内外的主流AI编程工具包括谷歌收购的Windsurf，字节的海外编程工具TRAE、阿里巴巴面向海外的Qoder等，都把智谱的模型变成自己产品里的隐形底座。

这也说明全球开发者正进入“多模型混用”时代，他们会选择在不同任务上，使用最具性价比的模型。海外用户付费意愿更强，也意味着一旦能融入全球开发者的工作流，可能会产生更强的“护城河”。

除了MaaS业务，原有的本地化部署业务毛利如何，也是值得关注的重点。根据招股书披露，智谱本地化部署业务的毛利率近三年均在50%以上。

本地化部署倾向被认为是长周期、回款慢的业务，为何毛利如此高。这或许跟智谱在私有化业务上，走出了一条不同于传统政企交付的路线有关。今年3月，智谱推出“模力社区—大模型 MaaS 平台”，落地上海浦东垂类模型生态集聚区。这意味着在一个可信的园区环境中，将GLM系列模型以平台化方式部署，让园区内多家企业可以共享调用。

这个模式的独特性在于，它既不像传统私有化那样周期长、成本高、重度定制，也不像纯API那样受限于数据安全和政府合规要求。它介于“两者之间”，是一种“一次部署、多方共享”的轻量化本地MaaS模式，优势是低成本、效率高、可规模复制。

也因此，从商业化上看，上述两部分业务都在持续发力。商业飞轮一旦转动起来，就会越转越快，行业格局就逐渐固化。OpenAI、Anthropic、智谱等都在尝试构建这样的飞轮。

国产模型厂商是否被低估

很长一段时间，因为DeepSeek效应掀起的全球热，一度让市场唱衰AI 六小龙的声音不绝于耳。在DeepSeek强模型能力下，B端反哺C端，可谓名利双收。市场上一度只认DeepSeek，其他模型厂商纷纷调整策略，有的放弃了基座模型研究，开始转向垂类模型，专注落地效果。

尽管摆脱了DeepSeek阴影的几家独立基座模型厂商，估值较上一轮融资均显著提升，但与美国模型厂商的估值逻辑相比，仍存在巨大差距。

美国第一梯队模型厂商OpenAI的估值已达到5000亿美元，也是全球估值最高的AI公司，Anthropic最新估值3500亿美元。相比之下，国内第一梯队的三家模型厂商估值均不及OpenAI 的1/100，Anthropic的1/50。

今年以来，两大巨头的融资节奏非常夸张。纵向对比融资结果，Anthropic估值增速最快，最新估值相比今年3月的615亿美元，暴涨了近6倍。而OpenAI 的估值相比今年4月时估值，也增加了2000亿美元。

很大一部分原因，是他们捆绑了三方资本、算力公司形成的强“AI联盟”，资金在内部形成了“闭环”。比如今年11月，Anthropic和英伟达、微软签订一笔150亿美元融资协议，Anthropic获得巨额资金的同时，作为回报，承诺从微软购买价值300亿美元的Azure算力，这些算力又要完全运行在英伟达的AI系统之上。

国内模型公司被低估的原因可能较为复杂。中国融资环境复杂，国内创投机构因为自身的融资困难，并不是很有耐心，一些大模型的投资人都希望隔轮退，早点套现。相比模型公司，他们更喜欢AI硬件这类偏向应用的领域，因为有收入和买单方，更容易退出。

国内外资本的估值逻辑存在显著差异。OpenAI作为引领全球GPT浪潮并在AGI领域多次树立里程碑的公司，其全球影响力赋予了美国AI模型独特的叙事逻辑，估值已经超越了传统企业的评估框架。

根据OpenAI近期披露的财务数据，OpenAI在2025年上半年实现营收43亿美元，已超过去年全年总额，但净亏损达135亿美元。目前OpenAI的估值为5000亿美元，这种估值逻辑与国内主流的PE（市盈率）倍数体系完全不同。

这也意味着，硅谷的逻辑是将OpenAI视为未来全球公司的操作系统，而非传统的AI工具，享有全球操作系统的溢价。这个故事很大，谁掌握了操作系统，谁就掌握了未来的产业节奏。

而智谱在内的国内头部厂商的模型被视作效率产品，依然是按照传统的成本结构定价，忽略掉了模型厂商的自我迭代能力和复杂的国际因素。

比如，这家脱胎于清华大学知识工程实验室的独立模型公司，一直保持稳定的强更新能力。今年7月，智谱推出基座模型GLM4.5，首次在一个模型里原生融合了推理能力、编码和智能体能力。9月底上线的GLM4.6，在Coding能力上，与世界最顶级的模型Anthropic Claude Sonnet 4、GPT-5 并列全球盲测第一，展示了其在 SOTA 级别模型上的技术壁垒。

实际上中国的开源模型，也在加速参与AI定义全球叙事的可能。对许多想发展AI的第三方国家而言，中国开源模型更有优势。比如他们完全可以把国内模型部署在私有云上，不仅免费，而且数据可控、安全。

今年以来，智谱向“一带一路”沿线多个国家，包括越南、印尼、马来西亚、新加坡、阿联酋、沙特和肯尼亚等输出AI基础设施和技术支持，帮助他们构建自主可控的AI能力。也因此，智谱一度被OpenAI视为中国最大的“头号竞争对手”。

当然OpenAI的目的，表面看是为了给美国政府施压，最终还是为了争夺全球叙事能力，保持自身估值上涨的可持续性。

单纯从盈利能力上去评估中国模型厂商，显然会低估中国模型能力。中国模型凭借高性价比、高性能，借助海外主权国家将大模型发展延伸到产业和国家级基础设施的机会，理应完成一次估值框架的迁移。不过中国独立模型厂商想要争夺全球叙事，也需要更多的算力、资本全方位投入。

作为OpenAI在中国市场映射标的，智谱只要还留在牌桌上，收入规模化趋势依然在，就有机会像OpenAI一样，争夺更大的估值空间。

撰写｜柳嘉

编辑｜八尺

以上内容不代表本平台立场，仅供读者参考