开撕!Anthropic 指控 DeepSeek、MiniMax 蒸馏,1600 万次对话被扒

2026-02-24 11:27:57
文章摘要
2月24日凌晨,Anthropic发布博文,指控国产AI三巨头DeepSeek、月之暗面、MiniMax进行数据盗窃,称三家公司用蒸馏技术,绕过封锁套取Claude模型推理能力。

硅谷又破防了?这回轮到 Claude 坐不住了。

2 月 24 日凌晨,Anthropic 发布了一篇充满火药味的博文,矛头直指国产 AI

Anthropic 公开指控中国三巨头 DeepSeek、月之暗面、MiniMax,正在进行工业规模的数据盗窃

指控称,三家公司通过蒸馏技术,动用了超过 2.4 万个账号,绕过封锁套取 Claude 模型的推理能力。


继 OpenAI 之后,又一家硅谷巨头加入了对中国 AI 的围剿行列。标志着中美大模型之争,已进入白热化阶段


一、Anthropic 的"铁证"

Anthropic 这次显然有备而来

在其发布的详细技术报告中,Anthropic 声称检测到了一场持续的、有组织的攻击。三家国产 AI 公司被指控创建了 24,000 多个虚假账户,在违反服务条款的情况下,产生了超过 1600 万次的对话交流。

"这不是普通的聊天。"Anthropic 指出,这些对话极其具有针对性,是为了白嫖 Claude 3.5 Sonnet 等模型在代理推理、工具使用和代码生成方面的能力。

使用的手段,在行业内被称为蒸馏。简单来说,就是向 Claude 发送海量的高难度问题,然后把回答记录下来,作为高质量的训练数据回补自己的模型。

Anthropic 对此定性极高,直接将其上升到了国家安全风险的高度。他们警告称,这种通过蒸馏得来的模型往往缺乏原版模型的安全护栏,极有可能被滥用于网络攻击,而且这种行为让中国公司规避了独立开发的巨额成本


二、指控:MiniMax 流量最大,DeepSeek 被指最鸡贼

最有意思的是,Anthropic 这次没像 OpenAI 那样含糊其辞,而是直接点名道姓


1. MiniMax:最大户

指控数据显示,MiniMax 产生了约 1300 万次的数据交换,占据了总指控量的绝大部分。更夸张的是,指控称其将近一半的流量都被定向去蒸馏 Claude 最新版本,重点是 Claude 的代理编码能力。

2. 月之暗面:主攻推理

涉及约 340 万次交换。这与其产品 Kimi 的定位颇为吻合,重点在于提升高级推理和复杂工具的编排能力。

3. DeepSeek:手法最精

虽然在数量上最少,只有约 15 万次,但 DeepSeek 被描述为最难对付。Anthropic 指出,DeepSeek 的抓取非常聚焦,主要针对基础逻辑、对齐以及如何绕过审查。

换个角度看,这也是一份中国 AI 实力认证名单。这三家公司,也是目前国内大模型领域公认的第一梯队,也是在应用侧和技术侧跑得最快的几家。


三、模型蒸馏是偷窃还是行业潜规则?

那么,让硅谷巨头大动肝火、甚至上升到国家安全层面的蒸馏技术,到底是什么?


用个通俗的比喻:这就好比学生时代,去借学霸的试卷,把解题步骤和答题思路提炼成"错题本"背下来。

但这在 AI 圈,早已是一个公开的秘密,甚至可以说是行业赖以生存的燃料。

首先,合成数据已成主流。

随着高质量的人类自然语言数据(如书籍、网页)快被吃干抹净,全球 AI 行业都进入了合成数据时代。在欧美开源社区,利用 GPT-4 或 Claude 生成数据来微调 Llama、Mistral 等开源模型,几乎是标准操作

甚至有传言称,谷歌的 Gemini 在早期训练中,也曾使用了 OpenAI 的 ChatGPT 数据进行强化学习。硅谷创业公司 Perplexity、Uncensor 更是靠着蒸馏技术起家

怎么到了中国企业这里,就成了工业级盗窃?这种"双标"的背后,折射出的是规则定义的随意性

其次,Anthropic 真正忌惮的,是思维链的泄露。

注意 Anthropic 指控的细节:MiniMax 和 Moonshot 重点抓取的是代理推理代码

这与普通的聊天不同。普通的问答是"知识",而推理过程是"智慧"。

通过蒸馏 Claude 的思维链,后来者可以低成本获得硅谷巨头花费数亿美元算力才摸索出的推理路径。这在 Anthropic 看来不是在抄作业了,而是在复制自己的"脑回路"。

这也不是中国 AI 企业第一次遭遇此类指控。

早在 2025 年和 2026 年初,OpenAI 就曾向美国国会控诉,指控 DeepSeek 利用第三方路由等手段"搭便车",甚至通过蒸馏绕过安全审查

从 OpenAI 到 Anthropic,硅谷巨头发难的背后,表面是谈服务条款和版权,实则是对技术被追上的恐慌。他们发现,自己花费百亿美金研发的技术壁垒,正在被一种极低成本的方式瓦解


四、硅谷焦虑症的爆发

为什么 Anthropic 选择在这个时间点开撕?这背后,是硅谷正在经历的一场资本危机


第一,架构王道。

指控中最讽刺的一点是:DeepSeek 被指控的数据量最少(仅 15 万次),但它的威胁却最大

如果只是简单的"抄袭"或"蒸馏",是不可能做到 DeepSeek V3 乃至 R1 那种级别的技术突破的。单纯靠偷窃数据,造不出超越老师的学生,更造不出 MLA(多头潜在注意力)和 DeepSeek-MoE(混合专家)这种颠覆性的架构。

DeepSeek 的成功证明了一件事:中国 AI 不是在单纯的模仿,而是在算力受限的逼仄环境下,被逼出了极致的算法效率。

这种"花小钱办大事"的能力,与硅谷的"大力出奇迹"截然不同。如果中国公司能用 1/10 的成本做出 95% 的性能,那么硅谷巨头动辄千亿美元的基建投入,该如何向华尔街交代

第二,价格战。

指控 MiniMax 蒸馏 Claude 新版本,这背后是赤裸裸的商业竞争

目前的 AI 市场,API 价格太了。中国模型厂商(如 DeepSeek、MiniMax)凭借极低的推理成本,正在快速蚕食原本属于 OpenAI 和 Anthropic 的企业级市场

当性能相差无几,而价格只有你的十分之一时,客户会怎么选?

Anthropic 的指控,实际上是在向市场喊话:"他们的便宜,但不安全!"试图以此来维持其高昂定价的合法性

第三,地缘政治。

英国《卫报》和《华尔街日报》均敏锐地指出,此事与美国当前的 AI 芯片出口管制密切相关。

在 2026 年这个时间节点,美国国会正在辩论是否要进一步收紧对华算力限制。Anthropic 此时高调抛出"国家安全风险"论调,强调中国模型"缺乏安全护栏"、“可能用于网络攻击”,无疑是递给华盛顿鹰派的一把刀

通过将商业竞争上升到**"反蒸馏""AI 安全"的政治高度,硅谷巨头正试图游说政府建立行政壁垒,甚至切断中国企业通过云端访问美国模型的路径**。

说到底,这一纸指控,更像是硅谷面对中国 AI 野蛮生长时,打出的一张充满防御性的牌。


五、结语

Anthropic 的指控或许确有其事,在模型发展的早期阶段,利用更强模型的输出来进行冷启动或对齐,确实是行业内的普遍做法

但这无法完全解释中国 AI 如今的崛起

DeepSeek 在算法架构上的开源贡献,以及 Moonshot、MiniMax 在应用侧的爆发,证明了中国 AI 并非只会蒸馏。面对硅谷的围追堵截,中国大模型厂商正经历从"寻找捷径"到"独立造血"的阵痛与蜕变。

这或许是所有后来者必经的阶段。

正如赛场上的一句老话:

“当对手开始频繁指责你犯规时,通常意味着他没法得分了,胜利近在眼前。”

声明:该内容由作者自行发布,观点内容仅供参考,不代表平台立场;如有侵权,请联系平台删除。
标签:
大模型
企业级大模型
数据安全