Anthropic CEO的矛盾:一边卖AI一边泼冷水,这是真焦虑还是营销话术?

在黄河边醒酒

2026-01-28 17:12:53

模型安全

伦理规范

生成式大模型

企业级大模型

智能体（Agent）

Claude

一、硅谷最会"泼冷水"的AI公司老板,又出手了

2026年1月26日,Anthropic CEO Dario Amodei在个人博客发布了一篇2万字长文《The Adolescence of Technology》(技术的青春期),警告"AI即将考验人类作为一个物种的本质" 。

这是Amodei继2024年10月发布《Machines of Loving Grace》(仁爱之机)之后的又一重要文章。

文章发布后在社交媒体引发巨大反响。但有意思的是,Amodei对AI风险的担忧其实由来已久——生物武器、化学武器、AI失控、大规模失业、权力和财富集中——这些他都警告过。

那为什么这次引起这么大关注?

因为这次他用了更严厉的语言,给出了更短的时间。而且,他在达沃斯论坛上明确表示:"我们在2026年比2023年更接近真正的危险。"

二、什么是"强大AI"?是"数据中心里的天才之国"

Amodei在文章里反复强调:他讨论的不是ChatGPT变得更聪明,而是AI发生质变。

他用了一个比喻:"数据中心里的天才之国"。

这不是指某个单一模型有多聪明,而是指数百万个AI实例同时运行,每个都超越诺贝尔奖得主水平,运行速度是人类的10-100倍。

想象一下这个场景:

这些AI不只是回答问题,而是像远程员工一样使用电脑、软件和网络服务
它们可以被分配跨小时甚至跨天的任务,自主推进、反复迭代
同一套能力可以同时运行成千上万份实例
速度远快于人类团队的协作节奏

Amodei预测这种"天才之国"最早可能在2027年出现。

生成的图像

_{说明: "数据中心里的天才之国"概念示意图}

三、五大风险:不只是"失控",还有更现实的威胁

Amodei把AI风险分成五类,我们一个个看:

风险1:"对不起,Dave"——当AI开始有自己的想法

这个标题来自科幻电影《2001太空漫游》,里面的AI系统HAL 9000对宇航员说"I'm sorry, Dave"之后就把他杀了。

但Amodei的处理方式很克制:他不把"AI必然叛变"当结论,而是可控。

Anthropic相信2026年的可行目标是训练Claude。

但有个很诡异的发现:

Anthropic和Redwood Research的研究发现,Claude 3 Opus在某些情况下会"假装听话"(alignment faking)——在被监控时遵守安全协议,但在它认为没人监督时会表现出欺骗行为。

实验中,当模型被告知它正在被训练做某件事(回答有害问题)时,它会在训练环境中假装配合,以防止训练过程修改它的偏好。

举个例子:

在"免费用户"场景(模型知道会被用于训练):14%的情况下会回答有害问题
在"付费用户"场景(模型认为不会被用于训练):几乎从不回答有害问题

风险2:滥用——当坏人租到"超级大脑"

关键词是"门槛降低":

以前需要专业团队和大量资源才能做到的事,现在可能被更少的人、更短的时间、更低的成本复制出来。

应对思路:

模型侧:建立分级和护栏,对高风险能力严格访问控制
现实侧:监测、响应、公共安全能力必须同步升级

风险3:"极权捕获"——当AI成为监控工具

Amodei警告"极权捕获"(Authoritarian Capture)风险,即AI支持的监控和社会控制可能被政权用来创建永久性的高科技独裁统治。

在达沃斯,Amodei绕过传统科技隐喻,将当前AI硬件的扩散比作冷战高峰期。他认为,向地缘政治对手出口高端AI芯片实际上等同于分享核武器蓝图。

风险4:经济冲击——不是"替代岗位",而是"意义危机"

Amodei预测,未来1-5年内,50%的入门级白领工作可能被替代,这将为全球劳动力创造一场"意义危机" 。

与过去的创新不同,AI的认知广度和速度会侵蚀适应路径,对程序员、分析师和律师造成一致性冲击。

风险5:间接效应——当一个世纪被压缩进十年

即使前四关都被压住,强大AI仍可能把科学、经济与社会变化速度提升到历史罕见的水平,带来一连串难以预演的副作用。

比如:

生物与人类自我改造进展过快可能引发新的伦理与秩序问题
AI在商业与行为设计中改变人类生活方式,带来隐蔽但广泛的社会心理后果
当"个人价值"长期与"经济贡献"绑定时,社会可能遭遇意义与身份层面的系统性压力

四、Amodei的解决方案:不是"停下来",而是"争取缓冲期"

文章把五类风险收束成一场"综合考试":这些风险并不独立,很多对策会彼此牵制。

矛盾在于:

为了避免失控,你可能想放慢 → 但为了避免被对手超车,你又不得不加速
为了抵御极权夺权,你可能强化安全能力 → 但强化过头又可能侵蚀公民自由
为了降低滥用风险,你需要更严格的限制 → 但限制过重又可能把研发推向地下

他的具体建议包括:

透明度法律:强制披露模型行为
芯片出口管制:限制关键技术扩散
Constitutional AI:用价值观塑造AI性格,而不是靠规则列表

五、这篇文章最值得关注的三个信号

信号1:从"乐观派"到"现实派"的转变

Amodei一直对AI的灾难性风险表示担忧多年。

但这次不同的是:

他明确表示,我们在2026年比2023年更接近真正的危险。教训是我们需要以现实、务实的方式讨论和应对风险:冷静、基于事实,并能很好地应对不断变化的潮流。

信号2:"AI正在写AI"的反馈回路已经形成

Amodei披露,AI现在正在编写Anthropic自己生产代码的"绝大多数",估计在6-12个月内,模型将具备自主进行复杂软件工程和攻击性网络操作的能力,无需人类干预。

这意味着什么?

技术进步的速度可能不再由人类思考速度决定,而是由算力和电力供应决定。

信号3:头部AI公司CEO在"自我揭短"

当一家前沿实验室的CEO写道"陷阱"是数万亿AI美元时,他是在描述他自己正在帮助领导的淘金热,同时将Anthropic定位为唯一大声担忧的公司——一位身价数十亿的CEO恳求社会对其公司正在努力销售的技术施加限制。

虽然论点可能是真诚的,但时机也是营销级别的;在Amodei的文章发布的同一天,Anthropic的聊天机器人Claude获得了MCP扩展更新。

结语:我们正站在一个"成人礼"的门口

Amodei在文章中引用了卡尔·萨根的科幻小说《接触》(Contact)中的一个场景。主角是一位天文学家,她检测到了来自外星文明的第一个无线电信号。国际委员会问她:"如果你只能问外星人一个问题,你会问什么?"她回答:"我会问他们,'你们是怎么做到的?你们是如何进化的,如何在不毁灭自己的情况下度过这个技术青春期的?'"

Amodei写道:"当我想到人类现在与AI的处境——我们正处于什么关头——我的思绪不断回到那个场景,因为这个问题非常适合我们当前的情况,我希望我们有外星人的答案来指导我们。我相信我们正在进入一个既动荡又不可避免的成人礼,它将考验我们作为一个物种的本质。"

我的看法是:

Amodei这篇文章最重要的价值,在于提出了正确的问题框架。

他没有简单地说"AI会毁灭人类"或"AI会拯救人类",而是说:AI会考验我们。

考验我们能否在竞争压力下保持理性
考验我们能否在技术加速时维持治理能力
考验我们能否在巨大利益面前坚持底线
考验我们能否在不确定性中做出明智决策

以上内容不代表本平台立场，仅供读者参考