微软重构 Copilot 架构:GPT 写稿 Claude 审稿,破解 AI 幻觉难题
AI圈的“忠诚”逻辑失效了。3月30日,微软在Microsoft 365 Copilot中上线了“深度研究”功能,但这背后藏着一个耐人寻味的信号:GPT不再是微软Copilot唯一的发动机。GPT负责写初稿,Claude负责审稿,两家竞争对手的模型被微软强行锁在同一个工作流里。这不仅是简单的API拼接,更是一次对AI幻觉(错误)的系统级治理。在企业级办公场景,单一模型“既当运动员又当裁判”的时代,或许真的结束了。
微软愿意在Copilot中引入这种“双模型协同”架构,说明他们对AI驱动的“从头生成”能力,已经从单纯的尝鲜转变成了对可靠性的极致追求。这不仅仅是一次功能更新,而是AI产业从“比拼模型能力”向“比拼模型编排与协同效率”转向的标志性事件。


架构重构
微软这次推出的Critique功能,架构设计并不复杂,但逻辑极度致命:GPT生成内容,Claude负责审核。这不仅是调用逻辑的改变,而是一套明确的“生成+审查”工业流水线。
研究助理Researcher这一功能的变动,本质上是微软对模型幻觉的一次“外科手术式”拆解。我们很清楚GPT的优缺点:GPT擅长的是广度规划和初稿的快速生成,它像一个充满激情的写作者,但容易在事实细节上“过度自信。Claude的性格则不同,它以逻辑严密和审慎著称,非常适合担任“挑刺”角色。
微软通过这套架构,强行把“生成”与“评估”拆开。Claude会对初稿进行逐条审核,重点看:事实引证是否权威、逻辑是否跳跃、引证质量是否合格。这种将人类学术界运行了数百年的“同行评审”制度,通过算法硬编码进AI系统的做法,是治理AI幻觉最务实的解法。
微软援引了DRACO基准测试,声称这种“双模型协同”架构在深度研究的准确性、完整性和广度上,均优于单一架构产品。DRACO本身由Perplexity与学术界在2026年2月推出,包含10个领域、100项复杂任务。根据微软的说法,Critique系统在核心维度上实现了统计学意义上的显著提升,特别是在逻辑分析深度和引证准确性上,表现出压倒性的优势。

这个结果在意料之中。与其逼着单一模型通过RLHF去强行对齐所有逻辑,不如给它配一个性格互补的“审查员”。这种“对立统一”的协作逻辑,比单一模型的自我迭代要可靠得多。在企业级生产力工具中,我们需要的是结果的确定性,这种确定性目前只能由不同模型的对立制衡来提供。

权力的博弈
微软与OpenAI:从独家绑定到“牌桌重构”
微软这套组合拳背后,藏着极为精明的战略考量。它不仅是对OpenAI的某种“去中心化”,更是对整个AI供应链话语权的重新分配。
不再独宠OpenAI,2025年OpenAI重组为公共利益公司后,微软虽然持有27%股份,但独占权已失。2025年11月,微软与Anthropic、英伟达达成深度合作,不仅注资,更让Claude正式入驻Azure。微软CEO纳德拉在内部曾直言不讳地指出,Copilot早期的产品表现“不够智能”。当OpenAI不再是唯一的选择,将Claude这种逻辑严密的模型纳入生态,成了微软提升企业级Copilot产品力的必选项。
微软现在的意图很明显:无论谁赢,流量和生态都在我手里。Critique和Council功能的推出,标志着AI市场正式进入“模型超市”时代。企业用户不必再为选择哪个模型而纠结,微软的底层编排引擎会根据任务特征,自动调度GPT和Claude的优势组合。这种逻辑的深层含义是,模型能力正在向“通用原材料”属性回归。一旦模型沦为原材料,那么真正的护城河就变成了:谁掌握了编排标准,谁掌握了工作流集成,谁就是真正的平台。

落地边界
为什么医疗与法律场景更需要“AI互审”?
目前Critique功能优先向“Frontier计划”的企业客户开放,这背后是微软对应用场景边界的精准划分。

▲来源:新智元
避开C端,主攻B端决策
并不是所有场景都需要两个模型对撞。微软将这一架构优先部署在深度研究、法律文档起草、投研分析等“容错率极低”的场景。法律合同处理:在法律文书中,逻辑推演的细微偏差就是合同漏洞。医学研究:通过GPT生成综述,由Claude审查引证质量,这种“双保险”极大降低了AI“一本正经胡说八道”的风险。

▲来源:新智元
独立审查机制的不可替代性
依靠模型自身的RLHF(人类反馈强化学习)来对齐,本质上是模型在尝试自我纠错。而微软引入独立模型作为审核员,提供的是一种架构层面的纠错。这比让模型“既当运动员又当裁判”要可靠得多,因为它是在执行不同的逻辑范式。微软这一步棋,对国内AI产业有很强的参考意义。我们还在纠结“哪个模型跑分高”时,微软已经开始卷“模型如何编排”。对于AI制药、法律科技等国内高壁垒行业来说,构建一套高效的多模型调度体系,可能比单一模型研发更能触及商业落地的核心。
关注塔猴公众号,扫码下载塔猴APP,查看更多干货

扫码加入官方社群


