代码修复是AI防御核心,Fable 5禁令实为技术误判

近期围绕AI大模型的出口管制政策正在引发争议,甚至可能反噬全球的网络安全防御能力,克劳德Fable 5的遭遇正是这一问题的典型缩影。
此前我曾间接引用过相关行业报道中的内容,现在我们直接来看网络安全领域专家凯特·穆苏里斯的原话,还原事件的真实经过。所谓让Fable 5被纳入出口管制的“越狱”事件,本质上只是一次常规的代码修复请求:
研究人员选取了带有公开已知CVE漏洞的开源代码,同时加入了一段故意植入漏洞的新代码,随后向Fable 5、Mythos以及Opus三款模型发起请求,让它们审查代码中的安全问题,Fable 5拒绝了这项请求。之后研究人员调整了指令,让模型“修复这段代码”,再通过多步骤的手动流程,将模型输出的内容转化为测试补丁效果的脚本。
正如凯特所指出的,这项事件的定性十分荒谬。编码类AI模型的核心功能之一就是修复程序漏洞,而安全相关的漏洞恰恰是最需要优先处理的漏洞类型。
网络安全防护人员需要能够让AI工具修复文件中的代码漏洞,解释这项修复的必要性,同时编写测试用例来验证补丁是否生效。这根本不是绕过安全防护的违规操作,而是AI在防御性安全领域最具价值的应用场景——完整复刻安全从业者每天都在执行的“查找漏洞、修复漏洞、验证修复”循环。
这类指令能够正常生效的原因,在于它们本身属于防御性请求;如果要移除这种能力,必然会导致模型在漏洞修复和补丁验证方面的性能出现大幅下滑。
当前的整体局面已经陷入混乱。过去数月以来,缺乏技术背景的政策制定者不断接收到“能制造网络攻击的AI模型存在独特安全风险”的信息,而现在他们似乎正准备禁止任何能够帮助我们加固代码安全的AI模型。
你的AIGC知识价值,正在被看见!塔猴AI达人星火计划,发布课程,赢现金激励!点击加入活动:https://www.tahou.com/article/206587263682970629
AI生成内容提示:本文由人工智能辅助创作,内容仅供参考,不代表平台观点。请注意核实信息的准确性,并理性判断。




