“龙虾三兄弟”开始“干活”,传统软件的“开机/点击”模式宣告退场!
人工智能的浪潮正在以一种比我们想象中更具颠覆性的方式重塑技术生态。如果说早期的ChatGPT解决了“信息检索”问题,那么近期以OpenClaw框架为代表的AI Agent的爆发,以及腾讯、荣耀等巨头对“执行力”的集体押注,则清晰地指向了下一个目标——AI开始“干活”,直接操作软件和系统。
这与英伟达CEO黄仁勋提出的“AI五层蛋糕”理论形成了完美的呼应:应用层(第五层)的变革,正在以前所未有的力度反向驱动底层基础设施(能源、芯片、数据中心)的重构。当AI不再是“回答问题的工具”,而是“执行任务的员工”时,过去二十年软件行业基于GUI(图形用户界面)建立的一切交互逻辑都将面临结构性瓦解的风险。
我们正从“用户-软件”的直接交互时代,快速过渡到“用户意图-AI Agent-工具调用”的间接执行时代。这种转变的本质,是软件行业的“去界面化”。传统软件的护城河正在被侵蚀,新的竞争焦点将是谁能掌握Agent的“操作系统入口”和“业务执行规范”。
一、Agent的崛起:从“聊天”到“行动”的跨越
1.1 “龙虾”效应:开源工具的病毒式扩散
OpenClaw(龙虾)框架的意外走红,并非偶然的技术事件,而是市场对“AI执行力”的集体渴望的集中爆发。它让AI第一次具备了系统权限调用能力,将潜力从“文本生成”拓展到了“实际操作”。尽管OpenClaw本身安全风险巨大(如媒体披露的公网暴露),但其在GitHub的爆炸性热度,证明了开发者和科技公司对“AI能干活”的强烈需求。腾讯WorkBuddy、智谱AutoClaw、字节ArkClaw,乃至英伟达的企业级NemoClaw,都证实了Agent技术栈正在从社区实验快速升温至产业竞争的焦点。
1.2 巨头战略转向:入口即控制权
各大科技公司(腾讯、阿里、字节、英伟达)的动作高度一致:不搞独立的AI应用,而是将Agent能力原生嵌入到用户最高频的入口(微信、企业微信、飞书、IDE)。这清晰地展示了Agent时代的新平台逻辑。在移动互联网时代,入口是App Store和微信;在Agent时代,入口就是“意图表达的窗口”。谁能让用户在日常沟通中(聊天窗口)直接表达需求,并让AI自动完成跨软件的复杂链条(打车、报销、代码提交),谁就掌握了下一代操作系统的控制权。这种“嵌入式执行”极大地提高了用户的平台切换成本。
二、底层重构:黄仁勋的“五层蛋糕”与AI的工程化基石
AI Agent的全面落地,不再是模型层面的竞争,而是对整个计算基础设施的“再设计”。
2.1 能源与芯片:智能生产的“硬约束”
黄仁勋将AI比作基础设施,并将其最底层定位于能源。实时生成智能需要实时的、大规模的电力供应。每一个Agent的复杂调用(如调用Playwright进行E2E测试、调用GitHub进行代码推送),都会消耗大量的推理算力。这直接驱动了对高能效比芯片(如NVIDIA的下一代架构)和数据中心散热技术的投入。应用层的爆发,正以万亿美元级的投资规模,反向拉动底层能源和芯片的升级。
2.2 MCP与Skills:工程化的“知识注入”与“行为规范”
如果AI Agent是执行者,那么MCP就是其连接外部世界的“标准化接口”,Skills/Rules则是其遵循的“企业SOP”。
传统软件的接口是死的,而MCP(Model Context Protocol)让AI能够安全、动态地访问这些接口。例如:
- Context7 MCP 确保Agent在写配置时,获取的是最新的官方API文档,防止因知识过期导致的系统故障。
- GitHub MCP 允许AI直接管理PR和Issue,将Agent嵌入到DevOps流程中。
Skills(如code-reviewer、cache-components)的意义在于将人类专家的经验“代码化”并“封装”。这解决了AI代码的可维护性和企业规范遵循性问题。一个没有经过Skills和Rules约束的Agent,生成代码的质量将不可控,这与我们看到的安全漏洞(如OpenClaw)的本质风险是一致的——缺乏外部规范和隔离*。

三、软件结构的颠覆:从“点击操作”到“意图驱动”
AI Agent最深刻的影响,是对软件使用模式的彻底颠覆。
3.1 软件的“去界面化”趋势
过去二十年,软件的价值在于其GUI——用户需要学习菜单、按钮和工作流。但在Agent模式下,用户只需要表达意图:“帮我完成季度预算分析,并生成PPT初稿”。荣耀推出的“一键养虾”功能,演示的正是这种意图驱动的跨端操作。AI Agent自动调用Excel(读取数据)、调用文档工具(生成报告)、调用通讯工具(分发)。软件不再是用户需要打开的界面,而是Agent可以调用的“能力模块”。
3.2 谁是赢家?新平台的诞生与旧平台的淘汰
如果Agent成为主流,那些无法提供标准API或缺乏Agent友好接口的传统软件,将逐渐沦为AI调用的“后台服务”。
这将加速软件行业的洗牌。那些能率先将核心功能转化为标准、安全、细粒度权限控制的API(即成为优秀的MCP Server)的企业,将获得新的生态控制权。那些固守老旧GUI交互模式,缺乏Agent接入能力的公司,将面临被“流程替代”的风险。
3.3 知识固化:Agent时代的Code Review升级
以code-reviewer Skill为例,AI现在可以自动检查代码正确性、效率和安全规范。这要求开发者必须将团队的隐性编码标准转化为显性的Rules。这种自动化审查,极大压缩了人工Code Review的时间,使得开发者可以将精力投入到更具创造性的**“规格设计”上。只有定义好“做什么”,AI才能高效地完成“怎么做”。

四、区域竞争与消费者的角色定位
4.1 中美AI的“不同轨”发展
a16z榜单显示,全球AI消费市场分裂为以欧美(侧重专业工具/企业级应用)和中国(侧重移动端/视频/本地化Agent)为代表的独立生态。像DeepSeek这样能跨越生态获得全球流量的产品是少数。这再次强调了“本地化Agent生态”建设的重要性。对于中国企业而言,建立符合本土监管和用户习惯的Agent基础设施,是规避地缘政治风险、确保市场持续增长的关键。
4.2 消费者的进化:从用户到“Agent训练师”
我们从Copilot/Cursor/Claude的实验中得出一个结论:AI工具需要开发者具备“驾驭能力”。消费者也将面临同样的进化压力。那些只依赖AI而不深入学习代码和逻辑的开发者,将仅仅成为“AI的快速执行者”,而无法理解和防御AI可能带来的风险(如SQL注入)。未来的核心竞争力,是将AI生成物转化为“人类可控”的最终产品。
结语
AI Agent的浪潮不是昙花一现,它是对传统软件逻辑的根本性挑战。黄仁勋所描绘的“五层蛋糕”正被应用层的颠覆所重塑。我们不再为“模型能力”付费,而是为“安全执行能力”和“领域知识的固化能力”买单。
对于每一个IT组织而言,现在不是等待下一个模型升级,而是立即着手构建自己的“AI原生协作体系”:标准化工具接入、沉淀业务规范,并重新定位人类开发者的角色——从代码的编写者,转变为AIAgent的架构师、安全审查员和终极意图定义者。只有这样,我们才能确保效率的提升,不会以系统崩溃或安全危机为代价。

