国产AI龙虾大乱斗：谁在真干活，谁在制造电子垃圾？

我真的没招了

2026-04-16 17:46:40

智能体（Agent）

AI工具

开源大模型

云端部署

文章摘要

过去三月，AIAgent爆火，腾讯、智谱等厂商推出“龙虾”程序，资本市场也十分活跃。

过去三个月，AI Agent可以说是科技圈里最硬的通货了。先是OpenClaw开源后迅速爆火，紧接着腾讯的 WorkBuddy、智谱的 AutoClaw、字节的 ArkClaw也纷纷跟进。这批能替人操作电脑的程序，被大家起了个外号叫“龙虾”。资本市场也没闲着——相关概念股一度冲上了历史新高。但说实话，热闹归热闹，如果你真拿这些龙虾去干点像样的活儿，结果往往是一地鸡毛。有的虾报错报到你头皮发麻，有的虾碰到复杂任务直接死机。热热闹闹是厂商的，空空荡荡是打工人的。在这个节骨眼上，我们决定做一次深度横评，看看到底谁是真能帮你摸鱼，谁又只是浪费显存的电子垃圾。

安装门槛

别被命令行吓跑了——到底谁才是真正能开箱即用的？OpenClaw最大的痛点就是安装。在GitHub上，你得自己配 Python环境、手动装几百个依赖包、再跟各种权限报错斗智斗勇。对从来没写过代码的人来说，这门槛高得离谱。现在市面上这波国产“龙虾”，最大的功劳就是把这一堆磨人的配置麻烦，给你打包收拾得干干净净。

▲图源：钛媒体

云端版：大多都做到了真正的开箱即用。你完全可以把它当成一个网页版的对话框来用，不需要在自己电脑里塞一堆乱七八糟的运行环境，登录上去就能直连云端跑任务。这对新手来说非常友好。

本地版：就是那种需要下载安装包的版本。只要你会从官网下载安装程序，基本就没什么难度。但还是得提醒一句：别总觉得“本地部署”就等于真正拿捏了AI。实际用下来，本地版太吃硬件环境了。万一哪天你家网络抽风，或者电脑自己休眠了，你跑到一半的定时任务直接全废。除非你家里有闲置的服务器或者高配机器，否则对大多数人来说，想真正“摸鱼”，云端版才是更靠谱的选择。

其实只要一个工具还需要你折腾几个小时的参数才能跑通，那它就别谈什么赋能打工人了。国产厂商现在把安装过程简化，其实是把复杂的工程环境打包成了一个产品。但记住，能装上，仅仅意味着你拿到了入场券，后面能不能干活，才是真正考验模型智力的时候。

干活能力

别被宣传词骗了。我们想看看到底谁是真的能独立干活的。于是拿了10款龙虾产品，从定时日报到网页自动化，挨个儿拉出来遛了遛。考核标准就一条：一次跑对，别让我反复给它擦屁股。结果还挺打脸的。如果你的需求是一次做对，这10款产品里，上来就能筛掉一半。报错的原因也都很真实：有的因为缺环境依赖跑不起来，有的遇到API超时，最离谱的直接在任务中途就崩了。稳定性上，云端虾在做定时任务交付时，明显比本地虾稳得多。本地虾一旦断网或者被电脑的电源管理干掉，任务链当场就断了。

▲图源：钛媒体

我们让它们都生成一份卡通风格的个人简介。表现最亮眼的是阿里的JVS Claw，它直接调用了专门的生图API，一次就生成了一张完全符合风格要求的图片，整个逻辑很顺畅。弱一些的，要么给你甩一堆看不懂的提示词文本，要么生成的图片画风跑偏，甚至偏离了主题。

为什么不同龙虾的脑子差这么多？很多人以为是UI的差距，但真正的核心是底层模型的智能程度和Skill库的深度。那些花里胡哨的龙虾，在面对需要多步逻辑推理的任务时，经常表现得又笨又努力——疯狂报错，但又死活不去改自己的代码。真正聪明的模型，会在出错后自己去纠正。比如爬虫抓取失败，它会尝试换条逻辑路径，而不是在原地反复撞墙。你买个产品，还得一直盯着它、给它改作业，那它就不是帮你摸鱼，而是给你增加工作量，让你变成它的专职修理工。

生态进化

别被那些花里胡哨的技能商店骗了——有些其实就是没牙的龙虾，光有壳没真钳子。很多人觉得买个龙虾回来就能变成钢铁侠的贾维斯。但老用户都懂，你拿到手的可能就是个空壳子。这东西的上限，全看它的牙口，也就是Skill。

Skill的本质是流程固化。当你有一堆重复性的工作——比如每天回邮件、爬实时行情——其实你就是在干一件极其枯燥的事。把这些工作流做成AI能调用的Skill，才是真正帮你省力的地方。

▲图源：钛媒体

智谱的AutoClaw表现还可以，定位预装技能挺准的。但腾讯的QClaw和Minimax的MaxClaw就有点让人摸不着头脑了。我问它们怎么用Skill，结果连对标OpenClaw的产品都找不到，反而直接去搜了公司名。这种回答，在真实的办公场景里根本没法用。百度的DuClaw有个审核逻辑让人捏把汗。有的产品是你装上插件之后才提示你不安全——这种事后提醒，对用户来说完全没用。如果一个Agent平台连入库的技能都审核不好，那它就是只没牙的龙虾。

总结一下，一个真正的Skill生态，应该有三个核心要素：创建：让你能按需自己DIY发现：不用你自己翻文档到处找以及最重要的，审核：如果没有完善的安全审计，那你基本就是在给自己的电脑请木马了。

如果非要选，到底谁能入场？

测完这10款产品，差距已经大得肉眼可见了。如果你追求云端部署的稳定性，不想在本地环境上浪费脑细胞，那阿里云的JVS Claw目前在兼容性和任务成功率上，算是比较能用的一个选项。如果你非要本地跑，智谱的AutoClaw在处理复杂逻辑任务（比如日报汇总）时，表现相对扎实，报错率比大多数产品都低不少。

至于剩下的那些，要么还在吭哧吭哧填自己的坑，要么就是纯蹭热度的。有一点你得记住：别信什么杀手级产品的神话。这领域技术迭代太快了。今天好用的东西，下周可能就因为开源框架的一个补丁，直接被甩在后面。

我的建议很实在：选那个报错率最低的、能真正把你从日报、邮件、Excel统计这些破事里解放出来的。如果一个产品动不动就给你弹一堆错误码，别犹豫，赶紧删了。别让它占着你电脑的空间，那只会浪费你的算力，还影响心情。

以上内容不代表本平台立场，仅供读者参考