徒手剥橘子干翻硅谷巨头:拆解中国机器人公司星动纪元的“最强大脑”
提到机器人界的天花板,大家脑子里往往会浮现出波士顿动力那台能熟练后空翻的机械狗,或者马斯克的擎天柱在舞台上走秀的画面。
但实际上让机器人翻跟头、解微积分,其实没那么难。真正能把一台造价几百万的机器人难倒的,往往是一个橘子,或者一只袜子。
在科技圈,对人类来说越下意识、越不用动脑子的事,对AI来说简直就是地狱难度。

剥个橘子,凭什么比解方程还难?
前Google的一位资深机器人专家Benjie Holson看不惯大家天天在网上发那些经过剪辑的“伪人视频”,于是干脆弄了个叫“Benjie’s Olympics”的真机比赛。这比赛被称为具身智能界的压力测试,因为规矩定得太不讲武德了。
比赛不比跑跳,专门考机器人干家务。而且是裸考:没有预设的完美环境,没有远程遥控,中途机器人要是抓空了,绝不能有工程师跑上去扶一把。
在这个被称为“Demo坟场”的考场上,最近爆出了一个大冷门。
来自中国的机器人初创公司星动纪元(创始人是清华的陈建宇),一举拿下了剥橘子、开锁和翻袜子的全球第一。

最核心的爆点在于,他们不仅拿了第一,而且正面锤爆了此前一直霸榜的硅谷明星公司——PI(Physical Intelligence)。PI可不是一般人,这家公司拿了贝索斯和OpenAI的钱,他们用的可是公认的全球最强闭源具身大脑。
星动纪元赢在哪?咱们来拆解一下这些地狱级考题。
比如剥橘子。橘子皮是软的,稍微一用力就会破,一打滑就会把果肉捏爆。PI的机器人完成这项任务花了2分46秒,而且还偷偷用了个外挂:削皮刀。星动纪元不仅没用工具,纯靠一双机械手硬剥,只用了1分47秒就干完了,速度快了35%。

再比如翻袜子。袜子形状是随机的。机器人不仅要盯着那团布料的形变,还得随时判断哪里是里面,哪里是开口。这考验的是机器人随机应变的眼力和手感。

星动纪元不仅做得快,最关键的是,他们只让AI看了120次人类示范的样本,就学会了这个动作;而硅谷的PI看了176次才学会。
这就好比师傅带徒弟。PI那个徒弟虽然名气大,但脑子有点轴,非得师傅手把手教176遍才会;星动纪元的徒弟悟性高,看了120遍就出师了。

为什么悟性这么高?大脑学会了边做边想
星动纪元的机器人凭什么手脚这么麻利?这得归功于他们给机器人装了一个会“边做边想”的脑子。
以前的大多数机器人干活,都有一个通病就是动作一顿一顿的。它们的流程是:看一眼屏幕 ➡️ 大脑算一下 ➡️ 伸一下手 ➡️ 再看一眼屏幕 ➡️ 发现偏了,大脑重新算 ➡️ 再调整手。这种串行操作,在应对那些随时会变形的软物体时,特别容易出岔子。
星动纪元的解法叫“异步推理”。简单来说,就是脑子和手分开跑,但配合默契。
机器人的手在撕第一块橘子皮的时候,它的大脑并没有闲着,而是已经提前把撕第二块皮的动作轨迹算好了。第一步干完,第二步的指令立刻无缝衔接。这就把以前那种烦人的延迟给磨平了,让机械手产生了一种接近人类的连续手感。

掀了马斯克的桌子:在“梦里”练武功
咱们把视线拉高一点,看看中美这几家头部公司,到底在用什么套路教机器人干活。
马斯克做Tesla Optimus,走的是“暴力美学”路线。他仗着有钱,雇了几千个真人,穿上动捕设备,像演电影一样去真实的车间里一遍遍做动作。机器人在旁边看着,硬生生把这些海量的数据背下来。这种办法管用,但太费钱了,而且换个工厂,可能又得重新教。
星动纪元的打法,更像是在搞意识流。
今年2月,星动纪元和斯坦福大学的Chelsea Finn团队(有意思的是,Chelsea Finn同时也是那个被锤爆的对手PI公司的创始人)合作,弄出了一个叫“Ctrl-World”的世界模型。这个模型后来还在权威评测里拿了全球第一。
世界模型是个啥?你可以把它理解为给机器人装了一个“脑内模拟器”。
星动纪元觉得,让造价昂贵的机器人在真实世界里一遍遍去试错、去摔坏盘子,成本太高了。有了世界模型,机器人可以在自己脑子里的虚拟空间中,把剥橘子可能遇到的几万种失误(比如手滑了、皮断了)全都在梦里演练一遍。
在梦里摔跤不花钱。等机器人在虚拟世界里练成了绝世高手,再把这套经验直接搬到现实的真机上。这也是为什么星动纪元能把那款自研的ERA-42具身模型训练得那么好,成为全球仅有的四家能精准控制全尺寸双足和五指灵巧手的公司之一(另外三家是特斯拉、英伟达和Figure)。
他们甚至搞出了一个叫VLAW的框架,让真实的动作数据和虚拟世界的演练形成了一个闭环。真机在外面受了挫折,把数据传回梦里;梦里分析出新的解法,再教给真机。这套左脚踩右脚上天的武功,确实把数据利用率压榨到了极致。

不吹牛了,下车间去打工吧
过去这一年,大家都看腻了那些在台上跳个舞、翻个跟头就跑去融资的机器人民工。投资人们现在变得极其势利:我不管你模型参数有几个亿,我就问你这玩意儿进厂能干活吗?
星动纪元在Benjie’s Olympics上死磕开锁和剥橘子,根本不是为了秀操作,这是在向资本市场和企业老板秀肌肉。你把开锁平移到工厂里,那就是汽车流水线上的高精度零部件对孔和打螺丝;你把剥橘子平移到物流仓库里,那就是易碎商品(比如鸡蛋、玻璃杯)的无损分拣。
这都是实打实能换成大额订单的场景。
事实上,星动纪元早就把他们的大脑模型派出去打工了。在物流、制造和商业服务场景里,部分任务的执行效率已经能达到人类的70%。

财富密码,往往藏在那些最脏、最累、最需要跨越物理摩擦力的蓝领车间里。从这次剥橘子的比赛来看,在这张桌子上,中国公司已经把筷子摆好了。
关注塔猴公众号,扫码下载塔猴APP,查看更多干货


