豆包被封、苹果延期、小米封测:AI手机助手为什么还没人做成
AI手机助手已经是手机厂商押注最重的方向。但这件事卡住了,因为每往前走一步,就要踩上某个人的利益。
2025年12月,努比亚M153开售。这台搭载豆包手机助手的工程样机,3499元,首批3万台24小时售罄,闲鱼价格炒到3.6万。跨平台比价、自动整理行程、批量处理消息,几乎覆盖手机日常使用的全场景。科技圈的评价是:第一次真正看到了AI手机的未来。

发售第二天,微信封了它。淘宝封了它。支付宝、美团、拼多多、农业银行、建设银行跟着封。从发布到核心功能大幅缩水,不到两周。
同期,苹果在WWDC把Apple Intelligence称为"iPhone历史上最重要的更新"。发布18个月后,真正落地的只有写作润色和表情包生成。新Siri内部测试只能正确处理67%到80%的用户请求,每三到五次就有一次失败。苹果AI负责人在内部全员会上把延期称为"丑陋和尴尬"。

3月6日,小米miclaw开启封测。官方提醒用户提前备份数据。只支持小米17系列五款机型。

三件事放在一起,描述的是同一个困境。
AI到底想对手机做什么
先说清楚AI手机助手真正想做的事。
用户说一句话:"帮我订明天去上海最便宜的机票,顺便把行程发给我妈,再把我的日程清一下。"AI自动跨越携程、12306、微信、日历,完成全流程,不需要用户打开任何一个App。
这件事的核心是:在用户和App之间插入一个统一的调度层。用户只和AI说话,AI替用户操作所有App。
技术路径上,各家选的方向不同。豆包选的是GUI Agent——模拟人的视觉,"看"屏幕,模拟手指点击,不需要任何App配合,什么都能操作。苹果走的是App Intents框架,让App主动声明"我能做什么",Siri按需调用,不触碰风控红线,但每个App都要单独接入。谷歌在Android里嵌Gemini,screen understanding准确度从上一代的11.4%提升到72.7%,AI读懂手机屏幕的能力发生了跃迁,但同样面对第三方App不开放接口的问题。小米miclaw以系统应用身份运行,通过官方接口调用50多个系统级工具,不模拟人类操作,直接调用系统能力。
四条路线,争的是同一件事:谁来当那个调度层。
豆包败在哪里
豆包被封杀,表面原因是技术路径,深层原因是身份。
技术层面,豆包依赖INJECT_EVENTS权限和无障碍权限模拟点击。这两个权限在银行App和微信的风控体系里,和外挂、黑灰产用的权限一模一样。用于账号批量注册、秒抢任务脚本、自动化支付流程,调用的是同一个接口。微信服务协议明确禁止通过第三方软件进行自动化操作,豆包触发的是这条协议里写明的风控机制。
但技术是可以改的,真正无法绕过的是另一件事。
豆包没有自己的手机。它的系统级权限是努比亚在硬件层面让渡给它的,不是天然属于它的。借来的权限,随时可以被收回、被限制、被绕过。字节是软件巨头,努比亚是边缘硬件厂商,双方的合作从第一天起就充满了权限边界、品牌协同、利益分配的博弈。在别人的地盘上建房子,地基从来不是你的。
但技术只是表面原因。豆包真正动了谁的蛋糕,才是它被联手封杀的根本。用户对豆包说"帮我点一杯最便宜的瑞幸",豆包自己决定打开哪个平台、选哪家店、走哪条流程。美团从商业帝国退化成了数据库和物流接口,看不到用户,拿不到行为数据,收不到广告费。预装费用、应用商店推广位、负一屏广告,都是App为了被用户看到而付的钱。AI绕过这些入口,平台依赖信息不对称赚取的利润空间被直接压缩。

这不是某一家大厂的私心,是整个生态的免疫反应。华为、小米、OPPO、vivo、荣耀全部接入了第三方大模型,但没有一家复制豆包的跨应用模式。当前生态已经形成了一个均衡:AI可以变聪明,但不能抢入口。
腾讯刘炽平在2025年三季报电话会上把这个均衡说得很直接:理想状态下,微信未来会在自身生态内推出AI智能体,在微信里帮用户完成各种任务。不反对AI助手,反对别人来当这个助手。
MCP能打破这个僵局吗
豆包的路线被堵死了,但还有另一条路在被讨论:让App主动开放接口,AI按需调用,不需要模拟人类点击,不触碰风控。
MCP协议就是这个思路的标准化尝试。Anthropic推出,微软、谷歌、Meta接入,已捐赠给Linux基金会,不属于任何一家公司。逻辑很清楚:App告诉AI"我能做什么",AI需要的时候直接调用,双方各取所需,不存在谁闯谁的门的问题。阿里、字节、腾讯的工程团队都在用它作为AI系统的互联方式。
问题在于,MCP要真正落地,需要微信、淘宝、美团把后台接口开放出来。开放意味着什么?意味着AI可以绕过它们的界面直接完成用户需求,用户不再需要打开App,广告没人看,推荐没机会展示,平台费心经营的流量入口被架空。
所以更可能发生的剧本是:超级App会主动推出受控的API开放框架,表面上是响应MCP标准,实际上是按自己的节奏和条件决定开放哪些能力、屏蔽哪些能力。合规接入替代被动调用,主动权还在它们手里。
高盛的报告把这个困境总结成三个障碍:系统级操作权限、系统级记忆能力、跨应用接口连接。三者目前都掌握在各自超级App手里。技术上解决这三个问题并不难,商业上打通它们,没有现成的答案。
小米选了一条能走通的路
miclaw和豆包,表面上都是AI手机助手,底层是完全不同的两件事。
miclaw技术文档里有一句话说得很准:运行在应用沙箱内的AI,无论模型多强,主要能做的事就是回答问题和联网搜索。系统级AI不一样,它能提供系统级的操控。豆包是第三方软件冒充用户在操作,miclaw是操作系统的一部分,用自己家的钥匙开自己家的门。超级App的风控系统针对的是异常操作行为,miclaw的操作在系统层面完全合法,因为小米就是这部手机的制造者。
但miclaw现在还不能调用微信、淘宝、美团。它的能力范围是清晰的:50多个系统级工具、米家10亿台IoT设备、人车家全生态。这是小米本来就有的地盘,不需要闯别人的门。云厂商看到的不是威胁,是一个每次执行任务都在消耗token的客户。腾讯云、阿里云抢着接入,逻辑很简单:miclaw跑起来,账单就往上涨。
官方提醒封测用户提前备份数据,只支持小米17系列。一个需要备份数据才敢装的AI助手,距离"接管你的手机"还有距离。
这是现在能走通的路:在自己的院子里先跑起来,不主动碰那条生死线。但院子再大,也有边界。
那扇门
AI手机助手最有价值的那个能力:跨越所有App、替用户统一调度至今没有一家做到。豆包试图强行闯入,被联手堵死。苹果试图谈判接入,慢到用户失去耐心。谷歌试图直接读屏,准确率刚从11.4%爬到72.7%,还在路上。小米选择先在自己的院子里跑起来,院子之外的问题往后放。
四条路线,没有一条真正打通了那扇门。
这扇门后面是什么?是用户在手机上所有的行为轨迹、消费决策、社交关系。谁打开这扇门,谁就拿到了AI时代最有价值的生产资料。所以超级App绝对不会主动交钥匙,它们宁愿自己做AI助手,把门从里面锁上。
这是一场利益结构的博弈。谁来当用户和数字世界之间的那个层,这个问题的答案会在接下来几年的封杀、谈判、妥协和反制里慢慢浮现。
