华为小艺升级:系统级智能体打造“意图即服务”新范式

这看似只是一次语音交互的升级,背后却是HarmonyOS向Agent架构的整体演进。基于全新升级的鸿蒙智能体框架2.0,小艺与系统深度融合,成为操作系统内置的智慧大脑,朝着最强系统智能体的目标不断进化。
过去二十余年,移动互联网的交互逻辑始终围绕「用户主动寻找应用,再在应用内查找具体服务」展开。我们早已习惯了这套运转顺畅的路径,但现实是,普通用户的手机平均安装七八十个应用,日均使用却仅10个左右,其中62%的应用一个月都不会被打开一次。这些应用并非体验不佳,只是使用场景相对固定,用完即被搁置,其服务价值需要新的调用方式激活。
Agent时代正在构建全新的「意图即服务」路径:用户只需要提出需求,Agent就能完成判断、调度、执行的全流程,精准理解需求并交付服务。用户无需知晓背后调用了哪些Agent或Skill,只需要等待需求被满足即可。在这个新的时代,交互入口的性质也发生了根本改变。过去应用争夺的是「信息入口」,决定用户能看到什么内容;而Agent时代争夺的是「行动入口」,决定能替用户完成什么事务。Agent将成为比搜索框更深、更高频的下一代默认入口,谁掌握了这个入口,谁就能掌控下一代移动互联网的分发权,这也是全球平台厂商既紧张又兴奋的核心原因。
行业的变革已经悄然展开:Google将Android的定义从「操作系统」更新为「智慧系统」,据行业观察预测到2026年底,将有40%的企业应用嵌入AI Agent,而这一数字在2025年仅不到5%。苹果此前通过App Intents框架让开发者为Siri开放功能接口,但受限于Siri本身的能力局限,直到近期的全球开发者大会,Siri才推出独立App形态,意图理解和操作手机的能力也有了大幅提升,开始通过生态智能和Siri AI能力吸引开发者。Google则更为激进,将Gemini Intelligence直接嵌入Android 17作为系统级Agent,通过AppFunctions API让应用开放功能接口,在没有API的场景下用GUI自动化作为兜底,不过目前接入的应用仅二三十个。
而在国内,当前最前沿的Agent化进展出现在华为身上。HarmonyOS的「元服务」架构天生将服务拆分为轻量、免安装、跨设备可调用的模块,恰好为Agent浪潮提供了天然的管道。华为在这条路上已经完成了三步布局:2024年搭建鸿蒙AI基础能力与框架,2025年发布HMAF推动应用级Agent化,到2026年的目标是实现整个操作系统的Agent化。HDC 2026上公布的三项核心动作,正是这第三步的具体落地路径。
一、系统能力全Skill化,打造小艺的全能工具箱
要让小艺真正具备执行能力,首先需要调动更多系统底层能力。此前感知、数据调用、设备控制等能力都被锁在系统底层,华为的解决方案非常直接:将2100多项系统能力和200多项系统级数据全部Skill化,交由小艺统一调度。备忘录、日历、图库、蓝牙、联系人、文件管理等系统应用的能力都已开放,小艺可以在用户授权下调用摄像头、解析屏幕内容、感知场景状态、调度多设备协同,整个HarmonyOS的系统能力都成为小艺随手可用的工具箱,用户无需再向小艺逐一说明操作步骤。以下两个场景可以直观展现小艺获得系统级能力加持后的Agent体验:
- 当你对小艺说「我报名了楚雄半马,帮我制定恢复训练计划」,小艺会先拆解需求,查询赛事相关信息,判断你处于停训恢复期,需要温和的重启方案;随后调用日程、运动健康、睡眠等系统数据,协调网页搜索、运动健康Coach、运动健康Health等多个Skill协同工作,最终综合评估后输出定制训练计划并自动写入你的日历。
- 跨端协同场景同样高效:当你不在鸿蒙电脑前,但需要获取电脑上的关键文件时,可以对小艺说「把电脑上跟傅里叶实验有关的所有材料打包发到我手机上,并生成一份材料清单」。即便电脑处于合盖待机状态,甚至不清楚具体文件名,小艺也能完成任务:手机端小艺联动PC端小艺,先检索电脑上近期保存的相关资料并发送清单供你确认,确认后PC端小艺调用文档管理Skill将文件打包为压缩包发送到手机,完成后自动跨设备发送通知提醒。
更重要的是,小艺在执行任务时,调用的工具、当前的执行步骤对用户完全透明,用户可以随时查看和控制整个流程。这些场景涉及当下热门的A2A和Skill概念。A2A(agent-to-agent)概念由Google和IBM在2025年4月首次提出,随后交由Linux基金会形成社区驱动的开源国际标准,目前已有超过150个全球组织参与支持。华为此前发布的AI终端白皮书、鸿蒙智能体框架白皮书都强调了系统级端/云智能体协同协议,是较早将A2A协作落地为系统级协议的厂商之一。
传统的AI交互链条是「人对AI说话,AI再执行」,而A2A的不同之处在于,Agent之间可以直接对话协作,这需要一个智能的协调管理者。在半马训练计划的场景中,小艺拆解任务后,调度「运动健康」「日程」「搜索」等多个子Agent和Skill,通过鸿蒙智能体框架(Harmony Agent Framework, HMAF)协议让它们自行协商交换数据,并行推进任务。
除了自主规划和协调系统与生态伙伴的能力,小艺还能帮用户「自定义工具」:当你对小艺说「做一个儿童学英语的小工具,支持拍物品学单词,拍照识别后展示英文、音标、释义和发音,卡片可以加入单词本」,小艺可以调用「码上飞」的文生代码能力,结合系统的相机、TTS文字转语音功能,快速生成一个可交互的学习工具,无需下载应用,更不用编写一行代码,说完就能直接使用。这比单纯帮用户完成任务更进一步,让用户从任务发起者转变为工具创造者。
二、开放生态接入,让第三方服务无缝融入
系统应用Skill化和A2A支持为小艺打下了基础,但如果仅调用自家服务,系统级Agent的能力天花板会很快到来。HDC 2026上,小艺开放平台完成升级,开放了Agent、Skill、MCP、意图框架等多种接入方式,第三方应用可以选择最适合自身的方式深度接入小艺的调度体系。目前已有500多个精选伙伴Skill上线,2000多个鸿蒙智能体上架,例如东方财富的妙想Skill已经可以联动联网搜索Skill,通过自然语言完成自定义条件选股。在更底层,鸿蒙智能累计开放了20多项AI子系统能力,日均调用量达到36.8亿次。信息摘要、卡证识别、活体检测、图像超分等能力已经被京东金融、铁路12306、知乎等应用接入,开发者无需自建模型,就能在应用中调用系统级AI能力。
为了让接入流程更顺畅,鸿蒙智能体框架做了多项优化:升级后的A2A协议支持端侧直连,头部伙伴的Agent可以在设备本地完成协作,腾讯视频已经通过这种方式接入,用户可以直接让小艺设置倍速、查询剧情,无需跳出当前界面;A2UI协议让Skill无需预先定义界面,Agent可以根据指令复杂度动态生成UI,同一个Skill可以在手机、平板、车机等不同设备上渲染;Skill上架流程打通了账号鉴权,配合自然语言开发工具,让不同规模和能力的开发团队都能快速接入。
对用户来说,只需要说出需求就能获得完整服务,小艺可以调用各类Skill/Agent为用户提供极致的智慧体验。比如周末邀请好友聚餐时,你可以对小艺说「今天有三个朋友来家里吃饭,帮我规划一份菜单」,小艺会根据人数和口味偏好生成菜单,列出每道菜的食材和分量,随后调用生鲜电商的Agent将食材清单一键加入购物车,用户确认后即可直接下单。从「想吃什么」到「食材到家」,一句话串联起菜单规划、食材匹配、生鲜电商三个环节,用户全程无需打开任何应用。
对开发者来说,分发逻辑已经发生了根本改变,与传统应用商城的模式截然不同。过去是「用户主动找应用」,数万应用争夺排名和推荐位;而「意图即服务」的逻辑是「用户说需求,系统匹配服务」,只要服务质量过硬、Agent/Skill适配顺畅,小艺就会在用户需求匹配时主动精准调用开发者的服务。华为去年启动的天工计划投入10亿元,目标是孵化超过10000个AI元服务、1000多种意图框架以及MCP、5000多个Agent,本质上是在帮助开发者降低接入门槛。
在众多接入方式中,MCP(Model Context Protocol)是Anthropic在2024年提出的Agent与工具通信标准,目前已经成为行业事实标准。鸿蒙兼容MCP,相当于为外部AI生态打开了大门:无论开发者属于哪个大模型生态,只要遵守该协议,就能接入小艺的调度体系。
当Agent可以跨应用调度服务、读取系统数据时,安全问题不再是附加选项,而是核心前提。华为在HDC 2026同期发布了相关安全白皮书,将安全架构摆在与Agent能力同等重要的位置。小艺采用HPIC(HarmonyOS个人智能计算系统)架构,坚持本地优先、数据最小化、用户可控的原则。当需要云端算力时,AI推理会在用户专属的机密环境中运行,通过OHTTP协议和端云协同加密实现用户身份三重匿名盲化,即使系统管理员也无法查看用户的明文数据。在应用层面,涉及转账、支付等操作时,系统会阻断自动化流程,必须由用户手动完成;证件、工作文件等敏感资料仅在设备本地流转,云端仅接收处理后的结果。HPIC已经通过权威实验室三大安全检验,达到行业高标准的增强级要求,同时小艺相关产品成为首个获得国家级认证的终端厂商智能体。
三、多模型灵活调度,搭配全域记忆体系
第三项核心动作关乎小艺的「智力来源」。要让小艺变得聪明,需要强大的模型支撑,但华为并没有押注单一模型。大模型领域的迭代速度极快,半年前的最优方案可能很快就会被超越,华为的选择非常务实:与其绑定某一个具体模型,不如搭建一套「万能插座」式的模型接入架构,让盘古、DeepSeek等大模型都能灵活对接调用,哪个模型在特定场景下表现最优,就使用哪个模型。这种灵活性让小艺的使用体验大幅提升。基于Agentic自演进架构,小艺可以自主思考、规划和调度任务,用户往往不需要详细说明复杂任务的执行步骤,小艺就能自主完成。例如当你对小艺说「帮我写一封英文商务邮件」,小艺会判断这是多语言生成任务,自动路由到英文写作能力更强的模型;当你说「分析一下我上个月的运动数据,给出改善建议」,任务涉及结构化数据理解和个性化推理,框架会切换到更擅长此类任务的模型。两个不同的请求对应两条不同的模型路径,但用户感知到的只有「小艺顺利完成了任务」。
这种多模型调度的思路与其他厂商的策略有相似之处,但华为的执行深度更深。其他厂商仅在单一层面开放了多模型后端,更多是将选择权交给开发者,并没有更多的协调层面的工作;而华为则在操作系统底层搭建了一套完整的模型调度框架,覆盖从意图理解到任务执行的全链路,且模型切换对用户完全透明。
模型调度解决了「会不会做」的问题,但另一个关键问题是「小艺能否记住用户」。就在近期,行业内推出了全新的记忆架构方案,系统会自动在所有历史对话中合成用户画像,无需用户手动告知「请记住」,并且会自动更新过时的信息。行业已经达成共识:即使模型再强大,如果每次对话都像第一次见面一样,用户体验的上限会非常有限。
在HDC 2026的相关分享中,小艺相关负责人介绍了小艺针对「用户记忆」所做的升级。小艺全新升级了记忆体系,分为四个层级:瞬时记忆处理单次推理,短时记忆覆盖单个对话窗口,长时记忆沉淀用户的指令偏好和隐性习惯,全时记忆进行伴随式的持续积累,最终形成全局动态用户画像。
与纯对话型AI不同,小艺的记忆来源不仅包括聊天记录,还涵盖了日历、运动健康、消费记录、图库等系统级数据。华为将这套记忆体系命名为「鸿蒙记忆」,它是AI OS的底座能力,并非小艺单个应用的私有功能。系统级数据、全场景设备、端侧隐私处理的组合,正是鸿蒙在记忆层面的差异化优势。
举个简单的例子:每年体检后我们通常会将报告下载到本地,但想要回溯几年前的某项身体数据进行对比会非常麻烦。当小艺帮你记录后,只需要唤起小艺问「我这三年甘油三酯的变化趋势是什么」,小艺就能跨时间调取数据,生成变化曲线,并结合健康相关的智能体提供咨询服务。
记忆只有回到具体场景中,才能从存档转化为能力。这套能力并不局限于某个单一应用,系统会根据记忆中沉淀的意图模式,自动判断何时弹出对应的服务。这条「记忆沉淀→服务唤醒」的链路,将「意图即服务」从被动响应升级为主动预判。
正如前文所述,一款优秀的Agent产品需要两个核心要素:优秀的模型和优秀的底层框架,二者相辅相成。好的智能体框架可以让优秀的Agentic模型发挥最大价值,带来更好的用户体验。对用户来说,小艺让人觉得「聪明懂我」「能办成事」的秘诀,正是这套可以灵活调用优质模型、不断积累用户记忆的工程体系。
2008年应用商店上线,沿着「用户下载应用、应用提供服务」的路径,经过18年的发展,已经成长出万亿美元级的分发和商业生态。而如今,全球所有平台厂商都在做同一件事:将交互入口从App迁移到Agent,为用户带来更优质的AI体验,同时为开发者创造新的发展机会。这次迁移的速度和生态扩张的速度,很可能比上一次更快:相关协议从发布到成为行业事实标准仅用了半年,跨智能体协作标准从提出到超过150个组织参与仅用了一年多,而在移动互联网早期,一个开发范式从提出到普及往往需要三五年时间。
华为在HDC 2026上让小艺深度融入操作系统底层,正是沿着这条新路径的前瞻性尝试。但我们更需要思考的是,这条路的终点指向何方?当一个Agent沉淀了你的日程、健康数据、消费偏好、工作习惯后,它和你的关系已经不再是「工具」可以概括的了。它会成为了解你的协作者,不需要每次从头了解你的身份、偏好、过往进展,它都记得清清楚楚。
至于传统应用,当然不会就此消失,但全新的交互入口已经清晰地出现在眼前。
你的AIGC知识价值,正在被看见!塔猴AI达人星火计划,发布课程,赢现金激励!点击加入活动:https://www.tahou.com/article/206587263682970629
AI生成内容提示:本文由人工智能辅助创作,内容仅供参考,不代表平台观点。请注意核实信息的准确性,并理性判断。




