罗福莉交卷 小米MiMo“龙虾全家桶”上线 免费“养虾”

2026-03-19 11:31:59

今日凌晨,小米重磅发布了MiMo大模型系列三款新品,由原DeepSeek核心成员罗福莉团队操刀,全面对标Agent智能体场景。这标志着国内终端厂商在自研大模型领域迈出关键一步。旗舰模型MiMo-V2-Pro凭借超1T参数和极具竞争力的定价,迅速在智能体评测中崭露头角,并提供了免费的“养虾”体验,旨在抢占Agent开发生态的制高点。

模型发布


今日凌晨,小米MiMo大模型系列迎来重磅更新,罗福莉团队一口气发布了三大模型:旗舰基座MiMo-V2-Pro、全模态Agent模型MiMo-V2-Omni,以及语音合成模型MiMo-V2-TTS。这三大模型的设计核心都聚焦于一个目标:全面优化智能体Agent的能力表现。

神秘模型的身份揭晓,上周在全球最大API聚合平台OpenRouter上,调用量多天登顶日榜的匿名模型Hunter Alpha和Healer Alpha,现已被官方确认为MiMo-V2-Pro和MiMo-V2-Omni的早期测试版本。这一泄露信息引发了行业热议,此前因参数规格相似,它甚至被猜测是DeepSeek V4。

旗舰基座MiMo-V2-Pro的性能突破,MiMo-V2-Pro总参数量超过1T,激活参数量达到42B,支持100万上下文长度,是前代模型的3倍规模。

在权威综合智能排行榜Artificial Analysis上,MiMo-V2-Pro位列全球第九,国内第三,成绩斐然。它在编程Agent、通用Agent和工具使用方面,表现与Claude Sonnet 4.6、GPT 5.2等持平,但API定价仅为Claude Opus 4.6的1/5。

这是终端厂商对传统大模型API定价体系发起的强力挑战。小米通过极具竞争力的价格,正在尝试用高性能Agent模型撬开现有市场,推动Agent场景的普及应用。

Agent核心能力


MiMo-V2-Omni和MiMo-V2-TTS的发布,确保了小米Agent在“感知”和“交互”层面能够提供一致的、高质量的体验。

▲MiMo-V2-Pro与Claude Opus 4.6、Claude Sonnet 4.6价格对比(图源:小米MiMo官网)

Omni模型实现跨模态执行,全模态基座模型Xiaomi MiMo-V2-Omni,融合了文本、视觉、语音能力,专为复杂的多模态执行场景打造。

在音频理解上,其表现超越了Gemini 3 Pro,支持超过10小时连续音频的深度分析。在智能体任务执行上,MiMo-V2-Omni结合OpenClaw框架,可以像人一样操控浏览器,自主完成“小红书做功课、京东比价砍价”的全流程任务。该模型还接入了WPS Office生态,能直接生成结构化的Word、Excel和PPT文档。

TTS模型:让智能体拥有情感与灵魂

语音合成大模型Xiaomi MiMo-V2-TTS,是为Agent时代的全模态交互而生,让智能体拥有有温度、有情感的声音。该模型支持从整体到局部的多层次语音风格控制,用户可用自然语言指令设定基调,实现同一语句中语气的自然过渡。它甚至能识别文本中的标点符号和语气词,自动转化为恰当的表达,全程无需人工干预。

生态整合与未来布局


小米此次发布的核心战略,是将大模型能力与终端生态、系统权限深度整合,打造“系统级原生智能体”。

MiMo Claw的免费体验吸引力,在MiMo-V2-Pro的官方体验页面,小米同步上线了MiMo Claw,免费提供MiMo-V2-Pro的“养虾”体验,每次30分钟自动销毁数据。这极大地降低了开发者测试Agent能力的门槛。

MiMo Claw模块已经打通金山WebOffice生态,原生支持Word、Excel、PPT、PDF四大格式,覆盖超95%的日常文档。小米浏览器也已接入MiMo-V2-Pro,助力AI搜索能力。

小米此举意味着终端厂商正在利用自身的系统入口优势,将模型、权限和服务深度整合。

这与腾讯放弃独立App、转向原生服务化的战略高度一致。小米的MiMo-V2-Pro在OpenClaw评测榜单上排名第三,证明了其在复杂的Agent架构中,工具调用和多步推理能力已经达到行业前列。终端厂商不再只是模型的被动使用者,而是利用自有生态,成为原生智能体系统的构建者。

小米大模型团队下一阶段的目标是攻克高复杂度推理和长周期任务规划。小米这次一口气亮出三款针对Agent优化的大模型,这显示了终端厂商在AI竞赛中的独特优势——他们可以直接将底层模型与用户场景深度耦合,打造出真正能够“系统级、无人工干预”完成任务的智能体。这无疑是对现有模型生态的一次强力洗牌。(微信公众号:Tahou_2025)


关注塔猴公众号,回复“1”加入专属社群

扫码下载塔猴APP,查看更多干货


声明:该内容由作者自行发布,观点内容仅供参考,不代表平台立场;如有侵权,请联系平台删除。
标签:
大模型
智能体(Agent)
语音合成(TTS)
模型部署