Mirage(原 Captions)融资 7500 万美元:AI 视频的下一场战争,不在生成,在“编辑权力”

在 AI 视频狂飙的一年之后,一个更微妙的分化开始出现。
一边,是模型能力的持续突破。从文生视频到数字人,从长时生成到多模态融合,技术路径几乎完全围绕“生成能力”展开;另一边,却是内容生产端越来越清晰的现实反馈——视频确实变得更容易被“做出来”,但真正能被看完、被传播、甚至产生转化的内容,依然稀缺。
技术供给与内容效果之间的落差,正在成为新的机会。
就在这样的背景下,Mirage(原 Captions)宣布获得 7500 万美元 融资,由 General Catalyst 旗下 Customer Value Fund(CVF)提供。这类资金的逻辑,与传统 VC 明显不同,它更关注已经被验证的增长模型与单位经济,而不是单纯押注未来。
这意味着一件事:Mirage 已经不是一个“正在探索”的 AI 产品,而是一家已经跑通路径、正在被放大的公司。
从数据来看,这个判断并不激进:
- 过去一年 下载量超过 320 万
- 内购收入达到 2840 万美元
- 累计生成视频超过 2 亿条
- 收入仅 25% 来自美国市场
这种结构说明,它已经跨越了单一市场和单一用户群体,具备一定的全球化基础。
但比数据更重要的,是它在过去一年中的方向性变化。
Mirage 正在从一个剪辑工具,转变为一个视频生产系统。
01
从 Captions 到 Mirage:一次刻意的“去工具化”
Mirage 的前身 Captions,是一款典型的 创作者工具,以 字幕 和 AI 剪辑 为核心的 移动端应用,主要服务创作者和短视频用户。它的价值在于效率,让用户更快生成字幕、更轻松完成剪辑。这类产品在短视频爆发期迅速增长,但也很容易陷入同质化竞争。

真正的转折发生在过去一年。当公司选择从 Captions 更名为 Mirage 时,它并不是简单的 rebranding,而是在主动重写自身定位:
它不再强调单一功能,而是开始构建一整套 围绕视频生产的模型体系,并将自己定义为一个“AI Lab”。
这种变化背后的核心,是视角的转移。
Captions 关注的是“视频如何被制作”,而 Mirage 开始思考的是:视频为什么会被看。
02
一个关键判断:视频的价值,不在生成,而在被消费
过去一年,AI 视频行业几乎围绕“生成”展开竞争。分辨率、更长时长、更自然的动作,成为核心指标。但这些指标更多来自技术视角,而不是内容视角。
Mirage 的路径恰好相反。它没有把重点放在生成能力上,而是 训练模型去理解视频中的更“底层”的维度:
- 节奏(pacing)
- 构图(framing)
- 注意力(attention dynamics)分布
这些维度看似抽象,但却直接决定了一个视频是否能被完整消费。
这背后是一种更接近内容行业的认知:视频不是一个“被生成”的对象,而是一个“被组织”的结果。它的价值来自结构,而不是素材本身。
因此,Mirage 提出了一个关键词——Assembly Intelligence(组装智能)。
与其从零生成内容,不如将已有素材、声音、脚本和视觉元素,通过更合理的结构组合在一起,从而形成一个“有效的视频”。
这不是技术路径的微调,而是对整个视频生产逻辑的重新定义。
03
“Assembly Intelligence”:一个被低估的方向
我们继续说 Mirage 创始人提出的关键词:
Assembly Intelligence(组装智能)
如果把 AI 视频流程拆开,大致可以分为三层:
- 内容生成(脚本、画面、声音)
- 内容处理(剪辑、字幕、特效)
- 内容组装(结构、节奏、分发)
大多数公司在做第一层,少数在优化第二层,而 Mirage 直接跳到了第三层。
这意味着,它关注的不是单个能力,而是:
如何把不同来源的素材,组合成一个“有效的视频”。
这件事的难度在于,它不仅是技术问题,更是经验问题。什么节奏能留住用户,什么剪辑能提高转化,本质上是长期内容生产中沉淀下来的隐性知识。
Mirage 的路径,是把这些 知识模型化。
04
为什么“组装”比“生成”更难
如果把问题拆开来看,生成内容更像是一个概率问题,而组装内容则更接近决策问题。
一个视频是否有效,往往取决于大量细微判断:
- 何时切换镜头?
- 如何控制节奏?
- 在哪一刻强化信息密度?
- 何时需要留白?
这些决策高度依赖语境,很难通过单一模型直接生成。
在传统内容生产中,这些能力来自剪辑师或运营人员的经验积累,并逐渐内化为直觉。而 Mirage 的尝试,是把这些直觉显性化,并转化为模型可以执行的规则。
一个细节可以说明这一点。Mirage 专门开发了一个音频模型,用于保留用户的原始口音。在很多 AI 系统中,口音会被自动“标准化”为美式英语,但对于全球用户而言,这种优化反而削弱了表达的真实性。Mirage 的选择,是保留差异。
这背后反映的,不是技术能力,而是对内容本质的理解。Mirage 的目标不是生成“标准内容”,而是:
保留表达的个体性,同时提升传播效率。
这与传统 AI 生成工具的方向,形成了微妙的差异。
05
从创作者工具,到企业视频基础设施
Mirage 的另一条清晰路径,是从创作者市场逐步向企业市场延伸。
目前,它已经形成两个产品端:
- 移动端 延续 Captions 的能力,服务个人创作者;
- Web 端 则提供更完整的营销套件,面向企业用户。
下一步,公司计划将两者整合,形成统一的视频生产体系。
这一变化背后,是用户需求的转移。
对于 中小企业(SMBs)而言,视频不再只是创意表达,而是 增长工具。他们需要的是:
- 批量生成内容
- 快速测试素材
- 提高转化效率
在这种场景下,单次创作能力的价值有限,真正重要的是系统化生产能力。
如果说 Canva 让设计进入规模化时代,那么 Mirage 正在尝试推动视频内容进入类似的阶段——从手工创作,走向工业化生产。
视频内容从手工创作,走向工业化生产。
06
为什么是现在:AI 视频的结构性转移
Mirage 的出现,并不是偶然,而是踩在一个行业转折点上。
过去,AI 视频的竞争集中在模型能力;而随着生成能力逐渐趋同,价值开始向下游迁移。谁能更好地组织内容、理解用户、提升转化,谁就更接近商业化核心。
2025 年初,Mirage 切换为 freemium 模型。
这个决策背后的压力很直接:
- ByteDance 的 CapCut
- Meta 推出的 Edits
这些产品正在迅速占领用户端。它们未必拥有最强的生成模型,但在内容结构与分发路径上具有优势。
Mirage 选择的,是在这一层之上继续向前,把“如何组织内容”本身变成一套可以被模型执行的能力。
这也是一个典型路径:
从创作者工具 → 向企业增长工具演化
07
投资逻辑的变化:从技术押注,到增长验证
General Catalyst 的 CVF(Customer Value Fund),并不属于典型的早期投资工具。它更关注那些已经验证商业模式、具备规模化能力的公司。

Mirage 能获得这类资金支持,说明其 增长逻辑 已经相对清晰。从 用户获取 到 收入结构,再到 ROI 表现,都具备可预测性。
投资人给出的判断也非常直接:
这是一个“无限 TAM(市场空间)”的赛道
随着视频成为最主要的信息载体,而 AI 持续降低生产门槛,内容的供给将进一步爆发。
问题不再是“有没有内容”,而是“什么内容有效”。
08
结语:AI 视频的终局,不是生成,而是控制结构
如果回看 AI 视频的发展路径,可以看到一个清晰的演化轨迹:从“能不能生成”,到“生成得好不好”,再到“是否有用”。
Mirage 的位置,正好落在第三阶段。
它并不试图在生成能力上继续竞争,而是把问题转向更接近内容本质的一侧:结构、节奏与注意力。也正因为如此,它的野心不再是做一个更强的工具,而是建立一种新的控制权。
对视频结构的控制权。
如果这个判断成立,那么 AI 视频的下一场竞争,将不再发生在模型层,而发生在更隐蔽的地方——谁更理解内容如何被消费,谁就更接近价值的中心。
09
关于 Vibehood
Vibehood 致力于连接 AI 创新者与资本、技术资源及生态伙伴,帮助真正的 builder 从实验项目走向规模化产品。
如果你正在构建 AI Agent、AI 应用或探索新的 AI 创业方向,或正在寻找融资与战略支持,欢迎在后台留言:
文章来自于微信公众号 "Vibehood",作者 "Vibehood"




