穿帮不用重拍？Netflix首次开源AI视频模型，改写后期制作“经济账”

2026-04-15 17:35:57

你正坐在剪辑室里，盯着屏幕上两车相撞的画面发呆。制片人突然说：“要不改成让那辆车独自开走？”放在一年前，这句话意味着几十万美元的重拍预算、两周特效团队加班、以及主演档期调整的地狱级协调。但今天，Netflix的开源AI模型VOID告诉你：点击鼠标，搞定。

2026年4月初，这家全球流媒体巨头在Hugging Face上发布了首个开源AI模型——VOID（Video Object and Interaction Deletion），以Apache 2.0许可证面向全球开放。这不只是一场技术发布，更是一份行业宣言：Netflix正式入局AI视频赛道。

流媒体老大，为什么需要AI？

Netflix与AI的渊源，比大多数人想象的要深。早期那个帮你挑DVD的Cinematch算法，其实就是Netflix对人工智能的第一次试探。二十年后，这家公司正在用AI重塑从内容创作到后期制作的每一个环节。

2025年，Netflix在生成式AI应用上迎来了里程碑时刻。阿根廷科幻剧集《永恒者》成了第一部将AI生成画面整合到高预算制作中的重大作品。制作团队借助自研和第三方AI工具，将复杂视觉特效的生产时间缩短了十倍——从数周压缩到几天。

同年10月，Netflix将旗下Scanline VFX和Eyeline Studios整合为统一的Eyeline品牌，下设视觉特效、虚拟制作和前沿研究三大板块。Eyeline Labs专注于推动生成式AI视频的边界，已产出一系列前沿成果，包括CVPR 2025口头报告论文《Go-with-the-Flow》。

真正的转折发生在2026年3月——Netflix以最高可达6亿美元的价格，收购了本·阿弗莱克创立的AI电影制作公司InterPositive。阿弗莱克在收购公告中刻意划清了界限：这不是关于文字提示或从无到有地生成什么，而是基于已拍摄的素材，让电影人拥有更多后期控制力。据报道，导演大卫·芬奇已经在布拉德·皮特主演的项目中使用了InterPositive的工具。

如今，VOID的发布将这条技术脉络推向了高潮。Netflix首席产品和技术官Elizabeth Stone说得直白：“InterPositive加入Netflix，是因为我们相信创新应该赋能故事讲述者，而不是取代他们。”

VOID的杀手锏：当AI学会“善后”

VOID的核心能力可以用一句话概括：它不只是从画面中删除一个物体，而是理解并重建该物体消失后，整个场景应该发生什么。

听起来很简单？实际难到令好莱坞视效团队头疼了几十年。VOID的做法是：人没了，吉他该落地就落地。这涉及对支撑关系、重力和碰撞的复杂因果推理。

这项“理解物理”的能力，源于VOID的核心创新——Quadmask（四值掩码）系统。它摒弃了传统的“移除/保留”二元掩码，将画面区域划分为移除区、过渡区、受影响区和保留区。通俗地说，Quadmask不仅告诉AI“擦什么”，还告诉它“擦完之后剩下的东西该怎么动”。

此外，VOID采用两阶段推理流程。第一阶段生成初步结果；第二阶段专门利用光流信息修复物体变形伪影，确保运动轨迹自然连贯。

在实际表现上，一项涵盖25名参与者、横跨多种场景的盲测中，VOID以64.8%的用户偏好率遥遥领先，排名第二的Runway仅为18.4%。VOID的演示案例极具说服力：两车对撞的视频中，它可以移除其中一辆车，生成剩余车辆继续行驶的画面，碰撞后的碎片、烟雾和火焰全部被替换为干净路面。

VOID的技术底座颇为“混搭”：底层是阿里巴巴PAI出品的50亿参数视频扩散模型CogVideoX-Fun-V1.5-5b-InP，Google的Gemini负责场景分析，Meta的SAM2完成物体分割，训练数据则来自Adobe Research的HUMOTO数据集和Google Kubric的合成反事实数据。

为什么开源？Netflix的“双轨”算盘

一个流媒体平台，把自己砸钱研发的AI模型免费送出去，图什么？

VOID以Apache 2.0许可证开源，意味着任何人都可以免费使用，甚至用于商业用途。但运行它需要40GB以上显存的GPU，这意味着它目前还不是一个消费级工具，而是面向专业影视制作机构和VFX工作室的“生产力杠杆”。

Meta开源Llama、Google开源Gemma——逻辑一脉相承：把基础研究工具释放出去，在学术和开发者社区中建立声誉和影响力，本质上是在参与定义未来影视产业AI工具的技术标准。

与此同时，Netflix对那些“真正值钱”的东西绝不手软。InterPositive被完全收购，直接并入Eyeline内部管线，对Netflix自家制作严格保密；Eyeline Labs的前沿成果也被牢牢握在手中。这套“开源基础研究、锁死核心工具”的双轨策略，折射出Netflix对AI工具生态的深思熟虑：用VOID争夺行业标准话语权，用内部工具构建不可替代的竞争壁垒。

流媒体的AI竞赛：谁能活到下一集？

Netflix不是一个人在战斗。

2026年的AI视频赛道早已群雄并起：OpenAI的Sora、快手的可灵、阿里的通义万相、Runway的Gen-4系列，各家都在抢占“视频生成”的定义权。当Runway在2026年2月宣布将竞争对手的模型引入自己平台时，一个新的信号出现了——平台不再需要拥有最好的模型，只需要拥有最好的工作流。

整个影视产业的底层逻辑正在重构，AI正在压缩单帧制作成本，转描、排版、剪辑和迭代周期正在以更小的团队实现更快的速度。对中等预算项目而言，这意味着数周的VFX工时和六位数的重拍成本可以被大幅压缩，2024年AI媒体和娱乐市场规模已达263.4亿美元，这个数字还在加速膨胀。

技术的意义，是让创作回归创作

从Cinematch到VOID，Netflix的技术进化路线勾勒出的不仅是一家流媒体公司的成长史，更是整个好莱坞权力格局的重构缩影。VOID带来的技术突破，本质上是一次成本革命。它让“补拍”变成“点击删除”，让“数周手工修复”变成“几分钟自动完成”。当昂贵的后期制作门槛被拉低，高质量视觉叙事将不再只是好莱坞大厂的专属。

但技术从来不是终点。Netflix首席产品和技术官Elizabeth Stone那句话值得反复琢磨：“创新应该赋能故事讲述者，而不是取代他们。”

当导演不再为穿帮镜头焦虑、不再为道具失误反复重拍、不再为物理逻辑不连贯的画面绞尽脑汁——他们终于可以把精力还给创作本身。这或许才是VOID带给这个行业最深远的价值。（微信公众号：Tahou_2025）

以上内容不代表本平台立场，仅供读者参考