穿帮不用重拍?Netflix首次开源AI视频模型,改写后期制作“经济账”
你正坐在剪辑室里,盯着屏幕上两车相撞的画面发呆。制片人突然说:“要不改成让那辆车独自开走?”放在一年前,这句话意味着几十万美元的重拍预算、两周特效团队加班、以及主演档期调整的地狱级协调。但今天,Netflix的开源AI模型VOID告诉你:点击鼠标,搞定。
2026年4月初,这家全球流媒体巨头在Hugging Face上发布了首个开源AI模型——VOID(Video Object and Interaction Deletion),以Apache 2.0许可证面向全球开放。这不只是一场技术发布,更是一份行业宣言:Netflix正式入局AI视频赛道。

流媒体老大,为什么需要AI?
Netflix与AI的渊源,比大多数人想象的要深。早期那个帮你挑DVD的Cinematch算法,其实就是Netflix对人工智能的第一次试探。二十年后,这家公司正在用AI重塑从内容创作到后期制作的每一个环节。
2025年,Netflix在生成式AI应用上迎来了里程碑时刻。阿根廷科幻剧集《永恒者》成了第一部将AI生成画面整合到高预算制作中的重大作品。制作团队借助自研和第三方AI工具,将复杂视觉特效的生产时间缩短了十倍——从数周压缩到几天。

同年10月,Netflix将旗下Scanline VFX和Eyeline Studios整合为统一的Eyeline品牌,下设视觉特效、虚拟制作和前沿研究三大板块。Eyeline Labs专注于推动生成式AI视频的边界,已产出一系列前沿成果,包括CVPR 2025口头报告论文《Go-with-the-Flow》。
真正的转折发生在2026年3月——Netflix以最高可达6亿美元的价格,收购了本·阿弗莱克创立的AI电影制作公司InterPositive。阿弗莱克在收购公告中刻意划清了界限:这不是关于文字提示或从无到有地生成什么,而是基于已拍摄的素材,让电影人拥有更多后期控制力。据报道,导演大卫·芬奇已经在布拉德·皮特主演的项目中使用了InterPositive的工具。
如今,VOID的发布将这条技术脉络推向了高潮。Netflix首席产品和技术官Elizabeth Stone说得直白:“InterPositive加入Netflix,是因为我们相信创新应该赋能故事讲述者,而不是取代他们。”

VOID的杀手锏:当AI学会“善后”
VOID的核心能力可以用一句话概括:它不只是从画面中删除一个物体,而是理解并重建该物体消失后,整个场景应该发生什么。
听起来很简单?实际难到令好莱坞视效团队头疼了几十年。VOID的做法是:人没了,吉他该落地就落地。这涉及对支撑关系、重力和碰撞的复杂因果推理。

这项“理解物理”的能力,源于VOID的核心创新——Quadmask(四值掩码)系统。它摒弃了传统的“移除/保留”二元掩码,将画面区域划分为移除区、过渡区、受影响区和保留区。通俗地说,Quadmask不仅告诉AI“擦什么”,还告诉它“擦完之后剩下的东西该怎么动”。
此外,VOID采用两阶段推理流程。第一阶段生成初步结果;第二阶段专门利用光流信息修复物体变形伪影,确保运动轨迹自然连贯。
在实际表现上,一项涵盖25名参与者、横跨多种场景的盲测中,VOID以64.8%的用户偏好率遥遥领先,排名第二的Runway仅为18.4%。VOID的演示案例极具说服力:两车对撞的视频中,它可以移除其中一辆车,生成剩余车辆继续行驶的画面,碰撞后的碎片、烟雾和火焰全部被替换为干净路面。

VOID的技术底座颇为“混搭”:底层是阿里巴巴PAI出品的50亿参数视频扩散模型CogVideoX-Fun-V1.5-5b-InP,Google的Gemini负责场景分析,Meta的SAM2完成物体分割,训练数据则来自Adobe Research的HUMOTO数据集和Google Kubric的合成反事实数据。

为什么开源?Netflix的“双轨”算盘
一个流媒体平台,把自己砸钱研发的AI模型免费送出去,图什么?
VOID以Apache 2.0许可证开源,意味着任何人都可以免费使用,甚至用于商业用途。但运行它需要40GB以上显存的GPU,这意味着它目前还不是一个消费级工具,而是面向专业影视制作机构和VFX工作室的“生产力杠杆”。

Meta开源Llama、Google开源Gemma——逻辑一脉相承:把基础研究工具释放出去,在学术和开发者社区中建立声誉和影响力,本质上是在参与定义未来影视产业AI工具的技术标准。
与此同时,Netflix对那些“真正值钱”的东西绝不手软。InterPositive被完全收购,直接并入Eyeline内部管线,对Netflix自家制作严格保密;Eyeline Labs的前沿成果也被牢牢握在手中。这套“开源基础研究、锁死核心工具”的双轨策略,折射出Netflix对AI工具生态的深思熟虑:用VOID争夺行业标准话语权,用内部工具构建不可替代的竞争壁垒。

流媒体的AI竞赛:谁能活到下一集?
Netflix不是一个人在战斗。
2026年的AI视频赛道早已群雄并起:OpenAI的Sora、快手的可灵、阿里的通义万相、Runway的Gen-4系列,各家都在抢占“视频生成”的定义权。当Runway在2026年2月宣布将竞争对手的模型引入自己平台时,一个新的信号出现了——平台不再需要拥有最好的模型,只需要拥有最好的工作流。
整个影视产业的底层逻辑正在重构,AI正在压缩单帧制作成本,转描、排版、剪辑和迭代周期正在以更小的团队实现更快的速度。对中等预算项目而言,这意味着数周的VFX工时和六位数的重拍成本可以被大幅压缩,2024年AI媒体和娱乐市场规模已达263.4亿美元,这个数字还在加速膨胀。

技术的意义,是让创作回归创作
从Cinematch到VOID,Netflix的技术进化路线勾勒出的不仅是一家流媒体公司的成长史,更是整个好莱坞权力格局的重构缩影。VOID带来的技术突破,本质上是一次成本革命。它让“补拍”变成“点击删除”,让“数周手工修复”变成“几分钟自动完成”。当昂贵的后期制作门槛被拉低,高质量视觉叙事将不再只是好莱坞大厂的专属。
但技术从来不是终点。Netflix首席产品和技术官Elizabeth Stone那句话值得反复琢磨:“创新应该赋能故事讲述者,而不是取代他们。”
当导演不再为穿帮镜头焦虑、不再为道具失误反复重拍、不再为物理逻辑不连贯的画面绞尽脑汁——他们终于可以把精力还给创作本身。这或许才是VOID带给这个行业最深远的价值。(微信公众号:Tahou_2025)


