今日凌晨,谷歌Veo 3.1 Lite 正式发布,是该公司迄今为止最实惠的视频模型。

生成1秒视频仅需0.05美元,折合0.35元人民币;相比之下,Seedance 2.0模型生成1秒视频需1元人民币,相差接近3倍。

白菜价


今年AI短剧和AI漫剧爆火,但高昂的算力成本让不少人望而却步。如果调用成本降不下来,AI短剧就只能停留在专业影视工作室的尝鲜阶段,根本无法面向所有用户的。

这次最大的变化在于,Veo 3.1 Lite的定价太低了。

  1. 720P分辨率:0.05美元/秒。
  2. 1080P分辨率:0.08美元/秒。

作为对比,高性能版本Veo 3.1 Fast原价是0.15美元/秒,即便4月7日降价后,其价格也要维持在0.1美元/秒(720P)和0.12美元/秒(1080P),Lite版把价格砍掉了一半。

“旧时王谢堂前燕,飞入寻常百姓家”,成本的降低,让大部分人都可以尝试AI短剧,也让让海量A/B测试在视频生成领域成为现实。

原生音频、极速生成


价格再亲民,我们还是会担心它是Veo 3.1 Fast阉割版,怀疑它的视频生成质量。

实际在视频生成上,Veo 3.1 Lite依旧稳扎稳打。它支持文本转视频和图像转视频两种模式,为了迎合目前的短视频,模型在分辨率与比例上做了场景适配,16:9横屏和9:16竖屏完美兼顾。在视频时长方面,谷歌开放了4秒、6秒、8秒的自定义选项。前3秒的完播率是短视频的生死线,这是谷歌的考量,过长的生成会增加失败率,还会消耗更多算力和资金。

画质还只是基本功,它的原生音频能力同样不差。Veo 3.1 Lite支持原生音频生成,环境音、音效同步。街道上的车流声、雨滴敲击窗户的环境音,模型在生成画面的同时,会交付带有原生音轨的多媒体文件。

目前,我们已经可以通过Gemini API和Google AI Studio直接调用测试。根据海外开发者的首批实测反馈,其生成速度和Fast版本相当,视频产出极快。

虽然Veo 3.1 Lite不支持4K分辨率(更高阶的Veo 3.1才支持),但对于手机端的信息流分发来说,720P和1080P已经完全性能溢出。在照片级真实感(photorealism)的表现上,它依然保持了谷歌一贯的工业水准。这种“够用就好、便宜管够”的产品定义,展现了谷歌极其务实的商业推演能力。

下低成本与seedance的对比


在2026年,提到视频生成模型,字节跳动的Seedance 2.0是绕不开槛。

首先是控制力与多模态输入,字节Seedance 2.0完胜。谷歌Veo 3.1 Lite的输入逻辑相对简单,提示词加上单张参考图,适合生成场景、产品展示或者风景人物。而字节Seedance 2.0主打的是导演模式,最多支持上传9张图像、3段视频(≤15秒)和3段音频。这就意味着,创作者可以指定画面中某个角色的脸部特征,同时规定镜头的运动轨迹。在运动一致性、多镜头过渡和复杂叙事上,字节Seedance 2.0目前在多项Benchmark评测中稳居第一,它还能实现音视频的联合生成,在唇同步和氛围音效的贴合度上表现得更加自然。

但如果我们把目光转向成本与落地,谷歌的优势就凸显出来了。

字节Seedance 2.0的官方定价相对较高。目前通过官方火山引擎调用的成本大约在0.14美元/秒(约合人民币1元/秒),生成一段15秒的视频大约需要15元人民币。如果通过第三方API调用,其Fast/Lite档位的价格在0.022至0.12美元/秒之间浮动。对于普通用户,字节更多是通过即梦的订阅制来提供服务,每月9.6至167美元不等的订阅费,要重度使用单秒成本才能降下来。

反观谷歌Veo 3.1 Lite,720P每秒0.05美元的明码标价,没有订阅制,使用起来更加实惠。那对于广大的企业和开发者而言,到底选哪个?

场景决定选择。

想低成本刷量、做营销大批量分发、开发轻量级娱乐App,闭眼选谷歌Veo 3.1 Lite,极致的性价比。利润更高,客户也不需要电影级的镜头调度,只希望又快又便宜,还好用。想做专业级短片、影视广告,追求电影级质感和复杂叙事,那就去用字节的Seedance 2.0,角色一致性更强。

两者互不干扰,谷歌向下兼容,用低价吃透长尾市场和开发者市场;字节向上突破,用技术抢占专业内容创作者的口碑。(微信公众号:Tahou_2025)


关注塔猴公众号,扫码下载塔猴APP,查看更多干货

扫码加入官方社群


以上内容不代表本平台立场,仅供读者参考