AI视频卷到影视垂类了:PixVerse C1实测,有几斤几两

2026-04-10 15:35:32

3月底,OpenAI宣布关停Sora。算力太烧钱,商业模式没跑通。这个曾经让整个AI视频圈集体失眠的产品,就这么安静下线了。

几乎同一时间,爱诗科技把PixVerse C1推了出来,喊的口号是"全球首个影视行业大模型"。时间节点撞得有点微妙,但这两件事背后的逻辑其实相反。Sora死在"太通用、太烧钱、没有具体买单场景",而C1从一开始就没想做通用模型,它盯着的是一个非常具体的需求:AI短剧制作。

爱诗科技本身不是新面孔。公司由字节跳动前视觉技术负责人王长虎创办于2023年4月,全球用户规模已突破1亿,B轮融资由阿里巴巴领投,拿到6000万美元。在AI视频这条赛道上,它早就是第一梯队的选手,C1是它第一次专门为影视场景单独训练一个垂类模型。

它到底解决了什么问题


在C1之前,用AI做视频最让人头疼的不是"生不生得出来",而是"生出来能不能用"。

具体说有三个老毛病。第一,角色一换镜头就掉样。上一集蓝眼睛,下一集变黑眼睛,观众出戏,制作方头痛。第二,动作像木偶。打斗戏看着像两个充气玩具在互相拍,力量感为零。第三,给你的是素材不是成片。你用AI生了一堆视频片段,但分镜、剪辑、音画对齐还得自己手动来,工作量砍掉的其实没想象中多。

C1是爱诗C系列模型的首次亮相,与现有的基建大模型V系列和先锋型世界模型R系列不同,C1是独立训练的垂直行业大模型,针对影视短剧场景进行专项优化。翻译成人话就是:V系列是通用底座,R系列是在探索边界,C1是专门为了生产落地训练的,目标就是让制作方能直接出成片,而不是一堆素材扔给后期去拼。

C1支持文生、图生、参考生及首尾帧四种生成模式,最高输出15秒1080P音画同步视频,并首创多宫格智能分镜功能,可一键将分镜图转为连续成片。分镜图直接转视频这个功能值得单独说一下,传统流程里,导演画完故事板,还要拍摄、剪辑才能看到动态效果,C1可以让你把静态分镜图直接变成带镜头感的连续视频,用来做拍摄前的预演,能省下不少试错成本。

(来源AI侦探社)

成片

实测三场戏


特效

  1. 东方神话(专门测文化理解)
一位身着道袍的仙人站在云端,双手结印,脚下莲花台缓缓升起,周身金光流转,远处山河如画卷般展开

  1. 视觉冲击型特效
夜晚荒野,一道雷劈下,地面裂开,蓝色能量沿裂缝蔓延扩散,镜头从地面缓慢拉升俯瞰全景

打斗

动漫风,夜战,两人高速近身格斗,强烈打击感。

首个影视行业大模型来了!一手实测PixVerse C1:运镜效果惊艳

打斗场景是AI视频的老大难,关节联动、物理碰撞、速度感,任何一个环节出问题都会穿帮。C1官方宣称有"工业级动作引擎",我们给的提示词是动漫风格夜战格斗,要求强烈打击感。

先说好的:氛围到位,光影处理稳,两人交手的节奏和力量感能感受到热血,打击感基本达标。每一拳如何去打有物理规律,不是在乱打,镜头调度也有刻意往塑造对抗上靠,拳拳到肉时肌肉力量对抗时泼洒的汗水细节令人眼前一亮。

但有一个问题没解决:角色的脸在整个打斗过程中几乎没有表情变化。打得最激烈的时候,脸是平的,像在散步。动漫格斗戏的灵魂就是那些咬牙、瞪眼、喘气的微表情,这块C1还没跟上。肢体动作上也有关节联动不够流畅的地方,某些角度看起来稍微有点假。

"打得动"和"打得活"之间,C1目前还有一道坎没迈过去。

运镜

运镜测试是这轮体验里表现最稳的一场,也是C1最想展示的能力。它不只想生成画面,它想有"拍"视频的思路。

一名战士站在山顶,风吹衣袂,镜头以其为中心缓慢环绕一圈,远处云海翻涌,日出光线逐渐打亮画面

跟同行比,它站在哪个位置


快手可灵在2026年1月的ARR已超过3亿美元,靠的是短视频平台的既有生态反哺商业化;字节的Seedance 2.0打的是通用视频生成,覆盖面更广;Runway走的是好莱坞专业制作路线,目标用户是大制作团队。

C1的位置夹在中间:比Runway更接地气、门槛更低,比通用模型更懂影视场景的具体需求。它把一些友商需要整个专业AI影视工作流才能实现的东西,浓缩在了模型层,省去了大量时间与学习门槛。

谁适合用,能拿到什么


AI短剧制作方是当下最对口的用户。2026年1月,国内AI漫剧单月上线数量达到14634部,平均每天470多部新剧上线。这个体量对出片速度的要求远高于对画质的要求,C1的自动分镜、音画同步、跨镜头角色一致性,正好戳中这个需求,用来加速生产流程是实在的。

个人创作者能从C1拿到的,是一个相对完整的从提示词到成片的路径,不需要自己搭工作流、不需要另外学剪辑,对没有专业背景的人来说入门门槛低。

传统影视工作室目前最适合把C1用在前期预演环节。把故事板快速转成动态视频,验证镜头调度和叙事节奏,在实拍之前就能看到大概效果,省掉一部分前期试错的时间和钱。

真正全流程替代专业制作,现阶段还做不到。文化理解的盲区、微表情的缺失、收尾节奏的控制,都是还没打磨到位的地方。C1现在更接近一个把导演、剪辑、特效初级工作打包进一个提示词的助手。这已经是很实用的东西,不过还不是片场里那个能独当一面的掌镜人。

关注塔猴公众号,扫码下载塔猴APP,查看更多干货

扫码加入官方社群


声明:该内容由作者自行发布,观点内容仅供参考,不代表平台立场;如有侵权,请联系平台删除。
标签:
影视级视频模型
音画同步
视频生成大模型