阿里HappyHorse一出场,字节连夜降门槛:搞懂这波AI视频的三国杀
字节跳动旗下的火山引擎突然发了个公告,说自家的Seedance 2.0视频大模型API服务全面开放了,企业和个人都能随便调用。
很多一直在圈子里盯风向的开发者,看到这个消息估计都心照不宣地笑了。
要知道,就在不久前,想用这套服务的门槛还高得吓人。你得先掏出一笔预付款,有些大客户甚至面临千万级别的最低消费。字节当时的姿态摆得挺高,大有“全村就我这儿有,爱买不买”的架势。
怎么突然就变得这么好说话了呢?
是这样,4月7号,一个连名字都没留的神秘大模型HappyHorse(大家戏称它为快乐马),空降到了权威盲测榜单Video Arena上。结果这匹马跑得贼快,在图生视频榜单上拿了1411分直接登顶,把字节的Seedance 2.0甩开了大概55分;在文生视频那边,也稳稳压了快手可灵3.0一头。
大家正猜这是哪家的新秀呢,三天之后,阿里官方笑眯眯地出来认领了:没错,这匹马是我家的。
阿里这一手“截胡”玩得相当漂亮。自从3月底OpenAI因为实在烧不起钱把Sora关停之后,大家都以为字节的Seedance 2.0要在AI视频圈一统江湖了。谁能想到,半路杀出个阿里组成一局“三国杀”。
咱们今天就好好盘一盘这三家大厂在视频模型上到底在争什么,以及咱们普通打工人能跟着捞着什么好处。


Sora没挺过去,全因为找不到打工的地方
嘻嘻,聊这三家之前,咱们得先鞭尸一下Sora。
Sora刚出来的时候多风光啊,那一段戴墨镜的女人走在东京街头的视频,把全世界都唬住了。可结果呢?上个月OpenAI默默把它关了,还退了迪士尼10亿美元的合作款。

它死于技术不行吗?真不是。它纯粹是死于贫穷和没处打工。
据媒体爆料,Sora每天光是跑算力就要亏掉大概100万美元。这么贵的玩意儿,做出来总得赚钱吧?结果OpenAI给Sora做个独立App,上线30天的用户留存率只有可怜的1%,到了60天直接归零。总收入满打满算才210万美元,投入产出比拉胯到了2500:1,堪称AI历史上最贵的一场烟花。
那你可能好奇了,怎么会没人用啊?因为普通人花钱生成个十几秒的炫酷视频,除了发朋友圈装个杯,根本产生不了任何收益。这就解释了,为什么现在全球最能打的视频大模型,全出在中国的内容公司里——字节、快手、阿里。
你Sora找不到人买单,可字节有抖音,快手有老铁。每天几亿人要在上面发视频、看广告、买东西。这些平台根本不用发愁获客,海量的创作者就是天然的用户。你用模型生成个爆款搞笑视频,或者带货视频,平台有一万种方法通过广告费把钱赚回来。
快手早就闷声发大财了。去年第四季度,可灵AI的营收就达到了3.4亿元,现在的年化收入已经冲到了2.4亿美元。
所以,AI发展到今天,光吹技术牛没用了,资本和市场可是很现实的。
刚当上老大就想收割?字节有点急
Sora一倒下,字节估计在被窝里笑出了声。自家不仅有现成的应用场景,Seedance 2.0的技术也确实争气。
Seedance能火,主要是它解决了一个大痛点。以前做个AI短片,视频和声音得拆开弄,弄完再靠后期对口型,麻烦得很。Seedance用了一种单流Transformer架构,就是:用一个脑子同时处理画面和声音。一次性输出带声音的成片,连口型和脚步声都能对得上。用它生成15秒视频的可用率能达到90%,以前行业平均也就20%左右。这完全不用再抽卡开盲盒了!
字节的商业算盘打得也很六。先放几个“猫狗大战哥斯拉”的免费模板,在抖音上病毒式传播,把用户的胃口吊起来。等大家用顺手了,立刻开启商业化。
但问题出在,当市场上只有你一家独大的时候,吃相就容易变得难看。
前段时间,不少中小型内容团队在网上疯狂吐槽Seedance 2.0。一方面是排队排到怀疑人生,高峰期能有8万人在线等,有时候等个7小时都出不来片,就连花钱充了高级会员也得等。
另一方面,大家发现使用成本在悄悄飙升。字节在年费基础上又搞出个VVIP等升级服务,变相把价格往上抬。做一部2分钟的短剧,刚开始成本大概只要7块钱,后来被逼到了80块钱。
这已经触及到了很多小团队的底线。大家都在骂,但又无可奈何,谁让人家是唯一选项呢。
阿里这匹马,其实是保卫电商来的
阿里这时候把HappyHorse牵出来,时机是非常的准。
你可能会纳闷,阿里一个搞电商的,跑来凑什么视频大模型的热闹?不务正业!
其实,这才是阿里在打防御战。
大家看看HappyHorse背后的团队就懂了。这支团队的负责人叫张迪,他以前是快手可灵的负责人,现在不仅管着阿里的创新事业部,还兼任了阿里妈妈的CTO。
现在的电商带货,早就不用图文了,全靠短视频和直播。如果阿里不做视频大模型,那淘宝上那几百万商家,想做个吸引人的带货视频,就得跑去用字节或者快手的AI工具。把电商最重要的内容生产工具捏在敌人手里,这对阿里来说是不可接受的。
所以HappyHorse的诞生,带着强烈的业务目的。它有个细节特别有意思:原生支持七种语言(包括中、英、日、法等)的唇形同步。这功能摆明了就是给跨境电商和各种虚拟带货主播量身定做的。老板们坐在仓库里,敲几行字,就能用AI生成一个老外操着流利外语卖小商品的短视频。

只要HappyHorse做得够好、够便宜,阿里不仅能帮自家商家省下大笔营销费,形成“内容-交易-履约”的闭环,还能顺手去掏字节的后院。那些被Seedance的高价和排队折磨得苦不堪言的MCN机构、独立开发者,肯定愿意多一个选择。
实际上,动作快的创业公司已经开始站队了。比如专门做电商AI Agent的工具DeskClaw,最近就接入了视频生成能力。随着竞争加剧,底下这些做SaaS软件和智能体的公司,一定会货比三家,谁家的大模型便宜、接口稳定,就用谁家的。
三国杀开局,咱们普通人跟着沾光
聊到这儿,再看字节在4月14号连夜取消API门槛、全面开放服务的动作就顺理成章了。
AI这门生意,现在拼的不仅是技术参数,更是谁能把算力成本打下来,谁能把应用场景铺得更广。
字节有抖音的庞大流量池,快手有老铁生态和已经跑通的营收账本,阿里有电商广告这棵常青树。这三家现在的模型能力咬得很紧,谁也没法一招把对面按死。
这种三国杀的局面,对行业来说是件大好事。
如果一家独大,我们只能被迫接受昂贵的定价,忍受无休止的排队。只有大厂们互相掐起来,为了抢客户大打价格战,算力成本才会稳中有降。越来越多的中小创业者、甚至普通打工人,才能真正用上便宜好用的AI视频工具,去拍点自己想拍的东西。
大厂们在牌桌上较劲,咱们就安安心心享受这波技术红利。毕竟,能白嫖的算力,才是好算力。


