Sora有多火?
马斯克、杨立昆、贾扬清、Jim Fan、谢赛宁等各路大佬都在讨论,周鸿祎更是喊出,Sora的诞生意味着AGI(通用人工智能)的实现或从十年缩短至一两年。
不少“普通人”也提前嗅到商机,围绕Sora搞钱的生意先火了。有媒体报道,一张网传截图显示,某机构已售出2万多份Sora培训课程,轻松到手200万。
如今,距离2月16日OpenAI发布文生视频大模型Sora已经过去快一周,但讨论依旧热烈,这实在是因为它过于优秀。
功能上,它能生成长达60秒的视频内容,远超其他文生视频工具几秒至十几秒的限额;它还能进行自我编辑和扩展,将两个不相关的内容过渡在一起,能转换主角周围的风格和环境等;
前景上,Sora不仅是视频生成工具,它更被视为世界模拟器;
创始团队上,也堪称传奇,核心成员包括12人,成立尚未超过1年,由两名刚刚毕业的博士生带队,其中还有00后。
在兴奋之余,Sora的强大也让一些内容创作者有了危机意识,有网友评价,“长短视频、游戏行业的朋友们一整年都不会快乐了。”
多位业内人士指出,以目前Sora生成视频的长度来看,它的到来最先会冲击到短视频领域。一旦大范围推广,Sora将大大降低短视频创作门槛,丰富短视频平台的内容供给,但随之而来的问题是,AI生成内容的增多可能会影响平台的内容生态,同时Sora还会和剪映、快影等工具抢夺用户,让此前的大笔投入付诸东流。
Sora朝短视频领域扔下了一枚重磅炸弹,考验创作者和抖音快手们的时刻到了。
一、Sora降低了门槛,也增加了竞争
虽然市面上已经有不少文成视频工具,比如Pika、Runway,用户输入文字就能得到一段几秒到十几秒的视频内容,但目前它们并未被广泛使用,主要原因还是效果一般。
某MCN机构负责人大成告诉“定焦”,他使用过Runway,“我们还从外部购买了优质素材,但最终生成的内容不够精良,根本用不了。”
看到Sora后,他十分激动,“时长能达到60秒,内容还合乎逻辑,感觉和之前的工具不在一个层次上。”
“Sora与此前的同类产品相比,效果好了不止10倍。”人工智能在读博士、做过相关大模型研究的牛小博表示。“目前Sora 60秒的稳定生成效果,将对短视频行业带来革命性影响。”
研究AI的阿涅也表达了相同观点,“创作者的门槛被降低,哪怕视频的可信度还没那么高,甚至会出现一些错误,但不仔细很难看出来,将来技术也会很快迭代。”
综合多位从业者的说法,Sora直接解决了文生视频领域的两大难题,准确性和一致性。
AI研究者Cyrus的感受是,与之前的工具相比,“Sora就像三体人打原始人”。
所谓准确性,指生成的视频能准确识别用户输入的文字需求,一致性是指,在运动过程中,主角在多视角运动变化中内容连贯,不会发生形变,同时其变化还能遵循物理规律。最明显的表现是,主角和背景的互动符合逻辑。
一年前,牛小博和团队还在探讨生成式AI无法了解空间尺度,比如生成图尺寸不对,但他们觉得,Sora的出现已经解决了这个问题。
有人用视频还原物理空间模型,发现也能够对应上,牛小博觉得这证明了Sora的空间计算能力基本正确,而人对空间的感知很大一部分也依靠视觉。
图源:Sora官网
从这个角度看,Sora生成的视频背后,有物理空间的逻辑支撑。
综合多位受访者的观点和多位科技界大佬的公开发言,尽管还有瑕疵,但Sora给视频乃至整个人工智能领域的重大突破在于,这是一个更智能,甚至具备一定思维能力的模型,其生成的视频能理解物理世界的客观规律。
这也让一批做短视频内容的从业者开始思考,Sora到底会不会抢自己的饭碗?
我们把现有的短视频简单分为两类,一类由真人出镜,往往真人就是一个账号甚至一家公司的“核心资产”,Sora对这类内容的冲击并不大;另一类由素材集合而成,考验拍摄、创意能力。Sora的出现,将大大提升这类视频的生产效率。
一些想要提高产量的创作者,非常期待Sora的到来。
大成表示,这类工具完全可以取代公司的低端劳动。“我们公司体量小,为了节省成本招了很多大学生,但他们刚毕业,半天憋不出一个文案,用了AI,几分钟就能写出上百条。”
去年他和团队就开始大规模使用AI工具了,“虽然这些工具还不成熟,但处理文案和粗剪,都很好用。作为一家视频生产商,一定要提高效率。”他表示。
对于一些有创意的团队来说,他们则认为短期内Sora不会对其产生威胁。
头部MCN机构负责人达克告诉“定焦”,“Sora还没有开始公测,该技术离成熟还有很长一段时间,而且我们的视频主要靠人的创意、头脑风暴,包括拍摄也是讲究创新的,镜头如何设计、如何过渡,都有思考。虽然Sora很强大,但完不成我们目前的创意设计需求。”他还透露,目前公司没有使用任何AI工具。
不过,这些创作者们必须面对的问题是,Sora的出现降低了短视频创作门槛,会有越来越多的人加入,跟他们抢夺流量和变现机会。
一名新媒体从业者表示,他们有内容创作能力,但苦于没有合适的视频拍摄、剪辑团队,新的工具出现,就是他们的机会。
综合多位业内人士的观点,在类型上,目前Sora对真人出镜类短视频影响较小,对动漫类、解说类内容影响比较大,甚至会淘汰很多没有创意、只蹭热点的批量做号公司。在岗位上,部分做机械性重复工作的人员可能会面临淘汰,但创意类人员会被提至更高位置。
总之,未来做短视频,参与者更多,竞争也更激烈。
二、抖音快手们会慌吗?
Sora的出现,将给短视频平台带来更加丰富的供给,但同时也让抖音快手们面临新的考验。
从业者表示,一方面,AI生成视频过多,会对短视频平台原有的内容生态造成冲击,另一方面,Sora的火爆,会抢走一部分抖音、快手旗下剪映、快影等工具的用户。
达克告诉“定焦”,AI生成的内容在上传短视频平台时,需要特殊标注。
去年5月,抖音就发布了《抖音关于人工智能生成内容的平台规范暨行业倡议》,这一倡议提出,要对该类内容进行显著标识,虚拟人使用者需要实名认证,同时对利用AI工具创作、发布侵犯肖像权、弄虚作假等内容进行严格处罚。
快手、小红书等平台也有相关的限制。今年2月,小红书官方发布AI创作内容的规范,要求创作者主动声明AI创作内容、不能用AI创作内容虚构使用体验进行商业变现等。
多位从业者表示,他们能够明显感觉到,平台在控制该类内容,甚至会限流。
“AI创作的内容同质化严重,且创意性不高,用户一旦刷到太多相似内容,就会变得不耐烦,甚至转战其他平台。”一位互联网行业观察者表示。
他还觉得,“如果平台对这类内容不做限制,越来越多创作者也会图省事使用AI,这会严重影响到平台各类内容占比,最直观的是,一些独有的、稀缺的视频会减少。”
以及还有可能会诞生大量虚假视频。Sora能快速生产大量逼真的短视频,也让造假变得轻而易举,一些用户对该类内容难辨真伪,一旦被骗,平台公信力也会受到严重影响。去年,利用文生图、AI换脸等AI生成内容进行诈骗的案件就被曝出不少。
图源:Sora官网
在Cyrus看来,如果平台扶持AI创作类内容,很像“为他人做嫁衣” ,结果就是影响用户留存。“设想一下,如果小红书上全是字节豆包大模型生产的内容,用户为什么不直接刷抖音呢?反之亦然。”
Cyrus预测,抖音、快手、小红书、B站上,不会大量推荐AI创作的内容。除非是平台自己做的文生视频大模型,在自家进行大范围推广后,进行单独变现。“比如当其优化到一定程度,可以直接走用户付费模式,但各家的产品目前都不具备这一能力。”
不止一位业内人士推断,Sora和其他AI视频创作工具之间的差距会越来越大,此前,“Sora会不会杀死剪映”的话题就曾引发热议。Sora如果被大规模应用,大多数AI工具可能会被市场抛弃,其他公司前期的大笔投入将付诸东流。
为什么差距会拉大?
周鸿祎曾公开指出,国内的大模型发展水平表面上看接近GPT-3.5,实际上离4.0还有一年半的差距。牛小博从技术端给出解释,Sora不是一个点状技术,而是一个复杂的系统工程。即便外界知道其核心技术是transformer注意力算法+diffusion的扩散算法等,但其背后是OpenAI给予的资金支持和积累的超强数据。
OpenAI通过积累的GPT通用语言模型加上DALL-E3图像生成模型,发展出视频能够理解图片内容,到Sora的时候,又提升了一致性和物理空间理解能力,这每一步的积累,缺一不可。
更大的预测更是让抖音们前路难料。有影视从业者认为,Sora被大范围使用后,有可能会出现比抖音更大的新平台。
在一部分人看来,Sora降低了用户门槛,必然导致内容创作者数量级猛增,而抖音这样的短视频平台,其体量、内容创作和推送的逻辑规则,能否承载该类内容很难说,很可能会诞生一个与Sora更相符合的平台。
牛小博通过观察互联网行业的发展,也赞同这一观点。“互联网在早期是专业用户使用,后来PC的普及扩大了用户,接着智能手机出现,人人可以联网,以至于服务各类人群需求的平台都出来了。也许随着Sora使用人群的增加,会有新的生态出现。”
三、Sora影响巨大,但不必神化
目前,Sora还没有开放公测,只有一些视觉艺术家、电影制作人、OpenAI员工等人士获得了访问权限。一部分原因是,Sora并非完美无缺。它对短视频的冲击,还没有完全展现。
AI训练师小刚指出,Sora存在大模型普遍存在的“幻觉问题”,它在理解物理规律、人与物体交互等方面还存在缺陷。
比如OpenAI官网公布了一些缺陷视频,包括蜡烛吹不灭、投篮时篮球在下落过程中爆炸,以及挖出来的椅子直接飘起来等不符合物理规律的内容,这是因为Sora的理解还不够成熟,误以为从沙子里挖出来的东西,一般都比较轻。
图源:Sora官网
而具体到短视频行业,小刚认为Sora最重要的一个不足是,还做不到人物固定。
举个例子,比如创作者用Sora生成了一条60秒的视频,画面中主角为A,但其在生成下一个视频后,主角很可能就换成了B。
相比Pika、Runway,大家能看到Sora的空间能力很强,但内容再短,做不到人物固定就没有意义,用户持续在短视频平台观看内容,无论是真人还是动画,都需要一个中心人物保证故事的延续性。
以及算力问题,也让很多人担忧Sora的普及速度。毕竟技术突破再大,如果成本过高,还是难以被大众接受。多名业内人士认为,这是目前Sora面临的最大困难。
“目前OpenAI没有公布Sora具体的算力、能源消耗需求以及参数量。初步判断,它需要的数据量、算力以及大量的能源消耗将是巨大成本,而这与其下个阶段的广泛推广必然存在矛盾。”牛小博认为。
每一次新技术的出现,都会引发一场新旧交替的大讨论。
虚拟拍摄技术刚诞生时,为影视行业节省了拍摄成本,但传统的拍摄方式至今仍然存在。OpenAI推出ChatGPT一年多以来,文字从业者也没有被替代,反而让更多人意识到优质内容创作者的价值。
同理,Sora对市场上同类AI工具带来了冲击,但它再强,淘汰的更多是没有创意、只想走量的短视频从业者,或是不会使用这类工具的人。
至于Sora是否会颠覆整个短视频行业,会不会诞生下一个超级平台,目前大家还在观望,需要看Sora能否迅速解决现有问题,以及国内有没有新的挑战者诞生。
(应受访者要求,文中达克为化名。)
本文来自微信公众号:定焦(ID:dingjiaoone),作者:王璐,编辑:魏佳