2024年开年,OpenAI再次用视频生成模型Sora惊艳了世界。
在 OpenAI 官网分享的演示视频中,Sora 可以直接输出有多个角色、多种场景和运镜的画面。虽然文生视频在概念上并不是新鲜玩意,但和竞争对手相比,Sora的表现用“碾压”来形容也不为过。相比Sora那高清、严谨、时长达到1分钟的视频而言,Runaway网页版产品最长18秒的成绩已经是最强的对手。
如此一枝独秀的成绩,彻底引发了世界范围内的行业焦虑。有人认为,国内文生视频领域的实力距离及格线尚有极大差距,同行们表示自家对文生视频领域的发展目标目前尚不清晰。
不过,“焦虑”并非文生视频浪潮中唯一的情绪。
无论是ChatGPT还是Sora,他们引人亢奋的原因在于它极有可能促成全要素生产率的提升。
第一波冲击首先落到了影视行业的头上,用某业内人士的话来说,“业内差一些的编剧作品写得还不如AI”。但时至今日,人工智能的表现并不像许多人预测的一样激进,这使得行业对待文生视频的态度也多了一些审慎的意味。甚至在一些人眼中,人工智能的发展几乎是有百利而无一害的助力,而非挑战。
01 这次,国内厂商们不跟了
这几天,朋友圈刷屏了腾讯科技对杨植麟、朱啸虎、王小川三位的访谈实录,三者分别代表了业内对于AI的不同看法。其中投资人朱啸虎的核心观点是,咱们搞大模型研发干不过美国,不如把目标放在应用层,降低风险,提高收益。
暂且不提这个观点的对与错,至少从业界的反应来看,ChatGPT发布后,国内迅速掀起了百模大战,但当下愿意下重注跟上Sora的厂商确实寥寥无几。
一方面,这和成本有关。和ChatGPT类似,Sora使用 transformer 架构,将视频和图像表示为称为 Patch 的较小数据单元的集合,类似于 GPT 中的 token。重要的是,它和GPT一样符合AI 缩尺律(Scaling Law),也就是说随着训练计算量的增加,样本质量明显提高。
这也意味着,想要训练出类似效果的文生视频大模型成本同样昂贵。举个例子,1000台服务器的电力成本就高达月20万元,根据纽约时报援引对OpenAI创始人山姆.奥特曼的采访,ChatGPT每天要消耗50万度的电。
而有行业人士表示,Sora 之所以暂未对外开放使用,算力可能是重要的限制原因。
另一方面,即便是Sora,现在的实际效果也并不被看好。根据一些内侧使用者表示,Sora在内容生成上经常出现“幻觉”,比如东京街头漫步视频中,女主角走路过程中出现了腿部变形、腿部交叉换位时错乱。OpenAI的解释是,Sora可能难以准确模拟复杂场景的物理原理。
一些视频行业的从业者们对于现阶段Sora的实用性也表示了怀疑,“首先它很难在短时间内替代一个人,其次它输出的实际效果和市场的需求可能也不太相符合”。
02 是挑战更是机会
诞生于好莱坞的科技娱乐公司数字王国的CEO谢安表示,对于影视行业的需求而言,人工智能技术无论在文案还是文生视频方面发挥的作用,更多是降本增效而非威胁。
数字王国由一手打造了《泰坦尼克号》《返老还童》等名作的老牌视效工作室演变而来,漫威系列的许多作品也是出自其手,公司对于好莱坞影视制作流程有极其深入的参与
数字王国常常在一部电影制作的初期流程就参与进来,为作品视觉进行设计、制作相关预演等工作。在这个阶段,AI的运用可以极大的提升工作效率,降低人力成本,将原本可能耗时3个月到半年的工作压缩至一周内。
这一点的实现,与数字王国自身的底蕴也有重要的关系。谢安表示,AI创作依赖优质的素材来源,这正是数字王国的优势之一。成立三十多年来,数字王国深度参与甚至一手包办的视效大片数不胜数,在这过程中不断地充实自身的数字资产。
优秀的AI模型+优质数字资产,很容易催生出强大的生产线,更进一步地实现视效设计和制作流程的降本增效。
但另一方面,视效大片对最终呈现效果的要求极高,从概念到设计,再到表演,任何细微的修改都会产生巨大的变化,这种程度的需求是目前的文生视频无法满足的。
换言之,用AI制作让导演满意的分镜脚本很容易,制作电影成片却极难。
因此,像数字王国这样的公司根本不怕被抢走饭碗。
除此之外,数字王国乐见AI技术发展还基于一个独特的原因:对数字王国而言,AI不仅仅是工具,还会是客户。
数字王国在好莱坞以影视视效制作著称,在其拥有的多项优势中,虚拟人技术是一张王牌,电影《复仇者联盟》中的灭霸,《返老还童》中的本杰明·巴顿都是由数字王国操刀的经典案例。
值得重视的是,在这两部电影中,均有演员并未参与拍摄,却出现在了正片中的戏份。
数字王国CEO谢安不久前在一次新闻采访中透露,其实公司已经帮助许多剧组实现了用虚拟人表演的内容,其中既包括主要角色的戏份,也包括群演扮演的路人,为剧组节省了大笔成本。
曾在北京台春晚亮相,引发热议的虚拟人邓丽君,也是数字王国手上的明星产品。
作为数字王国技术研发的重心之一,虚拟人的开发已经形成了一套成熟、高效的系统。谢安表示,只要对一个人进行足够的采样,数字王国可以很快就制作出完成度极高的“数字替身”,其产品完全可以进行商业应用。
在这样的前提下,如雨后春笋般冒出的人工智能模型,就成了数字王国眼中的庞大市场。CEO谢安在采访中表示:“目前成熟的AI模型都是以文字的形式存在,都没有一张‘脸’,想像一下,如果这些AI都有一张用户喜欢的,量身订制的脸,会是怎样的场景?用户过世的亲属,可以依靠虚拟人技术活在数字世界,和新生的后代互动,这又是怎样的光景?它其实是一个很庞大的商机。”
数字王国对市场的判断得到了相当大的支持,近期公司融资超过了8亿元港币。当新的风口既是你的工具,又成为你的市场时,这样的前景也就很难不被看好了。