Sora“搅局”影视与游戏,打不过就加入吧

吕凯源告诉财经E法,在Sora之前发布的很多文生视频产品并不符合物理世界规则,而Sora生成的内容已经大部分符合物理世界的规则了。

实丰文化回复投资者称,公司一直密切关注行业最新发展态势及用户需求,不断提升生产创作效率,AI技术与游戏的进一步融合将为游戏业务的开展降本增效,公司预期会使用“Sora”等视频AI工具进行游戏片头以及视频投放素材的生成,可以降低研发及制作成本。

几天前,好莱坞导演泰勒·派瑞在见证了OpenAI最新推出的Sora(人工智能文生视频大模型)后,搁置了8亿美元的工作室扩建计划。泰勒认为,有了Sora,将极大简化影视创作流程,对编辑、剪辑、道具、布景等职位产生重大影响,未来会有一大批人失业。

而在几个月前,梦工厂创始人杰弗瑞·卡森伯格表示,人工智能将在3年内削减90%的动画电影工作岗位。

显然,Sora的出现,已经让影视和游戏行业感受到了危机。如果一句话就能生成视频,视频剪辑师似乎轻易就会被取代。

华泰证券研报显示,2023年实际诞生的文生视频大模型达到数十个,全球用户数量超过百万级别,但目前多数视频模型仍处于产品早期阶段。2024年各大公司加快了文生视频模型的研发步伐。此外,中信证券测算,中国国内文生视频应用在短视频领域2025年潜在市场空间中值达80亿元。

1月2日,Midjourney宣布将在未来几个月加快训练文生视频模型,1月23日,谷歌推出文生视频模型Lumiere。在国内,字节跳动和腾讯也分别公布了视频模型MagicVideo V2与VideoCrafter2。除了大公司推出的产品,市场上已公开的大多数模型出自初创公司和小型技术开发团队,比如Runaway、Pika等,且目前已呈现较为可观的完成效果和商业模式。预计随着科技大厂产品的发布,后续相关产品生态将持续繁荣。

在与多位影视、游戏、短视频及短剧行业的资深人士深入交流之后,财经E法发现,在科技浪潮面前,“打不过就加入”,用好先进的AI工具为产业赋能,或许是更务实的策略。

一、影视:被颠覆只是时间问题

Sora的出现已让影视从业者感到了寒意,被颠覆似乎只是时间问题。

在Sora生成的视频中,一位穿着时髦的女性走在东京街头,路面的积水映射着远处霓虹都市;而在另一段动物视频中,几只猛犸象从雪原深处奔来,毛发与白雪在风中飘动,视频主角的面部表情和肢体动作都自然、生动。

文生视频的美好前景也被逐一展现:可媲美人类的场景设计、多场景运镜,以及对物理世界精确的理解。此外,Sora生成的视频时长也远超同类产品,据媒体测算,在相同的提示词下,Sora可生成近1分钟的视频,Pika仅能生成3秒的视频,Gen-2video可以生成4秒的视频。

近日,360集团创始人、董事长周鸿祎在2024亚布力中国企业家论坛第二十四届年会上分析,Sora的突破在于,它实现了机器对这个世界的感知、观察和交互的能力。也就是说,真正地给人工智能补上了眼睛,但这个眼睛不是工作在感知层面,而是工作在认知层面,能通过观察世界,来了解很多过去用文字无法表达的东西,比如雪花的特性、枕头的松软程度。

具体而言,相较此前的文生视频产品,Sora有着几大突出特点:

1. 符合现实世界的物理规律;

2. 能够生成一分钟的高清视频,并且支持生成不同时长、长宽比和不同分辨率的视频与图像;

3. 支持文字+图片生成视频,且可以基于文本提示,从而改变原视频的风格化和视频中的元素;

4. Sora可以生成带有动态摄像机运动的视频。随着摄像机的移动和旋转,人和场景元素在三维空间中一致移动;

5. Sora可以实现不同视频的自然衔接、过渡,且支持拓展视频。

根据OpenAI公布的Sora技术文档,Sora结合了Diffusion model(扩散模型)和Transformer两种技术架构。Diffusion model是一种生成模型,用于图像的生成。而Transformer是一种深度学习模型,可以学习文本之间的依赖关系,也能够处理图片和视频的任务,如图像分类、视频理解。在此基础上,Sora还增添了对绘画意图标签的理解以及空间与时间的补丁包,增强对物理世界的理解。

一些影视行业资深人士却仍在细节上存有疑问。青年导演吕凯源的作品曾入围第17届FIRST平面电影展主竞赛单元,并获得北京国际电影节最具新血潜力项目奖,他认为,Sora生成的视频质量确实不错。但这些视频更像《文明6》这类游戏的开头,而不像是电影或者广告的片段。

吕凯源告诉财经E法,在Sora之前发布的很多文生视频产品并不符合物理世界规则,而Sora生成的内容已经大部分符合物理世界的规则了。从这一意义上来说,Sora是通用人工智能的进步。“预期Sora可能会对影视行业颠覆,其实是人类对Sora的期望——希望它能理解得更深,但Sora未必能够达到人类对于艺术、时尚和文化的理解。”吕凯源说。

比如,在去年,ChatGPT爆火后,吕凯源曾经尝试用ChatGPT写过一些故事。他认为,AI确实能提供某些层面的启发、帮助,但目前ChatGPT还无法写出一个完整的剧本。吕凯源分析,GPT是文字的逻辑,Sora是视频的逻辑,这是人类的两种语言,文字语言与视觉语言是非常不一样的。“用文字来生成视频,意味着将一种文字的媒介转译成视频的媒介,这个过程是更复杂的,需要调用人类的感官、思考,这对文生视频而言是一个亟须克服的障碍” 吕凯源表示。

吕凯源认为,目前Sora生成的画面精度与真实的画面仍有差距。未来引入摄像机参数后或许能够生成高质量的视频,但他担忧会产生“恐怖谷效应”——画面越像,人类越会觉得不真实。且影视创作极具创造性和随机性,AI无法复制。比如,后期剪辑的思路其实是人类出于视觉上的完形心理,创造了剪辑的各种规则和玩法。

在做一些时尚片的时候,他经常会看一些国外的新时尚片,发现影视业的同行是在不断创造新剪辑语法的,且需要经过反复的试验才能生成一个好片子。镜头的长与短,用什么样的效果,这些细节Sora可能没有办法做到。

“例如,我随便输入一个指令‘一个人在一个房间里’,导演、编剧对于这个画面想象都是不一样的。演员的表情也是非常即兴、自我发挥的,他们有很多经验可以调动。但AI只能根据它对世界的理解。比如,笑这个表情,AI可能有1000种选项,它不一定会选择最对的,而是会选择最合适的。对于演员而言,可能他们选择了调用自己心里那个最出其不意的笑,反而获得了巨大的成功。”吕凯源说。

OpenAI官方也指出,Sora可能难以准确模拟复杂场景的物理原理,可能无法理解因果关系的具体实例。例如,一个人咬了一口饼干,但生成画面中的饼干上可能会没有咬痕。此外,Sora还可能会混淆提示的空间细节,例如混淆左右;并且Sora可能难以精确描述随着时间推移发生的事件,例如画面遵循特定的相机轨迹。

一位CG特效师告诉财经E法,看到Sora的生成效果时感受到了一些危机感,自己需要几天时间才能完成的设计,AI可能只需要几秒钟就能完成。但Sora的创新性以及是否能够满足对特效的细节要求还有待验证。

此外,吕凯源认为,并不是技术越好越能生产出好的作品,好作品是多因素叠加的成果。他以最近爆火的《热辣滚烫》举例,电影的叙事与内容不见得多么出挑,真正让其火出圈、获得高票房的原因是营销端的成功。好莱坞一些大IP的成功在于他们的故事是创新的、缜密的,再加上快餐式或鸡汤式的营销,最终实现成功。

面对当下的不足,资深互联网科技行业分析师陈泽敏告诉财经E法,Sora的突破在于已经给出了可以被推演的技术增长路径,而不是需要通过质变来改善的技术。假以时日,Sora生成的视频有望达到更高的质量和精细程度。

华策影视董事长赵依芳公开表示,将全面拥抱AIGC和数字化,以科技创新谋新路,以更大的能量继续引领行业。

二、游戏:更易受到冲击

另一个可能被Sora冲击的行业是游戏行业。OpenAI官方发布的一段演示视频还原了视频游戏《我的世界》。研究人员使用包含“我的世界”的提示词还原了一个与《我的世界》一致的高保真游戏片段。

多位受访者告诉财经E法,相较影视行业,游戏业更易受到Sora的冲击。

一名游戏设计师告诉财经E法,一旦Sora具备了稳定且成熟的产出能力,CG、过场动画等美术内容将极有可能被取代。她表示,游戏的过场动画以及宣发中的CG建模制作时长一般较短,Sora如果能够实现成熟且具有一致性的内容输出,这一部分的制作或许能够完全由AI完成。

陈泽敏也认为,目前Sora一分钟的作品有些细节可能不真实,但其实已经可以满足一些内容生产需要。他以游戏行业举例:“目前,优质内容的用户占比在全球都不高。大部分人消费的都是一些不用那么精细的内容。比如,一些中腰部的游戏仍然有很多用户在玩。”

但一家头部游戏厂商的产品经理则认为,同质化、低质量的内容难以开拓市场,游戏应当在AIGC的辅助下找到新的打法。可以预见的是,Sora的出现能够提升游戏的体验。他举例,用户也许可以利用Sora在游戏中实现自己创建场景,过得更加极致的沉浸式体验。此外,游戏的开发者也可以利用类似的工具减少重复性劳动。个人开发者可以利用AI工具以相对较低的成本开发游戏,甚至有可能与游戏厂商竞争。

当然,前述行业人士也强调,一款游戏的成功不仅仅在于美术和设计,玩法、题材、运营、宣发、商业模式等都是重要的因素。消费者对于好游戏的标准也不断变化,Sora的出现并不意味着游戏从业者集体失业。

一些游戏厂商对Sora的出现做了积极回应。

巨人网络在互动平台回复投资者称,公司关注到Sora在视频生成领域取得的突破性进展,巨人网络作为最早完成大语言模型备案的游戏公司之一,同样在积极布局多模态大模型领域,聚焦游戏垂直类创作场景。

游戏公司掌趣科技在互动平台回复, Sora等新技术的涌现,将有助于提升游戏研发效率,推进游戏创作的创意实现,提升游戏体验,促进游戏类型的多元化发展,更好地助力游戏行业向前发展。公司在“AI游戏创作平台”、LayaAir游戏引擎方面的布局,是游戏工具、平台与AI技术结合的积极探索,也是后续AI相关新技术(包括文生视频等)有效的应用场景与合作伙伴,同时相关3D素材、3D引擎技术的积累也或将有助于行业内相关技术的训练或迭代。

实丰文化回复投资者称,公司一直密切关注行业最新发展态势及用户需求,不断提升生产创作效率,AI技术与游戏的进一步融合将为游戏业务的开展降本增效,公司预期会使用“Sora”等视频AI工具进行游戏片头以及视频投放素材的生成,可以降低研发及制作成本。

三、短视频/短剧:后期制作可能被取代

大势所趋,影视、游戏以及短视频领域的资深人士已经开始积极拥抱Sora带来的新浪潮。

华泰证券研报预计,Sora能明显降低影视业的制作门槛及成本,且可以极大程度丰富影视作品的创造性及风格。Sora的出现将重塑影视行业,预计拥有核心导演或创意人才,及IP资源的公司更受益。

中信证券研报认为,Sora模型出色的语义理解、视频编辑和扩展能力为创作者提供了灵活和广泛的创意空间,有望加速文生视频应用在各行业的渗透率。短视频的时长普遍在60秒及以下,Sora的内容生成能力充分适配短视频时长及应用场景,可以大幅提高创作效率并降低创作门槛。

吕凯源认为,如果Sora能够发展到一个非常厉害的程度,能够让影视从业者直接上手操作,或许可以成为工作流的一部分。在后期工种中,最容易被取代的可能是CG特效,它能够节省很多的时间和空间,替人类把身边的物理世界复刻出来。

在短视频和短剧领域,Sora的替代效应可能更大。陈泽敏告诉财经E法,Sora的出现能够提升大量中腰部以下的短视频创作者的产能与产效。Sora可以将每个角色的样貌、动作甚至口癖导入模型,提升产能。“危机是一定出现了,短视频行业的一部分内容创作者可能会产生产能压力。”陈泽敏说。

具体而言,吕凯源认为,抖音的很多优秀创作者的视频画面质量并不好,但重要的是他们的视频是有内容和创意的,并不容易被取代。但短视频的后期制作以及大量的投流号的内容制作,则完全有可能被Sora取代。

陈泽敏总结,Sora大幅降低了行业试错成本,提高了生产效率,使得行业有更多的创意冒出来。他建议,如果能够利用这一工具大量生产中文视频内容,再鼓励推出1~2个类似的平台,中文AI视频可能会出现百花齐放的状态。

一位不愿具名的短剧从业者也告诉财经E法,目前来看Sora的制作效果远超出预期,未来或许能够应用于短剧的后期制作,提高产出效率。

“AI是一个生产力强于过去传统模式的工具。但本身用不用得好,一定要看用它的人怎么样,或者说这个工具被打磨、被训练得怎么样。”陈泽敏说。

本文来自微信公众号:财经E法 (ID:CAIJINGELAW),作者:樊朔,编辑:郭丽琴

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
(0)
上一篇 2024年2月28日
下一篇 2024年2月28日

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日