Sora火了,抖音快手们慌了?

图源:Sora官网

从这个角度看,Sora生成的视频背后,有物理空间的逻辑支撑。

在一部分人看来,Sora降低了用户门槛,必然导致内容创作者数量级猛增,而抖音这样的短视频平台,其体量、内容创作和推送的逻辑规则,能否承载该类内容很难说,很可能会诞生一个与Sora更相符合的平台。

图源:Sora官网

而具体到短视频行业,小刚认为Sora最重要的一个不足是,还做不到人物固定。

Sora有多火?

马斯克、杨立昆、贾扬清、Jim Fan、谢赛宁等各路大佬都在讨论,周鸿祎更是喊出,Sora的诞生意味着AGI(通用人工智能)的实现或从十年缩短至一两年。

不少“普通人”也提前嗅到商机,围绕Sora搞钱的生意先火了。有媒体报道,一张网传截图显示,某机构已售出2万多份Sora培训课程,轻松到手200万。

如今,距离2月16日OpenAI发布文生视频大模型Sora已经过去快一周,但讨论依旧热烈,这实在是因为它过于优秀。

功能上,它能生成长达60秒的视频内容,远超其他文生视频工具几秒至十几秒的限额;它还能进行自我编辑和扩展,将两个不相关的内容过渡在一起,能转换主角周围的风格和环境等;

前景上,Sora不仅是视频生成工具,它更被视为世界模拟器;

创始团队上,也堪称传奇,核心成员包括12人,成立尚未超过1年,由两名刚刚毕业的博士生带队,其中还有00后。

在兴奋之余,Sora的强大也让一些内容创作者有了危机意识,有网友评价,“长短视频、游戏行业的朋友们一整年都不会快乐了。”

多位业内人士指出,以目前Sora生成视频的长度来看,它的到来最先会冲击到短视频领域。一旦大范围推广,Sora将大大降低短视频创作门槛,丰富短视频平台的内容供给,但随之而来的问题是,AI生成内容的增多可能会影响平台的内容生态,同时Sora还会和剪映、快影等工具抢夺用户,让此前的大笔投入付诸东流。

Sora朝短视频领域扔下了一枚重磅炸弹,考验创作者和抖音快手们的时刻到了。

一、Sora降低了门槛,也增加了竞争

虽然市面上已经有不少文成视频工具,比如Pika、Runway,用户输入文字就能得到一段几秒到十几秒的视频内容,但目前它们并未被广泛使用,主要原因还是效果一般。

某MCN机构负责人大成告诉“定焦”,他使用过Runway,“我们还从外部购买了优质素材,但最终生成的内容不够精良,根本用不了。”

看到Sora后,他十分激动,“时长能达到60秒,内容还合乎逻辑,感觉和之前的工具不在一个层次上。”

“Sora与此前的同类产品相比,效果好了不止10倍。”人工智能在读博士、做过相关大模型研究的牛小博表示。“目前Sora 60秒的稳定生成效果,将对短视频行业带来革命性影响。”

研究AI的阿涅也表达了相同观点,“创作者的门槛被降低,哪怕视频的可信度还没那么高,甚至会出现一些错误,但不仔细很难看出来,将来技术也会很快迭代。”

综合多位从业者的说法,Sora直接解决了文生视频领域的两大难题,准确性和一致性。

AI研究者Cyrus的感受是,与之前的工具相比,“Sora就像三体人打原始人”。

所谓准确性,指生成的视频能准确识别用户输入的文字需求,一致性是指,在运动过程中,主角在多视角运动变化中内容连贯,不会发生形变,同时其变化还能遵循物理规律。最明显的表现是,主角和背景的互动符合逻辑。

一年前,牛小博和团队还在探讨生成式AI无法了解空间尺度,比如生成图尺寸不对,但他们觉得,Sora的出现已经解决了这个问题。

有人用视频还原物理空间模型,发现也能够对应上,牛小博觉得这证明了Sora的空间计算能力基本正确,而人对空间的感知很大一部分也依靠视觉。

图源:Sora官网

从这个角度看,Sora生成的视频背后,有物理空间的逻辑支撑。

综合多位受访者的观点和多位科技界大佬的公开发言,尽管还有瑕疵,但Sora给视频乃至整个人工智能领域的重大突破在于,这是一个更智能,甚至具备一定思维能力的模型,其生成的视频能理解物理世界的客观规律。

这也让一批做短视频内容的从业者开始思考,Sora到底会不会抢自己的饭碗?

我们把现有的短视频简单分为两类,一类由真人出镜,往往真人就是一个账号甚至一家公司的“核心资产”,Sora对这类内容的冲击并不大;另一类由素材集合而成,考验拍摄、创意能力。Sora的出现,将大大提升这类视频的生产效率。

一些想要提高产量的创作者,非常期待Sora的到来。

大成表示,这类工具完全可以取代公司的低端劳动。“我们公司体量小,为了节省成本招了很多大学生,但他们刚毕业,半天憋不出一个文案,用了AI,几分钟就能写出上百条。”

去年他和团队就开始大规模使用AI工具了,“虽然这些工具还不成熟,但处理文案和粗剪,都很好用。作为一家视频生产商,一定要提高效率。”他表示。

对于一些有创意的团队来说,他们则认为短期内Sora不会对其产生威胁。

头部MCN机构负责人达克告诉“定焦”,“Sora还没有开始公测,该技术离成熟还有很长一段时间,而且我们的视频主要靠人的创意、头脑风暴,包括拍摄也是讲究创新的,镜头如何设计、如何过渡,都有思考。虽然Sora很强大,但完不成我们目前的创意设计需求。”他还透露,目前公司没有使用任何AI工具。

不过,这些创作者们必须面对的问题是,Sora的出现降低了短视频创作门槛,会有越来越多的人加入,跟他们抢夺流量和变现机会。

一名新媒体从业者表示,他们有内容创作能力,但苦于没有合适的视频拍摄、剪辑团队,新的工具出现,就是他们的机会。

综合多位业内人士的观点,在类型上,目前Sora对真人出镜类短视频影响较小,对动漫类、解说类内容影响比较大,甚至会淘汰很多没有创意、只蹭热点的批量做号公司。在岗位上,部分做机械性重复工作的人员可能会面临淘汰,但创意类人员会被提至更高位置。

总之,未来做短视频,参与者更多,竞争也更激烈。

二、抖音快手们会慌吗?

Sora的出现,将给短视频平台带来更加丰富的供给,但同时也让抖音快手们面临新的考验。

从业者表示,一方面,AI生成视频过多,会对短视频平台原有的内容生态造成冲击,另一方面,Sora的火爆,会抢走一部分抖音、快手旗下剪映、快影等工具的用户。

达克告诉“定焦”,AI生成的内容在上传短视频平台时,需要特殊标注。

去年5月,抖音就发布了《抖音关于人工智能生成内容的平台规范暨行业倡议》,这一倡议提出,要对该类内容进行显著标识,虚拟人使用者需要实名认证,同时对利用AI工具创作、发布侵犯肖像权、弄虚作假等内容进行严格处罚。

快手、小红书等平台也有相关的限制。今年2月,小红书官方发布AI创作内容的规范,要求创作者主动声明AI创作内容、不能用AI创作内容虚构使用体验进行商业变现等。

多位从业者表示,他们能够明显感觉到,平台在控制该类内容,甚至会限流。

“AI创作的内容同质化严重,且创意性不高,用户一旦刷到太多相似内容,就会变得不耐烦,甚至转战其他平台。”一位互联网行业观察者表示。

他还觉得,“如果平台对这类内容不做限制,越来越多创作者也会图省事使用AI,这会严重影响到平台各类内容占比,最直观的是,一些独有的、稀缺的视频会减少。”

以及还有可能会诞生大量虚假视频。Sora能快速生产大量逼真的短视频,也让造假变得轻而易举,一些用户对该类内容难辨真伪,一旦被骗,平台公信力也会受到严重影响。去年,利用文生图、AI换脸等AI生成内容进行诈骗的案件就被曝出不少。

图源:Sora官网

在Cyrus看来,如果平台扶持AI创作类内容,很像“为他人做嫁衣” ,结果就是影响用户留存。“设想一下,如果小红书上全是字节豆包大模型生产的内容,用户为什么不直接刷抖音呢?反之亦然。”

Cyrus预测,抖音、快手、小红书、B站上,不会大量推荐AI创作的内容。除非是平台自己做的文生视频大模型,在自家进行大范围推广后,进行单独变现。“比如当其优化到一定程度,可以直接走用户付费模式,但各家的产品目前都不具备这一能力。”

不止一位业内人士推断,Sora和其他AI视频创作工具之间的差距会越来越大,此前,“Sora会不会杀死剪映”的话题就曾引发热议。Sora如果被大规模应用,大多数AI工具可能会被市场抛弃,其他公司前期的大笔投入将付诸东流。

为什么差距会拉大?

周鸿祎曾公开指出,国内的大模型发展水平表面上看接近GPT-3.5,实际上离4.0还有一年半的差距。牛小博从技术端给出解释,Sora不是一个点状技术,而是一个复杂的系统工程。即便外界知道其核心技术是transformer注意力算法+diffusion的扩散算法等,但其背后是OpenAI给予的资金支持和积累的超强数据。

OpenAI通过积累的GPT通用语言模型加上DALL-E3图像生成模型,发展出视频能够理解图片内容,到Sora的时候,又提升了一致性和物理空间理解能力,这每一步的积累,缺一不可。

更大的预测更是让抖音们前路难料。有影视从业者认为,Sora被大范围使用后,有可能会出现比抖音更大的新平台。

在一部分人看来,Sora降低了用户门槛,必然导致内容创作者数量级猛增,而抖音这样的短视频平台,其体量、内容创作和推送的逻辑规则,能否承载该类内容很难说,很可能会诞生一个与Sora更相符合的平台。

牛小博通过观察互联网行业的发展,也赞同这一观点。“互联网在早期是专业用户使用,后来PC的普及扩大了用户,接着智能手机出现,人人可以联网,以至于服务各类人群需求的平台都出来了。也许随着Sora使用人群的增加,会有新的生态出现。

三、Sora影响巨大,但不必神化

目前,Sora还没有开放公测,只有一些视觉艺术家、电影制作人、OpenAI员工等人士获得了访问权限。一部分原因是,Sora并非完美无缺。它对短视频的冲击,还没有完全展现。

AI训练师小刚指出,Sora存在大模型普遍存在的“幻觉问题”,它在理解物理规律、人与物体交互等方面还存在缺陷。

比如OpenAI官网公布了一些缺陷视频,包括蜡烛吹不灭、投篮时篮球在下落过程中爆炸,以及挖出来的椅子直接飘起来等不符合物理规律的内容,这是因为Sora的理解还不够成熟,误以为从沙子里挖出来的东西,一般都比较轻。

图源:Sora官网

而具体到短视频行业,小刚认为Sora最重要的一个不足是,还做不到人物固定。

举个例子,比如创作者用Sora生成了一条60秒的视频,画面中主角为A,但其在生成下一个视频后,主角很可能就换成了B。

相比Pika、Runway,大家能看到Sora的空间能力很强,但内容再短,做不到人物固定就没有意义,用户持续在短视频平台观看内容,无论是真人还是动画,都需要一个中心人物保证故事的延续性。

以及算力问题,也让很多人担忧Sora的普及速度。毕竟技术突破再大,如果成本过高,还是难以被大众接受。多名业内人士认为,这是目前Sora面临的最大困难。

“目前OpenAI没有公布Sora具体的算力、能源消耗需求以及参数量。初步判断,它需要的数据量、算力以及大量的能源消耗将是巨大成本,而这与其下个阶段的广泛推广必然存在矛盾。”牛小博认为。

每一次新技术的出现,都会引发一场新旧交替的大讨论。

虚拟拍摄技术刚诞生时,为影视行业节省了拍摄成本,但传统的拍摄方式至今仍然存在。OpenAI推出ChatGPT一年多以来,文字从业者也没有被替代,反而让更多人意识到优质内容创作者的价值。

同理,Sora对市场上同类AI工具带来了冲击,但它再强,淘汰的更多是没有创意、只想走量的短视频从业者,或是不会使用这类工具的人。

至于Sora是否会颠覆整个短视频行业,会不会诞生下一个超级平台,目前大家还在观望,需要看Sora能否迅速解决现有问题,以及国内有没有新的挑战者诞生。

(应受访者要求,文中达克为化名。)

本文来自微信公众号:定焦(ID:dingjiaoone),作者:王璐,编辑:魏佳

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
Like (0)
Previous 2024年2月22日
Next 2024年2月22日

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日