Suno改造音乐圈?还早

这是国外AI初创公司Suno研发的一款文本生成音乐工具,目前推出的是V3版本,用户只需输入几句歌词或者歌名,并自选音乐风格,便可在一分钟内得到两首时长在两分钟内的歌曲。

雷鸣表示,虽然目前Suno生成的音乐能轻松达到广告配乐、影视配音标准,但如果客户听完一遍后,还想修改一些细节,Suno就办不到了,只能再次随机生成另一首曲子。

“不开心就让Suno给你写首歌吧。”

近期,AI音乐生成类工具Suno发布最新版本,凭借着低门槛、速度快、歌曲完成度高的强大功能,被网友誉为音乐界的ChatGPT,甚至一些词曲创作者开始担心,自己要失业了。

这是国外AI初创公司Suno研发的一款文本生成音乐工具,目前推出的是V3版本,用户只需输入几句歌词或者歌名,并自选音乐风格,便可在一分钟内得到两首时长在两分钟内的歌曲。Suno支持中文在内的多种语言输入,且免费向用户开放。

近两年,在文生图、文生视频领域分别诞生了Midjourney、Sora等效果炸裂的应用。在AI生成音乐领域,类似的工具也不少,比如国内有网易的网易天音、腾讯的TME Studio,以及灵动音科技(创始团队来自清华大学)的BGM猫等。国外更不用说,比如谷歌的Magenta Studio,以及号称不会复制任何歌曲、生成独一无二曲子的Soundful等。但这些都没有引起大范围关注,直到Suno的出现。

此刻,圈外用户用Suno创作各种搞笑歌曲,过了一把音乐人的瘾,圈内从业者也将自己写的词放上去,试图一探自己和AI作曲的高低,结果被高完成度震惊。很多人觉得,Suno带来的震撼可以与上一次引发影视圈热议的Sora相提并论。

随着Suno的火热,其幕后团队的相关信息也出现在公众视野,这家坐落于麻省剑桥的公司,目前共有12名员工,四位创始人曾来自同一家公司,为机器学习专家,其中有两位还是音乐爱好者。

与市场上众多AI音乐生成类工具相比,Suno究竟强在哪?它会颠覆音乐圈吗?

“傻瓜式”操作,一分钟生成两首歌

业余音乐爱好者科科在社交平台上偶然刷到了Suno的相关内容,其能让小白用户在一分钟内完成歌曲创作的强大功能,让他忍不住尝试了一把。

在随机输入了一串没有任何逻辑性的数字加字母后,不到半分钟,科科便拿到了曲子。“这么拗口的歌词配上旋律居然十分流畅”,他感到十分意外。

其一键成曲的低门槛让网友们玩嗨了。有人让Suno一本正经地唱菜谱,还有人将自己打工的心酸经历输进去,生成歌曲发到网上。不少网友表示,自己被Suno创作的曲子笑到肚子疼。

图源 / Suno官网

Suno为什么火了?它究竟强在哪?

首先得益于它的低门槛,让普通用户找到了自己写歌的快乐。

很多网友表示,自己被Suno的“省事”所吸引。用Suno创作一首歌,只需简单四步。登录官网注册、点击AI创作、输入文字、点击创作按钮,便可拿到两首歌词相同但旋律不同的歌曲。

从打开软件到生成歌曲,全程不到一分钟。如果用户不会作词或者懒得作词,也有解决办法,用户只用选择希望的曲风,它就能自动生成。

Suno还十分智能,比如它支持歌曲进一步优化。

如果用户觉得生成的某一首歌不错,但还想再精进一步,只需要点击“生成类似“选项,类似于妙鸭相机的“我想更像我一点”按钮,几秒钟后便又可得到一首作品。

此前Suno支持用户每天免费使用5次,也就是生成十首歌,但不允许商用。不过目前,根据官网显示,用户首次注册可获得20积分,且第二天不会再赠,而每次生成一首,会消耗5个积分,也就是只能免费玩2次。如果想多玩几次或者商用,也有办法,交钱即可。

选择界面上的会员充值按钮,有68元~498元不等的4种套餐可选,价格越高,获得的创作次数越多。比如68元对应的是136首歌曲,498元则是1328首。官网标注,这些歌曲可被商用。

普通用户惊讶于Suno的一键生成速度和操作的低门槛,而部分圈内人士更关注其专业度,甚至产生了危机感。

音乐制作人樊宇镈用了好几个“非常”形容自己的惊讶程度。他告诉“定焦”,如果之前的AI音乐类工具是小学生水平,那Suno至少是上初中了。

在Suno之前,他尝试过用很多AI工具写歌,但效果一般。用他的话说,费半天劲训练AI,结果生成的更多是伴奏模型,或者是聚焦某一环节,比如辅助作词、自动编曲、生成人声、制作专辑封面等。整体计算下来,自己用AI时投入的时间和精力,和不使用差不了太多。

但这次Suno已经能做到自动生成歌词+选择谱曲风格+人声演唱,“发展到可以自动写solo的程度了。”而且他还发现,其创作的曲子还有和声,“不少初级音乐制作人都做不到这种程度,秒杀了那些在淘宝定价800元一首的初级编曲。”

和“定焦”的交流过程中,多位专业人士认为,Suno生成的歌曲有的能达到商用程度,即在不涉及版权风险的情况下,直接对外出售。

爱梦科技CEO雷鸣把一位新生代歌手的词放到Suno里一键成曲,听完后他觉得,AI创作的歌曲反而更接近行业标准。“做出来的歌质量很高,有的甚至能达到唱片级别。”

音乐从业者小杰也告诉“定焦”,自己和身边的音乐人朋友都在感慨Suno的强大,“本就吃不饱饭音乐圈又迎来了一波雪上加霜。”

Suno虽好,但不必神化

虽然AI生成类的音乐工具不少,但一些圈内人士觉得,之前的工具在曲作质量上存在明显问题,操作也不够便捷,所以更多是“狼来了”的故事,直到Suno V3版本出现,大幅刷新了他们的认知。

有着十年大厂编程经验,同时也密切关注AI的佐罗告诉“定焦”,他觉得Suno带来的影响可能和Sora差不多,是音乐、影视领域创作的一次重大突破,而且其已经处在公开免费使用阶段。

据了解,Suno背后主要由自研的两个大模型支撑,分别是基于transformer的Bark语音模型和Chirp音乐模型,前者主要用来生成人声,后者提供音乐旋律和音效。两者让Suno生成的音乐旋律更智能化、复杂化,这也是这家公司的核心技术。

不过,Suno也不完美,它在时长、语言理解力,以及音乐分轨等方面都有问题。

首先,目前Suno生成的曲子都不到两分钟,无论是普通用户还是专业音乐制作人,都明显感觉到很多作品经常戛然而止,这直接影响了听觉效果。

其次,虽然Suno支持多国语言创作,但其最了解的还是英文,在理解中文歌词及音乐风格上,存在明显偏差。

樊宇镈频繁使用过十几次后发现,在生成电子、R&B、摇滚等音乐风格时,Suno能处理得很好,但华语流行风格不太行。“定焦”在尝试用Suno创作时,风格上选择“民谣”,其创作出来的两首曲风都更像二次元。

他还遇到过主副歌不分的情况,将自己创作的中文歌词输入进去,并将主副词做了明显标注区分,但Suno依然把副歌的最后一句唱到了主歌上。

此外,Suno创作出的作品不支持调整分轨,专业人士没有办法对生成的歌曲进行调整,这也是目前困扰Suno商业化的最大难点。

雷鸣表示,虽然目前Suno生成的音乐能轻松达到广告配乐、影视配音标准,但如果客户听完一遍后,还想修改一些细节,Suno就办不到了,只能再次随机生成另一首曲子。

樊宇镈觉得,在这一点上,网易的AI音乐工具——网易天音就比较友好,支持导出音轨。不过,相比Suno,网易天音生成的曲子还比较初级,且需要音乐人认证。

AI研究者Cyrus则提出,目前AI生成音乐音频清晰度不够高,这也让其很难改编。即便Suno能导出来,曲子的高频和低频都会损失比较严重,还会伴有杂音、噪音等。所以目前Suno更多的是用来娱乐。

在Cyrus看来,文生图和视频的核心在于如何更完美地模拟物理世界,而音乐最重要的是,如何还原人的情绪。但Suno的歌曲旋律较为单一,使用的乐器也不够丰富,且生成的音乐时长还不够,这些都阻碍了情感传递。

想要解决这些问题,需要数据、时间和一定的技术突破。

人工智能在读博士、做过相关大模型研究的牛小博从技术端解释,目前Suno的底层技术还是大模型用到的diffusion、transformer的底层架构,但在多模态上有所突破,比如文字(含歌词)、声音(人声、曲子)、图像(能生成封面,但很简单)的多模态。而其生成的歌曲只有不到两分钟,很有可能是算力不够。

一位业内人士也告诉“定焦”,“目前AI生成音乐的一大技术难点是,大模型难以在学习复杂音乐乐理的同时,理解、模拟词曲情感,如果还要复制市面上特定风格、某一歌手的表达方式,那会更加复杂,这需要大量数据和算力。”

Cyrus觉得,Suno有所突破,但在技术层面并非革命性的创新。“Suno代表的AI生成音乐,可控度和复杂度远不及文生图,还有较长的一段路要走。”牛小博表示。

Suno会抢谁的饭碗?

目前,Suno以及AI生成音乐工具被热议,不过普及速度似乎不如想象中那么快。

“定焦”询问了几家国内音乐厂牌,以及大众熟知的歌手团队,大多数人表示,这类工具不会影响到他们的日常创作,甚至还有一部分人没有听说过Suno。

这主要有两方面原因。

一是音乐人或者公司使用 AI的主要目的是提高效率,但之前从业者需要反复调教AI,才能达到使用效果,调教AI的时间和其单独创作所花费的时间差不多。而且,当音乐人自身灵感爆发时,速度往往更快。

更主要的原因是,目前AI生成的音乐还满足不了用户/客户想要个性化歌曲的需求。即便是已经很强大的Suno,虽然歌曲质量在线,但缺乏有创造力的点。

归根究底,目前AI生产出的还是工业化产品。

牛小博表示,目前这类工具最大的难点是获取优质数据和相关版权。版权问题主要靠平台的努力,优质数据则考验运营能力。如果越来越多优秀音乐人能在Suno平台上持续产出高质量的音乐数据,AI便有可能产出更多高质量、有灵魂的歌曲。

不过,Suno所代表的AI生成类音乐工具,其更新迭代速度,已经让很多从业者感到恐慌。

去年4月推出文本转音频模型Bark,7月在音频生成模型上增加人声音乐,12月用户可以在网页上使用,再到如今推出Suno V3版本,这家成立不到两年的公司,在不到一年时间内,实现了AI音乐专家口中需要数年才能完成的突破。

有网友将Suno升级的三个版本对比发现,其修复自身BUG的速度也非常快。输入相同一段歌词,V1版本还将古风爆改成流行,V2就变成了很明显的古风,比如在开头加入古筝弹奏,而V3的人声和旋律一体化程度非常高。如果将来Suno再迭代,加上大量数据训练,取代一些工作岗位不是不可能。

图源 / Suno官网

而短期来看,它将很快会对两类人产生影响。

一类是普通用户。Suno联合创始人Shulman曾表示,他们的目的是,降低用户创作音乐的门槛,让每个普通用户都能成为创作者,Suno并不是想取代艺术家。而从目前的用户反馈来看,这一工具已经让很多音乐小白体验到了不懂乐理就能写一首歌的快乐。

另一类便是批量写歌的公司。

在交流中,大家都认同,Suno无法取代乐队这种需要团队合作的音乐种类,也不会影响知名音乐人的饭碗。“不过将替代掉95%以上没有那么厉害的从业者,”雷鸣表示,那些不追求独特性,喜欢批量写歌的公司和一些把音乐当伴奏的领域,将迅速被AI取代,比如广告配乐、环境音乐、影视配音,甚至一些同质化的网络歌手和短视频神曲。

Cyrus也觉得Suno对编曲、混音要求不高,特别是市面上那种几百块一首的口水歌打击很大。而对熟手来说,比如作曲、作词、编曲混音从业者,可能会带来利好,毕竟这些工作可以一个人完成了。

据了解,国外已经有公司收到了AI批量作曲的需求,且专业人士也将AI应用到了《芭比》和《奥本海默》等影视音乐中。国内目前还没有将AI音乐大规模投入到商用中的情况,不过从业者已经开始尝试。

需要注意的是,除了技术,AI所带来的版权问题,也是影响Suno以及AI作曲未来发展的一道门槛。

“音乐圈抵制AI作曲”、“部分歌手被怀疑借助AI作曲引发网友不满”、“音乐公司要求AI使用自家歌手声音时得到授权”……自从AI作曲出现后,这些声音就没有断过。

佐罗从另一方面分析,Suno也会给行业带来一些良性影响。“像影视剧、短视频等的BGM就不会有太多版权纠纷了,毕竟每位用户都可以用AI生成符合特定场景的音乐。”

现在,Suno公司已经宣布Suno V4正在开发中,并会推出一些令人兴奋的新功能。到时,AI和人类又将开启新一轮的较量了。

本文来自微信公众号:定焦(ID:dingjiaoone),作者:王璐,编辑:魏佳

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
Like (0)
Previous 2024年3月27日
Next 2024年3月27日

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日