AI的风终于吹到音乐圈,“宫保鸡丁”唱起来

版本1:

您目前设备暂不支持播放

版本2:

您目前设备暂不支持播放

在使用的过程中,我们发现,Suno有两种音乐合成模式选择,即Custom。

您目前设备暂不支持播放
《宫保鸡丁》

流行歌手杨凯杰表示,目前听到的这些AI合成音乐作品听起来很耳熟,相对来说比较粗糙,还无法达到发行的标准。

Suno的创始人们多次表示,他们想创造的是一个“音乐创造门槛极低”的世界,并设想全球有10亿人每个月支付10美元就能用Suno创作歌曲。

“这是它写的歌词?包括伴奏吗?”听完作品,在被介绍Suno V3的使用方法后,李亮华连续追问:“演唱,混音,伴奏,还有整个作品都这样搞出来的,还是说只写了词跟曲?”

李亮华是湖南第一师范学院作曲老师,也是湖南省创作委员会副会长兼秘书长,曾与韩磊、杨洪基、杨丽达等歌唱家合作。而现在,他还多了一重新的身份——一名小有名气的网红。在短视频平台上,李亮华会将征集而来的粉丝投稿作品演唱和点评。他还提到他自己,他现在也用AI人声录歌,他抖音上发的部分作品,就是用AI唱的。

在得到肯定回复,并得知正在播放的歌曲从伴奏、歌词、人声、编曲都是由AI在获得关键词数秒内生成后,李亮华感叹道:“和真人没什么区别了,能超越我们99%的人了,我预测AI在10年之内会干掉我们大部分作曲的。

3月22日,AI音乐生成软件Suno发布了V3版本。我们体验发现,用户通过输入关键词,几秒内便可制作出2分钟时长的成品音乐。这些关键词可以指定如摇滚、重金属、中国古风、流行、乡村等音乐风格,也可指定如吉他、钢琴、二胡等伴奏乐器。毫无乐理知识的普通人,也可快速生成自己想要的音乐。一经发布Suno V3便引起热议,截至发稿前官宣Twitter已有30w+互动量。

今年是大模型的应用年,以Sora为代表的多模态应用打响了第一枪,而现在轮到Suno了。

一、只需三步,音乐小白秒变“制作人”

我们也来体验当一把音乐制作人。

“请写一首歌,描述一个青年追求梦想的故事,吉他,摇滚,鼓,勇敢,克服困难。”我们打开Suno主页,输入了这些需求,然后点击“Create”键。静等几秒,一首歌曲就完成了。这首被AI创作的歌曲,已完成制作曲谱、填入歌词、匹配人声、系统编曲等步骤,算得上一首成品歌曲。

版本1:

版本2:

从得到的这首歌来看,曲风基本符合我们的需求。有趣的是,Suno V3每次会同时生成2个版本的音乐作品。用户可以根据自己的喜好选择自己中意的版本,还可以接着这2分钟继续创作,也可以将其以音频和视频下载下来。

按照同样的步骤,我们指定以《将进酒》为词,以“中国古风”“古筝”为关键词作了一首中国风的歌曲。

版本1:

版本2:

在使用的过程中,我们发现,Suno有两种音乐合成模式选择,即Custom Mode(自定义模式,可输入歌词)和Instrumental(生成纯音乐)。用户可以选择生成歌曲,也可选择生成纯音乐。具体来看,自定义模式中,用户可由AI生成歌词,也可以自己输入特定歌词,比如我们上文中提到的以《将进酒》为词所做的歌曲,还有网友在Suno V3制作出的《水调歌头》都是由用户输入特定歌词生成的歌曲。

截止到3月26日,在Suno制作库排行榜中,收听量排名第一的是中文摇滚歌曲《We Go!》,生成关键词为heavy metal(重金属),hard rock(硬摇滚), guitar(吉他),bass(贝斯),drum(鼓),powerful(有力的),aggresive(昂扬)


《We Go!》

李亮华对这首歌表示震惊,他说AI在音乐创作方面确实是进步很大,甚至称赞从伴奏制作、后期混音到演唱与真人几乎没什么区别了。

据了解,通常一首歌曲的制作需要经历灵感获取、写谱、填词、编曲等一系列流程,大致需要历时1~2个月左右,成熟的职业作曲人大致1~2天也可完成,一张专辑的完成常常需要以年为单位来计算。而Suno V3将音乐创作周期从“年月日”压缩到了“秒”。

对于这首摇滚歌曲《We Go!》,李亮华点评表示:“Suno在歌词方面,还是有一定欠缺,整篇歌词的排布显得十分空洞、生硬,比其对标的、现在市面上优秀的摇滚曲歌词,还有一定差距。”

原创歌手、音乐制作人极光旅客与李亮华的观点相似。他这样说道:“这首《We Go!》是一首中规中矩的简单摇滚乐,歌曲中的乐器音质基本还原了演出现场乐器的声音,这比以往常规音乐制作软件中的音质要真实很多,但目前在Suno听到的歌曲风格相对人工制作来说比较单一,节奏也比较平淡。”

截止到3月26日,该榜单排行前五中的其他四首歌曲,分别为《Guys what is wrong with my cat》《Deep Night》《Ein neuer Beginn》和《宫保鸡丁》。其中《宫保鸡丁》是以菜谱为词谱出的歌,配合AI人声演唱反差感十足。

《宫保鸡丁》

流行歌手杨凯杰表示,目前听到的这些AI合成音乐作品听起来很耳熟,相对来说比较粗糙,还无法达到发行的标准。AI生成音乐是基于一定的数据训练并重组来生成歌曲,能够轻松生成大量类似作品的同时,也呈现出了高度的同质性。

二、不到2年,12人的团队,创造了这款“神器”

这不是Suno第一次出圈。

尽管Suno V3的问世让大家惊叹AIGC的神奇,但Suno此前的版本却并不尽人意。2023年12月21日,为庆祝《海贼王》动画25周岁生日,制作方WIT STUDIO公司决定筹划重制《海贼王》“东海篇”。为此,作者尾田荣一郎制作了贺曲《YO-HO-HOおれ達海賊》。而该首曲子便是尾田借助Suno版本所作出来的。

然而,曲目一经官方发布便被网友吐槽歌曲过于AI化,旋律的编排、简单的歌词充斥着机械的声音,部分网友甚至因此开始抵制动画。

但尾田所使用的Suno并非近日的新版本,而是V2版本。根据Suno官网的详情页面显示,本次发布的最新V3版本,主要完成了这三点迭代:

(1)更好的音频质量;

(2)更多元的风格和流派;

(3)更强的提示遵从性,包括更少的幻觉和更优雅的结尾。

AI进入音乐行业最早可以追溯到上个世纪。20世纪60年代,部分音乐人开始以计算机编程的形式来实现对于音乐旋律的搭建;到了90年代,人工智能技术开始能够制作出部分乐器的声音。2001年英国爱丁堡大学的爱默生发布了E-MI,自此各式各样的AI音乐制作工具开始逐步成型和发展。当下,音乐人们在进行歌曲创作时,基本都会借助AI音乐制作软件。

AI合成音乐需要攻破多个困难,这是由于音频不像文字那样是离散的形态,声音是一串波型的连续信号。据Suno V3的联合创始人之一Mikey Shulman表示,因为高质量音频的采样率通常为44Khz或48Khz,这意味着“每秒48000个token”。

自2022年末ChatGPT横空出世开始,过去一年多,人工智能在文本、图像、视频生成等多个领域都呈现出落地与应用化的趋势。今年年初,Sora问世后,外界更是将其视为“带入AI 2.0新纪元”的代表。

但,有了这些技术和应用的铺垫,Suno V3的发布依旧出人意料。

据《滚石》杂志报道,Suno创业团队目前仅12人,成立不到两年,其中四位联合创始人分别为Mikey Shulman、Martin Camacho、Georg Kucsko 和 Keenan Freyberg。这四人都是机器学习方面的专家,此前曾共同就职于人工智能企业Kensho。其中,Shulman和Camacho还是音乐家,常常一起即兴演出。在 Kensho 公司任职时,四人所在的团队负责转录技术的研发,主要是转录上市公司的财报电话会议。

在合力工作中,四人都对于音频的开发技术产生了浓厚兴趣。他们组成初创团队推出的第一个产品是一个文本转语音程序,产品名为“Bark”。在该产品发布后他们对于用户进行了调研,发现大多数的用户真正想要的并非文本转语音之类的技术,而是期待音乐创作方面的技术。

后来四人察觉到,人工智能在文本、图像、视频生成等多个领域的表现十分抢眼。文本生成图片、文本生成视频领域的多模态大模型正进行着如火如荼的革新,而AIGC在音乐创作方向似乎还没有相应成熟的技术,于是四人开始着手对Suno的研发。“我们开始进行了一些初步的实验,结果看起来非常有前景。”Shulman在采访中这样说道。


三、定位:是工具,不是对手

对于商业化和定位,Suno已想清楚。

Suno的创始人们多次表示,他们想创造的是一个“音乐创造门槛极低”的世界,并设想全球有10亿人每个月支付10美元就能用Suno创作歌曲。

AI在音乐行业中的使用并非新鲜事儿。其实此前也有其他AI生成音乐的产品,比如Adobe的Project Music GenAI、YouTube的Dream Track等。李亮华在采访中表示,20年前自己就开始用AI生成乐器、伴奏了,但也只是部分乐器、人声AI生成,还是需要人工操作相当多的编排程序,像Suno这样的“一条龙”服务在过去是完全没有的。

李亮华还说道,近些年随着AI音质的提升,他在为学生们上课时也会提到,“再过几年,大部分歌手也要下岗了”。

随着数据库的更新、技术的迭代,AI将在未来5~10年内‘干掉’作曲人。”李亮华认为,AI显然为业内人士敲响了警钟,但他同时也提到,即便AI技术再升级,永远有1%是无法被替代的,这1%的来源也正是音乐行业的核心部分:创造力。

此外,杨凯杰还谈到,AI合成音乐可能会将音乐创作过度商业化,这完全本末倒置了。他认为音乐创作很多时候是主观的、能动的、感性的,是自己的生活记录和情感抒发。机器与人之间的最大区别往往就在于人文情怀,再好的词曲也比不上“周杰伦”三个字在听众心中的存在意义,再无瑕的人声演绎也难以与Taylor Swift演唱会现场的万人大合唱相比较。

“AI未来会超越99%的人类,但我不怕它,我反倒期待AI在音乐行业后续的发展,这敦促着音乐人、音乐行业的进步,或许可以进入一种良性循环。”李亮华总结。

值得注意的是,Suno V3对于著作权的归属问题在官网做了详尽的描述与规定,同时为了防止模型作品被滥用,还开发了专有的无声水印技术,用以检测歌曲是否是使用Suno创作。

根据官网介绍,目前Suno平台向用户免费开放。不过存在一定限制,每位用户每天最多可免费获得50个积分,用户利用这50积分可创作出10首音乐,但这类用户不能将制作出来的音乐用于商业盈利用途。如果用户订阅Suno的Pro计划,每月支付8美元,每天便能最多制作500首歌曲,并且还可以将这些歌曲用于商业用途,例如上传至YouTube、Spotify或Apple Music等平台。

本文来自微信公众号:中国企业家杂志 (ID:iceo-com-cn),作者:孙欣,编辑:姚赟

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
(0)
上一篇 2024年3月27日
下一篇 2024年3月27日

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日