音乐的门槛，又一次被AI拉低了

来源：新音乐产业观察更新时间2024-06-01 09:48:56 点击数：

被誉为音乐界ChatGPT的Suno，最近宣布完成了B轮1.25 亿美元的融资。据推测，此轮融资使这家刚成立两年、总部位于马萨诸塞州的公司估值达到5亿美元。截至2024年初，公司员工总数仅为12人。

公司还顺手放出了新的模型V3.5。新版本让AI生成歌曲的时长达到4分钟，而且显著改进歌曲结构与声音模型，很明显的就是歌曲的副歌部分更突出了。另一个官方只浅浅描述并称“Coming soon”的功能，似乎是由声音生成声音，把真实世界中的声响转化为音乐。如果在V4版本中这一功能实现，确实为AI音乐生成提供了无限的可能。

据国内AI产品榜（aicpb.com）数据，Suno实现了连续每月千万级的访问增长量。在AI音乐生成领域，Suno月访问量是第二名的八倍之多，可谓是一骑绝尘

Suno 联合创始人兼首席执行官Mikey Shulman直言，“创办 Suno 是为了打造一个任何人都可以制作音乐的未来，帮助人们重新发现我们小时候玩耍和探索的乐趣”。他的终极愿景，是全球有10亿人每月支付10美元使用Suno创作歌曲。

不只是AI工具，还是音乐社区

“在人生的某个阶段，我们失去了制作音乐的一些乐趣。我们中的一些人长大后成为了真正的音乐家，接受了必要的训练或拥有天生的技能，而我们其他人则开始明白，我们的位置就是安静地坐在观众席上欣赏演出。”在宣布融资消息的公开信中，Suno 联合创始人兼首席执行官Mikey Shulman写道。

八个月前Suno发布了第一款产品，宣称让任何人只要有一个简单的想法就能创作出一首歌。现在已有1000 万人使用 Suno 创作音乐。这其中有格莱美获奖的音乐家，但大部分还是第一次尝试创作音乐的普通用户。

Suno的主页很简单，在左侧菜单栏里选择Create就可以进行歌曲创作。在Custom Mode中开启定制模式，可以粘贴自己创作的歌词，也可以让AI根据主题生成歌词，然后简单选择一下音乐风格，确定一个歌曲名，就可以自动生成歌曲。

自V3版本开始，Suno可以说在AI音乐创作工具中爆火。最多十几秒，即可生成2分钟音乐，包含人声、具有复杂曲式结构、听感不亚于专业音乐作品。此外，还有丰富的曲风流派和音响效果供选择。产品一出就惊艳了全世界。

在刚刚推出的V3.5中，AI生成的音乐又有大幅改善。不但时间更长了，还明显感觉作曲中逻辑性更强了。也就是说，AI可以理解歌词，区分主歌副歌，设定作品的结构，让作品更精巧。即使没有专业的音乐知识或乐器演奏基础，普通人也能通过这些工具创作出高质量的音乐作品。作品还有自动生成的封面，用户可以下载音频进而分享作品。

Suno取得成功的另一要素是，它不仅是个AI音乐生成工具，还是个音乐平台和音乐社区。在首页中，你能看到新鲜的AI作品案例，还能看到最受欢迎的作品排行榜，更有分门别类的播放列表供选择。你也可以通过名字、风格或歌词内容搜索作品。你能看到其他用户发布的作品，看到作品的播放量和点赞量，也可以分享自己的作品。

如果你不知道自己想做哪种类型的音乐，在Explore功能中，有数百中细分的音乐风格供你试听选择。你可以选择钟意的音乐风格，一键跳到Create页面。

以往大多AIGC产品，大家只是新鲜一阵，热闹过去就人走茶凉了。但Suno却神奇地保留了用户粘性，还在自己的社区推广、制造了大量神曲，这些神曲破圈后又吸引了大量路人来打卡、尝试AI创作。

最惊人的是，每天登陆网站的人中，听歌的人比真正去生成音乐的人还多。第一批AI音乐的听众群，正在Suno的社区中被培养出来。

创始人是AI专家，也是音乐家

一段时间里，像Midjourney这样AI生成图像、文本，甚至视频的工具都取得了重大进展，但音频生成，尤其是音乐生成，却落后了，也鲜有破圈的应用。Suno 身上则寄托了破解AI音乐密码的行业期待。

Suno 刚成立不到两年。四名联合创始人都是机器学习专家，他们曾在另一家剑桥公司 Kensho Technologies 共事至 2022 年，该公司专注于寻找解决复杂商业问题的 AI 解决方案。其中，37岁的 Mikey Shulman拥有哈佛大学物理学博士学位，他和另一名创始人也都是音乐家，曾一起演出。

在前一家公司，四人致力于开发一种转录技术，用于记录上市公司的财报电话会议，因为会议通话音频质量差、行话太多、口音各异，这是一项棘手的任务。在此过程中，Mikey Shulman和他的同事们开始研究AI音频的可能性。他也发现，在AI研究中，音频总体上远远落后于图像和文本。

他们在头脑风暴中预设过开发包括助听器在内各种各样的产品，结果第一个产品是一款名为Bark的文本转语音程序。当他们调查早期Bark 用户时，大家表示真正想要的是一个音乐生成器。

Suno 使用与 ChatGPT 等大型语言模型相同的通用方法，将人类语言分解并标记成片段，然后根据需要重建它。但音频，尤其是音乐，几乎复杂得令人难以置信。音频不像单词那样可以被简单分解，它是一个连续的信号。高质量音频的采样率通常为 44khz或48khz，这意味着每秒 48000 个标记，这是一个很大的工程量。在2023年，AI专家还觉得Suno 这样的服务可能需要数年时间才能实现。

还有一个绕不过去的问题，就是版权。现在，使用Suno时，系统可以识别你输入的歌词是否受版权保护。如果用户计划使用受版权保护的歌词，必须征得许可。

但该Suno的主要争议在于，它是否利用受版权保护材料进行训练。OpenAI 因 ChatGPT 在其庞大的训练数据中使用书籍、新闻文章和其他受版权保护的材料而面临多起诉讼。有媒体要求 Suno 澄清这一点，但未得到答复。Suno 的创始人拒绝透露他们究竟将哪些数据塞入自己的模型，只透露了一点：它之所以能够生成令人信服的人类声音，部分原因是它除了从音乐中学习外，还从语音录音中学习。

Suno 表示，他们与各大唱片公司保持着沟通，并声称尊重艺术家和知识产权——他们的工具不允许你在提示中要求任何特定艺术家的风格，也不会使用真实艺术家的声音。

从创始人到员工中，许多人都是音乐家。公司的办公室里也摆放着钢琴和吉他，墙上挂着古典作曲家的照片。Suno并没有像当年Napster那样，表现出对音乐行业的公开敌意。但他们在做的事情，确实正在颠覆音乐行业的逻辑。

目标触及10亿用户，超越Spotify？

Suno创始人毫不掩饰自己的野心，他们想象着一个高度民主化的音乐世界。Mikey Shulman认为，目前音乐听众的数量远远超过音乐创作者的数量是“如此不平衡”，Suno 有望解决这种明显的不平衡。他的愿景是全球有10亿人每月支付10美元使用Suno创作歌曲。

Suno 最早的投资者之一是风险投资公司 Matrix 的合伙人Antonio Rodriguez。他认为 Suno 是一款功能强大且易于使用的乐器，并相信它可以将音乐创作带给每个人，就像照相手机和 Instagram 使摄影大众化一样。他和创始人甚至认为 Suno 可以吸引比 Spotify 更大的用户群。

获得新融资后，Mikey Shulman也宣布这笔钱将用来“打造人人都能创作音乐的未来”。对此，投资人表示全力支持，“所有伟大的公司都拥有优秀人才的组合，做些看似愚蠢的事，直到这事变得明显不愚蠢为止。”

到目前为止，Suno 用户似乎只热衷于将他们的歌曲分享给几个朋友，但也可以将它们上传到Spotify或 Apple Music 等平台。不排除一种可能，未来流媒体上充斥着AI生成的音乐。

AI会不会颠覆当下音乐行业的商业模式，一直是歌手、制作人和词曲作者热衷讨论的话题。但 Suno 的创始人声称没什么可担心的，“我们试图让10亿人比现在更多地参与音乐，如果人们更热衷于音乐，更专注于创作，培养出更独特的品味，这显然对艺术家来说是好事。我们对音乐未来的愿景是，它对艺术家友好。我们并不是想取代艺术家。”

但AI确实也在替代唱片行业中一些基础工作。ChatGPT可以帮助写词，Suno可以直接生成音乐，ACE可以帮助混音，甚至使用Mid journey、Runway、Sora可以帮助生成宣传图和MV。工业时代的音乐制作需要多个工种配合，也许以后只需要一个专业的人整体把关就足够。

尽管 Suno 只专注于吸引那些想创作歌曲以取乐的爱好者们，但在音乐行业人士的眼里，它仍可能造成重大破坏。像往常利润丰厚的广告配乐，未来是不是就都会由AI接手？

但对Suno来说，当下还有很多工作亟待完成。新的融资到账后，公司需要继续扩大规模，推出新的产品。在Mikey Shulman看来，还原已故歌手的声音这种操作不是人工智能未来的方向，他们考虑的是怎么把人们头脑中的想法变成现实，创作出原本不存在的作品。

也许等新技术连续落地后，现在的很多问题才会找到答案。

AI音乐在线生成：https://ai.cy211.cn/

Chat AI人工智能中文在线使用

专业AI论文生成器一键生成万字论文只需5分钟