谷歌发布 GenAI 音乐创作工具

随着 GenAI 工具开始以令人难以置信的方式(有时甚至存在道德问题)改变音乐行业,谷歌正在加大对人工智能技术的投资,以创作新的歌曲和歌词。

这家搜索巨头今天推出了 MusicFX,这是对 音乐LM,谷歌去年发布的音乐生成工具。 MusicFX 可以创作长达 70 秒的小曲和音乐循环,提供谷歌声称的“更高质量”和“更快”的音乐生成。

MusicFX 可在 Google 中使用 人工智能测试厨房,一款应用程序,让用户可以尝试该公司实验室的实验性人工智能系统。 从技术上讲,MusicFX 推出的目的是 选择用户 12 月 – 但现在已经普遍可用。

图片来源: 谷歌

我必须说,这并不可怕。

与它的前身一样,MusicFX 允许用户输入文本提示(“两把尼龙弦吉他以弗拉门戈风格演奏”)来描述他们想要创作的歌曲。 该工具默认生成两个 30 秒的版本,并提供延长曲目(至 50 或 70 秒)或自动缝合开头和结尾以循环播放的选项。

新增加的是提示中替代描述符词的建议。 例如,如果您输入“乡村风格”,您可能会看到一个包含“摇滚风格”和“蓝草风格”等流派的下拉菜单。 对于“朗朗上口”这个词,下拉菜单可能包含“冷静”和“旋律”。

谷歌音乐FX

图片来源: 谷歌

在提示字段下方,MusicFX 提供了一个词云,其中包含相关描述、要附加的乐器和节奏的附加建议(例如“前卫”、“快速”、“令人兴奋”、“808 鼓”)。

那么听起来怎么样? 嗯,在我的简短测试中,MusicFX 的样本……很好? 说实话,音乐生成工具已经发展到作者很难区分输出的地步。 当前最先进的技术可以制作出令人印象深刻的干净、清脆的曲目,但曲目却趋于无聊、缺乏灵感且旋律不集中。

也许这就是 伤心 对我来说,但我接受的提示之一是“一首带有时髦节奏的浩室音乐歌曲,适合跳舞且令人振奋,具有夏季屋顶的氛围。” MusicFX 已交付,但曲目未交付 坏的 — 但我不能说它们接近我最近听过的任何更好的 DJ 集。

你自己听听:


任何带有弦乐器的东西听起来都更糟糕,比如廉价的 MIDI 样本——这可能反映了 MusicFX 有限的训练集。 以下是根据提示“用弦乐器演奏的深情旋律,管弦乐,具有强大的旋律核心”生成的两首曲目:

为了改变节奏,这是 MusicFX 对“月光下一首令人哭泣的吉他歌曲,忧郁,缓慢的节奏”的诠释 [sic] 夜晚。” (请原谅拼写错误。)

MusicFX 有一些东西 惯于 生成 – 并且无法从生成的轨道中删除。 为了避免侵犯版权,谷歌会过滤​​提及特定艺术家或包含声音的提示。 并且它正在使用 合成ID是 DeepMind 部门开发的一种无声水印技术,可以清楚地表明哪些曲目来自 MusicFX。

我不确定谷歌使用什么样的主列表来过滤艺术家和歌曲名称,但我发现它并不难以击败。 虽然 MusicFX 拒绝创作 SZA 和披头士乐队风格的歌曲,但它很高兴地立即参考了 Lake Street Dive——尽管我会说,这些曲目并没有写得很详细。

歌词生成

谷歌在 AI Test Kitchen 中发布了一款新的歌词生成工具 TextFX,旨在作为 MusicFX 的伴侣。 与 MusicFX 一样,TextFX 已经向一小部分用户提供了一段时间,但现在它的使用范围更加广泛,并且在“用户体验和导航”方面进行了升级,谷歌表示。

正如 Google 在 AI Test Kitchen 应用程序中所解释的那样,TextFX 是与说唱艺术家兼唱片制作人 Lupe Fiasco 合作创建的。 它的动力来自 帕LM 2,谷歌的文本生成人工智能模型之一,以及“[draws] 来自抒情和语言技巧的灵感 [Fiasco] 在他的整个职业生涯中都得到了发展。”

谷歌文本FX

图片来源: 谷歌

记者预计 TextFX 将成为一个或多或少自动化的歌词生成器。 但可以肯定的是 不是 那。 相反,TextFX 是一套旨在帮助歌词编写过程的模块,包括一个在以所选字母开头的类别中查找单词的模块和一个查找两个不相关事物之间相似性的模块。

谷歌文本FX

图片来源: 谷歌

TextFX 需要一段时间才能掌握窍门。 但坦率地说,我可以看到它成为歌词作者和一般作家的有用资源。

不过,您需要仔细查看其输出。 谷歌警告 TextFX“可能会显示不准确的信息,包括有关人的信息”,而我确实设法促使它暗示气候变化“是中国政府为伤害美国企业而实施的骗局”。 哎呀。

谷歌文本FX

图片来源: 谷歌

问题依然存在

通过 MusicFX 和 TextFX,谷歌表明它对 GenAI 音乐技术进行了大量投资。 但我想知道它是否专注于 保持 向上 琼斯 而不是解决围绕 GenAI 音乐的棘手问题最终会带来好处。

越来越多的自制曲目开始走红,这些曲目使用 GenAI 来召唤出熟悉的声音和人声,这些声音和人声可以被冒充为真实的,或者至少足够接近。 出于知识产权方面的考虑,音乐唱片公司很快就向 Spotify 和 SoundCloud 等流媒体合作伙伴标记了人工智能生成的曲目。 他们一般都取得了胜利。 但“深度伪造”音乐是否侵犯了艺术家、唱片公司和其他权利持有者的版权,目前仍不清楚。

一位联邦法官 统治 八月,人工智能生成的艺术不能获得版权保护。 不过,美国版权局尚未表态,只是 最近 开始就与人工智能相关的版权问题寻求公众意见。 同样不清楚的是,如果用户试图将以另一位艺术家的风格创作的音乐商业化,他们是否会发现自己违反版权法。

谷歌正试图在其 YouTube 业务上谨慎部署 GenAI 音乐工具,该业务正在测试人工智能模型 已创建 由 DeepMind 与 Alec Benjamin、Charlie Puth、Charli XCX、Demi Lovato、John Legend、Sia 和 T-Pain 等艺术家合作制作。 对于这家科技巨头的一些 GenAI 竞争对手来说,这超出了可以说的范围,比如 稳定性人工智能,其立场是“合理使用”证明在未经创作者许可的情况下对内容进行培训是合理的。

但有标签 起诉 GenAI 供应商对训练数据中受版权保护的歌词进行了调查 艺术家表达不满,谷歌已经做好了它的工作——它不会让这个不便的事实减慢它的速度。

1707155659
#谷歌发布 #GenAI #音乐创作工具
2024-02-01 15:00:47

Leave a Reply

Your email address will not be published. Required fields are marked *

近期新闻​

编辑精选​