更新时间:2024-11-09 05:08:17
Meta 的 Audiocraft 团队发布了他们的 MusicGen AI 演示,它可以根据您的文本描述生成音频短片。您还可以使用现有旋律的样本作为基础。
它的工作方式非常简单;只需转到演示页面并描述您想在音频中听到的内容。在我们的例子中,我们用一个简单的指令提示系统,“80年代的合成波与朗朗上口的钩子”,然后按下生成。这花了一段时间,但最终给了我们一个 12 秒的剪辑。
然后,我们在提示中添加了另一条指令,告诉系统生成“80年代的合成波,带有朗朗上口的钩子和爵士旋律”。
根据您的说明,系统可能需要一段时间才能生成剪辑。在我们的例子中,生成第一个样本花了将近两分钟,生成第二个样本花了将近三分钟。
正如您可能知道的那样,MusicGen AI并不完美,但绝对值得一试。熨平提示可能会导致更好的结果。
该团队使用20,000小时的许可音乐来训练变压器模型,该模型通过预测音乐中的下一个段落来工作。
上个月早些时候,谷歌向公众开放了自己的文本到音乐AI系统,称为MusicLM,其工作原理类似于MusicGen。