从零开始搭建 AI 音乐生成器
前言
今天给大家分享一个超酷的技能:如何在你的Windows电脑上快速部署一款文字生成音乐的AI创作服务——MusicGPT,让你的音乐创作不再受限于地点!
MusicGPT 是一款开源的AI音乐生成器,它可以在本地运行最新的音乐生成模型,比如Meta推出的MusicGen。这款神器支持Windows、macOS和Linux系统,完全开箱即用,不需要你安装任何额外的依赖软件。即便是技术小白,也能轻松上手。

1. 本地部署
本次演示环境为Windows10专业版。
首先可以去这里:github.com/gabotechs/MusicGPT 下载Windows版本的应用执行文件。

下载后解压缩包,得到名为x86_64-pc-windows-msvc的文件夹。打开文件夹,双击 musicgpt 应用程序,即可自动部署。
需要注意的是Windows系统部署为自动下载模型到电脑C盘,需要预留至少2个G以上的空间。

稍等即可下载完毕:

然后会自动打开浏览器访问 musicgpt 的Web UI页面:

2. 使用方法介绍
可以看到,操作界面非常简洁,上方显示使用的模型,其他就只有切换黑白主题的图标,音乐时长选择和输入文字框,具官方描述,目前它仅支持Meta 的 MusicGen,但计划向用户透明地支持不同的音乐生成模型。
文字输入框左侧是生成时间选择功能,默认情况下,它会产生 10 秒的样本,最多可配置为 30 秒,且可以设定1秒到30秒内的任意时长。
经过测试,可以输入中文提示词与英文提示词进行文字生成音乐,但输入英文提示词的反馈相对更好一些。
如果不知道如何输入英文提示词,可以使用一些其他的大语言模型,去提问。然后将AI的回答作为你的文生音乐提示词,这种方法会比纯翻译软件效果更好些。
输入完提示词后,根据生成的音乐时长不同,等待时间也会相应短或长点。

生成音乐后,会自动播放,在生成的简单播放条中,点击下载按钮,即可将生成的音乐下载到本地电脑。

大多数模型都需要非常强大的硬件来运行推理,如果您想使用支持 CUDA 的 GPU,建议您使用 Docker 运行 MusicGPT


