从零开始搭建 AI 音乐生成器

不会kao代码的小王

|

2025-12-23 17:04:34

开源大模型

模型部署

场景化部署

边缘 AI

文章摘要

本文介绍了如何在Windows系统上快速部署并使用MusicGPT——一款本地的AI音乐生成服务。MusicGPT基于Meta的MusicGen模型，支持中英文提示词生成10-30秒的音乐片段，无需安装额外依赖，操作界面简洁直观。用户可通过提示词生成音乐并下载到本地，也可借助大语言模型优化提示词以获得更好的生成效果。

前言

今天给大家分享一个超酷的技能：如何在你的Windows电脑上快速部署一款文字生成音乐的AI创作服务——MusicGPT，让你的音乐创作不再受限于地点！

MusicGPT 是一款开源的AI音乐生成器，它可以在本地运行最新的音乐生成模型，比如Meta推出的MusicGen。这款神器支持Windows、macOS和Linux系统，完全开箱即用，不需要你安装任何额外的依赖软件。即便是技术小白，也能轻松上手。

图片描述

1. 本地部署

本次演示环境为Windows10专业版。

首先可以去这里：github.com/gabotechs/MusicGPT 下载Windows版本的应用执行文件。图片描述

下载后解压缩包，得到名为x86_64-pc-windows-msvc的文件夹。打开文件夹，双击 musicgpt 应用程序，即可自动部署。

需要注意的是Windows系统部署为自动下载模型到电脑C盘，需要预留至少2个G以上的空间。

图片描述

稍等即可下载完毕：

图片描述

然后会自动打开浏览器访问 musicgpt 的Web UI页面：

图片描述

2. 使用方法介绍

可以看到，操作界面非常简洁，上方显示使用的模型，其他就只有切换黑白主题的图标，音乐时长选择和输入文字框，具官方描述，目前它仅支持Meta 的 MusicGen，但计划向用户透明地支持不同的音乐生成模型。

文字输入框左侧是生成时间选择功能，默认情况下，它会产生 10 秒的样本，最多可配置为 30 秒，且可以设定1秒到30秒内的任意时长。图片描述经过测试，可以输入中文提示词与英文提示词进行文字生成音乐，但输入英文提示词的反馈相对更好一些。

如果不知道如何输入英文提示词，可以使用一些其他的大语言模型，去提问。然后将AI的回答作为你的文生音乐提示词，这种方法会比纯翻译软件效果更好些。图片描述输入完提示词后，根据生成的音乐时长不同，等待时间也会相应短或长点。

图片描述

生成音乐后，会自动播放，在生成的简单播放条中，点击下载按钮，即可将生成的音乐下载到本地电脑。

图片描述

大多数模型都需要非常强大的硬件来运行推理，如果您想使用支持 CUDA 的 GPU，建议您使用 Docker 运行 MusicGPT

以上内容不代表本平台立场，仅供读者参考

不会kao代码的小王

这个人很神秘

0

粉丝

0

文章

0

获赞

关注