GPT-SoVITS-WebUI 是强大的少样本语音转换与语音合成Web用户界面语音生成工具。
查看介绍视频 demo video
未见过的说话者 few-shot 微调演示:
few.shot.fine.tuning.demo.mp4
整合包使用教程:https://www.yuque.com/baicaigongchang1145haoyuangong/ib3g1e/vafogkyrwkk8rbzb
详细的介绍:https://github.com/RVC-Boss/GPT-SoVITS/blob/main/docs/cn/README.md
整合包下载地址:https://www.yuque.com/baicaigongchang1145haoyuangong/ib3g1e/dkxgpiy9zb96hob4#KTvnO
中国地区的用户可点击此处使用 AutoDL 云端镜像进行体验。
测试通过的环境
- Python 3.9,PyTorch 2.0.1,CUDA 11
- Python 3.10.13,PyTorch 2.1.2,CUDA 12.3
- Python 3.9,Pytorch 2.2.2,macOS 14.4.1(Apple 芯片)
- Python 3.9,PyTorch 2.2.2,CPU 设备
注: numba==0.56.4 需要 python<3.11
Windows
如果你是 Windows 用户(已在 win>=10 上测试),可以下载下载整合包,解压后双击 go-webui.bat 即可启动 GPT-SoVITS-WebUI。
中国地区的用户可以在此处下载整合包。
Linux
1 2 3 |
conda create -n GPTSoVits python=3.9 conda activate GPTSoVits bash install.sh |
macOS
注:在 Mac 上使用 GPU 训练的模型效果显著低于其他设备训练的模型,所以我们暂时使用 CPU 进行训练。
- 运行
xcode-select --install
安装 Xcode command-line tools。 - 运行
brew install ffmpeg
安装 FFmpeg。 - 完成上述步骤后,运行以下的命令来安装本项目:
1 2 3 |
conda create -n GPTSoVits python=3.9 conda activate GPTSoVits pip install -r requirements.txt |