GPT-SoVITS-v2声音克隆-剪辑指南

站长说

GPT-SoVITS是B站大佬“花儿不哭”开源的低成本AI音色克隆软件，MIT协议，目的是造福所有普通人。

GPT-SoVITS 只需要少量语音微调训练（推荐1分钟，最少5秒钟），就可以快速克隆人物的音色；或者不训练直接推理，由参考音频的情感、音色、语速控制合成音频的情感、音色、语速；还可以跨语种生成，即参考音频（训练集）和推理文本的语种为不同语种。

目前 GPT-SoVITS 已经发布了 V2版本：对低音质参考音频合成出来音质更好；底膜训练集增加到5k小时，zero shot性能更好音色更像，所需数据集更少；增加韩粤两种语言，中日英韩粤5个语种均可跨语种合成；V2中还加入了多音字优化。

现在很多的第一人称独白解说基本上都是用的这个克隆软件，本地一键部署也很简单。

文案写作、洗稿、字节跳动旗下AI助手

一款在线的声音克隆网站

完全免费的语音合成软件

超长小说一键转换自然流畅的语音文件

在线配音：免费的文本转语音工具

暂无评论...