站长说

GPT-SoVITS是B站大佬“花儿不哭”开源的低成本AI音色克隆软件,MIT协议,目的是造福所有普通人。

GPT-SoVITS 只需要少量语音微调训练(推荐1分钟,最少5秒钟),就可以快速克隆人物的音色;或者不训练直接推理,由参考音频的情感、音色、语速控制合成音频的情感、音色、语速;还可以跨语种生成,即参考音频(训练集)和推理文本的语种为不同语种。

目前 GPT-SoVITS 已经发布了 V2版本:对低音质参考音频合成出来音质更好;底膜训练集增加到5k小时,zero shot性能更好音色更像,所需数据集更少;增加韩粤两种语言,中日英韩粤5个语种均可跨语种合成;V2中还加入了多音字优化。

GPT-SoVITS-v2声音克隆

提示

现在很多的第一人称独白解说基本上都是用的这个克隆软件,本地一键部署也很简单。

GPT-SoVITS-v2声音克隆下载

暂无评论

暂无评论...
复制成功,感谢你的分享~