👋 欢迎来到GPT-SoVITS

GPT-SoVITS是花儿不哭大佬研发的低成本AI音色克隆软件。目前只有TTS（文字转语音）功能，将来会更新变声功能。

GPT-SoVITS的正确缩写应该是GSV，请不要用sovits来简称它，这会让人把它和So-VITS-SVC搞混，两者并没有什么关系

这篇文档是bilibili@白菜工厂1145号员工编写的GPT-SoVITS一站式用户手册（持续更新中，可以去B站催更）

各种游戏600多个角色在线试用：https://gsv.acgnai.top/

中文整合包下载：

TTS（Text-To-Speech）这是一种文字转语音的语音合成。类似的还有SVC（歌声转换）、SVS（歌声合成）等。目前GPT-SoVITS只有TTS功能，也就是不能唱歌。

GPT-SoVITS-V1实现了：

由参考音频的情感、音色、语速控制合成音频的情感、音色、语速

可以少量语音微调训练，也可不训练直接推理

可以跨语种生成，即参考音频（训练集）和推理文本的语种为不同语种

GPT-SoVITS-V2新增特点：

对低音质参考音频合成出来音质更好

底模训练集增加到5k小时，zero shot性能更好音色更像，所需数据集更少

增加韩粤两种语言，中日英韩粤5个语种均可跨语种合成

更好的文本前端：持续迭代更新。V2中英文加入多音字优化。

GPT-SoVITS使用指南