侧边栏壁纸
博主头像
Kefei的记事本博主等级

好脑瓜不如烂笔头

  • 累计撰写 219 篇文章
  • 累计创建 11 个标签
  • 累计收到 0 条评论

目 录CONTENT

文章目录

GPT-SoVITS使用指南

Administrator
2025-01-01 / 0 评论 / 0 点赞 / 15 阅读 / 3243 字

GPT-SoVITS指南 (yuque.com)

👋 欢迎来到GPT-SoVITS

GPT-SoVITS是花儿不哭大佬研发的低成本AI音色克隆软件。目前只有TTS(文字转语音)功能,将来会更新变声功能。

GPT-SoVITS的正确缩写应该是GSV,请不要用sovits来简称它,这会让人把它和So-VITS-SVC搞混,两者并没有什么关系

这篇文档是bilibili@白菜工厂1145号员工编写的GPT-SoVITS一站式用户手册(持续更新中,可以去B站催更)

项目地址:https://github.com/RVC-Boss/GPT-SoVITS

各种游戏600多个角色在线试用:https://gsv.acgnai.top/

zero shot试用:https://gsv-zs.acgnai.top/&https://huggingface.co/spaces/lj1995/GPT-SoVITS-v2

中文整合包下载:

https://www.yuque.com/baicaigongchang1145haoyuangong/ib3g1e/dkxgpiy9zb96hob4#KTvnO

https://www.icloud.com/iclouddrive/0fejFggjP4AgBHXlxz2DLJ71w#GPT-SoVITS-v2-240821

什么是TTS

TTS(Text-To-Speech)这是一种文字转语音的语音合成。类似的还有SVC(歌声转换)、SVS(歌声合成)等。目前GPT-SoVITS只有TTS功能,也就是不能唱歌。

GPT-SoVITS-V1实现了:

由参考音频的情感、音色、语速控制合成音频的情感、音色、语速

可以少量语音微调训练,也可不训练直接推理

可以跨语种生成,即参考音频(训练集)和推理文本的语种为不同语种

GPT-SoVITS-V2新增特点:

对低音质参考音频合成出来音质更好

底模训练集增加到5k小时,zero shot性能更好音色更像,所需数据集更少

增加韩粤两种语言,中日英韩粤5个语种均可跨语种合成

更好的文本前端:持续迭代更新。V2中英文加入多音字优化。

0

评论区