RVG TTS
基于检索的语音生成文本对语音系统是基于Python的语音文本,依赖于两个核心部分。为了能够产生语音,它依赖于Tacotron将文本转换为语音,然后使用RVC语音转换来使其听起来像任何字符,而无需使用音频文件。
要求
该TTS已在Python 3.10上进行了测试,尽管可以在其他版本上使用。
您必须使用最新的64位ESPEAK NG版本。
为了构建FairSeq依赖关系,您必须拥有Visual Studio并安装“使用C ++”开发软件包安装“桌面开发”。
用法
要使用它,请安装诗歌并使用poetry install --no-root ,然后下载Hubert Model,Forward Tacotron模型和任何RVC模型。然后,您可以将它们放入具有相应名称的模型文件夹中:
-
hubert_base.pt>hubert.pt -
forward_steps90k.pt>forward.pt -
(rvc .pth model name)– >rvc_model.pth -
(rvc .index model name)– >rvc_index.index(可选)
一旦拥有所有这些,就可以在CLI上使用所需的参数运行RVG.py文件,在没有任何参数的情况下运行该文件以启动Gradio WebUI,也可以将此代码包含在您自己的项目中,并从RVG.py导入RVG_tts函数。
当前功能集
- RVC V1和V2模型支持
- RVC索引支持
- 快速推理速度(开始〜10秒,连续运行〜5,并通过导入进行持续模式)
- 易于使用CLI
托多
- 支持两个RVC模型版本
- 创建一个适当的导入软件包
- 支持CLI的电话
- 进一步的代码凝结
- Gradio Webui
- 多态支持
其他语言
为了使用不同的语言,必须训练新的前向TACOTRON模型。没有数据集,这是我无法做的。这是我向社区寻求帮助的地方。如果您可以提供数据集,请这样做。
学分
前进TACOTRON已获得MIT许可证的许可
RVC WebUI已获得MIT许可证的许可
执照
版权2023 FOXIFY52
根据Apache许可证(版本2.0(“许可”)获得许可;除了符合许可外,您不得使用此文件。您可以在
http://www.ap**ac*he.org/licenses/LICENSE-2.0
除非适用法律要求或以书面形式同意,否则根据许可证分配的软件是按照“原样”分发的,没有任何明示或暗示的保证或条件。请参阅许可证,以获取执行许可条款和限制的特定语言。
