ultimate rvc
Aicovergen的扩展,提供了几种新功能和改进,使用户可以轻松地使用RVC生成与音频相关的内容。对于想要将歌唱功能纳入其AI助手/聊天机器人/VTUBER的人们来说,听听自己喜欢的角色唱着自己喜欢的歌曲,或者让自己喜欢的角色大声朗读他们最喜欢的书。
ultimate rvc正在不断开发和测试中,但是您现在可以在本地或在Google Colab上尝试一下!
YouTube展示柜
由社会和应用程序提供
新功能
- 使用Windows和Debian Linux Systems的启动器脚本的简单和自动化设置
- 重要的改进语音转换质量和速度。新功能包括支持其他音高提取方法,例如FCPE,不同的嵌入式型号以及预/后处理选项,例如自动传输和降噪。
- TTS功能,它允许您使用任何基于RVC的语音模型从文本中生成语音。使用此功能,您可以使用您喜欢的角色的声音来制作诸如生成音频书籍。
- 语音模型训练套件,该套件可让您使用各种选项,例如不同的数据集,嵌入式模型和培训配置来训练自己的语音模型。
- 根据需要保存中间音频文件的缓存系统,从而尽可能减少推理时间。例如,如果歌曲A已经使用B型B转换了,现在您想使用C转换A歌曲A,则可以跳过声音提取,并大幅度减少推断时间
- 能够在UI中收听中间音频文件。这对于了解给定生成管道的每个步骤中发生的事情很有用。
- “多步”生成选项卡:在这里,您可以隔离地尝试给定生成管道的每个步骤。例如,如果您已经提取了可用的人声,并且只想使用您的语音模型转换这些声音,那么您可以在专用的“多步”选项卡中进行歌曲封面生成。此外,这些“多步”生成选项卡也可用于在给定生成管道中的每个步骤进行设置。
- 从Gradio 3更新到Gradio 5以及从Python 3.9到Python 3.12,导致了许多视觉和性能的改进
- PYPI上的可重新分布软件包,它使您可以轻松地从任何Python 3.12环境中访问ultimate rvc项目。
- 支持为ultimate rvc Web应用程序保存和加载自定义配置。这使您可以轻松地在不同的配置之间切换,而无需每次手动更改设置。
在线平台
对于那些没有足够强大的NVIDIA GPU的人,您可以使用Google Colab尝试Ultimate RV。此外,尽管在那里没有GPU加速度,但ultimate rvc也在拥抱面空间上托管。对于那些想在本地运行ultimate rvc人,请遵循下面的设置指南。
本地设置
ultimate rvc项目当前支持Windows和基于Debian的Linux发行版,即Ubuntu 22.04和Ubuntu 24.04。不能保证对其他平台的支持。
要设置项目,请按照以下步骤操作,并在适当的终端执行提供的命令。在Windows上,该终端应该是PowerShell ,而在基于Debian的Linux发行版中,应该是bash -compliant shell。
安装git
按照GIT安装说明在计算机上安装GIT。
设置执行策略(仅Windows)
要在Windows上执行后续命令,有必要先授予PowerShell许可来运行脚本。这可以在用户级别上完成:
Set-ExecutionPolicy RemoteSigned -Scope CurrentUser
克隆ultimate rvc存储库
git clone https://gi*t*hub*.com/JackismyShephard/ultimate-rvc cd ultimate-rvc
安装依赖项
./urvc install
请注意,在Linux上,如果尚未可用,此命令将安装CUDA 12.8 Toolkit System Wide。如果您有问题,则可能需要手动安装工具包。
启动应用程序
./urvc run
Running on local URL: http://127.**0.*0.1:7860 7860,您可以单击使用Web应用程序打开选项卡的链接。
更新到最新版本
./urvc update
开发模式
在开发新功能或调试时,建议以开发模式运行该应用程序。这可以使热加载,这意味着当对代码进行更改时,应用程序将自动重新加载。
./urvc dev
用法
管理模型
下载型号
导航到Models选项卡下的Download子量表,然后将下载链接粘贴到RVC型号,并为其提供唯一的名称。您可以搜索已训练的语音模型可下载的AI Hub Discord。下载的zip文件应包含.pth模型文件,还可以选择一个.index文件。
填写两个输入字段后,只需单击Download即可。一旦输出消息说[NAME] Model successfully downloaded! ,您应该能够在Generate > song covers或Generate > speech选项卡中使用下载的模型。
上传模型
对于那些在本地训练RVC模型并希望将其用于语音转换的人。导航到Models选项卡下的“ Upload子尾”,然后按照那里的说明进行操作。一旦输出消息说出Model with name [NAME] successfully uploaded! ,您应该能够在Generate > song covers或Generate > speech选项卡中使用上传的模型。
生成歌曲封面
一键式一代
- 从
Source type下拉列表中,选择要从中检索转换的歌曲的源类型。 - 在
Source输入”字段中,根据所选的源类型,在YouTube上粘贴了歌曲的URL或上传音频文件。 - 从
Voice model下拉菜单中,选择要使用的语音模型。 - 单击
Options可以查看更多选项。
填写所有选项后,单击Generate ,AI生成的歌曲盖应在不到几分钟的时间内出现,具体取决于您的GPU。
PYPI软件包
ultimate rvc项目也可以作为PYPI上的可分配包装。
安装
可以在基于Python的3.12环境中与PIP一起安装包装。为此,首先需要在CUDA支持的情况下安装Pytorch:
pip install torch==2.7.0+cu128 torchaudio==2.7.0+cu128 --index-url https://download.pyto*r**ch.org/whl/cu128
然后可以安装ultimate rvc项目软件包,如下所示:
pip install ultimate-rvc
CLI用法
ultimate-rvc软件包可以用作Python库,但主要打算用作命令行工具。该软件包公开了两个顶级命令:
- 使用户可以生成歌曲直接从其终端覆盖的
urvc -
urvc-web启动了ultimate rvc Web应用程序的本地实例
有关任一命令的更多信息,请提供选项--help螺旋。
环境变量
ultimate rvc项目的行为可以通过许多环境变量来自定义。当前,这些环境变量仅控制记录行为和数据目录位置。它们如下:
-
URVC_CONSOLE_LOG_LEVEL:控制台记录的日志级别。如果未设置,则默认为ERROR。 -
URVC_FILE_LOG_LEVEL:文件记录的日志级别。如果未设置,则默认为INFO。 -
URVC_LOGS_DIR:将存储日志文件的目录。如果未设置,则将日志存储在当前工作目录中的logs目录中。 -
URVC_NO_LOGGING:如果设置为1,则将禁用日志记录。 -
URVC_MODELS_DIR:将存储模型的目录。如果未设置,则模型将存储在当前工作目录中的models目录中。 -
URVC_AUDIO_DIR:将存储音频文件的目录。如果未设置,则音频文件将存储在当前工作目录中的audio目录中。 -
URVC_TEMP_DIR:将存储临时文件的目录。如果未设置,临时文件将存储在当前工作目录中的temp目录中。 -
URVC_CONFIG_DIR:将存储配置文件的目录。如果未设置,则配置文件将存储在当前工作目录中的configs目录中。 -
URVC_VOICE_MODELS_DIR:将存储语音模型的目录。如果未设置,则语音模型将存储在URVC_MODELS_DIR目录的voice_models子目录中。 -
YT_COOKIEFILE:通过Web UI从YouTube下载音频时使用的文件的路径。如果未设置,则不会使用cookie。 -
URVC_ACCELERATOR:直接通过此存储库中的Shell脚本运行ultimate rvc时要使用的硬件加速器的类型。目前支持的选项是cuda和rocm,cuda为默认值。请注意,Windows不支持rocm和Linux上的实验。 -
URVC_CONFIG:启动ultimate rvc Web应用程序时,具有自定义值的配置名称,以加载。如果未设置,将使用ultimate rvc的默认配置。配置应位于ultimate rvc项目的configs目录中。如果不存在,将会引起错误。
使用条款
禁止将转换的语音用于以下目的。
-
批评或攻击个人。
-
倡导或反对特定的政治立场,宗教或意识形态。
-
公开表现出强烈的刺激表达式,而无需进行适当的分区。
-
销售语音模型和生成的语音剪辑。
-
冒充声音的原始主人,以恶意伤害/伤害他人的意图。
-
导致身份盗用或欺诈性电话的欺诈目的。
免责声明
我对与使用/滥用或无法使用此软件有关的任何直接,间接,结果,附带或特殊损害不承担任何责任。
