AniVoiceChanger
用于基于检索的语音转换WebUI的“扩展”。提供了一种记录您的语音,使用训练有素的语音模型转换的方法,并在没有运行WebUI的情况下将其输出。
展示:https://www.youtube.com/watch?v=c-pqtbh0lxy
设置指南:https://www.youtube.com/watch?v=k4vvw7ia1w8
设置
先决条件
安装git
请按照此处的说明在计算机上安装GIT。
安装7个拉链
从此处下载并安装7-ZIP应用程序。
这用于在下载后提取Zipped RVC WebUI应用程序。
安装虚拟音频电缆
通过在管理员模式下提取所有文件并运行设置程序,从这里下载并安装VB-Cable驱动程序。安装后重新启动。
这用于将转换后的语音音频输送到应用程序的音频输入中。
安装RVC WebUI
如果您尚未安装RVC WebUI,请从此处下载RVC-BETA.7Z文件,然后使用7-zip将其提取到您选择的文件夹中。它将需要大约8GB的空间,而不包括您以后可能会训练的任何语音模型。
克隆AniVoiceChanger存储库
在提取的RVC-BETA文件夹中(应该有很多文件夹和文件),打开命令行窗口并运行此命令以克隆整个存储库,并安装此扩展程序所需的其他依赖项。
AniVoiceChanger\\extra_requirements.txt\”>
git clone https://git*hu*b.*com/SociallyIneptWeeb/AniVoiceChanger
runtime\\python.exe -m pip install -r AniVoiceChanger \\extra_requirements.txt
在.env文件中填充您的环境变量
按照.env文件中写的说明,并填写适当的值。如果不确定,请参考设置视频的这一部分。
用法
该程序假设您已经训练了语音模型,并在“权重”文件夹中使用了模型文件。如果您没有这样做,请参考设置视频的这一部分。
请记住,将使用的游戏或应用程序的音频输入设备更改为电缆输出(VB-Audio虚拟电缆)。
有两种方法可以在本地或使用Google Colab运行此程序。如果您有大约5 GB的GPU VRAM可以备用,请在使用crepe Pitch提取算法的同时随意在本地运行。如果您只有大约3 GB的GPU VRAM,也可以在使用pm螺距提取算法时本地运行此操作。如果所有这些要求都没有满足,则应使用Google Colab运行此要求。
当地的
要启动程序,请在提取的RVC-BETA文件夹中打开命令行窗口(应该包含一堆文件夹和文件),然后运行此命令。
runtime\\python.exe AniVoiceChanger \\main_local.py
请注意,每次在
.env文件中更新变量时,您都必须重新运行此命令才能生效。例如,在更改模型名称时。
现在,按照键盘上的.ENV文件中定义的record_key并将其通知到您的麦克风。这可能第一次可能需要5秒钟才能产生和播放声音。对于连续的用途,通过缓存将大幅度缩短所花费的时间。语音将按照.env文件中定义的电缆输出音频设备和扬声器播放。生成的语音也将写入此文件夹中,以output.wav文件。
Google Colab
转到github中的AniVoiceChanger _colab.ipynb文件,然后单击Open in Colab 。这将打开COLAB笔记本。请按照笔记本中的说明进行训练语音模型或运行RVC推理服务器。
如果您已经将经过训练的语音模型上传到Colab运行时,并且已经开始运行推理服务器,则最后一个单元格的输出应显示NGROK公共URL。将此URL复制并粘贴到.env文件中的COLAB_URL环境变量中。正确设置了所有环境变量后,请在提取的RVC-Beta文件夹中打开命令行窗口(应该包含一堆文件夹和文件),然后运行此命令。请注意,每次在.env文件中更新变量时,您都必须重新运行此命令才能生效。例如,在更改模型名称时。
runtime\\python.exe AniVoiceChanger \\main_colab.py
请注意,每次在
.env文件中更新变量时,您都必须重新运行此命令才能生效。例如,在更改模型名称时。
现在,按照键盘上的.ENV文件中定义的record_key并将其通知到您的麦克风。这可能是第一次可能需要10秒钟才能产生和播放声音。对于连续的用途,通过缓存将大幅度缩短所花费的时间。语音将按照.env文件中定义的电缆输出音频设备和扬声器播放。生成的语音也将写入此文件夹中,以output.wav文件。
使用条款
禁止将转换的语音用于以下目的。
-
批评或攻击个人。
-
倡导或反对特定的政治立场,宗教或意识形态。
-
公开表现出强烈的刺激表达式,而无需进行适当的分区。
-
销售语音模型和生成的语音剪辑。
-
冒充声音的原始主人,以恶意伤害/伤害他人的意图。
-
导致身份盗用或欺诈性电话的欺诈目的。
免责声明
我对与使用/滥用或无法使用此软件有关的任何直接,间接,结果,附带或特殊损害不承担任何责任。
