AniVoiceChanger

用于基于检索的语音转换WebUI的“扩展”。提供了一种记录您的语音，使用训练有素的语音模型转换的方法，并在没有运行WebUI的情况下将其输出。

展示：https：//www.youtube.com/watch?v=c-pqtbh0lxy

设置指南：https：//www.youtube.com/watch?v=k4vvw7ia1w8

设置

先决条件

安装git

请按照此处的说明在计算机上安装GIT。

安装7个拉链

从此处下载并安装7-ZIP应用程序。

这用于在下载后提取Zipped RVC WebUI应用程序。

安装虚拟音频电缆

通过在管理员模式下提取所有文件并运行设置程序，从这里下载并安装VB-Cable驱动程序。安装后重新启动。

这用于将转换后的语音音频输送到应用程序的音频输入中。

安装RVC WebUI

如果您尚未安装RVC WebUI，请从此处下载RVC-BETA.7Z文件，然后使用7-zip将其提取到您选择的文件夹中。它将需要大约8GB的空间，而不包括您以后可能会训练的任何语音模型。

克隆AniVoiceChanger存储库

在提取的RVC-BETA文件夹中（应该有很多文件夹和文件），打开命令行窗口并运行此命令以克隆整个存储库，并安装此扩展程序所需的其他依赖项。

AniVoiceChanger\\extra_requirements.txt\”>

 git clone https://git*hu*b.*com/SociallyIneptWeeb/AniVoiceChanger
runtime\\python.exe -m pip install -r AniVoiceChanger \\extra_requirements.txt

在.env文件中填充您的环境变量

按照.env文件中写的说明，并填写适当的值。如果不确定，请参考设置视频的这一部分。

用法

该程序假设您已经训练了语音模型，并在“权重”文件夹中使用了模型文件。如果您没有这样做，请参考设置视频的这一部分。

请记住，将使用的游戏或应用程序的音频输入设备更改为电缆输出（VB-Audio虚拟电缆）。

有两种方法可以在本地或使用Google Colab运行此程序。如果您有大约5 GB的GPU VRAM可以备用，请在使用crepe Pitch提取算法的同时随意在本地运行。如果您只有大约3 GB的GPU VRAM，也可以在使用pm螺距提取算法时本地运行此操作。如果所有这些要求都没有满足，则应使用Google Colab运行此要求。

当地的

要启动程序，请在提取的RVC-BETA文件夹中打开命令行窗口（应该包含一堆文件夹和文件），然后运行此命令。

runtime\\python.exe AniVoiceChanger \\main_local.py

请注意，每次在.env文件中更新变量时，您都必须重新运行此命令才能生效。例如，在更改模型名称时。

现在，按照键盘上的.ENV文件中定义的record_key并将其通知到您的麦克风。这可能第一次可能需要5秒钟才能产生和播放声音。对于连续的用途，通过缓存将大幅度缩短所花费的时间。语音将按照.env文件中定义的电缆输出音频设备和扬声器播放。生成的语音也将写入此文件夹中，以output.wav文件。

Google Colab

转到github中的AniVoiceChanger _colab.ipynb文件，然后单击Open in Colab 。这将打开COLAB笔记本。请按照笔记本中的说明进行训练语音模型或运行RVC推理服务器。

如果您已经将经过训练的语音模型上传到Colab运行时，并且已经开始运行推理服务器，则最后一个单元格的输出应显示NGROK公共URL。将此URL复制并粘贴到.env文件中的COLAB_URL环境变量中。正确设置了所有环境变量后，请在提取的RVC-Beta文件夹中打开命令行窗口（应该包含一堆文件夹和文件），然后运行此命令。请注意，每次在.env文件中更新变量时，您都必须重新运行此命令才能生效。例如，在更改模型名称时。

runtime\\python.exe AniVoiceChanger \\main_colab.py

请注意，每次在.env文件中更新变量时，您都必须重新运行此命令才能生效。例如，在更改模型名称时。

现在，按照键盘上的.ENV文件中定义的record_key并将其通知到您的麦克风。这可能是第一次可能需要10秒钟才能产生和播放声音。对于连续的用途，通过缓存将大幅度缩短所花费的时间。语音将按照.env文件中定义的电缆输出音频设备和扬声器播放。生成的语音也将写入此文件夹中，以output.wav文件。

使用条款

禁止将转换的语音用于以下目的。

批评或攻击个人。
倡导或反对特定的政治立场，宗教或意识形态。
公开表现出强烈的刺激表达式，而无需进行适当的分区。
销售语音模型和生成的语音剪辑。
冒充声音的原始主人，以恶意伤害/伤害他人的意图。
导致身份盗用或欺诈性电话的欺诈目的。

免责声明

我对与使用/滥用或无法使用此软件有关的任何直接，间接，结果，附带或特殊损害不承担任何责任。

AniVoiceChanger