AICoverGen

使用YouTube视频或本地音频文件的任何RVC V2训练的AI语音来创建封面的自动管道。对于可能想在其AI助手/聊天机器人/VTUBER中添加歌唱功能的开发人员，或者想听听自己喜欢的角色唱自己喜欢的歌曲的人。

展示柜：https：//www.youtube.com/watch?v=2qzue4wm7cm

设置指南：https：//www.youtube.com/watch?v=pdlhk4vvhqk

WebUI正在不断开发和测试中，但是您可以立即在本地和Colab上尝试一下！

ChangElog

WebUI以更轻松的转换和语音模型下载
支持本地音频文件的封面几代
选择中间文件生成的选项。例如，孤立的人声/乐器
从表中下载带有搜索/标签过滤器的表格的公共语音模型
支持PixelDrain下载语音模型的链接
实施新的RMVPE音高提取技术，以更快，更高质量的人声转换
AI主人声，备份人声和乐器的音量控制
语音转换的索引率
AI主人声的混响控制
WebUI的本地网络共享选项
额外的RVC选项-Filter_radius，RMS_MIX_RATE，保护
本地文件通过文件浏览器选项上传
通过WebUI上传了经过本地训练的RVC V2型号
俯仰检测方法控制，例如rmvpe/mangio-crepe
人声和乐器的音调变化。与更改卡拉OK中的歌曲相同的效果。
音频输出格式选项：WAV或MP3。

将AICoverGen更新为最新版本

通过在AICoverGen目录中打开命令行窗口并运行以下命令来安装并提取任何新的要求和更改。

 pip install -r requirements.txt
git pull

对于Colab用户，只需在COLAB笔记本的顶部导航栏中单击Runtime ，然后在下拉菜单中Disconnect and delete runtime 。然后按照笔记本中的说明运行WebUI。

COLAB笔记本

对于那些没有足够强大的NVIDIA GPU的人，您可以使用Google Colab尝试使用AICoverGen 。

对于那些在几分钟后与Google CoLab笔记本上遇到问题的人，这是不使用webUI的替代方案。

对于那些想在本地运行的人，请遵循下面的设置指南。

设置

安装git和python

请按照此处的说明在计算机上安装GIT。另外，如果还没有，请遵循本指南安装Python版本3.9 。使用其他版本的Python可能会导致依赖性冲突。

安装FFMPEG

请按照此处的说明在计算机上安装FFMPEG。

安装Sox

请按照此处的说明进行安装并将其添加到Windows路径环境中。

克隆AICoverGen存储库

打开命令行窗口并运行这些命令以克隆整个存储库，并安装所需的其他依赖项。

AICoverGen
pip install -r requirements.txt\”>

 git clone https://g*ith**ub.com/SociallyIneptWeeb/AICoverGen
cd AICoverGen
pip install -r requirements.txt

下载所需的型号

运行以下命令以下载所需的MDXNET人声分离模型和Hubert Base模型。

 python src/download_models.py

Webui使用

要运行AICoverGen WebUI，请运行以下命令。

 python src/webui.py

旗帜	描述
`-h` ， `--help`	显示此帮助消息并退出。
`--share`	创建一个公共网址。这对于在Google Colab上运行Web UI很有用。
`--listen`	使Web UI从您的本地网络达到。
`--listen-host LISTEN_HOST`	服务器将使用的主机名。
`--listen-port LISTEN_PORT`	服务器将使用的侦听端口。

一旦出现以下输出消息Running on local URL: http://127.***0.0.1:7860出现，您可以单击链接以使用WebUI打开选项卡。

通过WebUI下载RVC模型

导航到Download model选项卡，然后将下载链接粘贴到RVC型号，并为其提供唯一的名称。您可以搜索已训练的语音模型可下载的AI Hub Discord。您可以参考下载链接的外观示例。下载的zip文件应包含.pth模型文件和可选的.Index文件。

填写两个输入字段后，只需单击Download ！一旦输出消息说[NAME] Model successfully downloaded! ，单击“刷新型号”按钮后，您应该能够在Generate选项卡中使用它！

通过WebUI上传RVC模型

对于在当地训练RVC V2型号并且想在AI封面几代中使用它们的人。导航到Upload model选项卡，然后按照说明进行操作。一旦输出消息说[NAME] Model successfully uploaded! ，单击“刷新型号”按钮后，您应该能够在Generate选项卡中使用它！

通过webui运行管道

从“语音模型”下拉菜单中，选择要使用的语音模型。如果您将文件手动添加到RVC_Models目录中以刷新列表，请单击Update 。
在歌曲输入字段中，将链接复制到YouTube上的任何歌曲或本地音频文件的完整路径上。
音高应根据原始人声和RVC AI模式设置为-12、0或12。这样可以确保声音并不是不可能的。
通过单击“手风琴箭头”展开，可以查看其他用于语音转换和音频混合的高级选项。

填写所有主要选项后，单击Generate ，并且AI生成的封面应在不到几分钟的时间内出现，具体取决于您的GPU。

使用CLI

RVC模型的手册下载

解压缩（如果需要），然后将.pth和.index文件传输到RVC_Models目录中的新文件夹。每个文件夹只能包含一个.pth和一个.index文件。

目录结构应该看起来像这样：

 ├── rvc_models
│   ├── John
│   │   ├── JohnV2.pth
│   │   └── added_IVF2237_Flat_nprobe_1_v2.index
│   ├── May
│   │   ├── May.pth
│   │   └── added_IVF2237_Flat_nprobe_1_v2.index
│   ├── MODELS.txt
│   └── hubert_base.pt
├── mdxnet_models
├── song_output
└── src

通过CLI运行管道

要使用命令行运行AI封面生成管道，请运行以下命令。

 python src/main.py [-h] -i SONG_INPUT -dir RVC_DIRNAME -p PITCH_CHANGE [-k | --keep-files | --no-keep-files] [-ir INDEX_RATE] [-fr FILTER_RADIUS] [-rms RMS_MIX_RATE] [-palgo PITCH_DETECTION_ALGO] [-hop CREPE_HOP_LENGTH] [-pro PROTECT] [-mv MAIN_VOL] [-bv BACKUP_VOL] [-iv INST_VOL] [-pall PITCH_CHANGE_ALL] [-rsize REVERB_SIZE] [-rwet REVERB_WETNESS] [-rdry REVERB_DRYNESS] [-rdamp REVERB_DAMPING] [-oformat OUTPUT_FORMAT]

旗帜	描述
`-h` ， `--help`	显示此帮助消息并退出。
`-i SONG_INPUT`	链接到YouTube上的歌曲或本地音频文件的路径。应将Windows的双引号和类似Unix的系统的单引号封闭。
`-dir MODEL_DIR_NAME`	rvc_models目录中包含您的`.pth`和`.index`文件的文件夹的名称。
`-p PITCH_CHANGE`	改变八度音调的AI声音。设置为0，以免更改。通常，使用1用于雄性转化为女性，为-1用于副副主席。
`-k`	选修的。可以添加以保持所有中间音频文件生成。例如隔离AI人声/乐器。留出来节省空间。
`-ir INDEX_RATE`	选修的。默认为0.5。控制AI留下多少口音。 0 <= index_rate <= 1。
`-fr FILTER_RADIUS`	选修的。默认3。如果> = 3：将中值过滤滤波到收获的音高结果。 0 <= filter_radius <= 7。
`-rms RMS_MIX_RATE`	选修的。默认为0.25。控制使用原始声乐的响度（0）或固定的响度（1）的多少。 0 <= rms_mix_rate <= 1。
`-palgo PITCH_DETECTION_ALGO`	选修的。默认RMVPE。最佳选择是RMVPE（人声清晰），然后是Mangio-Crepe（声音更平滑）。
`-hop CREPE_HOP_LENGTH`	选修的。默认值128。控制使用Mangio-Crepe Algo专门使用毫秒的音高变化的频率。较低的值会导致更长的转换和更高的语音裂纹风险，但音高准确性更好。
`-pro PROTECT`	选修的。默认为0.33。控制有多少原始人声的呼吸和无声的辅音留在AI人声中。设置为0.5以禁用。 0 <=保护<= 0.5。
`-mv MAIN_VOCALS_VOLUME_CHANGE`	选修的。默认为0。主AI人声的控制音量。使用-3将体积减少3分贝，或3分贝，将体积增加3分贝。
`-bv BACKUP_VOCALS_VOLUME_CHANGE`	选修的。默认为0。备份AI人声的控制量。
`-iv INSTRUMENTAL_VOLUME_CHANGE`	选修的。默认值0。背景音乐/乐器的控制卷。
`-pall PITCH_CHANGE_ALL`	选修的。默认值0。在半音中更改背景音乐，备份人声和AI人声的钥匙。略微降低了声音质量。
`-rsize REVERB_SIZE`	选修的。默认为0.15。房间越大，混响时间越长。 0 <= Reverb_size <= 1。
`-rwet REVERB_WETNESS`	选修的。默认为0.2。带有混响的AI人声级别。 0 <= Reverb_wetness <= 1。
`-rdry REVERB_DRYNESS`	选修的。默认为0.8。无混音的AI人声级别。 0 <= reverb_dryness <= 1。
`-rdamp REVERB_DAMPING`	选修的。默认为0.7。混响中高频的吸收。 0 <= Reverb_damping <= 1。
`-oformat OUTPUT_FORMAT`	选修的。默认mp3。 WAV的最佳质量和较大的文件大小，MP3的质量不错，文件大小。

使用条款

禁止将转换的语音用于以下目的。

批评或攻击个人。
倡导或反对特定的政治立场，宗教或意识形态。
公开表现出强烈的刺激表达式，而无需进行适当的分区。
销售语音模型和生成的语音剪辑。
冒充声音的原始主人，以恶意伤害/伤害他人的意图。
导致身份盗用或欺诈性电话的欺诈目的。

免责声明

我对与使用/滥用或无法使用此软件有关的任何直接，间接，结果，附带或特殊损害不承担任何责任。

AICoverGen

目录

ChangElog

将AICoverGen更新为最新版本

COLAB笔记本

设置

安装git和python

安装FFMPEG

安装Sox

克隆AICoverGen存储库

下载所需的型号

Webui使用

通过WebUI下载RVC模型

通过WebUI上传RVC模型

通过webui运行管道

使用CLI

RVC模型的手册下载

通过CLI运行管道

使用条款

免责声明

相关文章

微信

左子网

QQ交流群