Hex RVC (Lite)
使用YouTube视频或本地音频文件的任何RVC V2训练的AI语音来创建封面的自动管道。对于可能想在其AI助手/聊天机器人/VTUBER中添加歌唱功能的开发人员,或者想听听自己喜欢的角色唱自己喜欢的歌曲的人。
WebUI正在不断开发和测试中,但是您可以立即在本地和Colab上尝试一下!
ChangElog
- 新的F0方法
- WebUI以更轻松的转换和语音模型下载
- 支持本地音频文件的封面几代
- 选择中间文件生成的选项。例如,孤立的人声/乐器
- 从表中下载带有搜索/标签过滤器的表格的公共语音模型
- 支持PixelDrain下载语音模型的链接
- 实施新的RMVPE音高提取技术,以更快,更高质量的人声转换
- AI主人声,备份人声和乐器的音量控制
- 语音转换的索引率
- AI主人声的混响控制
- WebUI的本地网络共享选项
- 额外的RVC选项-Filter_radius,RMS_MIX_RATE,保护
- 本地文件通过文件浏览器选项上传
- 通过WebUI上传了经过本地训练的RVC V2型号
- 俯仰检测方法控制,例如rmvpe/mangio-crepe
- 人声和乐器的音调变化。与更改卡拉OK中的歌曲相同的效果。
- 音频输出格式选项:WAV或MP3。
将HEX-RVC更新为最新版本
通过在Hex-RVC目录中打开命令行窗口并运行以下命令来安装并提取任何新的要求和更改。
pip install -r requirements.txt
git pull
对于Colab用户,只需在COLAB笔记本的顶部导航栏中单击Runtime ,然后在下拉菜单中Disconnect and delete runtime 。然后按照笔记本中的说明运行WebUI。
COLAB笔记本
对于那些没有足够强大的NVIDIA GPU的人,您可以使用Google Colab尝试使用Hex RVC 。
对于那些想在本地运行的人,请遵循下面的设置指南。
设置
安装git和python
请按照此处的说明在计算机上安装GIT。另外,如果还没有,请遵循本指南安装Python版本3.9 。使用其他版本的Python可能会导致依赖性冲突。
安装FFMPEG
请按照此处的说明在计算机上安装FFMPEG。
安装Sox
请按照此处的说明进行安装并将其添加到Windows路径环境中。
克隆Aicovergen存储库
打开命令行窗口并运行这些命令以克隆整个存储库,并安装所需的其他依赖项。
git clone https://git*hub*.*com/kindahex/Hex-RVC
cd Hex-RVC
pip install -r requirements.txt
下载所需的型号
运行以下命令以下载所需的MDXNET人声分离模型和Hubert Base模型。
python src/download_models.py
Webui使用
要运行Aicovergen WebUI,请运行以下命令。
python src/webui.py
使用CLI
RVC模型的手册下载
解压缩(如果需要),然后将.pth和.index文件传输到RVC_Models目录中的新文件夹。每个文件夹只能包含一个.pth和一个.index文件。
目录结构应该看起来像这样:
├── rvc_models
│ ├── John
│ │ ├── JohnV2.pth
│ │ └── added_IVF2237_Flat_nprobe_1_v2.index
│ ├── May
│ │ ├── May.pth
│ │ └── added_IVF2237_Flat_nprobe_1_v2.index
│ ├── MODELS.txt
│ └── hubert_base.pt
├── mdxnet_models
├── song_output
└── src
运行管道
要使用命令行运行AI封面生成管道,请运行以下命令。
python src/main.py [-h] -i SONG_INPUT -dir RVC_DIRNAME -p PITCH_CHANGE [-k | --keep-files | --no-keep-files] [-ir INDEX_RATE] [-fr FILTER_RADIUS] [-rms RMS_MIX_RATE] [-palgo PITCH_DETECTION_ALGO] [-hop CREPE_HOP_LENGTH] [-pro PROTECT] [-mv MAIN_VOL] [-bv BACKUP_VOL] [-iv INST_VOL] [-pall PITCH_CHANGE_ALL] [-rsize REVERB_SIZE] [-rwet REVERB_WETNESS] [-rdry REVERB_DRYNESS] [-rdamp REVERB_DAMPING] [-oformat OUTPUT_FORMAT]
| 旗帜 | 描述 |
|---|---|
-h , --help
|
显示此帮助消息并退出。 |
-i SONG_INPUT
|
链接到YouTube上的歌曲或本地音频文件的路径。应将Windows的双引号和类似Unix的系统的单引号封闭。 |
-dir MODEL_DIR_NAME
|
rvc_models目录中包含您的.pth和.index文件的文件夹的名称。 |
-p PITCH_CHANGE
|
改变八度音调的AI声音。设置为0,以免更改。通常,使用1用于雄性转化为女性,为-1用于副副主席。 |
-k
|
选修的。可以添加以保持所有中间音频文件生成。例如隔离AI人声/乐器。留出来节省空间。 |
-ir INDEX_RATE
|
选修的。默认为0.5。控制AI留下多少口音。 0 <= index_rate <= 1。 |
-fr FILTER_RADIUS
|
选修的。默认3。如果> = 3:将中值过滤滤波到收获的音高结果。 0 <= filter_radius <= 7。 |
-rms RMS_MIX_RATE
|
选修的。默认为0.25。控制使用原始声乐的响度(0)或固定的响度(1)的多少。 0 <= rms_mix_rate <= 1。 |
-palgo PITCH_DETECTION_ALGO
|
选修的。默认RMVPE。最佳选择是RMVPE(人声清晰),然后是Mangio-Crepe(声音更平滑)。 |
-hop CREPE_HOP_LENGTH
|
选修的。默认值128。控制使用Mangio-Crepe Algo专门使用毫秒的音高变化的频率。较低的值会导致更长的转换和更高的语音裂纹风险,但音高准确性更好。 |
-pro PROTECT
|
选修的。默认为0.33。控制有多少原始人声的呼吸和无声的辅音留在AI人声中。设置为0.5以禁用。 0 <=保护<= 0.5。 |
-mv MAIN_VOCALS_VOLUME_CHANGE
|
选修的。默认为0。主AI人声的控制音量。使用-3将体积减少3分贝,或3分贝,将体积增加3分贝。 |
-bv BACKUP_VOCALS_VOLUME_CHANGE
|
选修的。默认为0。备份AI人声的控制量。 |
-iv INSTRUMENTAL_VOLUME_CHANGE
|
选修的。默认值0。背景音乐/乐器的控制卷。 |
-pall PITCH_CHANGE_ALL
|
选修的。默认值0。在半音中更改背景音乐,备份人声和AI人声的钥匙。略微降低了声音质量。 |
-rsize REVERB_SIZE
|
选修的。默认为0.15。房间越大,混响时间越长。 0 <= Reverb_size <= 1。 |
-rwet REVERB_WETNESS
|
选修的。默认为0.2。带有混响的AI人声级别。 0 <= Reverb_wetness <= 1。 |
-rdry REVERB_DRYNESS
|
选修的。默认为0.8。无混音的AI人声级别。 0 <= reverb_dryness <= 1。 |
-rdamp REVERB_DAMPING
|
选修的。默认为0.7。混响中高频的吸收。 0 <= Reverb_damping <= 1。 |
-oformat OUTPUT_FORMAT
|
选修的。默认mp3。 WAV的最佳质量和较大的文件大小,MP3的质量不错,文件大小。 |
使用条款
禁止将转换的语音用于以下目的。
-
批评或攻击个人。
-
倡导或反对特定的政治立场,宗教或意识形态。
-
公开表现出强烈的刺激表达式,而无需进行适当的分区。
-
销售语音模型和生成的语音剪辑。
-
冒充声音的原始主人,以恶意伤害/伤害他人的意图。
-
导致身份盗用或欺诈性电话的欺诈目的。
免责声明
我们不承担任何直接,间接,结果,偶然或特殊损害的责任。
