AICoverGen

2025-12-11 0 612

AICoverGen

使用YouTube视频或本地音频文件的任何RVC V2训练的AI语音来创建封面的自动管道。对于可能想在其AI助手/聊天机器人/VTUBER中添加歌唱功能的开发人员,或者想听听自己喜欢的角色唱自己喜欢的歌曲的人。

展示柜:https://www.youtube.com/watch?v=2qzue4wm7cm

设置指南:https://www.youtube.com/watch?v=pdlhk4vvhqk

WebUI正在不断开发和测试中,但是您可以立即在本地和Colab上尝试一下!

目录

  • ChangElog
  • 设置
    • 安装git和python
    • 安装FFMPEG和SOX
    • 克隆AICoverGen存储库
    • 下载所需的型号
  • Webui使用
    • 通过WebUI下载RVC模型
    • 通过WebUI上传RVC模型
    • 通过webui运行管道
  • 使用CLI
    • RVC模型的手册下载
    • 通过CLI运行管道
  • 使用条款

ChangElog

  • WebUI以更轻松的转换和语音模型下载
  • 支持本地音频文件的封面几代
  • 选择中间文件生成的选项。例如,孤立的人声/乐器
  • 从表中下载带有搜索/标签过滤器的表格的公共语音模型
  • 支持PixelDrain下载语音模型的链接
  • 实施新的RMVPE音高提取技术,以更快,更高质量的人声转换
  • AI主人声,备份人声和乐器的音量控制
  • 语音转换的索引率
  • AI主人声的混响控制
  • WebUI的本地网络共享选项
  • 额外的RVC选项-Filter_radius,RMS_MIX_RATE,保护
  • 本地文件通过文件浏览器选项上传
  • 通过WebUI上传了经过本地训练的RVC V2型号
  • 俯仰检测方法控制,例如rmvpe/mangio-crepe
  • 人声和乐器的音调变化。与更改卡拉OK中的歌曲相同的效果。
  • 音频输出格式选项:WAV或MP3。

将AICoverGen更新为最新版本

通过在AICoverGen目录中打开命令行窗口并运行以下命令来安装并提取任何新的要求和更改。

 pip install -r requirements.txt
git pull

对于Colab用户,只需在COLAB笔记本的顶部导航栏中单击Runtime ,然后在下拉菜单中Disconnect and delete runtime 。然后按照笔记本中的说明运行WebUI。

COLAB笔记本

对于那些没有足够强大的NVIDIA GPU的人,您可以使用Google Colab尝试使用AICoverGen 。

对于那些在几分钟后与Google CoLab笔记本上遇到问题的人,这是不使用webUI的替代方案。

对于那些想在本地运行的人,请遵循下面的设置指南。

设置

安装git和python

请按照此处的说明在计算机上安装GIT。另外,如果还没有,请遵循本指南安装Python版本3.9 。使用其他版本的Python可能会导致依赖性冲突。

安装FFMPEG

请按照此处的说明在计算机上安装FFMPEG。

安装Sox

请按照此处的说明进行安装并将其添加到Windows路径环境中。

克隆AICoverGen存储库

打开命令行窗口并运行这些命令以克隆整个存储库,并安装所需的其他依赖项。

AICoverGen
pip install -r requirements.txt\”>

 git clone https://g*ith**ub.com/SociallyIneptWeeb/AICoverGen
cd AICoverGen
pip install -r requirements.txt

下载所需的型号

运行以下命令以下载所需的MDXNET人声分离模型和Hubert Base模型。

 python src/download_models.py

Webui使用

要运行AICoverGen WebUI,请运行以下命令。

 python src/webui.py
旗帜 描述
-h--help 显示此帮助消息并退出。
--share 创建一个公共网址。这对于在Google Colab上运行Web UI很有用。
--listen 使Web UI从您的本地网络达到。
--listen-host LISTEN_HOST 服务器将使用的主机名。
--listen-port LISTEN_PORT 服务器将使用的侦听端口。

一旦出现以下输出消息Running on local URL: http://127.***0.0.1:7860出现,您可以单击链接以使用WebUI打开选项卡。

通过WebUI下载RVC模型

导航到Download model选项卡,然后将下载链接粘贴到RVC型号,并为其提供唯一的名称。您可以搜索已训练的语音模型可下载的AI Hub Discord。您可以参考下载链接的外观示例。下载的zip文件应包含.pth模型文件和可选的.Index文件。

填写两个输入字段后,只需单击Download !一旦输出消息说[NAME] Model successfully downloaded! ,单击“刷新型号”按钮后,您应该能够在Generate选项卡中使用它!

通过WebUI上传RVC模型

对于在当地训练RVC V2型号并且想在AI封面几代中使用它们的人。导航到Upload model选项卡,然后按照说明进行操作。一旦输出消息说[NAME] Model successfully uploaded! ,单击“刷新型号”按钮后,您应该能够在Generate选项卡中使用它!

通过webui运行管道

  • 从“语音模型”下拉菜单中,选择要使用的语音模型。如果您将文件手动添加到RVC_Models目录中以刷新列表,请单击Update
  • 在歌曲输入字段中,将链接复制到YouTube上的任何歌曲或本地音频文件的完整路径上。
  • 音高应根据原始人声和RVC AI模式设置为-12、0或12。这样可以确保声音并不是不可能的
  • 通过单击“手风琴箭头”展开,可以查看其他用于语音转换和音频混合的高级选项。

填写所有主要选项后,单击Generate ,并且AI生成的封面应在不到几分钟的时间内出现,具体取决于您的GPU。

使用CLI

RVC模型的手册下载

解压缩(如果需要),然后将.pth.index文件传输到RVC_Models目录中的新文件夹。每个文件夹只能包含一个.pth和一个.index文件。

目录结构应该看起来像这样:

 ├── rvc_models
│   ├── John
│   │   ├── JohnV2.pth
│   │   └── added_IVF2237_Flat_nprobe_1_v2.index
│   ├── May
│   │   ├── May.pth
│   │   └── added_IVF2237_Flat_nprobe_1_v2.index
│   ├── MODELS.txt
│   └── hubert_base.pt
├── mdxnet_models
├── song_output
└── src

通过CLI运行管道

要使用命令行运行AI封面生成管道,请运行以下命令。

 python src/main.py [-h] -i SONG_INPUT -dir RVC_DIRNAME -p PITCH_CHANGE [-k | --keep-files | --no-keep-files] [-ir INDEX_RATE] [-fr FILTER_RADIUS] [-rms RMS_MIX_RATE] [-palgo PITCH_DETECTION_ALGO] [-hop CREPE_HOP_LENGTH] [-pro PROTECT] [-mv MAIN_VOL] [-bv BACKUP_VOL] [-iv INST_VOL] [-pall PITCH_CHANGE_ALL] [-rsize REVERB_SIZE] [-rwet REVERB_WETNESS] [-rdry REVERB_DRYNESS] [-rdamp REVERB_DAMPING] [-oformat OUTPUT_FORMAT]
旗帜 描述
-h--help 显示此帮助消息并退出。
-i SONG_INPUT 链接到YouTube上的歌曲或本地音频文件的路径。应将Windows的双引号和类似Unix的系统的单引号封闭。
-dir MODEL_DIR_NAME rvc_models目录中包含您的.pth.index文件的文件夹的名称。
-p PITCH_CHANGE 改变八度音调的AI声音。设置为0,以免更改。通常,使用1用于雄性转化为女性,为-1用于副副主席。
-k 选修的。可以添加以保持所有中间音频文件生成。例如隔离AI人声/乐器。留出来节省空间。
-ir INDEX_RATE 选修的。默认为0.5。控制AI留下多少口音。 0 <= index_rate <= 1。
-fr FILTER_RADIUS 选修的。默认3。如果> = 3:将中值过滤滤波到收获的音高结果。 0 <= filter_radius <= 7。
-rms RMS_MIX_RATE 选修的。默认为0.25。控制使用原始声乐的响度(0)或固定的响度(1)的多少。 0 <= rms_mix_rate <= 1。
-palgo PITCH_DETECTION_ALGO 选修的。默认RMVPE。最佳选择是RMVPE(人声清晰),然后是Mangio-Crepe(声音更平滑)。
-hop CREPE_HOP_LENGTH 选修的。默认值128。控制使用Mangio-Crepe Algo专门使用毫秒的音高变化的频率。较低的值会导致更长的转换和更高的语音裂纹风险,但音高准确性更好。
-pro PROTECT 选修的。默认为0.33。控制有多少原始人声的呼吸和无声的辅音留在AI人声中。设置为0.5以禁用。 0 <=保护<= 0.5。
-mv MAIN_VOCALS_VOLUME_CHANGE 选修的。默认为0。主AI人声的控制音量。使用-3将体积减少3分贝,或3分贝,将体积增加3分贝。
-bv BACKUP_VOCALS_VOLUME_CHANGE 选修的。默认为0。备份AI人声的控制量。
-iv INSTRUMENTAL_VOLUME_CHANGE 选修的。默认值0。背景音乐/乐器的控制卷。
-pall PITCH_CHANGE_ALL 选修的。默认值0。在半音中更改背景音乐,备份人声和AI人声的钥匙。略微降低了声音质量。
-rsize REVERB_SIZE 选修的。默认为0.15。房间越大,混响时间越长。 0 <= Reverb_size <= 1。
-rwet REVERB_WETNESS 选修的。默认为0.2。带有混响的AI人声级别。 0 <= Reverb_wetness <= 1。
-rdry REVERB_DRYNESS 选修的。默认为0.8。无混音的AI人声级别。 0 <= reverb_dryness <= 1。
-rdamp REVERB_DAMPING 选修的。默认为0.7。混响中高频的吸收。 0 <= Reverb_damping <= 1。
-oformat OUTPUT_FORMAT 选修的。默认mp3。 WAV的最佳质量和较大的文件大小,MP3的质量不错,文件大小。

使用条款

禁止将转换的语音用于以下目的。

  • 批评或攻击个人。

  • 倡导或反对特定的政治立场,宗教或意识形态。

  • 公开表现出强烈的刺激表达式,而无需进行适当的分区。

  • 销售语音模型和生成的语音剪辑。

  • 冒充声音的原始主人,以恶意伤害/伤害他人的意图。

  • 导致身份盗用或欺诈性电话的欺诈目的。

免责声明

我对与使用/滥用或无法使用此软件有关的任何直接,间接,结果,附带或特殊损害不承担任何责任。

下载源码

通过命令行克隆项目:

git clone https://github.com/SociallyIneptWeeb/AICoverGen.git

收藏 (0) 打赏

感谢您的支持,我会继续努力的!

打开微信/支付宝扫一扫,即可进行扫码打赏哦,分享从这里开始,精彩与您同在
点赞 (0)

申明:本文由第三方发布,内容仅代表作者观点,与本网站无关。对本文以及其中全部或者部分内容的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。本网发布或转载文章出于传递更多信息之目的,并不意味着赞同其观点或证实其描述,也不代表本网对其真实性负责。

左子网 编程相关 AICoverGen https://www.zuozi.net/34159.html

v2ray step by step
上一篇: v2ray step by step
extism
下一篇: extism
常见问题
  • 1、自动:拍下后,点击(下载)链接即可下载;2、手动:拍下后,联系卖家发放即可或者联系官方找开发者发货。
查看详情
  • 1、源码默认交易周期:手动发货商品为1-3天,并且用户付款金额将会进入平台担保直到交易完成或者3-7天即可发放,如遇纠纷无限期延长收款金额直至纠纷解决或者退款!;
查看详情
  • 1、描述:源码描述(含标题)与实际源码不一致的(例:货不对板); 2、演示:有演示站时,与实际源码小于95%一致的(但描述中有”不保证完全一样、有变化的可能性”类似显著声明的除外); 3、发货:不发货可无理由退款; 4、安装:免费提供安装服务的源码但卖家不履行的; 5、收费:价格虚标,额外收取其他费用的(但描述中有显著声明或双方交易前有商定的除外); 6、其他:如质量方面的硬性常规问题BUG等。 注:经核实符合上述任一,均支持退款,但卖家予以积极解决问题则除外。
查看详情
  • 1、左子会对双方交易的过程及交易商品的快照进行永久存档,以确保交易的真实、有效、安全! 2、左子无法对如“永久包更新”、“永久技术支持”等类似交易之后的商家承诺做担保,请买家自行鉴别; 3、在源码同时有网站演示与图片演示,且站演与图演不一致时,默认按图演作为纠纷评判依据(特别声明或有商定除外); 4、在没有”无任何正当退款依据”的前提下,商品写有”一旦售出,概不支持退款”等类似的声明,视为无效声明; 5、在未拍下前,双方在QQ上所商定的交易内容,亦可成为纠纷评判依据(商定与描述冲突时,商定为准); 6、因聊天记录可作为纠纷评判依据,故双方联系时,只与对方在左子上所留的QQ、手机号沟通,以防对方不承认自我承诺。 7、虽然交易产生纠纷的几率很小,但一定要保留如聊天记录、手机短信等这样的重要信息,以防产生纠纷时便于左子介入快速处理。
查看详情

相关文章

猜你喜欢
发表评论
暂无评论
官方客服团队

为您解决烦忧 - 24小时在线 专业服务