基于检索的voice-conversion-webui
基于VIT的易于使用的语音转换框架。
常见问题解答(常见问题)
英语|中文简体|日本语| 한국어 (韩国语)| Français | Türkçe |葡萄牙
有一个单击的下载程序,用于模型/集成软件包/工具。欢迎尝试。
| 培训和推理WebUI |
|---|
| 实时声音改变gui |
|---|
特征:
- 通过使用TOP1检索将源功能替换为训练集功能来减少音调泄漏;
- 简单 +快速培训,即使是在糟糕的图形卡上;
- 用少量数据进行训练(> = 10分钟的低噪声语音建议);
- 模型融合以更改音节(使用CKPT处理tab-> ckpt合并);
- 易于使用的WebUI;
- UVR5模型快速分开人声和乐器;
- 高点语音提取算法Interspeech2023-RMVPE,以防止声音问题。提供最佳的结果(显着),并且比Crepe_full更快,资源消耗较低;
- 支持AMD/Intel图形卡加速度;
- 支持IPEX的Intel Arc图形卡加速度。
在这里查看我们的演示视频!
环境配置
Python版本限制
建议使用VENV管理Python环境。
出于版本限制的原因,请参阅此错误。
python --version # 3.8 <= Python < 3.11
Linux/MacOS一键依赖性安装和启动脚本
通过在项目根目录中执行run.sh ,您可以配置venv虚拟环境,自动安装所需的依赖项,然后单击一键启动主程序。
sh ./run.sh
依赖的手动安装
-
安装
pytorch及其核心依赖项,如果已经安装了,则跳过。请参阅:https://pytorch.org/get-started/locally/pip install torch torchvision torchaudio
-
如果您在Windows中使用Nvidia Ampere Architecture(RTX30XX),根据#21的经验,则需要指定与Pytorch相对应的CUDA版本。
pip install torch torchvision torchaudio --index-url https://download.py*t*orc*h.org/whl/cu117
-
根据您自己的图形卡安装相应的依赖项。
- NVIDIA GPU
pip install -r requirements/main.txt
- AMD/Intel GPU
pip install -r requirements/dml.txt
- AMD ROCM(Linux)
pip install -r requirements/amd.txt
- 英特尔IPEX(Linux)
pip install -r requirements/ipex.txt
4.如果您使用具有ROCM能力的AMD Radeon GPU,则需要选择Pytorch的ROCM版本。 bash pip3 install torch torchvision torchaudio --index-url https://download.p*yto*rc*h.org/whl/rocm6.2
准备其他文件
1。资产
RVC需要一些位于
assets文件夹中的模型进行推理和培训。
自动检查/下载(默认)
默认情况下,RVC可以自动检查主程序启动时所需资源的完整性。
即使资源尚未完成,该程序也将继续启动。
- 如果要下载所有资源,请添加
--update参数。 - 如果您想在启动时跳过资源完整性检查,请添加
--nocheck参数。
手动下载
所有资源文件均位于拥抱面孔空间中
您可以在
tools文件夹中找到一些脚本可以下载它们
您还可以将单击下载器用于型号/集成软件包/工具
以下是一个列表,其中包括RVC所需的所有预制和其他文件的名称。
- ./assets/hubert/hubert_base.pt
rvcmd assets/hubert # RVC-Models-Downloader command - ./assets/pretrated
rvcmd assets/v1 # RVC-Models-Downloader command - ./assets/uvr5_weights
rvcmd assets/uvr5 # RVC-Models-Downloader command
如果要使用该模型的V2版本,则需要下载其他资源
- ./assets/pretratained_v2
rvcmd assets/v2 # RVC-Models-Downloader command
2。下载RMVPE人声提取算法所需的文件
如果要使用最新的RMVPE声音提取算法,则需要下载俯仰提取模型参数并将其放入assets/rmvpe中。
- rmvpe.pt
rvcmd assets/rmvpe # RVC-Models-Downloader command
下载RMVPE的DML环境(可选,适用于AMD/Intel GPU)
- rmvpe.onnx
rvcmd assets/rmvpe # RVC-Models-Downloader command
3。AMDROCM(仅可选,仅Linux)
如果您想基于AMD的ROCM技术在Linux系统上运行RVC,请首先在此处安装所需的驱动程序。
如果您使用的是Arch Linux,则可以使用PACMAN安装所需的驱动程序。
pacman -S rocm-hip-sdk rocm-opencl-sdk
对于某些图形卡,您可能需要配置以下环境变量(例如:RX6700XT)。
export ROCM_PATH=/opt/rocm #Set ROCM Executables Path
export HSA_OVERRIDE_GFX_VERSION=10.3.0 #Spoof GPU Model for ROCM
另外,请确保您当前的用户位于render和video用户组中。
sudo usermod -aG render $USERNAME
sudo usermod -aG video $USERNAME
入门
直接启动
使用以下命令启动WebUI。
python web.py
Linux/MacOS
./run.sh
对于需要使用IPEX技术的I卡用户(仅Linux)
source /opt/intel/oneapi/setvars.sh
./run.sh
使用集成软件包(Windows用户)
下载并解开RVC-beta.7z 。解压缩后,双击go-web.bat用一键启动程序。
rvcmd packs/general/latest # RVC-Models-Downloader command
学分
- ContentVec
- vits
- hifigan
- Gradio
- 最终的声音去除剂
- 音频单位
- 声音提取:RMVPE
- 预验证的模型由YXLLLC和RVC-Boss训练和测试。
感谢所有贡献者的努力
RVC-Webui-Macos
基于检索的语音转换WebUI的MACOS优化版本,该版本专为Apple Silicon(M1/M2/M3)Mac设计。
特征
- 语音转换和高质量的结果
- 针对苹果硅(M1/M2/M3)MAC优化
- 用户友好的Web界面
- 支持各种音频格式
- 实时语音转换
- 自定义语音模型的培训功能
- 包括所有必需的型号 – 无需其他下载!
要求
- MacOS 12.0或更高版本
- Apple Silicon Mac(M1/M2/M3)
- Python 3.10或更高版本
- 8GB RAM最小值(建议使用16GB)
- 10GB免费磁盘空间
安装
- 克隆这个存储库:
git clone https://gith*ub.c*o*m/NevilPatel01/RVC-WebUI-MacOS.git
cd RVC-WebUI-MacOS
- 创建并激活虚拟环境:
python -m venv .venv
source .venv/bin/activate
- 安装依赖项:
pip install -r requirements/gui.txt
注意:此存储库包括所有必要的模型文件。您无需下载任何其他型号。但是,如果要使用不同的型号,则可以从原始存储库中下载它们。
用法
- 启动Web界面:
python web.py --port 7860
- 打开您的网络浏览器并导航到:
http://lo*c*al*host:7860
培训自己的模型
-
准备培训数据:
- 以WAV格式放置音频文件
- 推荐持续时间:10-50分钟干净的音频
- 样本率:16kHz或更高
- 将文件放入
logs/your_experiment_name/0_gt_wavs/
-
开始训练:
- 使用Web界面开始培训
- 选择您的实验名称
- 选择培训参数
- 点击“开始训练”
目录结构
RVC-WebUI-MacOS/
├── assets/
│ ├── pretrained/ # Pretrained models (included)
│ └── rmvpe/ # RMVPE model files (included)
├── logs/
│ └── your_experiment_name/
│ ├── 0_gt_wavs/ # Original audio files
│ ├── 1_16k_wavs/ # 16kHz converted files
│ ├── 2a_f0/ # Pitch information
│ └── 2b-f0nsf/ # Processed pitch information
├── requirements/
│ └── gui.txt # GUI dependencies
└── web.py # Main application file
故障排除
-
如果您遇到“没有支持的NVIDIA GPU找到”消息:
- 这对于M系列Mac是正常的
- 该应用程序将自动使用MPS(金属性能着色器)
-
如果您获得“已使用中的地址”错误:
- 尝试使用其他端口:
python web.py --port 7861
- 尝试使用其他端口:
-
如果模型加载失败:
- 验证文件权限
- 检查模型文件是否存在于资产目录中
- 尝试重新安装依赖项
贡献
欢迎捐款!请随时提交拉动请求。
执照
该项目是根据MIT许可证获得许可的 – 有关详细信息,请参见许可证文件。
致谢
- 原始项目:基于富穆亚马 – 取回的voice-conversion-webui
- Nevil Patel对MacOS进行了修改和优化
