RVC WebUI MacOS - 左子网

基于检索的voice-conversion-webui

基于VIT的易于使用的语音转换框架。

常见问题解答（常见问题）

英语|中文简体|日本语| 한국어 （韩国语）| Français | Türkçe |葡萄牙

使用将近50个小时的高质量开源VCTK训练组对基本模型进行了训练。因此，没有任何版权问题，请随时使用。

请期待具有较大参数，较大数据集，更好效果，基本平坦的推理速度以及所需的训练数据更少的RVCV3的基本模型。

有一个单击的下载程序，用于模型/集成软件包/工具。欢迎尝试。

培训和推理WebUI

实时声音改变gui

特征：

通过使用TOP1检索将源功能替换为训练集功能来减少音调泄漏；
简单 +快速培训，即使是在糟糕的图形卡上；
用少量数据进行训练（> = 10分钟的低噪声语音建议）；
模型融合以更改音节（使用CKPT处理tab-> ckpt合并）；
易于使用的WebUI；
UVR5模型快速分开人声和乐器；
高点语音提取算法Interspeech2023-RMVPE，以防止声音问题。提供最佳的结果（显着），并且比Crepe_full更快，资源消耗较低；
支持AMD/Intel图形卡加速度；
支持IPEX的Intel Arc图形卡加速度。

在这里查看我们的演示视频！

环境配置

Python版本限制

建议使用VENV管理Python环境。

出于版本限制的原因，请参阅此错误。

python --version # 3.8 <= Python < 3.11

Linux/MacOS一键依赖性安装和启动脚本

通过在项目根目录中执行run.sh ，您可以配置venv虚拟环境，自动安装所需的依赖项，然后单击一键启动主程序。

sh ./run.sh

依赖的手动安装

安装pytorch及其核心依赖项，如果已经安装了，则跳过。请参阅：https：//pytorch.org/get-started/locally/
```
pip install torch torchvision torchaudio
```
如果您在Windows中使用Nvidia Ampere Architecture（RTX30XX），根据＃21的经验，则需要指定与Pytorch相对应的CUDA版本。
```
pip install torch torchvision torchaudio --index-url https://download.py*t*orc*h.org/whl/cu117
```
根据您自己的图形卡安装相应的依赖项。

NVIDIA GPU
```
 pip install -r requirements/main.txt
```
AMD/Intel GPU
```
 pip install -r requirements/dml.txt
```
AMD ROCM（Linux）
```
 pip install -r requirements/amd.txt
```
英特尔IPEX（Linux）
```
 pip install -r requirements/ipex.txt
```

4.如果您使用具有ROCM能力的AMD Radeon GPU，则需要选择Pytorch的ROCM版本。 bash pip3 install torch torchvision torchaudio --index-url https://download.p*yto*rc*h.org/whl/rocm6.2

准备其他文件

1。资产

RVC需要一些位于assets文件夹中的模型进行推理和培训。

自动检查/下载（默认）

默认情况下，RVC可以自动检查主程序启动时所需资源的完整性。

即使资源尚未完成，该程序也将继续启动。

如果要下载所有资源，请添加--update参数。
如果您想在启动时跳过资源完整性检查，请添加--nocheck参数。

手动下载

所有资源文件均位于拥抱面孔空间中

您可以在tools文件夹中找到一些脚本可以下载它们

您还可以将单击下载器用于型号/集成软件包/工具

以下是一个列表，其中包括RVC所需的所有预制和其他文件的名称。

./assets/hubert/hubert_base.pt

 rvcmd assets/hubert # RVC-Models-Downloader command

./assets/pretrated

 rvcmd assets/v1 # RVC-Models-Downloader command

./assets/uvr5_weights

 rvcmd assets/uvr5 # RVC-Models-Downloader command

如果要使用该模型的V2版本，则需要下载其他资源

./assets/pretratained_v2

 rvcmd assets/v2 # RVC-Models-Downloader command

2。下载RMVPE人声提取算法所需的文件

如果要使用最新的RMVPE声音提取算法，则需要下载俯仰提取模型参数并将其放入assets/rmvpe中。

rmvpe.pt

 rvcmd assets/rmvpe # RVC-Models-Downloader command

下载RMVPE的DML环境（可选，适用于AMD/Intel GPU）

rmvpe.onnx

 rvcmd assets/rmvpe # RVC-Models-Downloader command

3。AMDROCM（仅可选，仅Linux）

如果您想基于AMD的ROCM技术在Linux系统上运行RVC，请首先在此处安装所需的驱动程序。

如果您使用的是Arch Linux，则可以使用PACMAN安装所需的驱动程序。

 pacman -S rocm-hip-sdk rocm-opencl-sdk

对于某些图形卡，您可能需要配置以下环境变量（例如：RX6700XT）。

 export ROCM_PATH=/opt/rocm #Set ROCM Executables Path
export HSA_OVERRIDE_GFX_VERSION=10.3.0 #Spoof GPU Model for ROCM

另外，请确保您当前的用户位于render和video用户组中。

 sudo usermod -aG render $USERNAME
sudo usermod -aG video $USERNAME

入门

直接启动

使用以下命令启动WebUI。

python web.py

Linux/MacOS

./run.sh

对于需要使用IPEX技术的I卡用户（仅Linux）

 source /opt/intel/oneapi/setvars.sh
./run.sh

使用集成软件包（Windows用户）

下载并解开RVC-beta.7z 。解压缩后，双击go-web.bat用一键启动程序。

rvcmd packs/general/latest # RVC-Models-Downloader command

学分

ContentVec
vits
hifigan
Gradio
最终的声音去除剂
音频单位
声音提取：RMVPE
- 预验证的模型由YXLLLC和RVC-Boss训练和测试。

感谢所有贡献者的努力

RVC-Webui-Macos

基于检索的语音转换WebUI的MACOS优化版本，该版本专为Apple Silicon（M1/M2/M3）Mac设计。

特征

语音转换和高质量的结果
针对苹果硅（M1/M2/M3）MAC优化
用户友好的Web界面
支持各种音频格式
实时语音转换
自定义语音模型的培训功能
包括所有必需的型号 – 无需其他下载！

要求

MacOS 12.0或更高版本
Apple Silicon Mac（M1/M2/M3）
Python 3.10或更高版本
8GB RAM最小值（建议使用16GB）
10GB免费磁盘空间

安装

克隆这个存储库：

git clone https://gith*ub.c*o*m/NevilPatel01/RVC-WebUI-MacOS.git
cd RVC-WebUI-MacOS

创建并激活虚拟环境：

python -m venv .venv
source .venv/bin/activate

安装依赖项：

pip install -r requirements/gui.txt

注意：此存储库包括所有必要的模型文件。您无需下载任何其他型号。但是，如果要使用不同的型号，则可以从原始存储库中下载它们。

用法

启动Web界面：

python web.py --port 7860

打开您的网络浏览器并导航到：

 http://lo*c*al*host:7860

培训自己的模型

准备培训数据：
- 以WAV格式放置音频文件
- 推荐持续时间：10-50分钟干净的音频
- 样本率：16kHz或更高
- 将文件放入logs/your_experiment_name/0_gt_wavs/
开始训练：
- 使用Web界面开始培训
- 选择您的实验名称
- 选择培训参数
- 点击“开始训练”

目录结构

 RVC-WebUI-MacOS/
├── assets/
│   ├── pretrained/    # Pretrained models (included)
│   └── rmvpe/         # RMVPE model files (included)
├── logs/
│   └── your_experiment_name/
│       ├── 0_gt_wavs/     # Original audio files
│       ├── 1_16k_wavs/    # 16kHz converted files
│       ├── 2a_f0/         # Pitch information
│       └── 2b-f0nsf/      # Processed pitch information
├── requirements/
│   └── gui.txt        # GUI dependencies
└── web.py             # Main application file

故障排除

如果您遇到“没有支持的NVIDIA GPU找到”消息：
- 这对于M系列Mac是正常的
- 该应用程序将自动使用MPS（金属性能着色器）
如果您获得“已使用中的地址”错误：
- 尝试使用其他端口： python web.py --port 7861
如果模型加载失败：
- 验证文件权限
- 检查模型文件是否存在于资产目录中
- 尝试重新安装依赖项

贡献

欢迎捐款！请随时提交拉动请求。

执照

该项目是根据MIT许可证获得许可的 – 有关详细信息，请参见许可证文件。

致谢

原始项目：基于富穆亚马 – 取回的voice-conversion-webui
Nevil Patel对MacOS进行了修改和优化

基于检索的voice-conversion-webui

特征：

环境配置

Python版本限制

Linux/MacOS一键依赖性安装和启动脚本

依赖的手动安装

准备其他文件

1。资产

自动检查/下载（默认）

手动下载

2。下载RMVPE人声提取算法所需的文件

下载RMVPE的DML环境（可选，适用于AMD/Intel GPU）

3。AMDROCM（仅可选，仅Linux）

入门

直接启动

Linux/MacOS

对于需要使用IPEX技术的I卡用户（仅Linux）

使用集成软件包（Windows用户）

学分

感谢所有贡献者的努力

RVC-Webui-Macos

特征

要求

安装

用法

培训自己的模型

目录结构

故障排除

贡献

执照

致谢

相关文章

微信

左子网

QQ交流群