配x主要分支是出血边缘:期望频繁更新和每个提交后发生许多破裂的变化
RVC Studio
该项目为培训RVC模型和生成AI语音盖提供了全面的平台。使用该应用程序下载所需的文件,然后在此处手动下载它们:https://huggingface.co/datasets/sayanoai/rvc–studio/tree/main/main
特征
- YouTube Music Downloader:只需单击即可从YouTube下载任何音乐视频作为MP3文件。
- 1键AI歌曲封面:轻松使用RVC创建AI歌曲封面。
- RVC模型微调:微调RVC模型,以模仿您想要使用自己的数据的任何声音。
- 使用RVC模型1键键式TT:使用微型VC模型仅需单击即可将任何文本转换为语音。
- 内置张板:您可以使用内置tensorboard仪表板监视VC型号的训练进度和性能。
- LLM集成:使用流行的LLM实时与您的RVC模型聊天。
- Auto-PlayList:让您的RVC模型从您喜欢的播放列表中唱歌。
计划的功能
- Demucs:Meta的人声和乐器音乐源分离。
- 音频过程:您可以通过添加混响,Echos等来增强生成歌曲的质量。
- 使用Cloud API的TT:使用基于云的文本到语音服务来生成任何文本的高质量和自然语音。
- 实时VC接口:使用您喜欢的RVC型号转换您的语音。
要求
- Python 3.6或更高(在v3.8.17上开发和测试)
- pip
- Virtualenv或Conda软件包经理
简单安装
- 克隆此存储库或下载zip文件并提取它。
- 双击“ conda-installer.bat”以安装最新版本的conda软件包管理器
- 双击“ conda-start.bat”(如果跳过步骤2。)
手动安装
- 克隆此存储库或下载zip文件。
- 导航到项目目录,并使用命令
virtualenv venv创建虚拟环境。 - 使用命令
source venv/bin/activateLinux/Mac或venv\\Scripts\\activateWindows上的命令源VENV/BIN/激活虚拟环境。或使用conda create -n RVC-Studio & conda activate RVC-Studio。 - 使用Command
pip install -r requirements.txt安装所需的软件包。 - 使用命令
streamlit run Home.py运行简化应用程序。
或在Google Colab中运行
推理页面的说明
- 在WebUI页面或此处下载所有必需模型
- 将您喜欢的歌曲放在./songs文件夹中
- 导航到“ RVC服务器”页面并启动服务器
- 导航到“推理”页面,然后按“刷新数据”按钮
- 选择一首歌(目前仅支持WAV/FLAC/OGG/MP3)
- 选择语音模型(将您的RVC V2模型放入./models/rvc/和index文件中。/models/rvc/.index/)
- 选择人声提取模型(预处理模型是可选的)
- 单击“保存选项”和“ 1键VC”以启动
聊天页面的说明
聊天功能已迁移到RVC-Chat。
如果您的计算机可以处理这些型号的较大版本。 (您必须建立自己的配置)
dockerize
运行docker compose up --build在主要项目文件夹中构建。
已知问题:张板在Docker容器中不起作用。如果您知道解决方案,请随时提交公关。固定在提交8B720936B4DAB347CBA0E4A791330FB533BFDF1D中
常见问题解答
- FFMPEG/ESPEAK的麻烦?阅读此
免责声明
该项目仅用于教育和研究目的。产生的声音闭合无意侵犯原始歌曲或文字的任何版权或商标。该项目不认可或促进对生成AI技术的任何非法或不道德使用。该项目对由于使用或滥用生成的声音范围而引起的任何损害或负债概不负责。
学分
该项目使用以下存储库中的代码和AI模型:
- 卡拉凡恩船长。
- RVC项目的基于检索的语音转换WebUI。
- Anjok07的终极声乐拆卸GUI。
- 精简。
- TACOTRON 2-NVIDIA比实际时间更快地推断的Pytorch实现。
- 树皮:Suno-ai的孟加拉语语言工具包。
- SpeechT5:一种自我监督的预训练模型,用于Microsoft的语音识别和生成。
- VIT:Jaywalnut310等人的端到端文本到语音的对抗性学习的条件变异自动编码器。
- Iahispano的Applio-RVC-Fork
我们感谢这些存储库的所有作者和贡献者的出色工作以及公开提供代码和模型。
