语音合成Ngngngan
python脚本下载和处理数据以训练越南MC Nguyen Ngoc ngan的语音合成模型
下载和处理音频以训练神经网络以模仿Ngan叔叔的声音
出于版权原因,这里只有代码,没有人愿意阅读下面的说明以运行自我训练的音频拉动代码
RVC检查点:https://hhggverface.co/doof–ferb/rvc-ngngan
Matcha-TTS检查点:https://hhgggingface.co/doof-ferb/matcha_ngngngan
演示:Matcha-tts?https://*h*uggin*gface.co/spaces/doof-ferb/matchatts_ngngan
要求
需要NVIDIA GPU
安装ffmpeg
git clone这个仓库
准备新的Python Env( venv或conda )pip install torch torchaudio --find-links=https://download.p**yt*orch.org/whl/torch_stable.html
可选: pip install jupyter-lab tensorboard用于可视化
例如张量 – logdir <通往包含事件的文件夹localhost:6006 tensorboard --logdir <path to folder containing events.out.tfevents.*>
或直接运行pip install -r requirements.txt ,但可能不是最新的
工作流程
第1部分:准备RVC的数据
第2部分:例如RVC培训 +推理
第3部分:准备文本到语音的数据
第4.1部分:例如VITS 2培训(放弃Becse培训太长)
第4.2部分:例如Matcha-TTS培训
各种各样的
git update-index --skip-worktree data/vits2_ngngngan_nosdp.json
git update-index --skip-worktree tensorboard/export_tensorboard_RVC.py
git update-index --skip-worktree tensorboard/export_tensorboard_MatchaTTS.py
