llama_cute_voice_assistant
动机:许多具有人工智能的语音助手的声音令人不愉快。虽然这可能是个人喜好。我的目标是创建一个更人性化的助手,使您能够插入可爱的动漫角色声音和Vtuber声音。
解决方案图:
如何安装
本指南可能不是最详细的。它需要改进。
步骤1-安装llama_cute_voice_assistant
Windows的安装过程
- 安装git https://git**-scm*.com/downloads
- 安装CudatoolKit(您只能选择Pytorch支持的CUDA的版本。请参阅此处的支持版本https://py*t*or*ch.org/get-started/locally/)
- 安装Miniconda https://docs.c*o**nda.io/en/latest/miniconda.html
- 开放Miniconda控制台
- 创建新的Conda环境
conda create --name llama_cute_voice_assistant python=3.11
- 激活Conda环境
conda activate llama_cute_voice_assistant
- 克隆项目
git clone https://*git*hu*b.com/atomlayer/llama_cute_voice_assistant.git
- 转到项目目录
cd llama_cute_voice_assistant
- 安装Pytorch
- 转到https://pytor*ch.**org/get-started/locally/
- 生成一个为您的系统安装pytorch的命令(命令将是这样的:pip3 install torch torch torchvision torchaudio -index-url https://download.py*t**orch.org/whl/cu118)
- 执行命令
- 安装库
pip install SpeechRecognition==3.10.0
pip install pyttsx3==2.90
pip install soundfile==0.12.1
pip install simpleaudio==1.0.4
pip install pygame==2.5.1
conda install PyAudio
pip install openai-whisper --no-cache-dir
pip install omegaconf==2.3.0
pip install git+https://**github.co*m/openai/whisper.git
conda install -c conda-forge ffmpeg
步骤2-安装Oobabooga文本生成Web UI
-
https://*git**hub.com/oobabooga/text-generation-webui#one-click-installers
-
使用-api参数打开Oobabooga文本生成Web UI。
-
在“模型”选项卡上:下载并运行您喜欢的AI模型。
-
在聊天设置>“字符”选项卡上:设置您的字符名称和描述。
步骤3-安装实时语音更换器
详细说明-https://www.youtube.com/watch?v=_jxbvstgpoo
-
下载https://huggi**ngf*ace.co/wok000/vcclient000/blob/main/mmvcserversio_win_onnxgpu-cuda_v.1.5.3.11.zip
-
解开档案
-
运行start_http.bat
-
加入AI Hub Discord:https://discord.gg/aihub
-
转到搜索模型频道
-
查找并下载您喜欢的模型
-
单击实时语音更改客户端中的编辑按钮
-
将模型上传到免费单元格
-
调整声音的最佳音调参数。
步骤4 – 安装虚拟麦克风
-
下载并安装VB-Cable虚拟音频设备https://*v*b-a*udio.com/cable/
-
打开实时语音更换器
-
设置音频输入:电缆输出(VB-Audio虚拟电缆)
- 按开始按钮
步骤5-更改settings.py文件中的设置
- 替换oobabooga_api_name和唤醒单词。
OOBABOOGA_API_NAME- OOBABOOGA文本生成Web UI中的一个字符的名称(Paremeters>“字符”选项卡)
oobabooga_api_name = \"Lisa\"
wake_words = [\"lisa\"]
如何使用
- 在项目文件夹中打开conda控制台
- 运行命令:
python voice_chat.py
- 说唤醒单词和助手的命令。
链接
https://githu*b.c*o*m/davabase/whisper_real_time
