PolGen
PolGen — это инновационный инструмент для создания каверов и переозвучки с использованием голосов, обученных на RVC v2.
? Основные возможности ?
? Гибкая установка моделей
PolGen поддерживает несколько способов установки моделей:
- Загрузка по ссылке на ZIP-файл: Поддерживаемые сайты: HuggingFace, Pixeldrain, Google Drive, Mega, Яндекс Диск.
- Загрузка ZIP-файла с устройства: Просто перетащите ZIP-файл в программу.
- Загрузка .pth и .index файлов по отдельности: Нет необходимости запаковывать файлы в ZIP архив.
Преобразование текста в речь (TTS) от Edge-TTS
PolGen поддерживает преобразование текста в речь с использованием Edge-TTS. Создавайте разговорные аудиозаписи из текста без лишних усилий.
Установка кастомных HuBERT моделей
PolGen предоставляет гибкость в выборе моделей для лучшего результата. Установите кастомные HuBERT модели, чтобы адаптировать программу под свои нужды.
Установка и запуск
Запуск на Google Colab
Если у вас нет мощной видеокарты от NVIDIA, PolGen можно запустить с использованием Google Colab.
Запуск на ПК
Note
- Скачайте ZIP-архив и распакуйте содержимое в любое удобное место – Скачать
- Запустите файл для установки PolGen:
- Windows:
run-PolGen-installer.bat - Linux:
run-PolGen-installer.sh
- Windows:
- Запустите программу PolGen:
- Windows:
run-PolGen.bat - Linux:
run-PolGen.sh
- Windows:
Для Windows, возможно, потребуется установить Microsoft C++ Build Tools с выбранной нагрузкой «Desktop development with C++».
Tip
Для лучшего опыта рекомендуется использовать предварительно скомпилированную версию.
- Скачайте ZIP-архив и распакуйте содержимое в любое удобное место – Репозиторий / Скачать
- Запустите файл:
- Windows:
run-PolGen.bat - Linux:
run-PolGen.sh
- Windows:
Условия использования
Использование преобразованного голоса для следующих целей запрещено:
- Критика или нападение на отдельных лиц.
- Поддержка или противодействие конкретным политическим позициям, религиям или идеологиям.
- Публичное отображение сильно стимулирующих выражений без соответствующего зонирования.
- Продажа голосовых моделей и сгенерированных голосовых клипов.
- Притворство оригинальным владельцем голоса с злонамеренными намерениями причинить вред/боль другим.
- Мошеннические цели, ведущие к краже личности или мошенническим телефонным звонкам.
?️ Отказ от ответственности
Я не несу ответственности за любые прямые, косвенные, последующие, случайные или специальные убытки, которые могут возникнуть в результате или в связи с использованием, неправильным использованием или невозможностью использования этого программного обеспечения.
? Контакты
Если у вас есть вопросы или предложения, пожалуйста, свяжитесь со мной через Telegram или GitHub Issues.
