Делаем реалистичный женский голос в реальном времени

Делаем реалистичный женский голос в реальном времени

gen1us ?


Предисловие

Для начала нам потребуется средняя-мощная видеокарта, на слабой видеокарте будет большая задержка


Что потребуется?


Сама программа, ссылка для скачивания и туториал ниже:

Ссылка https://github.com/w-okada/voice-changer


Туториал по скачиванию:


На открывшемся сайте листаем вниз и нажимаем на Hugging face как на скрине:


[IMG]


Далее видим кучу файлов:


[IMG]



Если у вас мак, то скачиваете мак версию.

Если у вас видеокарта AMD, то скачиваем onnxDirectML версию (самую новую)

Если у вас видеокарта Nvidia, то скачиваем onnxgpu версию (самую новую)


Установка

Распаковываем архив и ищем в папке файл "start_http.bat" и запускаем.

У вас начнут скачиваться файлы и в итоге запустится панель:


[IMG]

Для вывода звука из программы нам понадобится виртуальный аудио кабель (VAC) Virtual Audio Cabel


Ссылка на (VAC) Virtual Audio Cabel https://drive.google.com/file/d/1G4_9XM2HKj-ZUPp1mFjY8dkHDZE7TVTJ/view

VT https://www.virustotal.com/gui/file/d9cc50239e5bad10f689c7c9e82ef52dd99ac6fafeb62dcc6678c493b2d05141


Архив распаковывать необязательно, для установки запускаем этот файл:


[IMG]



В установщике везде ждём далее и со всем соглашаемся.


ВАЖНО: ПРИ УСТАНОВКЕ КАБЕЛЬ ПОСТАВИТ СЕБЯ КАК ДЕФОЛТ УССТРОЙСТВО ВЫВОДА ЗВУКА, НЕ ЗАБУДЬТЕ ПОМЕНЯТЬ НА СВОИ НАУШНИКИ ОБРАТНО, А ТАК ЖЕ НЕ ЗАБЫВАЕМ ПОСТАВИТЬ LINE 1 В УССТРОЙСТВО ВВОДА В ДИСКОРДЕ 



Интерфейс

Я сделал для вас перевод интерфейса на русский (только то, что нам нужно):


[IMG]



В Качестве ставим от 192 до 512 (выше нет смысла), в битрейте ставим 4096

В тональности ставим +12 если вы тестируете женскую голосовую модель и -12 если мужскую.

Далее нажимаем Start и профит. голосовая модель работает!


Заключение

Мы потратили всего 15 минут и получаем просто прекрасный результат по изменению голоса. Буду рад ответить на все ваши вопросы по статье в комментариях.





Report Page