Делаем реалистичный женский голос в реальном времени
gen1us ?![](/file/36f20f8f6ff926b8065f5.jpg)
Предисловие
Для начала нам потребуется средняя-мощная видеокарта, на слабой видеокарте будет большая задержка
Что потребуется?
Сама программа, ссылка для скачивания и туториал ниже:
Ссылка https://github.com/w-okada/voice-changer
Туториал по скачиванию:
На открывшемся сайте листаем вниз и нажимаем на Hugging face как на скрине:
![](https://nztcdn.com/files/8b18993704afc20c9f3db0c4c105abc565cc67f1dfa88191d9a3cbbf224dd323.webp)
Далее видим кучу файлов:
![](https://nztcdn.com/files/e8fabf4eb3683a35b95ee81a653751af9bca99779249bd49b7871a07ebc2a69e.webp)
Если у вас мак, то скачиваете мак версию.
Если у вас видеокарта AMD, то скачиваем onnxDirectML версию (самую новую)
Если у вас видеокарта Nvidia, то скачиваем onnxgpu версию (самую новую)
Установка
Распаковываем архив и ищем в папке файл "start_http.bat" и запускаем.
У вас начнут скачиваться файлы и в итоге запустится панель:
![](https://nztcdn.com/files/c8df38755bcfe9877b542f86ac780d587c82fe1066f9625224f54d9fbe08711e.webp)
Для вывода звука из программы нам понадобится виртуальный аудио кабель (VAC) Virtual Audio Cabel
Ссылка на (VAC) Virtual Audio Cabel https://drive.google.com/file/d/1G4_9XM2HKj-ZUPp1mFjY8dkHDZE7TVTJ/view
VT https://www.virustotal.com/gui/file/d9cc50239e5bad10f689c7c9e82ef52dd99ac6fafeb62dcc6678c493b2d05141
Архив распаковывать необязательно, для установки запускаем этот файл:
![](https://nztcdn.com/files/9fae5a41c1b70aa37a8d81be37d1690e61d0560df852c2360ee4dc98e0b5825c.webp)
В установщике везде ждём далее и со всем соглашаемся.
ВАЖНО: ПРИ УСТАНОВКЕ КАБЕЛЬ ПОСТАВИТ СЕБЯ КАК ДЕФОЛТ УССТРОЙСТВО ВЫВОДА ЗВУКА, НЕ ЗАБУДЬТЕ ПОМЕНЯТЬ НА СВОИ НАУШНИКИ ОБРАТНО, А ТАК ЖЕ НЕ ЗАБЫВАЕМ ПОСТАВИТЬ LINE 1 В УССТРОЙСТВО ВВОДА В ДИСКОРДЕ
Интерфейс
Я сделал для вас перевод интерфейса на русский (только то, что нам нужно):
![](https://nztcdn.com/files/8150b2de2cafff024a9f3967f7c86a836d43a27b7120a97351e46cb3f8faff9f.webp)
В Качестве ставим от 192 до 512 (выше нет смысла), в битрейте ставим 4096
В тональности ставим +12 если вы тестируете женскую голосовую модель и -12 если мужскую.
Далее нажимаем Start и профит. голосовая модель работает!
Заключение
Мы потратили всего 15 минут и получаем просто прекрасный результат по изменению голоса. Буду рад ответить на все ваши вопросы по статье в комментариях.