Computer Vision Engineer

Relocation/office Spb| full time | 180-300k

Myna Labs — исследовательская лаборатория, разрабатывающая голосовые технологии и технологии компьютерного зрения.

За стартапом стоит фонд, который ранее инвестировал в Looksery и AI Factory (приобретены компанией Snap за $150 млн и $166 млн соотвественно), а также мы получили грант от Nvidia Inception.

Недавно запустили saidit.app — развлекательное мобильное приложение для записи видео с аудио-фильтрами, которые позволяют говорить голосом другого человека (MSQRD для аудио).

Saidit! AI Voice Changer

Сейчас разрабатываем технологию real-time deep-fake (video + audio), которая будет полностью работать на телефоне, и имеем все шансы сделать это первыми 🤘

У нас объективно сильная молодая команда (ex Nvidia, Google, Amazon, Samsung AI, Lyft, Mail.Ru, VK, PicsArt, VisionLabs), и мы ищем опытных Computer Vision Engineer'ов, готовых участвовать в создании FaceSwap-технологии и решать другие интересные задачи.

🤓 Задачи

Разрабатывать face swap (дип фейки, mobile, near real-time)
Ужимать модели (квантизация, дистилляция и прочее), оптимизировать инференс и доводить все это добро до телефона (таргет платформа iOS / CoreML). Дальше подхватывают iOS разработчики
Читать, понимать, воспроизводить статьи по компьютерному зрению (как генеративные, так и дискриминативные модели) и не грустить когда они не заводятся

👩‍💻 Ожидания

Сильные навыки имплементации, тренировки и отладки моделей (PyTorch)
Опыт работы в Computer Vision:
Image and video generation (GANs, VAEs)
Face alignment, Face swap,
Детекция, сегментация, классификация
Читать последние статьи с конференций и понимать, что из всего множества стоит попробовать заимплементить: CVPR, ECCV, ICCV, NeurIPS, arXiv 😊
Проактивность. Надо самому уметь оценивать текущий результат. Как с помощью известных model-based метрик вроде FID, так и с помощью классического: поспрашивал людей <-> залил результаты на Толоку <-> выдумал новую метрику, которая хорошо коррелирует с качеством ожидаемых результатов

Buzzwords: Python 3, PyTorch, TorchScript, PyTorch Lightning, *nix, bash, CoreML, wandb, Swift 5

☺️ Будет плюсом

Понимание компьютерной графики и 3D (рендеринг как классический, так и neural)
Swift (чтобы тестировать модели и обрабатывать видео на девайсе)
ARKit / ARCore / (если надо какое-то 3D, допустим синтетические данные)
Наличие публикаций на CV/ML конференциях

🥳 Готовы предложить

Команда единомышленников из Data Science-мира с опытом (публикациями) в области генерации и трансфера звука и картинок
Зарплата 180-300k + phantom stocks
ДМС со стоматологией + компенсация обедов и занятий спортом
Купим всю необходимую технику, доступ к рабочим станциями с 2080 и RTX 6000 + AWS
Работа в комфортном офисе, в 3х минутах от ст. м. Петроградская (гибкий график + иногда можно работать из дома)
Помощь с релокейтом для иногородних кандидатов

⚙️ Процесс

Общение с нашим HR-коллегой, который расскажет все про стартап и которому можно задать разные вопросы
Мы высылаем тестовое задание на 24 часа в любой удобный для вас день. В качестве GPU хватит Google Colab или Kaggle Kernel.
Обсуждаем тестовое задание и задаем технические вопросы: ML/CV, Алгоритмы

✅ОТКЛИКНУТЬСЯ

Computer Vision Engineer

Report Page