Computer Vision Engineer
Relocation/office Spb| full time | 180-300k
Myna Labs — исследовательская лаборатория, разрабатывающая голосовые технологии и технологии компьютерного зрения.
За стартапом стоит фонд, который ранее инвестировал в Looksery и AI Factory (приобретены компанией Snap за $150 млн и $166 млн соотвественно), а также мы получили грант от Nvidia Inception.
Недавно запустили saidit.app — развлекательное мобильное приложение для записи видео с аудио-фильтрами, которые позволяют говорить голосом другого человека (MSQRD для аудио).
Сейчас разрабатываем технологию real-time deep-fake (video + audio), которая будет полностью работать на телефоне, и имеем все шансы сделать это первыми 🤘
У нас объективно сильная молодая команда (ex Nvidia, Google, Amazon, Samsung AI, Lyft, Mail.Ru, VK, PicsArt, VisionLabs), и мы ищем опытных Computer Vision Engineer'ов, готовых участвовать в создании FaceSwap-технологии и решать другие интересные задачи.
🤓 Задачи
- Разрабатывать face swap (дип фейки, mobile, near real-time)
- Ужимать модели (квантизация, дистилляция и прочее), оптимизировать инференс и доводить все это добро до телефона (таргет платформа iOS / CoreML). Дальше подхватывают iOS разработчики
- Читать, понимать, воспроизводить статьи по компьютерному зрению (как генеративные, так и дискриминативные модели) и не грустить когда они не заводятся
👩💻 Ожидания
- Сильные навыки имплементации, тренировки и отладки моделей (PyTorch)
- Опыт работы в Computer Vision:
- Image and video generation (GANs, VAEs)
- Face alignment, Face swap,
- Детекция, сегментация, классификация
- Читать последние статьи с конференций и понимать, что из всего множества стоит попробовать заимплементить: CVPR, ECCV, ICCV, NeurIPS, arXiv 😊
- Проактивность. Надо самому уметь оценивать текущий результат. Как с помощью известных model-based метрик вроде FID, так и с помощью классического: поспрашивал людей <-> залил результаты на Толоку <-> выдумал новую метрику, которая хорошо коррелирует с качеством ожидаемых результатов
Buzzwords: Python 3, PyTorch, TorchScript, PyTorch Lightning, *nix, bash, CoreML, wandb, Swift 5
☺️ Будет плюсом
- Понимание компьютерной графики и 3D (рендеринг как классический, так и neural)
- Swift (чтобы тестировать модели и обрабатывать видео на девайсе)
- ARKit / ARCore / (если надо какое-то 3D, допустим синтетические данные)
- Наличие публикаций на CV/ML конференциях
🥳 Готовы предложить
- Команда единомышленников из Data Science-мира с опытом (публикациями) в области генерации и трансфера звука и картинок
- Зарплата 180-300k + phantom stocks
- ДМС со стоматологией + компенсация обедов и занятий спортом
- Купим всю необходимую технику, доступ к рабочим станциями с 2080 и RTX 6000 + AWS
- Работа в комфортном офисе, в 3х минутах от ст. м. Петроградская (гибкий график + иногда можно работать из дома)
- Помощь с релокейтом для иногородних кандидатов
⚙️ Процесс
- Общение с нашим HR-коллегой, который расскажет все про стартап и которому можно задать разные вопросы
- Мы высылаем тестовое задание на 24 часа в любой удобный для вас день. В качестве GPU хватит Google Colab или Kaggle Kernel.
- Обсуждаем тестовое задание и задаем технические вопросы: ML/CV, Алгоритмы
