Computer Vision Engineer

Computer Vision Engineer


Relocation/office Spb| full time | 180-300k

Myna Labs — исследовательская лаборатория, разрабатывающая голосовые технологии и технологии компьютерного зрения.

За стартапом стоит фонд, который ранее инвестировал в Looksery и AI Factory (приобретены компанией Snap за $150 млн и $166 млн соотвественно), а также мы получили грант от Nvidia Inception.

Недавно запустили saidit.app — развлекательное мобильное приложение для записи видео с аудио-фильтрами, которые позволяют говорить голосом другого человека (MSQRD для аудио).

Saidit! AI Voice Changer

Сейчас разрабатываем технологию real-time deep-fake (video + audio), которая будет полностью работать на телефоне, и имеем все шансы сделать это первыми 🤘

У нас объективно сильная молодая команда (ex Nvidia, Google, Amazon, Samsung AI, Lyft, Mail.Ru, VK, PicsArt, VisionLabs), и мы ищем опытных Computer Vision Engineer'ов, готовых участвовать в создании FaceSwap-технологии и решать другие интересные задачи.

🤓 Задачи

  • Разрабатывать face swap (дип фейки, mobile, near real-time)
  • Ужимать модели (квантизация, дистилляция и прочее), оптимизировать инференс и доводить все это добро до телефона (таргет платформа iOS / CoreML). Дальше подхватывают iOS разработчики
  • Читать, понимать, воспроизводить статьи по компьютерному зрению (как генеративные, так и дискриминативные модели) и не грустить когда они не заводятся

👩‍💻 Ожидания

  • Сильные навыки имплементации, тренировки и отладки моделей (PyTorch)
  • Опыт работы в Computer Vision:
  • Image and video generation (GANs, VAEs)
  • Face alignment, Face swap,
  • Детекция, сегментация, классификация
  • Читать последние статьи с конференций и понимать, что из всего множества стоит попробовать заимплементить: CVPR, ECCV, ICCV, NeurIPS, arXiv 😊
  • Проактивность. Надо самому уметь оценивать текущий результат. Как с помощью известных model-based метрик вроде FID, так и с помощью классического: поспрашивал людей <-> залил результаты на Толоку <-> выдумал новую метрику, которая хорошо коррелирует с качеством ожидаемых результатов

Buzzwords: Python 3, PyTorch, TorchScript, PyTorch Lightning, *nix, bash, CoreML, wandb, Swift 5

☺️ Будет плюсом

  • Понимание компьютерной графики и 3D (рендеринг как классический, так и neural)
  • Swift (чтобы тестировать модели и обрабатывать видео на девайсе)
  • ARKit / ARCore /  (если надо какое-то 3D, допустим синтетические данные)
  • Наличие публикаций на CV/ML конференциях

🥳 Готовы предложить

  • Команда единомышленников из Data Science-мира с опытом (публикациями) в области генерации и трансфера звука и картинок
  • Зарплата 180-300k + phantom stocks
  • ДМС со стоматологией + компенсация обедов и занятий спортом
  • Купим всю необходимую технику, доступ к рабочим станциями с 2080 и RTX 6000 + AWS
  • Работа в комфортном офисе, в 3х минутах от ст. м. Петроградская (гибкий график + иногда можно работать из дома)
  • Помощь с релокейтом для иногородних кандидатов

⚙️ Процесс

  • Общение с нашим HR-коллегой, который расскажет все про стартап и которому можно задать разные вопросы
  • Мы высылаем тестовое задание на 24 часа в любой удобный для вас день. В качестве GPU хватит Google Colab или Kaggle Kernel.
  • Обсуждаем тестовое задание и задаем технические вопросы: ML/CV, Алгоритмы

ОТКЛИКНУТЬСЯ


Report Page