Senior DS/ML Developer (LLM/NLP, ASR) / Sifox

Senior DS/ML Developer (LLM/NLP, ASR) / Sifox

Удалённо или Москва

Наша компания специализируется на разработке голосовых сервисов для телеком-индустрии. Мы внедряем наши продукты в сети крупных операторов мобильной связи, активно растем и, в связи с этим, усиливаем команду. Резидент «Сколково».

Возможна работа из зарубежья.

Ищем Senior DS/ML программиста, который будет отвечать за разработку и масштабирование приложения для анализа речи в режиме реального времени и текста, а также интеграции данного приложения в имеющуюся голосовую платформу.

Задачи

  • Реализация рекомендательной системы, вопрос-ответ, классификации, обработки текста, исправление ошибок, извлечение структурной информации и т.д. на базе LLM движка для виртуального ассистента на основе opensource библиотек;
  • Проектирование и улучшение компонентов LLM движка, включая: feature extraction, pretraining, finetuning, comparison;
  • Анализ качества моделей на стенде и в продуктивной среде, сравнение с датасетами-бенчмарками (и их подготовка);
  • Интеграция и масштабирование разработанных модулей в продукты компании;
  • Доработка сторонних библиотек и, при необходимости, переписывание критичных к производительности компонент с python на другие языки;
  • Оптимизация моделей и алгоритмов для обработки текста под высокие нагрузки, использование подходом вида: RAG LLM with cache;
  • Написание тестов и проведение нагрузочного тестирования;
  • Расчет нагрузки и формулирование требований к оборудованию;
  • Взаимодействие с продуктовой командой, аналитиками и разработчиками платформы.

Требования

  • Опыт в разработке голосовых приложений от 3х лет;
  • Умение писать читаемый и тестируемый код с высокой степенью масштабируемости;
  • Опыт продуктивизации LLM моделей в высоконагруженных средах;
  • Глубокое знание современного ML стека (pytorch, onnx, pytest, openvino, tensorflow,flow и др.);
  • Знание библиотек для работы с аудио, например: librosa, torchaudio и др.;
  • Опыт работы с LangChain, Hugging Face (PEFT, Transformers, etc.), Cohere;
  • Опыт работы уровня prod c такими LLM как: Saiga-2, LLaMA, GPT-j и другие opensource модели;
  • Опыт работы уровня prod c NLP моделями: fastText, GloVe/Word2Vec и т.д.;
  • Хорошее представление об известных ASR библиотеках: kaldi, nvidia nemo, espnet и др.;
  • Умение работать с векторными базами данных Milvus, Chroma, QDrant, Weaviate и др.

Приветствуется

  • Знание различных языков программирования cython, С++, SQL, GraphQL;
  • Знакомство с инструментами: RabbitMQ, PostgreSQL, FreeSwitch;
  • Опыт в телеком-проектах.

Условия:

  • З/п - фикс + бонусы (уровень дохода обсуждается с финальным кандидатом);
  • Формат работы — удаленный (при желании, можно трудиться в офисе недалеко от м. Динамо);
  • Гибкий график (начало рабочего дня может обсуждаться с руководителем);
  • Оформление с соблюдением всех норм ТК РФ;
  • ДМС (после 3 мес. испытательного периода, в случае местонахождения на территории РФ);
  • Аккредитация Минцифры: предоставляются все льготы для IT-специалистов (в том числе IT-ипотека).

Контакты:

TG: @alexeyakopyan


Report Page