Data Scientist (команда Коммуникации)
PythonИщем опытного DS в направление коммуникаций
В направлении коммуникаций есть темы, где хочется применить машинное обучение: переписки пользователей и транскрибированные звонки. Мы уже начали работу с собранными данными и будем глубже погружаться в такие задачи как:
- Выявление интентов и фактов из переписок пользователей
- Для большего погружения в то, что происходит между пользователями
- Для обогащения информации о пользователях
- Для последующей автоматизации общения
- Анализ и обработка транскрибаций звонков для выявления интентов и спама
- Решение задачи по выбору лучшего канала и времени для коммуникации с пользователем
- Разработка новых способов использовать накопленные данные по коммуникациям пользователей
Каждый член команды у нас — это ценный источник продуктовых и бизнес решений.
Го делать мир HR-Tech эффективнее и ярче
Мы ждем от кандидата:
- Опыт реализации и применения моделей машинного обучения в продакшене;
- Понимание основных методов и алгоритмов Machine Learning;
- Уверенное владение Python (numpy, scipy, pytorch, sklearn)
- Алгоритмическая подготовка: знание основных алгоритмов и структур данных;
- Понимание и опыт работы с A/B-экспериментами;
- Умение работать в команде, грамотно отстаивать свою точку зрения;
- Непомерное желание улучшать продукт и завоевывать мир!
Будет плюсом:
- Знание принципов работы нейросетевых моделей для обработки текста;
- Опыт в nlp-задачах будет большим плюсом;
- Опыт работы с различными источниками данных: SQL, Cassandra, Hive, Presto, Kafka, etc.;
- Опыт работы с Java и владение другими языками программирования, фреймворками и технологиями.
Вам предстоит:
- Переводить задачу с языка продактов на язык машинного обучения. Предлагать свои идеи на тему того, как продуктовым инициативам помогут DS решения;
- Очень много прототипировать и доводить свои решения до продакшена на python;
- Обучать много моделей с нуля: выгружать данные, заниматься feature engineering'ом, выбирать ML-алгоритмы и тюнить их;
- Доводить все модели до продакшена, запускать в A/B, поддерживать удачные решения.
Наш стек технологий:
- Python
- NumPy, SciPy, Pandas, scikit-learn;
- XGBoost, LightGBM, CatBoost;
- PyTorch, Hugging Face для сеток;
- Hadoop, Hive, Presto, Apache Airflow.
Почему у нас хорошо:
- Мы постоянно на волне новых технологий: 30% времени работы продуктовых команд и неограниченное время тех команды у нас занимает техналог.
- Мы регулярно пересматриваем стек и при необходимости его меняем;
- Сильная команда разработчиков уровня senior и middle, постоянный обмен опытом;
- Настроенные процессы CI/CD, большое количество автоматизаций и кодогенерации, делающих нашу работу проще и приятнее;
- Отсутствие бюрократии и ненужных встреч. Если процесс нам мешает мы его выкидываем. Никаких авторитетов;
- Методология Kanban + Release Train;
- Целеполагание через OKR, полностью прозрачный процесс на уровне компании;
- Можно стать немножко видеоблогером и записать “охэхэнную историю” в техблоге.
Мы хотим, чтобы каждый сотрудник был доволен своей работой, поэтому мы предлагаем:
- Гибкий график работы из дома либо в офисе;
- Корпоративное ДМС со стоматологией с первого месяца работы (решаем вопросы со здоровьем быстро и удобно);
- Электронная корпоративная библиотека;
- Кофемашина с зерновым кофе, чай, фрукты, йогурты на кухне;
- Активная корпоративная жизнь;
- Молодой, профессиональный и дружный коллектив;
- Возможность профессионального развития, обучение за счет компании, участие в специализированных конференциях;
- Достойный уровень заработной платы;
- Совместную постановку целей и индивидуальный план развития.
Откликнуться
