Data Scientist/MLOps
PythonНаша команда работает над цифровизацией и автоматизацией процессов управления недвижимостью и эксплуатации объектов Сбера. Мы внедряем ML-решения для повышения энергоэффективности зданий в соответствии с международным стандартом ISO 50001 , оптимизации потребления ресурсов и снижения операционных издержек.
Обязанности:
- разработка и внедрение сервисов на основе ML-моделей в соответствии с архитектурными стандартами платформы Model Execution Framework (MEF) - прикладной сервис по сборке, развертыванию и исполнению моделей машинного обучения в форме Docker контейнеров
- реализация серверной части сервисов на Python с использованием библиотеки PyFramework , предоставляемой MEF, включая обработку входящих запросов (REST/gRPC), интеграцию с инфраструктурными компонентами и поддержку логирования/трассировки
- настройка и оптимизация web-серверов с помощью специализированных конфигураторов PyFramework для обеспечения корректного взаимодействия с системами MEF
- интеграция адаптеров для работы с внутренними сервисами и хранилищами данных MEF
- обеспечение устойчивости и отказоустойчивости сервисов: настройка graceful shutdown, работа с таймаутами, управление состоянием
- поддержание соответствия форматов логов и метрик требованиям централизованной системы мониторинга MEF
- написание технической документации к реализованным шаблонам и сервисам, включая описание установки, настройки и принципов взаимодействия с ME.
Требования:
- опыт коммерческой работы Data Scientist или ML Engineer от 2–3 лет
- уверенное владение Python 3.7+ для анализа данных, построения моделей и автоматизации пайплайнов
- практический опыт построения и обучения моделей машинного обучения и глубокого обучения на TensorFlow, PyTorch и Scikit-learn (реализованные production-кейсы)
- опыт подготовки и трансформации данных, применения современных методов обработки (feature engineering, data augmentation, time series, tabular, NLP или CV — на примерах)
- навыки построения, оптимизации и оценки ML-моделей (регрессия, классификация, ансамбли, нейросети, etc.), уверенное владение метриками качества и A/B тестированием
- опыт упаковки и деплоя моделей в продакшен (REST/gRPC API, контейнеризация через Docker)
- опыт работы с инструментами управления экспериментами (MLflow, DVC, Weights & Biases или аналоги)
- опыт интеграции моделей в production-окружение через Kubernetes/OpenShift (развертывание, поддержка, масштабирование)
- навыки работы с хранилищами данных (PostgreSQL, S3, Hadoop или аналоги)
- опыт работы с Git (ветвление, code review, управление версиями моделей/кода)
- опыт подготовки технической документации и артефактов для внедрения моделей в инфраструктуру
БУДЕТ ПЛЮСОМ:
- навыки построения и сопровождения end-to-end решений (от данных до production)
- знание и опыт работы с брокерами сообщений (Kafka, RabbitMQ)
- опыт деплоя ML-моделей в MEF
- навыки кастомизации Docker-образов, работы с CI/CD пайплайнами для ML (Jenkins, GitLab, Bitbucket CI/CD)
- опыт поддержки production-сервисов (мониторинг, логирование, Prometheus, Grafana, ELK/EFK/Sentry)
- опыт работы с корпоративными портальными DevOps-инструментами (Nexus, SecMan/Vault, SberOSC и др.)
Условия:
- офисный формат работы в новом ИТ Хабе на Васильевском острове (Уральская, 1), гибридный формат обсуждаем после испытательного срока
- годовой бонус и ежегодный пересмотр
- расширенный ДМС с первого дня + льготное страхование для семьи
- корпоративный университет Сбера, внутренняя образовательная платформа, участие в IT-конференциях
- корпоративная пенсионная программа, подписка СберПрайм+, скидки от партнеров и сервисов группы.
Откликнуться
