Вакансия: Senior Data Scientist (LLM R&D)
Компания: НИУ ВШЭ (Центр стратегической аналитики и больших данных ИСИЭЗ)
Проект: iFORA
Опыт работы: от 3 лет
Город: Москва (м. Лубянка / м. Тургеневская)
Формат работы: гибрид
Занятость: full time
Зп: от 300 000 net.
🔥 iFORA - интеллектуальная аналитическая система больших данных (собственная разработка ИСИЭЗ НИУ ВШЭ). Система позволяет анализировать более 850 млн документов из уникальной коллекции (научные статьи, патенты, медиа и др.) для поддержки принятия стратегических решений.
Мы приглашаем в нашу команду опытного Data Scientist для работы над проектом по созданию платформы анализа данных с уклоном в исследования с области больших языковых моделей.
Стек: Python; Jupyter, VSCode; numpy, PyTorch; Transformers, TRL, Axolotl, Langhcain/LangGraph; s3, MLFlow
📌 Задачи:
▪️Исследование способности агентов к рассуждению и планированию (Reasoning, CoT)
▪️Полный цикл обучения до вывода модели в продакшн (Domain Adaptation и дообучение LLM с использованием внутренних и синтетических данных, создание функций оценки ответов)
▪️Разработка методов эффективного обучения и инференса
▪️Улучшение Deep Research продукта
▪️Разработка стратегий построения и обновления knowledge graph для RAG-системы
▪️NLP-задачи: Preprocessing, Classification, Summarization, NER, Semantic Search, Clustering и др
📌 Требования:
▪️Опыт работы в области ML/DS 3+ лет
▪️Высшее образование, степень: специалист / магистр / доктор наук / кандидат / PhD в области математики и компьютерных наук
▪️Коммерческий опыт тренировки и масштабирования LLM моделей: pre-train, fine-tune, Multi-GPU Training и оптимизация гиперпараметров
▪️Разбираетесь в RL (RLHF, RLVR), знание алгоритмов и методов preference-based optimization (PPO, DPO, GRPO)
▪️Глубокое знание современных DL/LLM-архитектур
▪️Опыт prompt engineering и chain-of-thought reasoning для LLM
▪️Опыт работы с Pytorch, ONNX, Nvidia TensorRT, CUDA, Docker
▪️Знание методов оптимизации и ускорения инференса нейронных сетей
▪️Умеете превращать научные статьи в код: реализовывали SOTA-методы и алгоритмы
▪️Способность вести учет экспериментов (файлы с метриками, s3, MLFlow, W&B)
▪️Знание средств командной разработки - Chat, Kanban, Wiki, Mail
▪️Базовые знания Linux, Git, Bash и Docker
📌 Будет плюсом:
▪️Наличие научных публикаций
▪️Опыт разработки ИИ-агентов (ReAct, Multi-Agent)
▪️Опыт в LangChain, LangGraph для построения multi-agent систем (MAS) RAG-систем или AI-агентов
📌 Условия:
▪️Интересная работа и масштабный проект
▪️Кластер с GPU A40, A100, H200 для прототипирования
▪️Доступ к суперкомпьютеру НИУ ВШЭ «cHARISMa»
▪️Обучение (семинары, курсы, тренинги от НИУ ВШЭ, английский)
▪️График работы: гибрид (возможна удалёнка), гибкое время начало дня с 8.00 до 11.00
▪️Программы лояльности от крупнейших фитнес-клубов и театров Москвы
▪️ДМС
▪️Доступ к регулярно обновляющейся библиотеке НИУ ВШЭ, а также электронным и аудиокнигам издательства «МИФ»
▪️Офис в шаговой доступности от лучших кофеен и книжных Москвы на Мясницкой (м. Лубянка / м. Тургеневская), скидки в «Даблби», «Ska vi fi ka?» и «Буквышка» при предъявлении пропуска НИУ ВШЭ
✅ Контакт для связи: anna_hr_hse