Вакансия: Senior Data Scientist (LLM R&D)

Компания: НИУ ВШЭ (Центр стратегической аналитики и больших данных ИСИЭЗ)

Проект: iFORA

Опыт работы: от 3 лет

Город: Москва (м. Лубянка / м. Тургеневская)

Формат работы: гибрид

Занятость: full time

Зп: от 300 000 net.

🔥 iFORA - интеллектуальная аналитическая система больших данных (собственная разработка ИСИЭЗ НИУ ВШЭ). Система позволяет анализировать более 850 млн документов из уникальной коллекции (научные статьи, патенты, медиа и др.) для поддержки принятия стратегических решений.

Мы приглашаем в нашу команду опытного Data Scientist для работы над проектом по созданию платформы анализа данных с уклоном в исследования с области больших языковых моделей.

Стек: Python; Jupyter, VSCode; numpy, PyTorch; Transformers, TRL, Axolotl, Langhcain/LangGraph; s3, MLFlow

📌 Задачи:

▪️Исследование способности агентов к рассуждению и планированию (Reasoning, CoT)

▪️Полный цикл обучения до вывода модели в продакшн (Domain Adaptation и дообучение LLM с использованием внутренних и синтетических данных, создание функций оценки ответов)

▪️Разработка методов эффективного обучения и инференса

▪️Улучшение Deep Research продукта

▪️Разработка стратегий построения и обновления knowledge graph для RAG-системы

▪️NLP-задачи: Preprocessing, Classification, Summarization, NER, Semantic Search, Clustering и др

📌 Требования:

▪️Опыт работы в области ML/DS 3+ лет

▪️Высшее образование, степень: специалист / магистр / доктор наук / кандидат / PhD в области математики и компьютерных наук

▪️Коммерческий опыт тренировки и масштабирования LLM моделей: pre-train, fine-tune, Multi-GPU Training и оптимизация гиперпараметров

▪️Разбираетесь в RL (RLHF, RLVR), знание алгоритмов и методов preference-based optimization (PPO, DPO, GRPO)

▪️Глубокое знание современных DL/LLM-архитектур

▪️Опыт prompt engineering и chain-of-thought reasoning для LLM

▪️Опыт работы с Pytorch, ONNX, Nvidia TensorRT, CUDA, Docker

▪️Знание методов оптимизации и ускорения инференса нейронных сетей

▪️Умеете превращать научные статьи в код: реализовывали SOTA-методы и алгоритмы

▪️Способность вести учет экспериментов (файлы с метриками, s3, MLFlow, W&B)

▪️Знание средств командной разработки - Chat, Kanban, Wiki, Mail

▪️Базовые знания Linux, Git, Bash и Docker

📌 Будет плюсом:

▪️Наличие научных публикаций

▪️Опыт разработки ИИ-агентов (ReAct, Multi-Agent)

▪️Опыт в LangChain, LangGraph для построения multi-agent систем (MAS) RAG-систем или AI-агентов

📌 Условия:

▪️Интересная работа и масштабный проект

▪️Кластер с GPU A40, A100, H200 для прототипирования

▪️Доступ к суперкомпьютеру НИУ ВШЭ «cHARISMa»

▪️Обучение (семинары, курсы, тренинги от НИУ ВШЭ, английский)

▪️График работы: гибрид (возможна удалёнка), гибкое время начало дня с 8.00 до 11.00

▪️Программы лояльности от крупнейших фитнес-клубов и театров Москвы

▪️ДМС

▪️Доступ к регулярно обновляющейся библиотеке НИУ ВШЭ, а также электронным и аудиокнигам издательства «МИФ»

▪️Офис в шаговой доступности от лучших кофеен и книжных Москвы на Мясницкой (м. Лубянка / м. Тургеневская), скидки в «Даблби», «Ska vi fi ka?» и «Буквышка» при предъявлении пропуска НИУ ВШЭ

✅ Контакт для связи: anna_hr_hse

Вакансия: Senior Data Scientist (LLM R&D)

Report Page