Вакансия: Senior ML/LLM Engineer
iFORA — интеллектуальная система анализа больших данных (разработка Института статистических исследований и экономики знаний НИУ ВШЭ).
Платформа анализирует 850+ млн документов (научные статьи, патенты, аналитические материалы, медиа) и используется для поддержки стратегических решений в науке, технологиях и экономике.
Мы развиваем новое направление — LLM-системы для deep research и аналитики, включая multi-agent архитектуры, RAG-системы и knowledge graphs.
Ищем Senior ML / LLM Engineer, который поможет проектировать и развивать интеллектуальные системы анализа знаний.
Чем предстоит заниматься:
- Разработка multi-agent систем (MAS) для Deep Research задач
- Создание LLM-агентов с использованием tool calling, planning и reasoning
- Проектирование и развитие RAG-архитектуры включая поверх коллекции из 850+ млн документов
- Разработка и поддержка knowledge graph для аналитических и исследовательских сценариев
- Оптимизация LLM inference (latency, throughput, batching, KV cache)
- Подготовка и оптимизация моделей для production
- Разработка воспроизводимых ML pipelines и инфраструктуры экспериментов
- Внедрение и эксплуатация AI / ML сервисов в production
Стек: Python, PyTorch, Transformers; LangChain / LangGraph; vLLM, sglang, Triton Inference Server; MLFlow; S3-совместимые хранилища; Docker, Jupyter, VSCode
Что мы ожидаем:
- 3+ лет опыта в Machine Learning / AI
- знание паттерной архитектуры и системного дизайна
- уверенное владение Python
- опыт разработки систем на базе LLM
- опыт построения RAG систем или AI-агентов
- опыт вывода ML/AI сервисов в production
- понимание архитектуры ML pipelines и инженерного подхода
Будет плюсом:
- опыт работы с LangChain / LangGraph
- опыт разработки multi-agent систем
- опыт реализации GraphRAG, AgenticRAG, Colbert
- опыт оптимизации inference (vLLM, Triton, TensorRT, ONNX)
- опыт обучения или fine-tuning моделей (LoRA, multi-GPU training)
- опыт работы с knowledge graphs или графовыми БД (Neo4j, ArangoDB, Neptune)
- опыт работы с ML experiment tracking (MLFlow, W&B, DVC)
- опыт работы с s3 хранилищами
- опыт работы с мультимодальными моделями
Что мы предлагаем:
- доступ к мощной вычислительной инфраструктуре: GPU A40, A100, H200; кластер для ML-разработки; суперкомпьютер НИУ ВШЭ cHARISMa
- участие в развитии одной из крупнейших аналитических платформ научных данных
- работа с современными LLM и AI-архитектурами
- сильная исследовательская и инженерная команда
- гибкий график (начало рабочего дня с 8:00 до 11:00), гибридный формат работы (возможна удалёнка)
- обучение и курсы НИУ ВШЭ, английский язык
- доступ к библиотеке НИУ ВШЭ и образовательным ресурсам
- программы лояльности фитнес-клубов и театров
- офис на Мясницкой (м. Лубянка / м. Тургеневская)
✅ Контакт для связи: @anna_hr_hse