Вакансия: Senior ML/LLM Engineer

Вакансия: Senior ML/LLM Engineer


iFORA — интеллектуальная система анализа больших данных (разработка Института статистических исследований и экономики знаний НИУ ВШЭ).

Платформа анализирует 850+ млн документов (научные статьи, патенты, аналитические материалы, медиа) и используется для поддержки стратегических решений в науке, технологиях и экономике.

Мы развиваем новое направление — LLM-системы для deep research и аналитики, включая multi-agent архитектуры, RAG-системы и knowledge graphs.

Ищем Senior ML / LLM Engineer, который поможет проектировать и развивать интеллектуальные системы анализа знаний.

Чем предстоит заниматься:

  • Разработка multi-agent систем (MAS) для Deep Research задач
  • Создание LLM-агентов с использованием tool calling, planning и reasoning
  • Проектирование и развитие RAG-архитектуры включая поверх коллекции из 850+ млн документов
  • Разработка и поддержка knowledge graph для аналитических и исследовательских сценариев
  • Оптимизация LLM inference (latency, throughput, batching, KV cache)
  • Подготовка и оптимизация моделей для production
  • Разработка воспроизводимых ML pipelines и инфраструктуры экспериментов
  • Внедрение и эксплуатация AI / ML сервисов в production

Стек: Python, PyTorch, Transformers; LangChain / LangGraph; vLLM, sglang, Triton Inference Server; MLFlow; S3-совместимые хранилища; Docker, Jupyter, VSCode

Что мы ожидаем:

  • 3+ лет опыта в Machine Learning / AI
  • знание паттерной архитектуры и системного дизайна
  • уверенное владение Python
  • опыт разработки систем на базе LLM
  • опыт построения RAG систем или AI-агентов
  • опыт вывода ML/AI сервисов в production
  • понимание архитектуры ML pipelines и инженерного подхода

Будет плюсом:

  • опыт работы с LangChain / LangGraph
  • опыт разработки multi-agent систем
  • опыт реализации GraphRAG, AgenticRAG, Colbert
  • опыт оптимизации inference (vLLM, Triton, TensorRT, ONNX)
  • опыт обучения или fine-tuning моделей (LoRA, multi-GPU training)
  • опыт работы с knowledge graphs или графовыми БД (Neo4j, ArangoDB, Neptune)
  • опыт работы с ML experiment tracking (MLFlow, W&B, DVC)
  • опыт работы с s3 хранилищами
  • опыт работы с мультимодальными моделями

Что мы предлагаем:

  • доступ к мощной вычислительной инфраструктуре: GPU A40, A100, H200; кластер для ML-разработки; суперкомпьютер НИУ ВШЭ cHARISMa
  • участие в развитии одной из крупнейших аналитических платформ научных данных
  • работа с современными LLM и AI-архитектурами
  • сильная исследовательская и инженерная команда
  • гибкий график (начало рабочего дня с 8:00 до 11:00), гибридный формат работы (возможна удалёнка)
  • обучение и курсы НИУ ВШЭ, английский язык
  • доступ к библиотеке НИУ ВШЭ и образовательным ресурсам
  • программы лояльности фитнес-клубов и театров
  • офис на Мясницкой (м. Лубянка / м. Тургеневская)


✅ Контакт для связи: @anna_hr_hse

Report Page