SRE
Remote | 290 - 400 т.р.
Позиция: SRE, lead в инвестиционной компании
Формат: удаленно, работа по времени Еревана (+1 час к МСК)
Вилка: от 290к до 400к до вычета по ИП
Контакт для связи: @Masha_UIT
Задачи:
- Лидирование поддержки и эксплуатации (L1–L3), инцидент‑менеджмент, коммуникация со стейкхолдерами.
- Настройка и развитие мониторинга, алертинга, SLI/SLO, RCA и пост‑мортемов.
- Поддержка CI/CD и quality gates, релизы, откаты, контроль изменений.
- Управление средами dev/stage/prod, конфигурацией, секретами и доступами.
- Поддержка инфраструктуры в AWS, автоматизация рутинных операций.
- Развитие практик надежности (SRE), снижение MTTR и частоты инцидентов.
- Формирование команды дежурных, организация 24/7 on‑call и дежурств.
- Ведение/создание runbook’ов и эксплуатационной документации.
* Координация улучшений в части устойчивости AI‑компонент и критичных сервисов.
Требования (обязательные):
- Опыт в роли Technical Support Lead / DevOps / SRE от 3–5 лет, включая лидерские функции.
- Kubernetes (обязательно).
- Практики SRE: error budgets, chaos testing, capacity planning
- Опыт в финтех/брокерских системах.
- Опыт эксплуатации AI‑сервисов (модели/инференс, мониторинг качества, ресурсоёмкость). (на базовом уровне)
- AWS (обязательно): сетевые и вычислительные сервисы, IAM, ECR, мониторинг.
- CI/CD (Jenkins/GitHub Actions или аналогичные системы).
- Наблюдаемость: метрики, логи, трассировка, алерты (будет плюсом)
- Стек: AWS, Kubernetes, DockerKafka, Redis, Postgres, Python‑микросервисы CI/CD (Jenkins/GitHub Actions и др.)
- Опыт оптимизации затрат в AWS и работы с бюджетами.
- Английский язык от В2 будет плюсом (но команда русскоговорящая)
По всем вопросам обращайтесь к @Masha_UIT