Старший инженер по мониторингу (SRE)

Чем предстоит заниматься

  • Обеспечением непрерывного мониторинга состояния инфраструктуры, платформы и бизнес-приложений.
  • Настройкой, оптимизацией и поддержкой системы алертинга для оперативного реагирования на инциденты.
  • Конфигурацией, развертыванием и оптимизацией агентов и экспортеров для сбора метрик.
  • Полным циклом работы с инцидентами: диагностика, проведение постмортем-анализов (post-mortem) и разработка сценариев автоматического исправления.
  • Совершенствованием интеграции платформы мониторинга с информационными системами.
  • Участием в разработке метрик качества сервисов (SLI) и определении целевых уровней обслуживания (SLO).
  • Разработкой и поддержанием актуальной технической документации: архитектурные схемы мониторинга, runbooks, процедуры реагирования.
  • Внедрением и развитием лучших практик в области мониторинга, наблюдаемости и надежности сервисов.

Что мы ожидаем

  • Опыт от 3 лет на позиции инженера мониторинга или SRE с выстраиванием систем мониторинга с нуля.
  • Глубокое понимание устройства и практического применения современных стеков мониторинга: Prometheus (включая VictoriaMetrics и Alertmanager), Grafana, знание Zabbix будет преимуществом.
  • Практический опыт построения и настройки масштабируемых, отказоустойчивых или геораспределенных (мультисайтовых) систем мониторинга.
  • Опыт тонкой настройки и масштабирования VictoriaMetrics: работа с кастомными экспортерами, relabeling, remote write/read.
  • Продвинутое владение Grafana: создание комплексных дашбордов с использованием переменных (templating), организация панелей, настройка визуализаций и плагинов.
  • Понимание принципов микросервисной архитектуры, контейнеризации и практический опыт работы с Kubernetes и Helm.
  • Умение настраивать мониторинг для всех компонентов K8s: поды, ноды, сервисы (сервис-дискавери), работа с kube-state-metrics и cAdvisor.
  • Опыт интеграции систем мониторинга с внешними платформами управления инцидентами и оповещения посредством API.

Мы предлагаем

  • Работу в аккредитованной ИТ-компании.
  • Шаг в космос - для тех, кто вдохновлен идеей покорения космоса и мечтает быть к этому причастным.
  • Комфортный офис на метро "Мневники" с гибридным форматом работы.
  • Оформление в соответствии с ТК РФ.
  • Конкурентный уровень заработной платы - на уровне лидеров ИТ/телеком-индустрии.

Similar jobs