Инженер группы мониторинга в Wildberries Банк (международное направление)
Эксплуатация и развитие системы мониторинга инфраструктуры и приложений;
Настройка и поддержка алертинга с учетом критичности бизнес-сервисов;
Оперативная реакция на инциденты в рамках дежурств 24/7;
Диагностика и локализация причин сбоев;
Участие в разборе инцидентов (RCA, post-mortem);
Снижение количества ложных срабатываний (alert fatigue);
Поддержка и актуализация технической документации и runbook’ов;
Взаимодействие со смежными подразделениями при устранении инцидентов.
Linux: понимание работы процессов, памяти, дисковой подсистемы и сетевого стека. Навыки диагностики с использованием стандартных инструментов (top/htop, iostat, vmstat, lsof, tcpdump, ss и др.);
Системы мониторинга, логирования, трассировки;
Практический опыт работы с одним или несколькими инструментами мониторинга:Prometheus + Grafana, VictoriaMetrics, Zabbix;
Kubernetes: понимание архитектуры K8s (Control Plane, Worker Nodes). Умение работать с основными объектами: Pod, Deployment, Service, Ingress, ConfigMap, Secret. Опыт работы с `kubectl` для диагностики (logs, describe, exec, get events). Понимание специфики мониторинга контейнеризированных сред (cAdvisor metrics, kube-state-metrics).
Обучение и развитие: языковые клубы, собственный корпоративный университет, программы развития управленческих навыков и многое другое;
Благополучие сотрудников: корпоративный пакет ДМС со стоматологией, корпоративный спорт, консультации психолога и дополнительные возможности аккредитованной IT-компании;
Множество сообществ: клуб спикеров, футбола, йоги, шахмат и т.д.;
Забота о семьях: создаем условия, в которых легко сочетать карьеру и заботу о близких – от гибкого подхода до масштабных проектов для детей сотрудников;
Скидки и партнерские программы: на обучение, страхование, покупки и многое другое;
Комфортная рабочая среда: бесплатное питание в офисе, современные офисы рядом с метро, корпоративная техника и портал для сотрудников.