SRE (Рекламная платформа)

ИТ B2C — самая крупная экосистема в Сбере. Нас более 8000 человек в 18 городах России. Мы занимаемся разработкой и развитием розничных решений, помогая сделать сервисы Банка доступнее, безопаснее и удобнее. SberAds — единая рекламная платформа экосистемы Сбера. Мы предоставляем бизнесу и агентствам технологичный инструмент для запуска эффективной рекламы на главных цифровых площадках страны. В основе платформы лежит искусственный интеллект: система сама выбирает оптимальную площадку для показа, работает с 250+ уникальными сегментами аудитории и использует нейросети для генерации креативов. Мы создаем продукт, который принимает решения в реальном времени и обеспечивает точность для тысяч рекламодателей. Мы ищем Senior SRE, который станет связующим звеном между инфраструктурой и командами разработки. Под капотом SberAds — высоконагруженный AdTech-движок, требующий безупречной надежности. Вы будете отвечать за надежность и автоматизацию сервисов, обслуживающих миллионы RPS. Важный вектор развития — внедрение ИИ в процессы самой команды SRE для делегирования рутины AI-агентам. Наш стек: * Облако: SberCloud (CCE, ECS, VPC, NAT Gateway и др.). * Оркестрация: Kubernetes (CCE), Helm. * Базы данных: PostgreSQL, MySQL, MongoDB, Redis, Tarantool, ClickHouse. * Брокер сообщений: Kafka. * Observability: VictoriaMetrics, Grafana, ELK-стек, Elastic APM, Sentry. * Языки прикладного стека: C++, Go. * Конфиги и Безопасность: HashiCorp Vault, Consul (KV), Keycloak (IAM). * IaC & CI/CD: Terraform, Ansible, GitLab CI. * Прочее: VPN, Mattermost.* управление инфраструктурой в SberCloud. Администрирование и масштабирование кластеров CCE (Cloud Container Engine), настройка инфраструктурных объектов (Ingress, StorageClasses, Сеть) * построение сквозной наблюдаемости, развитие инфраструктуры мониторинга (VictoriaMetrics, Grafana), логирования (ELK), распределенного трейсинга и прикладного APM (Elastic APM), а также интеграция Sentry * взаимодействие с командами C++/Go, помощь в расследовании инцидентов, анализ проблем производительности на стыке кода и инфраструктуры * взаимодействие с выделенной командой DBA по вопросам инфраструктуры баз данных. Понимание влияния работы СУБД на общую надежность сервисов и SLO * эксплуатация кластера Kafka. Обеспечение отказоустойчивости и пропускной способности потоков данных * управление распределенными конфигурациями через Consul и секретами через HashiCorp Vault * внедрение искусственного интеллекта в инженерную культуру. Делегирование стандартных операционных задач (создание ранбуков, первичный анализ логов, генерация IaC-кода) ИИ-агентам * настройка инфраструктуры как кода (IaC). Capacity management — прогнозирование и управление ресурсами кластеров K8s и облачных сервисов * поддержка инфраструктуры VPN для удаленных сотрудников, платформы Mattermost и управление матрицей доступов (в т.ч. агентских кабинетов) через Keycloak.* высшее образование * опыт работы на позиции Senior SRE / DevOps от 5 лет * глубокое понимание архитектуры Kubernetes и опыт работы с облачными кластерами (CCE, EKS, GKE или аналогами) * практический опыт работы с Kafka * уверенные знания HashiCorp Vault и Consul * понимание принципов построения Observability-систем и опыт работы с Elastic APM / ELK / VictoriaMetrics * опыт работы с IaC (Terraform) и написания скриптов на Python/Go/Bash для автоматизации * понимание сетевого стека (VPC, DNS, балансировка), работы ОС Linux. * открытость и стремление использовать AI-агентов и LLM в ежедневной работе SRE-команды для делегирования рутины, ускорения расследований и автоматизации * умение выстраивать процессы взаимодействия между смежными командами (DevOps, DBA, Sec) * умение общаться с разработчиками, переводить бизнес-требования в инфраструктурные решения. Будет плюсом: * навыки работы с генеративными AI-моделями * опыт создания AI-агентов и использования их в работе будет преимуществом -опыт использования GigaChat, Kandinsky и аналогов в продуктах, навыки создания и использования AI-агентов * инструментальное владение AI для анализа, генерации и автоматизации * опыт работы с инфраструктурой SberCloud / Huawei Cloud. * опыт разработки или глубокого профилирования приложений на C++ или Go (понимание специфики работы с памятью, core dumps). * практический опыт интеграции ИИ-инструментов (LLM, AI-агентов) в процессы CI/CD, мониторинга или автоматического резольвинга инцидентов. * опыт интеграции Vault с облачными KMS (у нас этот процесс впереди, будем рады экспертизе).* офис рядом с метро Маяковская * гибридный формат работы * годовой бонус и ежегодный пересмотр * расширенный ДМС с первого дня + стоматология и льготное страхование для семьи * корпоративный университет Сбера, внутренняя образовательная платформа, участие в IT-конференциях * 90 дней удаленной работы из любого региона РФ * льготная ипотека в Сбере, корпоративная пенсионная программа, подписка СберПрайм+, скидки от партнеров и сервисов группы компаний.

Similar jobs