SRE (Рекламная платформа)
ИТ B2C — самая крупная экосистема в Сбере. Нас более 8000 человек в 18 городах России. Мы занимаемся разработкой и развитием розничных решений, помогая сделать сервисы Банка доступнее, безопаснее и удобнее.
SberAds — единая рекламная платформа экосистемы Сбера. Мы предоставляем бизнесу и агентствам технологичный инструмент для запуска эффективной рекламы на главных цифровых площадках страны.
В основе платформы лежит искусственный интеллект: система сама выбирает оптимальную площадку для показа, работает с 250+ уникальными сегментами аудитории и использует нейросети для генерации креативов. Мы создаем продукт, который принимает решения в реальном времени и обеспечивает точность для тысяч рекламодателей.
Мы ищем Senior SRE, который станет связующим звеном между инфраструктурой и командами разработки. Под капотом SberAds — высоконагруженный AdTech-движок, требующий безупречной надежности. Вы будете отвечать за надежность и автоматизацию сервисов, обслуживающих миллионы RPS. Важный вектор развития — внедрение ИИ в процессы самой команды SRE для делегирования рутины AI-агентам.
Наш стек:
* Облако: SberCloud (CCE, ECS, VPC, NAT Gateway и др.).
* Оркестрация: Kubernetes (CCE), Helm.
* Базы данных: PostgreSQL, MySQL, MongoDB, Redis, Tarantool, ClickHouse.
* Брокер сообщений: Kafka.
* Observability: VictoriaMetrics, Grafana, ELK-стек, Elastic APM, Sentry.
* Языки прикладного стека: C++, Go.
* Конфиги и Безопасность: HashiCorp Vault, Consul (KV), Keycloak (IAM).
* IaC & CI/CD: Terraform, Ansible, GitLab CI.
* Прочее: VPN, Mattermost.* управление инфраструктурой в SberCloud. Администрирование и масштабирование кластеров CCE (Cloud Container Engine), настройка инфраструктурных объектов (Ingress, StorageClasses, Сеть)
* построение сквозной наблюдаемости, развитие инфраструктуры мониторинга (VictoriaMetrics, Grafana), логирования (ELK), распределенного трейсинга и прикладного APM (Elastic APM), а также интеграция Sentry
* взаимодействие с командами C++/Go, помощь в расследовании инцидентов, анализ проблем производительности на стыке кода и инфраструктуры
* взаимодействие с выделенной командой DBA по вопросам инфраструктуры баз данных. Понимание влияния работы СУБД на общую надежность сервисов и SLO
* эксплуатация кластера Kafka. Обеспечение отказоустойчивости и пропускной способности потоков данных
* управление распределенными конфигурациями через Consul и секретами через HashiCorp Vault
* внедрение искусственного интеллекта в инженерную культуру. Делегирование стандартных операционных задач (создание ранбуков, первичный анализ логов, генерация IaC-кода) ИИ-агентам
* настройка инфраструктуры как кода (IaC). Capacity management — прогнозирование и управление ресурсами кластеров K8s и облачных сервисов
* поддержка инфраструктуры VPN для удаленных сотрудников, платформы Mattermost и управление матрицей доступов (в т.ч. агентских кабинетов) через Keycloak.* высшее образование
* опыт работы на позиции Senior SRE / DevOps от 5 лет
* глубокое понимание архитектуры Kubernetes и опыт работы с облачными кластерами (CCE, EKS, GKE или аналогами)
* практический опыт работы с Kafka
* уверенные знания HashiCorp Vault и Consul
* понимание принципов построения Observability-систем и опыт работы с Elastic APM / ELK / VictoriaMetrics
* опыт работы с IaC (Terraform) и написания скриптов на Python/Go/Bash для автоматизации
* понимание сетевого стека (VPC, DNS, балансировка), работы ОС Linux.
* открытость и стремление использовать AI-агентов и LLM в ежедневной работе SRE-команды для делегирования рутины, ускорения расследований и автоматизации
* умение выстраивать процессы взаимодействия между смежными командами (DevOps, DBA, Sec)
* умение общаться с разработчиками, переводить бизнес-требования в инфраструктурные решения.
Будет плюсом:
* навыки работы с генеративными AI-моделями
* опыт создания AI-агентов и использования их в работе будет преимуществом -опыт использования GigaChat, Kandinsky и аналогов в продуктах, навыки создания и использования AI-агентов
* инструментальное владение AI для анализа, генерации и автоматизации
* опыт работы с инфраструктурой SberCloud / Huawei Cloud.
* опыт разработки или глубокого профилирования приложений на C++ или Go (понимание специфики работы с памятью, core dumps).
* практический опыт интеграции ИИ-инструментов (LLM, AI-агентов) в процессы CI/CD, мониторинга или автоматического резольвинга инцидентов.
* опыт интеграции Vault с облачными KMS (у нас этот процесс впереди, будем рады экспертизе).* офис рядом с метро Маяковская
* гибридный формат работы
* годовой бонус и ежегодный пересмотр
* расширенный ДМС с первого дня + стоматология и льготное страхование для семьи
* корпоративный университет Сбера, внутренняя образовательная платформа, участие в IT-конференциях
* 90 дней удаленной работы из любого региона РФ
* льготная ипотека в Сбере, корпоративная пенсионная программа, подписка СберПрайм+, скидки от партнеров и сервисов группы компаний.