DevOps-инженер в дисковые сервисы Яндекс 360
Яндекс 360 — это Диск, Почта, Документы, Календарь, Телемост, Заметки и другие сервисы. Мы ищем инженера, который поможет нам поддерживать инфраструктуру Яндекс 360 и развивать сервисы. Ждём разработчиков, разбирающихся в администрировании, или администраторов, умеющих программировать.Проектирование и оптимизация архитектуры
Вы будете выстраивать и оптимизировать архитектуру сервисов, обеспечивая их масштабируемость и отказоустойчивость. Автоматизация инфраструктуры
В числе ваших задач — автоматизировать развёртывание, конфигурирование и обслуживание инфраструктуры, поддерживать практики IaC с использованием Terraform. Мониторинг, логирование и реагирование на инциденты
Потребуется настраивать системы мониторинга, чтобы отслеживать ключевые метрики доступности и производительности сервисов. Вы будете оперативно диагностировать и устранять инциденты, минимизируя время простоя сервисов, а также отслеживать показатели SLA/SLI/SLO. Внедрение и поддержка CI/CD и GitOps
Нужно налаживать и поддерживать процессы CI/CD. Ваша цель — обеспечить воспроизводимость сборок и стабильность процессов развёртывания, а также автоматизировать тестирование и проверку безопасности перед выпуском новых версий. Работа с инфраструктурой и облачными сервисами
В ваши обязанности входит администрирование баз данных, очередей и другой инфраструктуры. Вы будете управлять облачными ресурсами: создавать виртуальные машины, настраивать сети и балансировщики нагрузки, обеспечивать высокую доступность сервисов. Также вы станете следить за безопасностью инфраструктуры: управлять доступом, настраивать сетевые политики и своевременно обновлять компоненты. Больше о разработке в Яндексе — в канале Yandex for Developers* Глубоко знаете Linux, умеете работать в командной строке, знаете Bash * Работали на практике с контейнеризацией и оркестрацией (Docker, Kubernetes), отлично разбираетесь в них * Автоматизировали инфраструктуру через IaC, знаете Terraform * Настраивали и поддерживали системы мониторинга для Kubernetes (например, Prometheus или VictoriaMetrics, Grafana, Alertmanager) * Умеете организовать сбор и анализ логов (Vector, Fluent Bit, Loki, стек ELK) * Работали с CI/CD-платформами (например, GitLab CI, GitHub Actions, Azure DevOps и т. п.) * Администрировали PostgreSQL * Умеете разрабатывать инструменты автоматизации на Python * Работали хотя бы с одним крупным облачным провайдером (Yandex Cloud, AWS, Azure, Google)* Работали с GitOps-инструментами (ArgoCD, Flux CD) * Знакомы с Kafka * Имели дело с ClickHouse
Вы будете выстраивать и оптимизировать архитектуру сервисов, обеспечивая их масштабируемость и отказоустойчивость. Автоматизация инфраструктуры
В числе ваших задач — автоматизировать развёртывание, конфигурирование и обслуживание инфраструктуры, поддерживать практики IaC с использованием Terraform. Мониторинг, логирование и реагирование на инциденты
Потребуется настраивать системы мониторинга, чтобы отслеживать ключевые метрики доступности и производительности сервисов. Вы будете оперативно диагностировать и устранять инциденты, минимизируя время простоя сервисов, а также отслеживать показатели SLA/SLI/SLO. Внедрение и поддержка CI/CD и GitOps
Нужно налаживать и поддерживать процессы CI/CD. Ваша цель — обеспечить воспроизводимость сборок и стабильность процессов развёртывания, а также автоматизировать тестирование и проверку безопасности перед выпуском новых версий. Работа с инфраструктурой и облачными сервисами
В ваши обязанности входит администрирование баз данных, очередей и другой инфраструктуры. Вы будете управлять облачными ресурсами: создавать виртуальные машины, настраивать сети и балансировщики нагрузки, обеспечивать высокую доступность сервисов. Также вы станете следить за безопасностью инфраструктуры: управлять доступом, настраивать сетевые политики и своевременно обновлять компоненты. Больше о разработке в Яндексе — в канале Yandex for Developers* Глубоко знаете Linux, умеете работать в командной строке, знаете Bash * Работали на практике с контейнеризацией и оркестрацией (Docker, Kubernetes), отлично разбираетесь в них * Автоматизировали инфраструктуру через IaC, знаете Terraform * Настраивали и поддерживали системы мониторинга для Kubernetes (например, Prometheus или VictoriaMetrics, Grafana, Alertmanager) * Умеете организовать сбор и анализ логов (Vector, Fluent Bit, Loki, стек ELK) * Работали с CI/CD-платформами (например, GitLab CI, GitHub Actions, Azure DevOps и т. п.) * Администрировали PostgreSQL * Умеете разрабатывать инструменты автоматизации на Python * Работали хотя бы с одним крупным облачным провайдером (Yandex Cloud, AWS, Azure, Google)* Работали с GitOps-инструментами (ArgoCD, Flux CD) * Знакомы с Kafka * Имели дело с ClickHouse