Analista CloudOps Júnior
Analista CloudOps Júnior
Sua missão
Como Analista de Infraestrutura CloudOps Júnior, você será responsável por apoiar a sustentação e evolução de ambientes em nuvem de alta disponibilidade. Sua missão envolve auxiliar na redução do esforço operacional através de automações básicas, monitorar a resiliência do ambiente e aprender a aplicar conceitos de Inteligência Artificial no dia a dia da operação, sempre com o suporte do time técnico.
Quais serão suas responsabilidades:
1. Operação e Suporte à Implementação:
-
Auxiliar na operação e deploy de ambientes em nuvem Multicloud (foco inicial em GCP ou AWS).
-
Apoiar a administração e monitoramento de clusters Kubernetes (principalmente GKE), acompanhando a escalabilidade e consumo de recursos.
-
Executar e validar rotinas de backups regulares e garantir a integridade dos dados para recuperação.
-
Executar tarefas de manutenção preventiva sob orientação.
-
Coletar dados de capacidade para apoiar o planejamento de recursos do time.
2. Observabilidade e Fundamentos de SRE:
-
Apoiar o time na aplicação de práticas de Site Reliability Engineering (SRE), acompanhando métricas de SLO, SLA e SLIs.
-
Monitorar a observabilidade do ambiente através de logs, métricas e tracing, reportando anomalias.
-
Triar problemas de desempenho iniciais e escalar para os níveis superiores quando necessário.
-
Seguir runbooks para aplicar soluções conhecidas e evitar interrupções de serviço.
3. Automação e Introdução a AIOps:
-
Executar, manter e sugerir melhorias em automações operacionais existentes (runbooks e scripts).
-
Aprender e interagir com ferramentas de IA/ML utilizadas para detecção de anomalias e redução de ruído de alertas (AIOps).
4. Operações de Incidentes e Segurança:
-
Atuar em regime de sobreaviso/escala para resposta a incidentes, com o apoio de analistas mais experientes.
-
Participar da análise de causa raiz (Post-mortem) para entender falhas e aprender medidas preventivas.
-
Aplicar patches e medidas de segurança básicas sob supervisão.
-
Apoiar na resposta a incidentes de segurança seguindo os protocolos estabelecidos.
5. Colaboração e Aprendizado:
-
Colaborar no dia a dia com times de DevOps, Segurança e Banco de Dados.
-
Desenvolver visão técnica fundamentada em custo, risco e performance.
-
Apoiar em deploys de aplicações e atualizações de infraestrutura.
-
Garantir uma comunicação clara e transparente com o time sobre o status das atividades.
O que você precisa ter:
-
Experiência em Cloud: Conhecimentos teóricos ou práticos iniciais em GCP ou AWS.
-
Orquestração: Entendimento conceitual de Kubernetes/Containers (diferencial se já tiver interagido com GKE).
-
Automação: Noções de lógica de programação e conhecimento básico em scripting (Bash, Python ou PowerShell).
-
Infraestrutura como Código: Conhecimento teórico ou pequenas práticas com Terraform, Ansible ou esteiras de CI/CD.
-
Monitoramento: Noções de ferramentas de observabilidade (ex: Prometheus, Grafana, ELK ou Zabbix).
-
Gestão de Incidentes: Capacidade analítica para troubleshooting básico, boa comunicação para reportar problemas e resiliência para atuar em momentos de crise com apoio do time.
O que seria muito legal que você soubesse:
-
Ter operado de forma básica ambientes GCP ou AWS.
-
Conhecimento em Cloud adicionais (Huawei Cloud ou Azure).
-
Noções de FinOps (conceito de custos em nuvem).
-
Projetos pessoais, acadêmicos ou laboratoriais (homelab) utilizando as tecnologias da vaga.
-
Certificações de nível Foundational/Associate (ex: AWS Cloud Practitioner, Google Digital Leader ou Associate Cloud Engineer).
O que te tornaria um especialista para essa vaga:
-
Arquitetura de Sistemas:
Capacidade para projetar e implementar arquiteturas de sistemas complexas.
Experiência em tomar decisões de design para otimizar desempenho e escalabilidade.
-
Governança em Nuvem:
Experiência em estabelecer e manter práticas de governança em ambientes de nuvem.
Conhecimento profundo das políticas de conformidade e regulamentações relevantes.
-
Segurança Avançada:
Especialização em práticas avançadas de segurança, incluindo detecção e resposta a incidentes.
Implementação de soluções de segurança em vários níveis.
-
Automação e Orquestração Avançada:
Desenvolvimento de frameworks de automação personalizados.
Orquestração eficiente de sistemas distribuídos e complexos.
-
Gerenciamento de Performance:
Otimização avançada de desempenho em todos os níveis da infraestrutura.
Análise preditiva para identificar e resolver problemas antes que ocorram.
-
Inovação Tecnológica:
Avaliação constante de novas tecnologias e sua aplicabilidade.
Contribuições para a inovação e melhoria contínua dos processos.
-
Gestão de Mudanças Estratégicas:
Liderança em iniciativas de transformação digital.
Definição e implementação de estratégias de mudança eficazes.
-
Pesquisa e Desenvolvimento:
Participação ativa em projetos de pesquisa e desenvolvimento.
Colaboração com equipes de P&D para impulsionar a inovação.
-
Resolução de Problemas Excepcionais:
Solução eficaz de problemas altamente complexos.
Tomada de decisões rápidas em situações críticas.
Perfil comportamental esperado:
-
Mentalidade de dono: Assumir a responsabilidade pelos problemas até sua resolução final.
-
Visão de Causa Raiz: Foco em solucionar a origem dos problemas, evitando soluções paliativas.
-
Inconformismo: Busca constante pela automação de processos manuais e repetitivos.
-
Comunicação: Capacidade de transmitir informações de forma clara e organizada, especialmente em cenários complexos.
O que oferecemos:
🍽️ VR e VA
🩺 Assistência médica
🦷 Assistência odontológica
🤑 Bônus variável anual
👶 Auxílio creche
💻 Auxílio home office
🏋️ Wellhub + App Ginastica Laboral
✨ Seguro de vida
🎂 Day Off no mês de Aniversário
🚘 Vale Transporte ou Estacionamento
💉 Campanha de Vacinação
🧠TelePsicologia e Nutrição Online
💆Massagem no escritório para modelo híbrido
😎 Emendas de Feriado
📱Acesso aos nosso produtos
🍫Bateu aquela fome? Temos snacks no escritório