Site Reliability Engineer (SRE)
Que tal impactar vidas fazendo parte de uma empresa que impulsiona soluções inovadoras e o avanço tecnológico no Brasil? 🌎Se você compartilha desse propósito, confira a nossa oportunidade e venha com a gente: #ComeWithUs #BeAttus! Mas antes de tudo, um ponto muito importante. Reconhecida pelo GPTW como uma das melhores empresas para se trabalhar, a Attus leva às Procuradorias de Estados e Municípios soluções inteligentes para a gestão de processos judiciais e consultivos.Sobre a vaga_ Somos uma empresa de tecnologia com a missão de revolucionar a advocacia pública com soluções inovadoras que otimizam processos e potencializam resultados, e a visão de ser a solução líder do setor. Buscamos um(a) Site Reliability Engineer (SRE) para garantir a confiabilidade, disponibilidade e performance dos nossos sistemas críticos.Procuramos um(a) profissional com autonomia para estabelecer e evoluir as práticas de confiabilidade da empresa — de observabilidade e SLOs à resposta a incidentes e automação — tratando a operação como engenharia. Mais do que reagir a problemas, esperamos alguém que defina padrões, antecipe falhas e reduza o trabalho manual com automação e Inteligência Artificial. Essa vaga é a sua cara?Responsabilidades e atribuiçõesNessa vaga, você irá... ➡ Definir e acompanhar indicadores de confiabilidade (SLI, SLO, SLA) e operar com base em Error Budget;➡ Estabelecer estratégias de alta disponibilidade, resiliência e disaster recovery (RTO/RPO);➡ Conduzir capacity planning e análise de performance dos serviços;➡ Atuar na confiabilidade e performance de aplicações em Kubernetes;➡ Estruturar e evoluir a observabilidade dos sistemas (logs, métricas, traces e alertas);➡ Criar dashboards e alertas com foco em visibilidade e ação, reduzindo ruído e falsos positivos;➡ Detectar problemas antes do cliente, instrumentando os serviços;➡ Estabelecer e conduzir o processo de resposta a incidentes (classificação, severidade, on-call);➡ Liderar ou apoiar troubleshooting de aplicações e ambientes distribuídos;➡ Conduzir análise de causa raiz (RCA) e post-mortems, propondo prevenção;➡ Desenvolver e manter runbooks operacionais;➡ Automatizar tarefas operacionais e respostas a incidentes (self-healing), eliminando trabalho manual repetitivo;➡ Utilizar IA para análise de logs, detecção de anomalias, troubleshooting e otimização (AIOps);➡ Buscar continuamente "automatizar antes de repetir", evoluindo a maturidade operacional;➡ Trabalhar junto a desenvolvimento e plataforma na melhoria contínua da confiabilidade;➡ Disseminar a cultura de confiabilidade e boas práticas entre as equipes;➡ Aplicar boas práticas de segurança em ambientes produtivos (segredos, acessos, segregação);➡ Garantir rastreabilidade (logs, auditoria e eventos);➡ Apoiar conformidade com padrões como ISO 27001 e práticas de DevSecOps;➡ Integrar confiabilidade e segurança (Security by Design).Faz sentido para você? Vamos ver o que não pode faltar para você vir para esse time! Requisitos e qualificaçõesOs requisitos técnicos e comportamentais para esta vaga são: Técnico_➡ Experiência ou conhecimento em observabilidade (Grafana, Prometheus, Elastic, Dynatrace ou similares)➡ Experiência ou conhecimento em Kubernetes e containers (Docker)➡ Conhecimento em Linux e redes (HTTP, DNS, TLS/SSL)➡ Conhecimento em scripts e automação (Shell, Python ou similares)➡ Capacidade analítica e foco em resolução de problemas➡ Uso de IA no dia a dia e mentalidade de automação ("automatizar antes de repetir")➡ Perfil organizado, autônomo e com boa comunicação técnica sólida como Desenvolvedor Full Stack em nível pleno/sênior, com projetos em produção; Comportamental_➡ Facilidade de aprendizado;➡ Busca do aprendizado constante;➡ Empatia com a lógica do cliente;➡ Foco na melhor experiência para o cliente;➡ Colaboração, saber oferecer e pedir ajuda;➡ Boa capacidade de comunicação para interagir com diferentes áreas;➡ Proatividade e organização;➡ Alinhamento com nossos valores: Honestidade e Ética, Excelência e Cuidado com as Entregas, Reconhecimento, Respeito e Educação. É um grande diferencial se você tem..➡ Experiência com SLI, SLO e Error Budget➡ Experiência com troubleshooting de sistemas distribuídos➡ Experiência com ambientes críticos e alta disponibilidade➡ Experiência com ferramentas APM (Dynatrace, Datadog)➡ Conhecimento em OpenTelemetry e instrumentação➡ Conhecimento em Kafka, Elasticsearch ou Redis➡ Experiência com automação de incidentes (self-healing) e IaC (Terraform, Ansible)➡ Conhecimento em Chaos Engineering e Service Mesh➡ Experiência com IA aplicada à operação (AIOps, copilots técnicos)➡ Vivência em ambientes regulados (governo, jurídico ou financeiro)Se identificou? Candidate-se para a oportunidade e venha potencializar você também! 🤩 Informações adicionaisPor último, mas não menos importante! Confira nossos, (seussss possíveis) benefícios... 🥁 🩺 Saúde e Bem-Estar🏆Plano de saúde: Cuidado completo com sua saúde.🏆Seguro de vida: Segurança e tranquilidade para você e sua família.🏆Parcerias com descontos: Acesso a farmácias, nutricionistas e psicólogos com condições especiais.🏆App de bem-estar (Clude): Incentivo à prática de atividades físicas e ao bem-estar.🏆Total Pass: Tenha acesso a uma ampla rede de academias mais próximas a você.🏆Ginástica Laboral: Pausas ativas para cuidar do corpo durante o trabalho.💰 Benefícios Financeiros e Auxílios🏆Vale-alimentação: Para a modalidade de contrato CLT.🏆Cartão Caju: Com presente especial no mês do seu aniversário.🏆Auxílio home office: Suporte para montar um ambiente de trabalho confortável e produtivo.🏆Auxílio-educação: Incentivo para seu desenvolvimento acadêmico e profissional.🏆Auxílio-leitura: Estímulo para você expandir seus conhecimentos.🚀 Desenvolvimento e Carreira🏆Desenvolvimento contínuo: Programas e ações para impulsionar sua carreira.🏆Programa de Inovação: Espaço para você trazer suas ideias e fazer a diferença.🏆Dual Screen: Ferramentas adequadas para uma melhor produtividade.🧘♀️ Flexibilidade e Qualidade de Vida🏆Vaga 100% remota: Trabalhe de onde você se sentir melhor.🏆FreeDay🏆Momento Off: Incentivamos pausas para desconexão e descanso.🏆Folga na sua formatura: Celebramos suas conquistas com você.🏆Presente para novos filhos dos colaboradores: Um mimo para celebrar a chegada do novo membro da família.🏆Presente de retorno da licença paternal: Um apoio na volta dessa fase importante.🌱 Cultura e Engajamento🏆Ambiente fraterno e colaborativo: Um time que se ajuda e cresce junto.🏆Kit de boas-vindas ecológico: Comece sua jornada conosco de forma sustentável.🏆Cultura sustentável: Com ações práticas como o incentivo à compostagem.🏆Lives Virtuais de Confraternização: Momentos para celebrar e conectar com a equipe.🏆Campanhas perenes: Ações de engajamento que acontecem o ano todo.