Engenheiro de Dados Sênior
Sobre a BRQ
A BRQ combina especialistas, ferramentas e inteligência artificial para entregar projetos e equipes de tecnologia alinhadas aos desafios reais dos clientes, com excelência técnica e uma relação próxima e responsável. Em outras palavras: a gente entra no contexto, faz as perguntas certas, monta a combinação ideal de pessoas e tecnologia e entrega com método, clareza e consistência.
Com mais de 33 anos de história e mais de 2.500 profissionais, a BRQ está entre as maiores empresas de tecnologia do Brasil, atuando em projetos de alta complexidade e escala. Somos reconhecidos como líderes em GenAI e Inovação para grandes empresas no estudo ISG Provider Lens™.
Nosso propósito é transformar problemas complexos em progresso, com engenharia precisa, todo potencial do humano + IA e atuação próxima em cada etapa.
Sobre a vaga
Você atuará na estruturação da fundação de dados da vertical de Dívida Ativa, com foco em arquitetura Lakehouse, governança e construção de pipelines para ingestão, canonização e disponibilização analítica. O objetivo é habilitar modelagem estatística, jurimetria e iniciativas de Pricing, garantindo uma transição fluida entre dados capturados por crawlers e camadas analíticas consumíveis por Cientistas de Dados.
Stack principal: Python, SQL, Databricks, PostgreSQL e NoSQL. Ambiente em AWS.
Responsabilidades
- Estruturar a fundação de dados de Dívida Ativa (governança, perfis de acesso, catalogação e controle de custos).
- Desenvolver e evoluir pipelines de ingestão e canonização, consolidando dados brutos em Databricks e PostgreSQL.
- Modelar e organizar dados para suportar teses de Pricing, atualização de CDAs, jurimetria e análises fundamentalistas.
- Garantir qualidade e fluidez na passagem do dado (crawlers → camada analítica) para consumo por Cientistas de Dados.
- Evoluir a arquitetura de Data Lake para uma abordagem Lakehouse robusta e escalável.
- Melhorar monitoramento, observabilidade e confiabilidade dos pipelines.
- Habilitar e fortalecer a camada Gold para consumo analítico.
Requisitos
- Experiência sólida com Databricks e modelagem relacional em PostgreSQL.
- Domínio de Python e SQL, com experiência em processamento distribuído e pipelines de dados.
- Experiência comprovada com Apache Spark.
- Vivência com arquiteturas de Data Lake e/ou Lakehouse.
- Experiência prática com AWS para plataformas de dados.
- Prática com governança de dados (catálogo, linhagem, acessos e custos).
- Capacidade de atuar de ponta a ponta: ingestão bruta, canonização e estruturação analítica.
- Autonomia, proatividade, senso de dono e boa leitura de negócio.
- Vivência com alto volume de dados e pipelines críticos.
- Disponibilidade em horário comercial no Brasil, com participação em cerimônias síncronas.
Diferenciais
- Experiência com bases/dados jurídicos e/ou esteiras de precificação de ativos/crédito.
- Conhecimento em Iceberg (ou tecnologias similares de Lakehouse).
- Experiência com Glue, EMR, Trino ou Athena, e/ou DuckDB.
- Experiência com orquestração e transformação (Airflow e/ou dbt).
- Experiência com APIs e modelagem (FastAPI, Pydantic).
- Vivência com observabilidade de pipelines e ecossistemas com múltiplas fontes/ETLs complexos.
- Capacidade de atuar como referência técnica para o time.
Cultura na BRQ
Chamamos de BRQ Way o nosso jeito de cuidar das pessoas, com iniciativas de carreira e desenvolvimento, saúde e bem-estar, e comunicação e conexão. Trabalhamos com flexibilidade de acordo com o contexto do projeto (anywhere office, híbrido ou presencial) e investimos em desenvolvimento contínuo com BRQ Academy, mentoria, incentivo a certificações e programas de idiomas, entre outras frentes.
Diversidade, inclusão e liberdade fazem parte do nosso dia a dia. Temos três grupos de afinidade, chamados de Roars, para comunidade LGBTQIA+, pessoas pretas e mulheres, que criam espaços de troca e ações internas para fortalecer representatividade e pertencimento. Saiba mais sobre carreiras na BRQ: https://www.brq.com/carreiras/
Código da vaga: f74290
- #LI-Remote
- #LI-CL1