Cientista de Dados Sênior

A Leega é uma empresa focada no atendimento eficiente e inovador em seus clientes. Isso não poderia ser diferente com o nosso principal combustível: as pessoas! Nossa cultura é inspiradora e nossos valores estão presentes no dia a dia: ética e transparência, excelência de qualidade, trabalho em equipe, responsabilidade econômica, social e ambiental, relações humanas e credibilidade.Buscamos profissionais inovadores que sejam movidos por desafios e focados em resultados.Se você busca uma empresa dinâmica e parceira e que investe em seus colaboradores através de capacitação constante, a Leega é o lugar para você!>> A LEEGA É PARA TODOS, ficaremos muito felizes em ter você em nosso time. Venha fazer parte da nossa história e da construção do nosso futuro. Cadastre-se agora mesmo em nossas vagas!Responsabilidades e atribuiçõesSobre a oportunidadeVocê vai transformar dados de demanda, ocupação e comportamento de compra em modelos que precificam uma malha com milhares de pares origem-destino e rotas multi trecho — um problema de revenue management cientificamente rico, com inventário perecível de assentos, sazonalidade forte, no-show e tetos regulatórios. É um papel centrado na descoberta: formular hipóteses, validá-las com rigor estatístico e mover receita e margem na escala de milhões de viagens por ano. Seus Desafios • Investigação e EDA — conduzir análise exploratória e estatística para descobrir padrões, levantar hipóteses e guiar a modelagem. • Previsão de demanda — modelar demanda e no-show por par origem-destino com gradient boosting e séries temporais, corrigindo o viés de demanda censurada (unconstrained demand). • Elasticidade e disposição a pagar — estimar elasticidade-preço e willingness-to-pay por segmento e rota, base para a otimização de preço. • Revenue management em rede — modelar proteção de assentos e alocação de capacidade (fare buckets) em rotas multi-trecho, equilibrando ocupação e receita. • Experimentação causal — desenhar testes A/B e inferência causal que validam mudanças de preço e medem uplift real, com critérios estatísticos claros de promoção. • Explicabilidade e confiança — garantir interpretabilidade (ex.: SHAP) para defender cada preço perante o negócio e o regulador. • Cold start e calibração — desenhar estratégias para rotas com pouco histórico, partindo de priors de literatura e evoluindo para ML, por tenant. Você é a ponte entre ciência e produto: colabora com ML engineers no caminho até produção, com data engineers na disponibilidade dos dados, e com as áreas comercial e de operações na definição das metas. Requisitos e qualificaçõesStack & Ferramentas Linguagem & libs: Python (pandas, NumPy, scikit-learn, statsmodels), XGBoost, LightGBM Estatística & ML clássico: EDA, modelos estatísticos, regressão, classificação, clustering Deep learning: PyTorch, TensorFlow Causal & temporal: séries temporais/forecasting, inferência causal (ex.: EconML, DoWhy), bayesiano/hierárquico Revenue management & otimização: elasticidade, fare buckets / seat protection, programação linear Experimentação, MLOps & dados: A/B testing, JupyterHub, MLflow, Ray Tune; SHAP, SQL, Cube.js sobre Athena O que Buscamos Essenciais • Formação quantitativa sólida (Estatística, Economia, Matemática, Engenharia, CC ou afim) e base robusta em probabilidade, inferência e desenho experimental. • Análise exploratória de dados (EDA) e forte capacidade de storytelling e visualização.• ML clássico (regressão, classificação, clustering) e séries temporais; familiaridade com deep learning (PyTorch ou TensorFlow). • Python e o ecossistema de Data Science (pandas, scikit-learn, statsmodels); SQL para dados em larga escala. • Inferência causal e/ou testes A/B e medição de impacto. • Comunicação científica clara e conforto com desenvolvimento assistido por IA (Claude Code). Diferenciais • Revenue management ou pricing em transporte, aviação ou hotelaria (domínios canônicos de RM). • Pesquisa operacional e otimização (programação linear; Gurobi, HiGHS ou OR-Tools). • Deep learning aplicado (PyTorch, TensorFlow) — ex.: demanda com embeddings ou modelos sequenciais. • ML causal (EconML, DoWhy) e modelagem bayesiana/hierárquica (PyMC, Stan). • Reinforcement Learning (em especial RL offline) e ecossistema Ray. • Pós-graduação (Mestrado/Doutorado) e experiência com LLMs/RAG. Informações adicionaisTrabalho RemotoTempo de Projeto: 6 meses, com possibilidade de extensão/internalização.

Similar jobs