2026-008 Especialista I (Foco em Arquitetura de IA e LLMs)

Responsabilidades e atribuiçõesAtividades:• Arquitetura, implantação e otimização de modelos de IA, com foco em Machine Learning (ML) e Large Language Models (LLMs);• Desenvolvimento e ajuste fino (fine-tuning) de modelos de IA, utilizando técnicas avançadas de RAG (Retrieval-Augmented Generation), LoRA, quantização e distilação;• Integração de modelos de IA em pipelines produtivos, garantindo escalabilidade, segurança e eficiência computacional;• Monitoramento e manutenção de modelos em produção, aplicando MLOps para gestão do ciclo de vida dos modelos;• Colaboração com equipes de desenvolvimento backend, garantindo interoperabilidade entre os modelos de IA e os sistemas baseados em Java e arquiteturas orientadas a serviços;• Análise e engenharia de dados, garantindo a qualidade e a curadoria dos dados para o treinamento de modelos de IA.Requisitos e qualificaçõesRequisitos:· Mestrado concluído em Inteligência Artificial, Ciência da Computação, Engenharia de Dados ou áreas correlatas;· Inglês avançado, com capacidade de comunicação técnica e escrita científica;· Experiência (5+ anos) em Machine Learning e LLMs, incluindo arquitetura, tuning, implantação e otimização de modelos;· Domínio de frameworks e bibliotecas de IA, como TensorFlow, PyTorch, Hugging Face Transformers e LangChain;· Experiência com MLOps, utilizando Kubeflow, MLflow, Airflow ou Vertex AI para automação e monitoramento de modelos em produção;· Pipeline de dados para IA, incluindo engenharia de features, data augmentation e tratamento de dados desbalanceados;· Modelos generativos e NLP, com conhecimento aprofundado em Transformer-based architectures (GPT, BERT, T5, Llama, Mistral);· Experiência com técnicas de otimização de modelos, incluindo quantização, sparsity, LoRA e fine-tuning supervisionado;· Integração de modelos em APIs e serviços, utilizando FastAPI, Flask ou gRPC para servir modelos em produção;· Experiência com arquiteturas escaláveis para inferência de IA, incluindo implementação de modelos em GPU, multi-node e edge computing;· Versionamento e reprodutibilidade de experimentos, utilizando DVC, Weights & Biases ou MLflow;· Experiência com bancos de dados vetoriais, como FAISS, Pinecone, Weaviate ou Milvus, para implementação de RAG (Retrieval-Augmented Generation);· Domínio de infraestrutura de nuvem para IA, com experiência prática em AWS (SageMaker, Bedrock), GCP (Vertex AI) ou Azure ML.· Inglês intermediário/avançado.Diferenciais:· Publicações científicas ou participação em projetos de pesquisa em IA/ML;· Experiência com frameworks para redes neurais gráficas (GNNs);· Conhecimento em segurança de modelos de IA, incluindo adversarial attacks e privacidade diferencial;· Familiaridade com desenvolvimento de agentes autônomos baseados em LLMs (AutoGPT, BabyAGI, CrewAI);· Experiência em integração de IA em sistemas críticos e ambientes restritos;· Contribuições em projetos open-source na área de IA.Informações adicionaisLocal de Trabalho:Vila Olimpia - São Paulo-SPPresencial com possibilidade de 2 dias home officeO que oferecemos: Plano médico e odontológico Bradesco, extensivo a dependentes diretosGympass (Wellhub)Programa de Saúde e Bem-estar: +SaúdeQuick massage no escritórioSeguro de vidaVale Refeição e Alimentação (cartão Swile)Vale TransportePLR (Participação nos Lucros e Resultados)Previdência PrivadaCrédito ConsignadoModelo de trabalho híbridoHorário flexívelVale-presente e day off no aniversárioAuxílio creche para filhos até 71 meses

Similar jobs