Machine Learning Engineer

Show

Desarrollar y ajustar modelos de visión computacional (Detectron2, YOLOX, RT-DETR, SegFormer, Mask R-CNN) para detección, segmentación y medición de elementos estructurales en los seis módulos.
Construir y mantener la infraestructura de pipelines de entrenamiento, incluyendo carga de datos, aumento de datos, ajuste de hiperparámetros y entrenamiento distribuido en instancias de Azure optimizadas para GPU.
Gestionar el seguimiento de experimentos (MLflow o Weights & Biases), manteniendo registros claros de versiones de modelos, configuraciones de entrenamiento y métricas de desempeño para cada módulo.
Implementar estrategias de transfer learning utilizando los pesos de modelos beta existentes, cuando las arquitecturas sean compatibles, y luego ajustar progresivamente con datos anotados específicos de cada módulo.
Diseñar y ejecutar estrategias de aumento de datos, incluyendo generación de datos sintéticos con rotación, escalado, ruido y oclusión parcial para mejorar la robustez frente a distintos tipos de planos.
Ejecutar validación cruzada (K-fold con divisiones estratificadas según complejidad del plano, estilo de dibujo y tipo vector/raster) y generar reportes de evaluación de modelos con métricas F1, precisión, recall y desglose por clase.
Optimizar el rendimiento de inferencia de los modelos mediante cuantización (FP16/INT8), estrategias de batching y optimización con TensorRT para cumplir el objetivo de procesamiento menor a 10 minutos.
Colaborar con el/la Data Engineer en los requerimientos del pipeline de preprocesamiento y herramientas para el flujo de anotación.
Guiar y apoyar a los/las ML Engineers en la ejecución de entrenamientos, debugging de problemas de desempeño de modelos y buenas prácticas para experimentos reproducibles de ML.

Más de 5 años de experiencia en ingeniería de machine learning con foco en visión computacional y/o análisis de documentos.
Experiencia práctica sólida con al menos dos de las siguientes tecnologías: Detectron2, YOLOX, SegFormer, LayoutLMv3 o arquitecturas comparables.
Dominio de Python, PyTorch y workflows de entrenamiento acelerados por GPU.
Experiencia con herramientas de seguimiento de experimentos de ML y pipelines de entrenamiento reproducibles.
Sólido entendimiento de transfer learning, active learning y técnicas de aumento de datos.
Experiencia desplegando modelos en endpoints de inferencia basados en la nube (Azure ML, AWS SageMaker o equivalentes).
Inglés intermedio-avanzado o avanzado (indispensable para la comunicación diaria)

Contrato a largo plazo.
100% Remoto.
Vacaciones y PTOs
Posibilidad de recibir 2 bonos al año.
2 revisiones salariales al año.
Clases de inglés.
Equipamiento Apple.
Plataforma de cursos en linea
Budget para compra de libros.
Budget para compra de materiales de trabajo
mucho mas..