Machine Learning Engineer
- Desarrollar y ajustar modelos de visión computacional (Detectron2, YOLOX, RT-DETR, SegFormer, Mask R-CNN) para detección, segmentación y medición de elementos estructurales en los seis módulos.
- Construir y mantener la infraestructura de pipelines de entrenamiento, incluyendo carga de datos, aumento de datos, ajuste de hiperparámetros y entrenamiento distribuido en instancias de Azure optimizadas para GPU.
- Gestionar el seguimiento de experimentos (MLflow o Weights & Biases), manteniendo registros claros de versiones de modelos, configuraciones de entrenamiento y métricas de desempeño para cada módulo.
- Implementar estrategias de transfer learning utilizando los pesos de modelos beta existentes, cuando las arquitecturas sean compatibles, y luego ajustar progresivamente con datos anotados específicos de cada módulo.
- Diseñar y ejecutar estrategias de aumento de datos, incluyendo generación de datos sintéticos con rotación, escalado, ruido y oclusión parcial para mejorar la robustez frente a distintos tipos de planos.
- Ejecutar validación cruzada (K-fold con divisiones estratificadas según complejidad del plano, estilo de dibujo y tipo vector/raster) y generar reportes de evaluación de modelos con métricas F1, precisión, recall y desglose por clase.
- Optimizar el rendimiento de inferencia de los modelos mediante cuantización (FP16/INT8), estrategias de batching y optimización con TensorRT para cumplir el objetivo de procesamiento menor a 10 minutos.
- Colaborar con el/la Data Engineer en los requerimientos del pipeline de preprocesamiento y herramientas para el flujo de anotación.
- Guiar y apoyar a los/las ML Engineers en la ejecución de entrenamientos, debugging de problemas de desempeño de modelos y buenas prácticas para experimentos reproducibles de ML.
- Más de 5 años de experiencia en ingeniería de machine learning con foco en visión computacional y/o análisis de documentos.
- Experiencia práctica sólida con al menos dos de las siguientes tecnologías: Detectron2, YOLOX, SegFormer, LayoutLMv3 o arquitecturas comparables.
- Dominio de Python, PyTorch y workflows de entrenamiento acelerados por GPU.
- Experiencia con herramientas de seguimiento de experimentos de ML y pipelines de entrenamiento reproducibles.
- Sólido entendimiento de transfer learning, active learning y técnicas de aumento de datos.
- Experiencia desplegando modelos en endpoints de inferencia basados en la nube (Azure ML, AWS SageMaker o equivalentes).
- Inglés intermedio-avanzado o avanzado (indispensable para la comunicación diaria)
- Contrato a largo plazo.
- 100% Remoto.
- Vacaciones y PTOs
- Posibilidad de recibir 2 bonos al año.
- 2 revisiones salariales al año.
- Clases de inglés.
- Equipamiento Apple.
- Plataforma de cursos en linea
- Budget para compra de libros.
- Budget para compra de materiales de trabajo
- mucho mas..