Plaftorm Engineer

Sobre Creai

En Creai nos especializamos en aprovechar el poder de la inteligencia artificial y el aprendizaje automático para transformar negocios. Nuestra misión es ayudar a nuestros clientes a reducir costos, aumentar la eficiencia y desbloquear nuevas oportunidades mediante soluciones de IA de vanguardia.

Objetivo del Puesto

Diseñar, construir y evolucionar la plataforma de ingeniería de Creai como un producto interno de autoservicio (IDP). Como primer miembro del equipo reportando directamente al CTO, establecerás los cimientos técnicos y la cultura de infraestructura para soportar proyectos de IA/ML a escala global, con autonomía total para definir la arquitectura y la visión tecnológica de largo plazo.

👤 Requisitos

Experiencia profesional

  • Track record comprobable de más de 4 años en Platform Engineering, DevOps o SRE, gestionando infraestructura crítica en producción dentro de entornos de alto crecimiento (fast-paced).

  • Dominio avanzado de AWS y Azure: arquitectura de red compleja, seguridad de identidad (IAM/Entra ID) y gestión experta de clústeres Kubernetes (EKS/AKS).

  • Maestría en Terraform: desarrollo de módulos reutilizables, gestión de estado a escala y automatización total del ciclo de vida de los recursos.

  • Experiencia profunda operando clústeres en producción: implementación de RBAC, políticas de red, Helm, y optimización de escalamiento dinámico (HPA, VPA, Cluster Autoscaler).

  • Diseño de ecosistemas de entrega continua robustos utilizando GitHub Actions, GitLab CI o Azure DevOps, bajo principios de GitOps (ArgoCD o Flux).

  • Dominio de Docker (imágenes multi-stage, optimización de capas) y seguridad proactiva mediante escaneo de vulnerabilidades (Trivy, Snyk) y endurecimiento de runtimes.

  • Implementación de estrategias de observabilidad (métricas, logs, trazas) con Prometheus, Grafana, Datadog u OpenTelemetry, enfocadas en la definición de SLAs/SLOs.

  • Sólidas capacidades de programación en Python y Bash para la creación de herramientas internas que eliminen el trabajo manual (toil).

Soft skills

  • Inglés avanzado indispensable (escrito y verbal) para colaboración con equipos y clientes globales.

  • Mentalidad de "Ownership" y capacidad para navegar la ambigüedad de una startup.

  • Comunicación asertiva, capaz de traducir requerimientos técnicos en valor de negocio.

⭐ Conocimientos Deseables

  • MLOps de última generación: Experiencia con MLflow, Kubeflow o SageMaker Pipelines para el ciclo de vida de modelos.

  • Infraestructura de Cómputo Intensivo: Gestión de recursos GPU, orquestación de cargas de trabajo para LLMs y arquitecturas de Bases de Datos Vectoriales (Pinecone, Weaviate).

  • FinOps: Capacidad para monitorear y optimizar costos de cómputo en la nube, garantizando eficiencia financiera.

  • Service Mesh: Implementación de Istio o Linkerd para mTLS y control de tráfico fino.

  • Certificaciones: AWS Solutions Architect Pro o Azure Solutions Architect Expert.

🗂 Funciones Principales

  • Liderar la estrategia multi-cloud (AWS/Azure) mediante Terraform, garantizando una infraestructura inmutable, segura y altamente escalable.

  • Desarrollar herramientas y abstracciones que mejoren la Developer Experience (DevEx), permitiendo que los equipos de ingeniería y ciencia de datos desplieguen con fricción cero.

  • Orquestar clústeres de alta disponibilidad para cargas de trabajo de IA Generativa, optimizando el uso de hardware especializado (GPUs) y arquitecturas RAG.

  • Implementar el principio de mínimo privilegio y gestión avanzada de secretos. Liderar la respuesta a incidentes y promover una cultura de blameless post-mortems.

  • Monitorear el rendimiento del stack tecnológico y ejecutar estrategias de FinOps para maximizar el ROI de la infraestructura cloud.

  • Definir los estándares de ingeniería de plataforma y actuar como mentor para el crecimiento del equipo técnico.

  • Colaborar directamente con clientes para diseñar arquitecturas que resuelvan sus retos de IA más complejos.

🎁Beneficios

  • 💻 Trabajo flexible con horario alineado a CST.

  • 🏖️ PTO ilimitado: Confiamos en que gestionarás tu tiempo de manera efectiva.

  • 🎓 Presupuesto anual para desarrollo: Acceso a cursos, certificaciones y conferencias.

  • 🛠️ Presupuesto para equipamiento: Configura tu espacio de trabajo remoto ideal.

  • 🩺 Beneficio de salud: Acceso a cobertura médica privada o subsidios para seguro médico.

  • 🚀 Oportunidades de crecimiento: Plan de carrera y mentoría con expertos en IA y tecnología.

  • Ambiente de startup dinámico y flexible: Autonomía para tomar decisiones y proponer ideas, con un enfoque en resultados en lugar de horas trabajadas.

  • ⚖️ Balance vida-trabajo: Cultura que prioriza la flexibilidad y el bienestar, permitiéndote gestionar tu tiempo sin sacrificar tu vida personal.Beneficios