MLOps Engineer (MLOps 엔지니어)

About

[회사 소개]
주식회사 오토메타(Automata Inc.)는 AI 중심의 오케스트레이션 플랫폼 기업으로, 복잡한 소프트웨어 개발과 운영을 쉽고 효율적으로 만듭니다.
AI와 도메인 지식을 결합하여, 기획·개발·운영 전 과정을 자동화하고, 기업이 보다 빠르고 효율적으로 디지털 혁신을 이룰 수 있도록 지원합니다.

솔루션 사업부에서는 AI·클라우드 기반의 다양한 서비스와 플랫폼을 기획·개발하고, SM 사업부에서는 구축된 시스템과 서비스를 안정적으로 운영·관리합니다.
국내외 다양한 산업의 파트너와 협력(BMW, LG, Samsung, China Mobile, 한진, Guanaitong 등)하며, 금융·유통·F&B·공공 등 폭넓은 분야에서 프로젝트를 성공적으로 수행하고, 솔루션 및 서비스를 제공하고 있으며, 더욱 많은 기업들과 파트너십을 진행 중에 있습니다.

주식회사 오토메타(Automata Inc.)의 목표는 AI 기술로 지속 가능한 업무 혁신과 비즈니스 경쟁력 강화를 실현하는 것입니다.

[주요 서비스 & 솔루션]
- Zenith Ai : AI 기반 개발 자동화 & 지식 오케스트레이션 플랫폼 (자체 LLM, RLRV, Ontology, RAG 기술 도입)
- Harmony CVM : 기업 연동형 B2B·B2C 마켓플레이스 솔루션
- OrderHop : QR·스마트오더 기반 F&B 올인원 매장 운영 솔루션
- Harmony RCS : 차세대 양방향 메시징·마케팅 솔루션

[회사 문화]
- 자율과 책임: 성과 중심의 유연한 업무 환경
- 열린 소통: 직급에 상관없는 자유로운 아이디어 공유
- 빠른 실행: 결정이 나면 바로 실행, 결과로 이야기

[함께하고 싶은 분]
- AI·IT 기술로 더 나은 업무 환경을 만들고 싶은 분
- 문제 해결을 즐기고 빠른 실행에 자신 있는 분
- 다양한 산업과 프로젝트 경험을 쌓고 싶은 분

Responsibilities

1. Learning & Training Infrastructure 구축
• RLVR 기반 Verifier-driven Learning Pipeline 설계 및 구축
• Production 실행 결과를 학습 신호로 전환하는 Closed-loop Learning System 구축
• Reward Signal 생성 및 Evaluation Pipeline 운영
• Self-evolving Learning Infrastructure 설계

2. LLM Fine-tuning 및 모델 최적화
• Qwen 등 Open-weight LLM Fine-tuning
• LoRA, FSDP2, Mixed Precision, FP8 기반 학습 최적화
• 한국어 및 Enterprise Domain 특화 모델 학습
• 모델 성능 개선 및 학습 효율 최적화

3. GPU Infrastructure 운영
• GPU Training Cluster 설계 및 운영
• Multi-node Distributed Training 환경 구축
• Cloud 및 On-premise GPU 인프라 관리
• 학습 비용 및 리소스 최적화

4. Inference Infrastructure 구축
• vLLM, TGI, TensorRT-LLM 기반 Serving Infrastructure 구축
• 모델 배포 자동화 및 운영
• Latency, Throughput, Cost 최적화
• Production 환경 모델 운영 및 관리

5. MLOps Observability & Evaluation
• 모델 성능 모니터링 체계 구축
• Drift, Hallucination, Latency, Accuracy 추적
• 실험 관리 및 Evaluation Framework 구축
• A/B Testing 및 Statistical Evaluation 운영

6. Multi-Agent Inference Integration
• Agent-to-Agent Protocol 기반 Inference Layer 구축
• Multi-Agent Collaboration 환경 설계
• Zenith Engine과 AI Agent Infrastructure 연동
• Ontology 및 Knowledge Graph 기반 추론 시스템 통합

Requirements

MLOps, Machine Learning Engineering 또는 AI Infrastructure 분야 실무 경험을 보유하신 분
Python 기반 AI/ML 시스템 개발 경험이 있는 분
PyTorch 또는 HuggingFace 기반 모델 학습 경험이 있는 분
모델 학습부터 배포까지 End-to-End Workflow를 이해하고 있는 분
Cloud 또는 GPU Infrastructure 운영 경험이 있는 분
• Production 환경에서 AI 서비스를 운영해본 경험이 있는 분
• 학습 성능, 추론 성능, 비용 간의 Trade-off를 이해하고 최적화할 수 있는 분
• 한국 오피스(서울)에서 대면(On-site) 근무가 가능한 분
• 한국어로 원활한 업무 커뮤니케이션이 가능한 분
- 읽기, 쓰기, 말하기 능통
- 외국인의 경우 TOPIK 6급 이상 필수

Preferred

AI / ML Training
• LLM Fine-tuning 경험
• RLHF, RLVR, DPO, RLAIF 관련 경험
• Constitutional AI 관련 경험
• Reward Model 설계 경험
• DSPy, TextGrad, Verifier 기반 시스템 구축 경험
• MoE(Mixture of Experts) 모델 학습 경험

Infrastructure
• Distributed Training 환경 구축 경험
• DeepSpeed, FSDP, Megatron-LM 활용 경험
• Kubernetes 또는 SLURM 운영 경험
• GPU Cluster 운영 경험
• vLLM, TGI, TensorRT-LLM 활용 경험
• Multi-node Training 최적화 경험
• Observability & Evaluation
• MLflow, Weights & Biases(W&B), Opik 활용 경험

OpenTelemetry 기반 Observability 구축 경험
• LLM Evaluation Framework 구축 경험
• Drift Detection 및 Production Monitoring 경험
• A/B Testing 및 통계 기반 모델 평가 경험

Integration
• REST API 기반 서비스 개발 경험
• MCP, A2A 등 AI Agent Protocol 관련 경험
• Ontology 또는 Knowledge Graph 연동 경험
• Enterprise AI 시스템 구축 경험
• 개인정보보호, 보안, 컴플라이언스 환경에서의 AI 운영 경험

기타
• RLHF, RLVR, Fine-tuning, GPU Training 관련 프로젝트 경험을 보유하신 분
• AI Research를 실제 Production System으로 구현한 경험이 있는 분
• 복잡한 문제를 구조화하고 자동화하는 것을 즐기는 분
• AI Learning Infrastructure의 미래를 함께 만들어가고 싶은 분

Benefits

• 자율적인 근무 환경
- 시차 출퇴근제 (9-10시 출근 가능, 8시간 근무)
- 1/2 반차 휴가 사용
• 수평적인 근무 환경
• 매주 수요일 재택근무
• 연 22회 휴가 지급 (정규직 대상)
- 기본 연차(15일) + 일퇴찬스 (6일 : 1달에 0.5개 * 12) + 생일휴가 (1일)
• 연휴 샌드위치 공동연차 제도