Senior Cloud Infra Engineer (DevOps, SRE)

About

We are looking for the best
UMOS ONE은 42dot의 자회사로, 스스로 운영되는 도시교통 운영체제(Urban Mobility Operating System, UMOS)를 기반한 모빌리티 서비스에서의 실제 플릿 운영과 자율 주행 확장까지, 전 과정을 아우르는 통합 플랫폼을 개발하고 있습니다.

UMOS ONE은 모빌리티 서비스 ‘TAP!’, 차량 관제·운영 시스템 ‘Pleos Fleet’, AI 기반 운송 관리 시스템 ‘Capora’ 등 다양한 솔루션을 통해 SDV (software-defined vehicle) 기반의 기술을 상용화하며, 미래 모빌리티 서비스의 중심을 이끌어가고자 합니다.

빠르게 변화하는 시장 속에서 복잡한 문제를 날카롭게 분석해 정확한 해법을 실행력 있게 구현해 나갈 동료를 찾고 있습니다. 혼자보다는 함께 더 멀리 가는 팀, 단순한 협업을 넘어 서로의 성장을 진심으로 응원하는 문화 속에서 의미 있는 도전을 이어가고 싶다면, UMOS ONE에서 그 여정을 함께하세요.

Responsibilities

• EKS 기반 클라우드 인프라 구축 및 운영 (Infra Engineering & Modernization)
• AWS 가상 인프라 아키텍팅: EC2 기반 레거시 모놀리식 구조에서 EKS(Kubernetes) 기반 마이크로서비스 아키텍처(MSA)로의 전환 아키텍처를 직접 설계하고, 컨테이너 인프라를 안정적으로 구축합니다
• IaC 및 GitOps 기반 인프라 자동화 (DevOps & IaC)
• 인프라 프로비저닝 자동화: Terraform 등을 활용하여 전사 인프라 영역을 모듈화 및 코드화(IaC)하고, 수동 조작(Click-Ops) 없는 재현 가능한 환경을 구현합니다
• GitOps 및 CI/CD 파이프라인 엔지니어링: Gitlab, ArgoCD 등을 연계하여 인프라 변경 및 애플리케이션 배포 전 과정을 자동화하는 통합 CI/CD 파이프라인을 구축 및 고도화합니다
• SRE 관점의 가용성 관리 및 Observability 구축 (SRE & Observability)
• Terraform 등을 활용한 인프라 전 영역의 코드화(IaC) 및 모듈화된 프로비저닝 환경 구축
• 수동 배포 환경을 개선하여 애플리케이션 및 인프라의 통합 CI/CD 파이프라인 설계 및 고도화
• 개발 단계부터 배포까지의 전 과정을 자동화하여 개발 생산성 및 배포 안정성 확보
• SRE 및 24x7 모니터링 체계 설계 (SRE & Observability)
• 통합 가용성 모니터링: 대규모 실시간 대용량 트래픽 수용을 위해 Prometheus, Grafana, ELK 등을 활용한 24x7 풀스택 Observability 시스템을 연동하고 고도화합니다
• Self-healing 및 트러블슈팅: 서비스 가용성 지표(SLI/SLO)를 정의하고, 장애 복구 자동화(Self-healing) 아키텍처 및 무중단 배포 전략을 실무 레벨에서 검증하고 구현합니다

Requirements

• 5년 이상의 인프라 설계 및 운영 경력을 보유하신 분
• AWS 환경에서 대규모 인프라를 직접 설계하고 구축 및 운영해 본 경험이 풍부하신 분
• Terraform 등 IaC 도구를 활용하여 인프라를 코드화하고 관리해 본 숙련도가 높으신 분
• Docker 및 Kubernetes(EKS) 기반의 컨테이너 환경을 구축하고 운영 및 트러블슈팅이 가능하신 분
• CI/CD 도구(Jenkins, GitHub Actions, ArgoCD 등)를 활용하여 배포 자동화 체계를 구축해 본 경험이 있으신 분

Preferred

• 기존 레거시(온프레미스/EC2) 환경의 완전 분산형 워크로드를 EKS 아키텍처로 Zero-to-One 이관(Migration) 프로세스 주도 경험
• 차량 IoT, 센서 데이터 등 대규모 실시간 스트리밍(Kinesis, Kafka 등) 인프라 수용을 위한 Burst 대역폭 최적화 설계 경험
• Python, Go, Bash 스크립트를 활용해 반복적인 운영 프록시 및 자동화 툴(CLI 도구 등)을 직접 개발하여 인프라 운영 리소스를 크게 감축해 본 역량
• Terraform 내에 보안 스캔 자동화를 통합하거나, AWS Security Hub, GuardDuty 연동을 통해 ISMS-P / ISO 27001 등 컴플라이언스 기술적 보안 규격을 통과해 본 경험

Benefits

• 복지카드
• 식비 지원
• 단체 상해보험
• 건강검진
• 경조사지원
• 최신형 업무기기 지원
• 라운지 간식 및 음료 제공

Similar jobs