Senior AI Engineer (Closed-loop Simulation & RL)

We are looking for the best

42dot의 Senior AI Engineer (Closed-loop Simulation & RL)는 Driving Foundation Model과 자율주행 모델을 closed-loop 환경에서 평가하고, failure case와 safety-critical scenario를 기반으로 모델을 지속적으로 개선하는 업무를 담당합니다. 이 포지션은 closed-loop simulation, scenario evaluation, reinforcement learning, reward modeling, policy distillation, post-training을 통해 자율주행 의사결정 모델의 안전성, 주행 품질, 일반화 성능을 고도화합니다.

Responsibilities

Driving VLA/World Model/Planning 모델의 closed-loop evaluation framework 설계 및 개발
Log replay, scenario-based simulation, regression test, safety-critical case mining pipeline 구축
RL, offline RL, reward modeling, policy distillation, post-training 기반 driving policy 개선
Simulation rollout, reward function, evaluation metric, failure analysis pipeline 설계 및 운영
Safety, comfort, progress, rule compliance 등 자율주행 품질 지표 정의 및 모델 평가 체계 구축
Counterfactual simulation, synthetic scenario, real-world driving log를 활용한 model improvement loop 개발
VLM/VLA, Data, ML Platform 조직과 협업하여 closed-loop 학습/평가 시스템 통합

Qualifications

Reinforcement Learning, imitation learning, planning, simulation, robotics, autonomous driving 관련 5년 이상의 연구/개발 경험 또는 이에 준하는 역량
Closed-loop evaluation, simulation rollout, scenario testing, policy evaluation 중 하나 이상에 대한 실무 경험
Python 및 PyTorch 기반 ML 모델 학습 또는 evaluation pipeline 개발 경험
RL, reward modeling, trajectory planning, sequential decision making에 대한 이해
모델의 실패 사례를 분석하고 metric, reward, dataset, training recipe 개선으로 연결한 경험
대규모 실험, rollout, evaluation 자동화 및 결과 분석 경험
Research/Engineering 조직과 협업해 모델 개선 loop를 주도적으로 운영할 수 있는 역량

Preferred Qualifications

Autonomous driving simulator, log replay, scenario generation, regression test 경험
Offline RL, model-based RL, safe RL, preference/reward modeling, policy distillation 경험
Multi-agent simulation, traffic participant modeling, reactive agent modeling 경험
Waymax, CARLA, nuPlan, NavSim 등 simulator 또는 benchmark 사용 경험
VLA/World Model/Foundation Model post-training 경험
Simulation-to-real correlation 분석 경험
3DGS, NeRF, neural rendering, geometric foundation model 경험
Distributed rollout, large-scale evaluation infra 경험
3D world model, action-conditioned prediction, synthetic data generation과 closed-loop evaluation을 연결해본 경험

Interview Process

서류전형 - 코딩테스트 - 화상면접 (1시간 내외) - 대면 혹은 화상면접 (3시간 내외) - 최종합격
전형절차는 직무별로 다르게 운영될 수 있으며, 일정 및 상황에 따라 변동될 수 있습니다.
전형일정 및 결과는 지원서에 등록하신 이메일로 개별 안내드립니다.

Additional Information

이력서 제출 시 주민등록번호, 가족관계, 혼인 여부, 연봉, 사진, 신체조건, 출신 지역 등 채용절차법상 요구 금지된 정보는 제외 부탁드립니다.
모든 제출 파일은 30MB 이하의 PDF 양식으로 업로드를 부탁드립니다. (이력서 업로드 중 문제가 발생한다면 지원하시고자 하는 포지션의 URL과 함께 이력서를 recruit@42dot.ai으로 전송 부탁드립니다.)
인터뷰 프로세스 종료 후 지원자의 동의하에 평판조회가 진행될 수 있습니다.
국가보훈대상자 및 취업보호 대상자는 관계법령에 따라 우대합니다.
장애인 고용 촉진 및 직업재활법에 따라 장애인 등록증 소지자를 우대합니다.
42dot은 의뢰하지 않은 서치펌의 이력서를 받지 않으며, 요청하지 않은 이력서에 대해 수수료를 지불하지 않습니다.
3개월의 수습기간이 적용될 수 있습니다.

※ 지원 전 아래 내용을 꼭 확인해 주세요.

42dot이 일하는 방식, 42dot Way 보러가기 →
42dot만의 업무몰입 프로그램, Employee Engagement Program 보러가기 →