Senior AI Engineer (Closed-loop Simulation & RL)

We are looking for the best

42dot의 Senior AI Engineer (Closed-loop Simulation & RL)는 Driving Foundation Model과 자율주행 모델을 closed-loop 환경에서 평가하고, failure case와 safety-critical scenario를 기반으로 모델을 지속적으로 개선하는 업무를 담당합니다. 이 포지션은 closed-loop simulation, scenario evaluation, reinforcement learning, reward modeling, policy distillation, post-training을 통해 자율주행 의사결정 모델의 안전성, 주행 품질, 일반화 성능을 고도화합니다.

Responsibilities

  • Driving VLA/World Model/Planning 모델의 closed-loop evaluation framework 설계 및 개발

  • Log replay, scenario-based simulation, regression test, safety-critical case mining pipeline 구축

  • RL, offline RL, reward modeling, policy distillation, post-training 기반 driving policy 개선

  • Simulation rollout, reward function, evaluation metric, failure analysis pipeline 설계 및 운영

  • Safety, comfort, progress, rule compliance 등 자율주행 품질 지표 정의 및 모델 평가 체계 구축

  • Counterfactual simulation, synthetic scenario, real-world driving log를 활용한 model improvement loop 개발

  • VLM/VLA, Data, ML Platform 조직과 협업하여 closed-loop 학습/평가 시스템 통합

Qualifications

  • Reinforcement Learning, imitation learning, planning, simulation, robotics, autonomous driving 관련 5년 이상의 연구/개발 경험 또는 이에 준하는 역량

  • Closed-loop evaluation, simulation rollout, scenario testing, policy evaluation 중 하나 이상에 대한 실무 경험

  • Python 및 PyTorch 기반 ML 모델 학습 또는 evaluation pipeline 개발 경험

  • RL, reward modeling, trajectory planning, sequential decision making에 대한 이해

  • 모델의 실패 사례를 분석하고 metric, reward, dataset, training recipe 개선으로 연결한 경험

  • 대규모 실험, rollout, evaluation 자동화 및 결과 분석 경험

  • Research/Engineering 조직과 협업해 모델 개선 loop를 주도적으로 운영할 수 있는 역량

Preferred Qualifications

  • Autonomous driving simulator, log replay, scenario generation, regression test 경험

  • Offline RL, model-based RL, safe RL, preference/reward modeling, policy distillation 경험

  • Multi-agent simulation, traffic participant modeling, reactive agent modeling 경험

  • Waymax, CARLA, nuPlan, NavSim 등 simulator 또는 benchmark 사용 경험

  • VLA/World Model/Foundation Model post-training 경험

  • Simulation-to-real correlation 분석 경험

  • 3DGS, NeRF, neural rendering, geometric foundation model 경험

  • Distributed rollout, large-scale evaluation infra 경험

  • 3D world model, action-conditioned prediction, synthetic data generation과 closed-loop evaluation을 연결해본 경험

Interview Process

  • 서류전형 - 코딩테스트 - 화상면접 (1시간 내외) - 대면 혹은 화상면접 (3시간 내외) - 최종합격

  • 전형절차는 직무별로 다르게 운영될 수 있으며, 일정 및 상황에 따라 변동될 수 있습니다.

  • 전형일정 및 결과는 지원서에 등록하신 이메일로 개별 안내드립니다.

Additional Information

  • 이력서 제출 시 주민등록번호, 가족관계, 혼인 여부, 연봉, 사진, 신체조건, 출신 지역 등 채용절차법상 요구 금지된 정보는 제외 부탁드립니다.

  • 모든 제출 파일은 30MB 이하의 PDF 양식으로 업로드를 부탁드립니다. (이력서 업로드 중 문제가 발생한다면 지원하시고자 하는 포지션의 URL과 함께 이력서를 recruit@42dot.ai으로 전송 부탁드립니다.)

  • 인터뷰 프로세스 종료 후 지원자의 동의하에 평판조회가 진행될 수 있습니다.

  • 국가보훈대상자 및 취업보호 대상자는 관계법령에 따라 우대합니다.

  • 장애인 고용 촉진 및 직업재활법에 따라 장애인 등록증 소지자를 우대합니다.

  • 42dot은 의뢰하지 않은 서치펌의 이력서를 받지 않으며, 요청하지 않은 이력서에 대해 수수료를 지불하지 않습니다.

  • 3개월의 수습기간이 적용될 수 있습니다.

※ 지원 전 아래 내용을 꼭 확인해 주세요.