RL-инженер в команду локомоции человекоподобных роботов

Команда локомоции человекоподобных роботов создаёт и обучает модели, которые учат роботов ходить, сохранять равновесие и выполнять сложные двигательные действия в рамках симуляции и в реальном мире. Ждём от вас опыта внедрения RL-решений в продакшен или исследовательские пайплайны.Обучение RL-агентов локомоции
Вам предстоит создавать и обучать политики ходьбы, балансировки и сложных двигательных скиллов в Isaac Lab и MuJoCo. Исследование и применение современных методов RL
Вы будете адаптировать под задачи локомоции разные идеи из научных статей: от Residual RL до transformer-control. Создание и усложнение симуляционных сред
Нужно будет проектировать физические сцены, на которых роботы будут учиться двигаться: лестницы, неровные поверхности, препятствия. Анализ и улучшение поведения агентов
Предстоит разрабатывать метрики, валидировать reward-функции, искать неочевидные зависимости и точки роста в поведении моделей. Внедрение разработок на реальных роботах
Вы будете переносить обученные политики на реальные платформы и наблюдать, как ваши модели начинают двигаться в физическом мире. Больше об ML в Яндексе — в канале Yandex for ML* Обучали модели RL и внедряли решения в продакшен или исследовательские пайплайны * Уверенно программируете на Python и работаете с PyTorch * Понимаете кинематику и динамику роботов * Разбираетесь в современных RL-подходах PPO, SAC, TD3 и т. д. * Умеете формулировать гипотезы и выстраивать эксперименты для их проверки * Читаете и внедряете идеи из научных статей с ICRA, CoRL, NeurIPS, RSS и других * Имеете опыт работы с Isaac Lab, Isaac Gym и MuJoCo* Знаете C++ или CUDA, имеете опыт симуляции физики и оптимизации вычислений * Понимаете подходы Early Experience и Diffusion Policy

Similar jobs