Team Lead RL в команду гуманоидных роботов

Мы создаём нейросетевые компоненты для роботов. Вам предстоит стать техлидером в направлении reinforcement learning для автономных гуманоидных и других роботизированных платформ. Мы ищем человека, который умеет соединять исследовательскую глубину, инженерную строгость и продуктовую ответственность.Лидерство в команде
Вы будете возглавлять команду RL-разработчиков и отвечать за качество технических решений. В ваши задачи войдут постановка целей, разбиение сложных исследовательских и инженерных задач на части, ревью решений и развитие экспертизы в команде. Важно выстраивать эффективную коммуникацию с VLA-командой и другими командами, синхронизировать планы и помогать превращать исследовательские идеи в работающие решения. Техническое лидерство в RL-домене
Вы будете определять, как применять reinforcement learning в автономных гуманоидных и других роботизированных системах. В зоне ответственности — выбор подходов, архитектур, метрик, исследовательских приоритетов и требований к качеству поведения робота. Важно проектировать решения как часть общей системы обучения и управления роботом, поскольку RL-направление тесно связано с VLA и другими ML-компонентами. Обучение роботов
Вы будете развивать подходы к обучению роботов в симуляции, на синтетических сценариях и на данных с реальных устройств. Особое внимание нужно уделить переносу моделей на физические платформы, устойчивости поведения и работе с редкими и сложными сценариями. Вам предстоит строить воспроизводимые эксперименты и превращать результаты тестов в понятные улучшения моделей. Внедрение SOTA-подходов
Вы будете исследовать и внедрять современные RL-подходы для гуманоидной локомоции, whole-body control, motion tracking и long-horizon-задач. Фокус — на устойчивости поведения, качестве motion tracking, sim-to-real-переносе, ускорении обучения политик и повышении стабильности экспериментов. Вам нужно разбираться в работах уровня SONIC и CLONE, понимать, как их применить к нашим задачам, и превращать лучшие идеи в воспроизводимые эксперименты, пайплайны обучения и работающие решения на роботах. Больше об ML в Яндексе — в канале Yandex for ML* Управляли командой * Прекрасно ориентируетесь в reinforcement learning, знаете теорию и методы RL, успешно применяли их и добивались практических результатов * Работали с задачами робототехники, локомоции или управления движением * Понимаете специфику обучения в симуляции и переноса моделей на реальные робототехнические платформы * Умеете встраивать ML/RL-решения в реальные системы * Работали с PyTorch * Программируете на Python* Работали с гуманоидными роботами или другими физическими робототехническими платформами * Знакомы с SOTA-подходами в RL для гуманоидной локомоции, включая работы уровня SONIC, CLONE * Работали с sim-to-real, domain randomization, curriculum learning или imitation learning * Имеете публикации, open-source-проекты или опыт участия в AI/robotics-соревнованиях

Similar jobs