Старший LLM-разработчик в Нейро

Мы развиваем Нейро — систему моделей для построения ответов LLM с использованием Поиска Яндекса. Наша команда обучает SFT, исследует самые новые алгоритмы RL, максимизирует реворды, внедряет длинные контексты и MoE. Мы ищем сильного DL-разработчика, знающего LLM и умеющего писать код.Исследование подходов RL
Так как Нейро должен не только писать тексты, но и использовать картинки, видео, подходящую структуру, мы используем десятки реворд-моделей для оптимизации разных аспектов. Сейчас наши основные методы — DPO и CE-RL, но они несовершенны, и мы хотим обучаться эффективнее. Нужно будет читать статьи, реализовывать новые методы, а также совершенствовать текущие. Оптимизации моделей
Раскатка Нейро на миллионы пользователей — это очень дорого, а когда речь начинает идти о многостадийных поисках, то числа становятся совсем заоблачными. Нужно исследовать, реализовывать и иногда дебажить квантования, дистилляции, спекдеки. А потом внедрять их без потерь качества. Поиск новых направлений
Когда делаешь новый продукт, возникает множество челленджей, и важно среди них находить точки роста, которые потом конвертируются в задачи. Например, нам не хватает более длинного контекста, не хватает умения «видеть» картинки. Когда такая точка роста находится, нужно превратить её в задачу, договориться со смежниками про совместные действия и довести эту задачу до конца в вопросах не только разработки, но и менеджмента. Такие задачи отлично помогают расти в сторону лида или техлида, и возникают они регулярно. Подробнее про Alice AI Больше об ML в Яндексе — в канале Yandex for ML* Понимаете, как устроены LLM, как они обучаются и какие у них степени свободы * Знаете классические DL и ML * Пишете код на Python * Читаете статьи, готовы к сложным вызовам и амбициозным задачам* Работали с RL * Реализовывали методы оптимизации или продакшн-инференса моделей

Similar jobs