ML-разработчик в Яндекс Образование
Яндекс Образование создаёт продукты для школьников, родителей и учителей. Наша цель — разработать AI-репетитора, который умеет вести учебный диалог. Ищем ML-разработчика с бэкграундом в NLP и LLM. Вам предстоит участвовать в создании и развитии такого тьютора: от исследований до продакшен-систем.Улучшение базового качества диалога для достижения образовательных целей
Вы будете улучшать качество диалогового взаимодействия модели с пользователем: строить гипотезы, экспериментировать с архитектурами, данными и схемами обучения, анализировать ошибки и внедрять улучшения. Фокус — сложные пользовательские запросы, неоднозначные формулировки и образовательные сценарии, которые требуют глубокого понимания контекста и предметной области. Построение архитектуры продуктовой ML-системы
Вам предстоит разрабатывать ML-часть AI-тьютора как полноценного продукта: совместно с менеджерами продукта формировать требования и метрики качества, проектировать и развивать ML-пайплайн обучения, оценки и аналитики, а также отвечать за релизы, A/B-эксперименты и интеграцию моделей в сервисы Яндекса (например, Яндекс Репетитор AI, Алиса). Исследования в области LLM
Мы активно используем современные NLP-подходы и большие языковые модели. Вы будете дообучать и адаптировать LLM под образовательные сценарии, работать с алайнментом моделей и контролем качества ответов, применять и развивать подходы RAG, function calling, сценарное управление диалогом. Создание инфраструктуры обучения, адаптация к условиям продакшена
Вам предстоит участвовать в создании инфраструктуры для обучения и экспериментов с моделями, а также в адаптации решений под продакшен-ограничения. Это включает оптимизацию latency и стоимости инференса, масштабирование real-time-сервисов с высокой нагрузкой, обучение LLM-агентов и разработку среды, в которой агенты могут симулировать диалоги между преподавателем и учеником для тестирования и улучшения системы. Больше об ML в Яндексе — в канале Yandex for ML* Уверенно владеете Python и работали с PyTorch * Знакомы с основами обучения LLM * Работали с vLLM для развёртывания LLM * Обладаете крепкой базой знаний в ML* Работали с DL в области речевых технологий * Внедряли нейросетевые модели в продакшен * Работали с большими данными
Вы будете улучшать качество диалогового взаимодействия модели с пользователем: строить гипотезы, экспериментировать с архитектурами, данными и схемами обучения, анализировать ошибки и внедрять улучшения. Фокус — сложные пользовательские запросы, неоднозначные формулировки и образовательные сценарии, которые требуют глубокого понимания контекста и предметной области. Построение архитектуры продуктовой ML-системы
Вам предстоит разрабатывать ML-часть AI-тьютора как полноценного продукта: совместно с менеджерами продукта формировать требования и метрики качества, проектировать и развивать ML-пайплайн обучения, оценки и аналитики, а также отвечать за релизы, A/B-эксперименты и интеграцию моделей в сервисы Яндекса (например, Яндекс Репетитор AI, Алиса). Исследования в области LLM
Мы активно используем современные NLP-подходы и большие языковые модели. Вы будете дообучать и адаптировать LLM под образовательные сценарии, работать с алайнментом моделей и контролем качества ответов, применять и развивать подходы RAG, function calling, сценарное управление диалогом. Создание инфраструктуры обучения, адаптация к условиям продакшена
Вам предстоит участвовать в создании инфраструктуры для обучения и экспериментов с моделями, а также в адаптации решений под продакшен-ограничения. Это включает оптимизацию latency и стоимости инференса, масштабирование real-time-сервисов с высокой нагрузкой, обучение LLM-агентов и разработку среды, в которой агенты могут симулировать диалоги между преподавателем и учеником для тестирования и улучшения системы. Больше об ML в Яндексе — в канале Yandex for ML* Уверенно владеете Python и работали с PyTorch * Знакомы с основами обучения LLM * Работали с vLLM для развёртывания LLM * Обладаете крепкой базой знаний в ML* Работали с DL в области речевых технологий * Внедряли нейросетевые модели в продакшен * Работали с большими данными