ML-разработчик в группу релевантности рекламы
Алиса всё чаще становится одной из ключевых точек входа в Яндекс Поиск. Мы создаём рекламу для этого нового формата и ищем ML-разработчика, который поможет нам спроектировать весь путь подбора объявлений в диалоге — от кандидатогенерации до оценки релевантности. Приходите, если знаете Python и C++.Разработка моделей подбора рекламы в диалоговом контексте
Алиса ведёт с пользователем живой разговор, и реклама должна органично в него вписываться. Вам предстоит проектировать и обучать модели, которые учитывают историю диалога, интент пользователя, тональность и формат взаимодействия. Вы будете работать с редакторскими, асессорскими и модельными разметками, обрабатывать большие данные, обучать тяжёлые ML-модели и преобразовывать их в легковесные модели для использования в реальном времени. Задачи на стыке RecSys и NLP
Подбор рекламы в Алисе — это полноценный рекомендательный пайплайн. На этапе кандидатогенерации нужно за миллисекунды отобрать из сотен миллионов объявлений тысячи релевантных кандидатов — здесь мы работаем с эмбеддинговыми моделями, ANN-индексами и классическими подходами рекомендательных систем. На этапе ранжирования и оценки релевантности задача становится NLP-центричной: модели должны глубоко понимать смысл диалога и текст объявления, оценивать их семантическую близость и предсказывать, насколько реклама уместна в конкретном контексте разговора. Вы сможете развиваться в обоих направлениях или сфокусироваться на том, что ближе. Больше об ML в Яндексе — в канале Yandex for ML* Знаете Python и C++ * Базово разбираетесь в алгоритмах и структурах данных * Имеете опыт обучения моделей в области NLP: BERT, GPT и других * Знакомы с архитектурами рекомендательных систем * Знакомы с A/B-тестированием и умеете проводить базовую аналитику влияния своих внедрений* Занимались дистилляцией и оптимизацией моделей для real-time-инференса * Имеете опыт файнтюнинга генеративных моделей (RLHF, DPO) * Знакомы с рекламными системами или аукционными механизмами
Алиса ведёт с пользователем живой разговор, и реклама должна органично в него вписываться. Вам предстоит проектировать и обучать модели, которые учитывают историю диалога, интент пользователя, тональность и формат взаимодействия. Вы будете работать с редакторскими, асессорскими и модельными разметками, обрабатывать большие данные, обучать тяжёлые ML-модели и преобразовывать их в легковесные модели для использования в реальном времени. Задачи на стыке RecSys и NLP
Подбор рекламы в Алисе — это полноценный рекомендательный пайплайн. На этапе кандидатогенерации нужно за миллисекунды отобрать из сотен миллионов объявлений тысячи релевантных кандидатов — здесь мы работаем с эмбеддинговыми моделями, ANN-индексами и классическими подходами рекомендательных систем. На этапе ранжирования и оценки релевантности задача становится NLP-центричной: модели должны глубоко понимать смысл диалога и текст объявления, оценивать их семантическую близость и предсказывать, насколько реклама уместна в конкретном контексте разговора. Вы сможете развиваться в обоих направлениях или сфокусироваться на том, что ближе. Больше об ML в Яндексе — в канале Yandex for ML* Знаете Python и C++ * Базово разбираетесь в алгоритмах и структурах данных * Имеете опыт обучения моделей в области NLP: BERT, GPT и других * Знакомы с архитектурами рекомендательных систем * Знакомы с A/B-тестированием и умеете проводить базовую аналитику влияния своих внедрений* Занимались дистилляцией и оптимизацией моделей для real-time-инференса * Имеете опыт файнтюнинга генеративных моделей (RLHF, DPO) * Знакомы с рекламными системами или аукционными механизмами