Аналитик-разработчик в группу аналитики поисковых технологий

Мы занимаемся аналитикой ML- и инфраструктурных технологий, лежащих в основе Яндекс Поиска. Ищем аналитика-разработчика, который будет отвечать за правильность еком-товаров: выстраивать систему метрик качества, собирать датасеты, приоритизировать задачи, чтобы сделать товарную базу достоверной.Выстраивание системы метрик
Метрики — основа любого продукта. От качества метрик зависит, что в итоге выучат наши ML-модели и в какую сторону будет двигаться продукт. Мы используем систему из офлайн- и онлайн-метрик. Эту систему предстоит улучшать, а для этого нужно понять, где её область применения, какие у неё недостатки и как их исправить. Сбор офлайн-метрик качества базы
Вам предстоит собирать learn-датасет для ML-моделей и формировать метрики их качества. Для этих задач мы используем краудсорсинг и GPT-разметку. Приоритизация задач правильности на основе данных
Решить задачу правильности разом для всей товарной базы — проблема сверхсложная. Очень много категорий товаров и нюансов — чтобы учесть их все, нужны большие ресурсы и запас времени. Но есть более важные срезы и задачи, и команде аналитики нужно определять приоритетность. Больше об аналитике в Яндексе — в канале Yandex for Analytics* Работали с большими объёмами событийных данных и логами различных сервисов * Уверенно владеете Python и SQL * Знаете статистику и теорию вероятностей * Можете самостоятельно разбираться в данных, находить проблемы качества и причины аномалий* Участвовали и побеждали в олимпиадах по математике, физике, программированию * Работали с архитектурой аналитических данных продукта (собирали DWH, витрины) * Разрабатывали и внедряли новые метрики * Знаете основы машинного обучения

Similar jobs