Аналитик-инженер (MusicSearch)
SberDevices — инновационное направление компании, которое создает умные устройства, виртуальные ассистенты и другие продукты в области NLP, gamedev, computer vision.
Команда Поиска ищет Аналитика-инженера в MusicSearch. Мы создаем поисковый движок, который позволяет ассистенту на устройствах находить нужный трек, исполнителя, плейлист или подкаст.
Инженер данных в нашей команде — это человек, который строит “платформу качества”: собирает и сводит данные из разных источников, делает витрины и датасеты для оценки, автоматизирует пайплайны и мониторинг, в том числе — в реальном времени, чтобы деградации находились быстрее, чем их увидят пользователи.
Если вам интересно работать на стыке data engineering, продуктовой аналитики и поиска — и вы хотите не просто “переливать данные”, а делать инфраструктуру, на которой стоит культура качества AI-продукта — приходите к нам.* ответственность за оценку качество поиска
* планирование и проведение экспериментов и АБ-тестирования для сравнения моделей
* построение пайплайнов оценки и переоценки качества (включая LLM-as-a-judge) и их поддержка
* витрины и датасеты для оффлайн/онлайн-оценки, A/B-экспериментов и расследований деградаций
* мониторинг качества данных на потоке: свежесть, полнота, задержки, аномалии, регрессии.* опыт в data engineering / analytics engineering от 3 лет (уровень middle+ / senior)
* очень сильный SQL и практический опыт построения витрин (ClickHouse и/или PostgreSQL; оконные функции, сложные агрегации, оптимизация)
* уверенный Python для задач ETL/ELT (парсинг, валидация, интеграции, утилиты для пайплайнов)
* опыт работы с оркестраторами задач (предпочтительно Airflow) для построения и поддержки пайплайнов;
* хорошее понимание архитектуры данных и жизненного цикла датасетов (raw → нормализация → витрины), умение делать решения поддерживаемыми
* способность закрывать задачу «от данных в разных местах» до стабильной витрины/пайплайна/алерта
* инструментальное владение AI для анализа, генерации и автоматизации.
**Будет плюсом:**
* dbt или аналогичный подход к управлению SQL-моделями (тесты, документация, зависимости)
* опыт с логами поиска/клика (показы выдачи, клики, сессии, dwell time) и склейкой событий
* опыт построения мониторинга/дашбордов (Grafana / Superset / DataLens)
* опыт с Kafka/очередями, Kubernetes, Terraform/Ansible, CI/CD для data-проекта
* знакомство с OpenSearch/Elastic как компонентом поисковой системы.* гибридный формат работы (м Новослободская)
* годовая премия
* корпоративный спортзал и зоны отдыха
* более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
* регулярные митапы и развитое DS-community
* расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
* гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
* бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
* вознаграждение за рекомендацию друзей в команду Сбер.