Senior Data Engineer
В команде разрабатывается ML-система, детектирующая Out-of-stock ситуации и аномалии в продажах, которая в near-real-time выявляет потенциальные проблемы с наличием товара и отправляет предупреждения сотрудникам магазинов для оперативной проверки и выкладки.
Задача
- Мы строим end-to-end пайплайны, которые собирают данные из разных источников (онлайн и оффлайн-продажи, ERP, внешние API), очищают, трансформируют и подготавливают их для моделей машинного обучения (бустинг и нейронные сети). От качества этих пайплайнов зависит точность прогноза и миллионы управленческих решений в закупках и логистике.
Что предстоит
- Разрабатывать и оптимизировать Spark-пайплайны для обработки данных в масштабе (200+ млн строк ежедневно).
- Настраивать хранение и доступность данных в DWH.
- Автоматизировать интеграцию данных: продажи, акции, цены, остатки, погода, календари.
- Работать в связке с Data Science-командой, обеспечивая стабильный и качественный поток данных для моделей.
- Участвовать в развитии платформы прогнозирования спроса, делая её более надёжной, масштабируемой и удобной.
Что мы предлагаем
- Нашими решениями пользуются десятки тысяч людей внутри компании и миллионы клиентов вовне
- Сообщество экспертов: можно общаться и обмениваться опытом на митапах, демо-днях и конференциях
- Мы поможем развиваться: цифровая академия, лидерский клуб, школы технических специалистов
- Х5 — это стабильная компания. У нас достаточно ресурсов для того, чтобы сотрудники чувствовали себя комфортно и уверенно
- В X5 много проектов и направлений, между которыми можно перемещаться
- Гибридный формат работы. В Х5 можно работать в офисе, дома или совмещать