Data Engineer в Портал продавцов
Заниматься разработкой, сопровождением, оптимизацией ETL-пайплайнов на Apache Spark;
Разрабатывать интеграции со стриминговыми источниками данных (Kafka);
Реагировать на инциденты, осуществлять поддержку существующих пайплайнов;
Проводить сбор, анализ и выявление требований, взаимодействать с заказчиками;
Проектировать и разрабатывать витрины данных для аналитики;
Принимать участие в разработке и развитии внутреннего фреймворка;
Принимать участие в code review.
Уверенный опыт программирования на Python (не менее 2-х лет);
Опыт работы с hadoop (spark/yarn/hdfs/hive), с apache Airflow / Dagster и со Spark (Pyspark);
Опыт в оптимизации SQL запросов (индексы, партицирование, шардирование и тд);
Опыт работы с MPP СУБД (ClickHouse/GreenPlum/Vertica);
Опыт работы со стриминговыми данными (Kafka).
Будет плюсом:
Опыт работы в DBT;
Понимание концепций моделирования хранилищ данных;
Ведение процесса покрытия данных контролем качества (DQ).
Обучение и развитие: языковые клубы, собственный корпоративный университет, программы развития управленческих навыков и многое другое;
Благополучие сотрудников: корпоративный пакет ДМС со стоматологией, корпоративный спорт, консультации психолога и дополнительные возможности аккредитованной IT-компании;
Множество сообществ: клуб спикеров, футбола, йоги, шахмат и т.д.;
Забота о семьях: создаем условия, в которых легко сочетать карьеру и заботу о близких – от гибкого подхода до масштабных проектов для детей сотрудников;
Скидки и партнерские программы: на обучение, страхование, покупки и многое другое;
Комфортная рабочая среда: бесплатное питание в офисе, современные офисы рядом с метро, корпоративная техника и портал для сотрудников.