ML Engineer / Python Developer

ИТ B2C — самая крупная экосистема в Сбере. Нас более 8000 человек в 18 городах России. Мы занимаемся разработкой и развитием розничных решений, помогая сделать сервисы Банка доступнее, безопаснее и удобнее. Ждем именно тебя! Мы – команда экспертов, объединенных общей страстью к искусственному интеллекту и рекомендательным системам (RecSys). Нашей главной задачей является создание современной, масштабируемой рекомендательной платформы, способной предвосхищать ожидания пользователей, предлагая персонализированные рекомендации на каждом этапе их взаимодействия с экосистемой Сбер. Наши решения охватывают широкий спектр отраслей: от финансов и e-commerce до индустрии развлечений и здравоохранения. Развитие нашей платформы строится вокруг внедрения новых SOTA-моделей. Мы следим за мировыми трендами, экспериментируем с новыми подходами, внедряем их как часть платформы и доводим до конкретного применения в бизнесе. Ищем Machine Learning Engineer в команду для вывода в ПРОМ рекомендательных моделей Банка. Мы работаем с огромным количеством данных, и высоконагруженными сервисами, что делает нашу работу не только важной, но и технически интересной. Также от нас напрямую зависит развитие самого продукта рекомендательной платформы в Банке, так как именно мы определяем ключевые точки ее роста. Если вам близка идея быть первопроходцем, и вы хотите стоять у истоков новой технологии, присоединяйтесь к нам!* Разработка и совершенствование End-to-End ML-пайплайнов; * Разработка продакшен-пайплайнов обработки данных; * Работа с огромными объёмами данных Сбера (петабайты) на PySpark, исследование подходов применения их в моделях; * Писать эффективный и масштабируемый код для тренировки и инференса моделей на PyTorch, проводить эксперименты на GPU-кластере; * Performance оптимизации кода по обработке больших массивов данных или онлайн сервисов рекомендаций с высокой нагрузкой; * Менторинг младших членов команды, обмен знаниями и экспертизой.* Математический бэкграунд; * Хорошее знание Python и ключевых фреймворков для работы с данными (PySpark, PyArrow, Pandas); * Опыт написания качественного production кода; * Опыт написания промышленных пайплайнов обработки данных, содержащих множество шагов, зависимостей и сложную логику; * Опыт использования Airflow (или другого industry-standard оркестраторов пайплайнов, т.к. Luigi, Dagster и т.д.); * Хорошее понимание баз данных SQL / NoSQL; * Навыки работы с генеративными AI-моделями; опыт создания AI-агентов и использования их в работе будет преимуществом; * Опыт использования GigaChat, Kandinsky и аналогов в продуктах, навыки. **Будет плюсом:** * Опыт работы с Kubernetes; * Опыт работы с MLFlow (или другими аналогичными инструментами); * Опыт распределенного обучение больших моделей на GPU-кластере; * Опыт или образование в области финансов, банкинга; * Опыт реализации online inference в условиях высокой нагрузки; * Опыт оптимизации пайплайнов препроцессинга данных под highload. **Стек технологий:** * Python, PySpark, Airflow, Kubernetes, FastAPI, S3, PyTorch, MLFlow, Jira, Confluence, Git.* Гибридный/офисный формат работы (опционально) * Годовой бонус и ежегодный пересмотр * Расширенный ДМС с первого дня + стоматология и льготное страхование для семьи * Корпоративный университет Сбера, внутренняя образовательная платформа, участие в IT-конференциях * Офис на Кутузовской с зонами отдыха и спортзалом * 90 дней удаленной работы из любого региона РФ (не применимо для сопровождения) * Льготная ипотека в Сбере, корпоративная пенсионная программа, подписка СберПрайм+, скидки от партнеров и сервисов группы компаний.

Similar jobs