Data Scientist / Deep Learning Engineer (рекомендательные системы)
ИТ B2C — самая крупная экосистема в Сбере. Нас более 8000 человек в 18 городах России. Мы занимаемся разработкой и развитием розничных решений, помогая сделать сервисы Банка доступнее, безопаснее и удобнее.
Ждем именно тебя!
Мы – команда экспертов, объединенных общей страстью к искусственному интеллекту и рекомендательным системам (RecSys). Нашей главной задачей является создание современной, масштабируемой рекомендательной платформы, способной предвосхищать ожидания пользователей, предлагая персонализированные рекомендации на каждом этапе их взаимодействия с экосистемой Сбер. Наши решения охватывают широкий спектр отраслей: от финансов и e-commerce до индустрии развлечений и здравоохранения.
Развитие нашей платформы строится вокруг внедрения новых SOTA-моделей. Мы следим за мировыми трендами, экспериментируем с новыми подходами, внедряем их как часть платформы и доводим до конкретного применения в бизнесе.
Generative AI сегодня задает новый вектор развития RecSys. Мы видим будущее за сменой парадигмы построения рекомендательных систем: переход от классической архитектуры, состоящей из стадий отбора кандидатов и ранжирования, к генеративным моделям. Это открывает двери для настоящего end-to-end обучения и глубокой синергии с LLM.
Мы ищем Senior Data Scientist в R&D команду для создания рекомендательной системы следующего поколения. Мы ставим перед собой амбициозную цель разработать и довести до внедрения генеративную рекомендательную модель, обучаемую end-to-end. Если вам близка идея быть первопроходцем, и вы хотите стоять у истоков новой технологии, присоединяйтесь к нам!* анализировать новые подходы, разбирать научные статьи, генерировать и проверять гипотезы для улучшения качества работы генеративных рекомендательных моделей
* имплементировать гипотезы на Python, писать эффективный и масштабируемый код для тренировки и инференса моделей на PyTorch, проводить эксперименты на GPU-кластере
* дизайнить постановки экспериментов, таргеты, reward-функции, метрики качества, готовить данные под эксперимент
* до-обучать LLM (Fine-tuning и Alignment) под специфику рекомендательного домена.* математический бэкграунд
* опыт работы в Data Science от 3-х лет
* хорошее знание Deep Learning, прикладной опыт обучения моделей
* уверенное владение Python и PyTorch, опыт работы с ключевыми ML/DL фреймворками (экосистема Hugging Face, Lightning)
* понимание текущего состояния индустрии в области Generative AI;
* навыки работы с генеративными AI-моделями; опыт создания AI-агентов и использования их в работе будет преимуществом;
* опыт использования GigaChat, Kandinsky и аналогов в продуктах, навыки.
**Будет плюсом:**
* опыт работы в области RecSys или NLP
* опыт распределенного обучение больших моделей на GPU-кластере
* опыт до-обучения и валидации качества LLM, опыт с фреймворками TRL/verl
* умение работать с большими данными (таблицы, временные ряды) на PySpark.
**Стек технологий:**
Python, PyTorch, Transformers, MLFlow* гибридный/офисный формат работы (опционально)
* годовой бонус и ежегодный пересмотр
* расширенный ДМС с первого дня + стоматология и льготное страхование для семьи
* корпоративный университет Сбера, внутренняя образовательная платформа, участие в IT-конференциях
* льготная ипотека в Сбере, корпоративная пенсионная программа, подписка СберПрайм+, скидки от партнеров и сервисов группы компаний.