Data Scientist (СбербанкОнлайн)

Ищем Data Scientist инженера в команду Сбербанк.Онлайн Первый этап отбора на эту вакансию — общение с AI-рекрутером. После отклика ждите сообщение от него в Сберчате, диалог зайдёт примерно 10 минут. Задача AI-рекрутера — уточнить недостающие детали и ускорить рассмотрение вашей кандидатуры. AI-рекрутер только начинает свой путь, поэтому просим относиться с пониманием. Ваш опыт и участие помогут сделать его удобным и полезным для всех!* разрабатывать и внедрять классические ML-модели для улучшения ИИ-сценариев агентов и помощника (классификация интентов, предсказание следующего действия пользователя, детекция аномалий, ранжирование ответов) * проводить исследовательский анализ данных (EDA) логов взаимодействий пользователей с мобильным приложением и помощником * формировать признаки (feature engineering) на основе событий в СберБанк Онлайн, истории операций, поведения в диалогах * участвовать в A/B-тестировании моделей: готовить данные, рассчитывать метрики, интерпретировать результаты * автоматизировать процессы валидации и переобучения моделей (пайплайны на Python/SQL) * настраивать и обучать baseline-модели для задач LLM-приложений (например, рулевые модели, детекторы токсичности, классификаторы отказов) * взаимодействовать с аналитиками и разработчиками для интеграции ML-решений в прод (через API или признаковые таблицы) * анализировать качество работы ИИ-сценариев с точки зрения данных: полнота покрытия интентов, доля неуверенных ответов, корреляция с бизнес-метриками * участвовать в проработке метрик модели (precision, recall, F1, lift) и мониторинга дрейфа данных/таргета.* аналитика данных — уверенное владение SQL (PostgreSQL). Умение писать сложные запросы, оконные функции, агрегации * классический ML — деревья решений, случайный лес, градиентный бустинг (XGBoost / LightGBM / CatBoost), логистическая регрессия, кластеризация (KMeans, DBSCAN), снижение размерности (PCA) * Python — pandas, numpy, scikit-learn, matplotlib/seaborn. Умение писать production-подобный код без Jupyter-грязи * понимание метрик ML — accuracy, precision, recall, ROC-AUC, PR-AUC, logloss, MSE/MAE для бизнес-кейсов * Feature engineering — работа с категориальными переменными, временными рядами, агрегатами событий * понимание жизненного цикла ML-модели (обучение, валидация, тестирование, мониторинг дрейфа) * навыки работы с генеративными AI-моделями, опыт создания AI-агентов и использование их в работе будет преимуществом * опыт использования GigaChat, Kandinsky и аналогов в продуктах * инструментальное владение Ai для анализа, генерации и автоматизации * работа с логами и событиями — умение извлекать целевую переменную из сырых логов приложения и ИИ-помощника. Будет плюсом: * опыт работы с Greenplum / Hadoop (Hive) / PySpark — для работы с большими объёмами логов мобильного приложения * базовое понимание LLM, RAG, эмбеддингов (например, уметь использовать sentence-transformers как источник признаков) * знание, как оценить качество ИИ-агента не только моделью, но и пользовательскими метриками (CR, CSAT, retention) * опыт в финтехе или продуктах с высокой нагрузкой и требованиями к безопасности/Опыт работы с мобильными приложениями * понимание, как деплоить модель в виде микросервиса (Flask/FastAPI + Docker).* формат работы гибрид из Москвы * офис Кутузовская 32к1 * срочный трудовой договор (декретная ставка) на период от года * стабильный оклад и социальная поддержка сотрудников * расширенный ДМС с первого дня и льготное страхование для близких * корпоративное обучение за счет компании * бесплатную подписку СберПрайм+ и скидки на продукты компаний-партнеров * мощное железо, дополнительные мониторы и всё, что нужно для продуктивной работы * многофункциональный спортивный зал (бесплатно).

Similar jobs