Data Scientist (СбербанкОнлайн)
Ищем Data Scientist инженера в команду Сбербанк.Онлайн
Первый этап отбора на эту вакансию — общение с AI-рекрутером. После отклика ждите сообщение от него в Сберчате, диалог зайдёт примерно 10 минут. Задача AI-рекрутера — уточнить недостающие детали и ускорить рассмотрение вашей кандидатуры. AI-рекрутер только начинает свой путь, поэтому просим относиться с пониманием. Ваш опыт и участие помогут сделать его удобным и полезным для всех!* разрабатывать и внедрять классические ML-модели для улучшения ИИ-сценариев агентов и помощника (классификация интентов, предсказание следующего действия пользователя, детекция аномалий, ранжирование ответов)
* проводить исследовательский анализ данных (EDA) логов взаимодействий пользователей с мобильным приложением и помощником
* формировать признаки (feature engineering) на основе событий в СберБанк Онлайн, истории операций, поведения в диалогах
* участвовать в A/B-тестировании моделей: готовить данные, рассчитывать метрики, интерпретировать результаты
* автоматизировать процессы валидации и переобучения моделей (пайплайны на Python/SQL)
* настраивать и обучать baseline-модели для задач LLM-приложений (например, рулевые модели, детекторы токсичности, классификаторы отказов)
* взаимодействовать с аналитиками и разработчиками для интеграции ML-решений в прод (через API или признаковые таблицы)
* анализировать качество работы ИИ-сценариев с точки зрения данных: полнота покрытия интентов, доля неуверенных ответов, корреляция с бизнес-метриками
* участвовать в проработке метрик модели (precision, recall, F1, lift) и мониторинга дрейфа данных/таргета.* аналитика данных — уверенное владение SQL (PostgreSQL). Умение писать сложные запросы, оконные функции, агрегации
* классический ML — деревья решений, случайный лес, градиентный бустинг (XGBoost / LightGBM / CatBoost), логистическая регрессия, кластеризация (KMeans, DBSCAN), снижение размерности (PCA)
* Python — pandas, numpy, scikit-learn, matplotlib/seaborn. Умение писать production-подобный код без Jupyter-грязи
* понимание метрик ML — accuracy, precision, recall, ROC-AUC, PR-AUC, logloss, MSE/MAE для бизнес-кейсов
* Feature engineering — работа с категориальными переменными, временными рядами, агрегатами событий
* понимание жизненного цикла ML-модели (обучение, валидация, тестирование, мониторинг дрейфа)
* навыки работы с генеративными AI-моделями, опыт создания AI-агентов и использование их в работе будет преимуществом
* опыт использования GigaChat, Kandinsky и аналогов в продуктах
* инструментальное владение Ai для анализа, генерации и автоматизации
* работа с логами и событиями — умение извлекать целевую переменную из сырых логов приложения и ИИ-помощника.
Будет плюсом:
* опыт работы с Greenplum / Hadoop (Hive) / PySpark — для работы с большими объёмами логов мобильного приложения
* базовое понимание LLM, RAG, эмбеддингов (например, уметь использовать sentence-transformers как источник признаков)
* знание, как оценить качество ИИ-агента не только моделью, но и пользовательскими метриками (CR, CSAT, retention)
* опыт в финтехе или продуктах с высокой нагрузкой и требованиями к безопасности/Опыт работы с мобильными приложениями
* понимание, как деплоить модель в виде микросервиса (Flask/FastAPI + Docker).* формат работы гибрид из Москвы
* офис Кутузовская 32к1
* срочный трудовой договор (декретная ставка) на период от года
* стабильный оклад и социальная поддержка сотрудников
* расширенный ДМС с первого дня и льготное страхование для близких
* корпоративное обучение за счет компании
* бесплатную подписку СберПрайм+ и скидки на продукты компаний-партнеров
* мощное железо, дополнительные мониторы и всё, что нужно для продуктивной работы
* многофункциональный спортивный зал (бесплатно).