Data Scientist (LLM & ML) в команду «История операций» СберБанк Онлайн
**О команде и вызове**
«История операций» — это один из самых высоконагруженных и посещаемых экранов в приложении. Наша цель — превратить сухие строчки чеков в умную, интерактивную ленту. Мы внедряем LLM, чтобы пользователь мог общаться со своими финансами на естественном языке, получать моментальные умные инсайты, автоматические теги и персонализированную аналитику расходов.* **Разрабатывать и внедрять ИИ-агентов (LLM Agents):** проектировать логику рассуждений агентов на базе GigaChat, обучать и дообучать модели (Finetuning, LoRA/QLoRA), настраивать вызов внешних инструментов (Tool Calling, API, SQL-скрипты) под задачи банкинга.
* **Проектировать и обучать классические ML-модели:** разработать точечную ML-модель для анализа транзакционных и табличных данных (классификация, кластеризация или скоринг) для обогащения контекста агента.
* **Строить RAG-системы:** проектировать архитектуру контекстного поиска ответов по сложным финансовым логам, чекам и документам пользователя.
* **Анализировать и дорабатывать корзину запросов:** оценивать результаты ответов агентов на предмет качества и ошибок, согласовывать метрики (Guardrails, Ragas), защищать подходы перед бизнесом и показывать ценность данных на понятном языке.
* **Обеспечивать надёжность и оптимизировать воркфлоу:** минимизировать задержки (latency) ответов, настраивать мониторинг внедрённых решений и контролировать траекторию поведения агента, полностью исключая галлюцинации в продакшене.**Наш идеальный кандидат**
* **Имеет опыт в LLM от 2-3 лет**: запускал языковые модели в продакшн (Transformers, BERT, GPT-подобные архитектуры).
* **Мастерски владеет Python**: знает библиотеки PyTorch, Hugging Face, LangChain, LlamaIndex.
* **Понимает специфику работы с LLM**: умеет эффективно настраивать Prompt Engineering, оптимизировать инференс (vLLM, TensorRT-LLM) и оценивать качество генерации (Ragas, TruLens).
* **Обладает базой в классическом машинном обучении**: понимает алгоритмы Classic ML, умеет работать с табличными данными и признаками (CatBoost / LightGBM / Scikit-learn).
* **Дружит с Big Data**: уверенно пишет сложные запросы на SQL (Hive/Spark) для подготовки датасетов.**Почему это вакансия-мечта**
* **Масштаб и влияние**: ваш код и обученные модели будут работать в смартфонах каждого второго жителя страны.
* **Топовый стек и ресурсы**: доступ к мощным суперкомпьютерам Сбера для обучения крупнейших моделей.
* **Минимум бюрократии**: мы работаем по гибким методологиям внутри сильного DS-сообщества.
* **Забота и бенефиты**: конкурентная белая зарплата, годовые бонусы, ДМС
* Тренажерный зал (работает даже сейчас)
* Современный IT-офис с пуфами, игровыми зонами и т.д.
* Умопомрачительные виды на Москву
* Профильное обучение, митапы, конфы, воркшопы внутри и вне компании
**Если вы хотите быть у истоков создания принципиально новой, умной истории операций — давайте создавать будущее финтеха вместе!**