Data Scientist (LLM & ML) в команду «История операций» СберБанк Онлайн

**О команде и вызове** «История операций» — это один из самых высоконагруженных и посещаемых экранов в приложении. Наша цель — превратить сухие строчки чеков в умную, интерактивную ленту. Мы внедряем LLM, чтобы пользователь мог общаться со своими финансами на естественном языке, получать моментальные умные инсайты, автоматические теги и персонализированную аналитику расходов.* **Разрабатывать и внедрять ИИ-агентов (LLM Agents):** проектировать логику рассуждений агентов на базе GigaChat, обучать и дообучать модели (Finetuning, LoRA/QLoRA), настраивать вызов внешних инструментов (Tool Calling, API, SQL-скрипты) под задачи банкинга. * **Проектировать и обучать классические ML-модели:** разработать точечную ML-модель для анализа транзакционных и табличных данных (классификация, кластеризация или скоринг) для обогащения контекста агента. * **Строить RAG-системы:** проектировать архитектуру контекстного поиска ответов по сложным финансовым логам, чекам и документам пользователя. * **Анализировать и дорабатывать корзину запросов:** оценивать результаты ответов агентов на предмет качества и ошибок, согласовывать метрики (Guardrails, Ragas), защищать подходы перед бизнесом и показывать ценность данных на понятном языке. * **Обеспечивать надёжность и оптимизировать воркфлоу:** минимизировать задержки (latency) ответов, настраивать мониторинг внедрённых решений и контролировать траекторию поведения агента, полностью исключая галлюцинации в продакшене.**Наш идеальный кандидат** * **Имеет опыт в LLM от 2-3 лет**: запускал языковые модели в продакшн (Transformers, BERT, GPT-подобные архитектуры). * **Мастерски владеет Python**: знает библиотеки PyTorch, Hugging Face, LangChain, LlamaIndex. * **Понимает специфику работы с LLM**: умеет эффективно настраивать Prompt Engineering, оптимизировать инференс (vLLM, TensorRT-LLM) и оценивать качество генерации (Ragas, TruLens). * **Обладает базой в классическом машинном обучении**: понимает алгоритмы Classic ML, умеет работать с табличными данными и признаками (CatBoost / LightGBM / Scikit-learn). * **Дружит с Big Data**: уверенно пишет сложные запросы на SQL (Hive/Spark) для подготовки датасетов.**Почему это вакансия-мечта** * **Масштаб и влияние**: ваш код и обученные модели будут работать в смартфонах каждого второго жителя страны. * **Топовый стек и ресурсы**: доступ к мощным суперкомпьютерам Сбера для обучения крупнейших моделей. * **Минимум бюрократии**: мы работаем по гибким методологиям внутри сильного DS-сообщества. * **Забота и бенефиты**: конкурентная белая зарплата, годовые бонусы, ДМС * Тренажерный зал (работает даже сейчас) * Современный IT-офис с пуфами, игровыми зонами и т.д. * Умопомрачительные виды на Москву * Профильное обучение, митапы, конфы, воркшопы внутри и вне компании **Если вы хотите быть у истоков создания принципиально новой, умной истории операций — давайте создавать будущее финтеха вместе!**

Similar jobs