Middle ML Engineer (Retrieval Agent / RnD)
This position is no longer accepting applications(closed Jun 20, 2026).
Мы ищем ML Engineer в RnD подразделение для работы над специализированной моделью для агентного поиска. Наша цель — переход от статических RAG-пайплайнов к адаптивным агентным системам, управляющим процессом извлечения знаний. Вам предстоит работать на стыке инженерии и исследований: создавать датасеты, обучать модели (SFT/RL) и сравнивать эффективность кастомных решений с существующими фреймворками. \- Разработка тестовых корзин для оценки многошагового поиска (multi-step retrieval) и сложных запросов;
\- Дообучение языковых моделей (SFT, LoRA) и применение методов Reinforcement Learning (GRPO) для оптимизации стратегий поиска;
\- Сравнительный анализ производительности: кастомные модели управления поиском vs агентные подходы на базе фреймворков (ReAct);
\- Проектирование и поддержка пайплайнов оценки качества поиска для агентных систем.\- Опыт от 1 года коммерческой разработки в NLP с фокусом на LLM и RAG-архитектуры;
\- Понимание работы и стратегий поиска (векторные модели, реранкеры, ReAct);
\- Умение оценивать качество поиска (Recall, MRR, NDCG) и проектировать эксперименты для сравнения гипотез;
\- Владение экосистемой: PyTorch, HuggingFace, vLLM, LangChain/LangGraph;
**Будет плюсом:**
\- Опыт дообучения эмбеддеров или LLM;
\- Опыт реализации многошаговых агентных сценариев;
\- Публикации, соревнования или пет-проекты, связанные с задачей поиска.* Кластер с GPU A100 для экспериментов;
* комфортный современный офис рядом с м. Кутузовская
* гибридный формат работы
* ежегодный пересмотр зарплаты, годовая премия
* корпоративный спортзал и зоны отдыха
* система обучения для профессионального и карьерного развития
* расширенный полис ДМС с первого дня работы и страхование для семьи
* программа ипотеки для сотрудников
* бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
* вознаграждение за рекомендацию друзей в команду Сбера.