LLM Engineer / Inference Engineer (Центр Практического ИИ)
Центр практического ИИ — подразделение Сбера, которое занимается сложными AI-проектами и решает нетривиальные задачи банка и экосистемы Сбера.
Наша команда строит и дообучает линейку LLM под банковские сценарии и запускает модели в пром в "жёстких" контурах: локальные устройства / закрытые контуры / строгие SLA по задержкам.
Работа включает полный цикл: данные → дообучение → оценка качества → оптимизация инференса → нагрузочное тестирование → внедрение.
Первый этап отбора на эту вакансию – общение с AI-рекрутером. После отклика вам на почту придет приглашение пройти первичное интервью с ГигаРекрутером в Telegram. Диалог займёт примерно 10 минут. Его задача — уточнить недостающие детали и ускорить рассмотрение вашей кандидатуры.
ГигаРекрутер только начинает свой путь, поэтому просим относиться с пониманием. Ваш опыт и участие помогут сделать его удобным и полезным!### Вы будете:
* обучать LLM на GPU-кластерах
* собирать, очищать и готовть датасеты для pre-training и fine-tuning
* анализировать результаты экспериментов и улучшать качество моделей на основе метрик
* оптимизировать инференс, проводить нагрузочное тестирование и внедрять обученные модели.### Мы ожидаем, что вы:
* имеете подтвержденный практический опыт обучения LLM (pre-training, fine-tuning, aligment) в исследовательских или production-задачах
* глубоко понимаете теоретические и практические аспекты LLM: архитектура, токенизация, построение пайплайнов, batching, mixed precitions, распределенное обучение, дебаг неудачных итераций обучения
* имеете опыт разработки на Python от 3 лет, пишете чистый и поддерживаемый код в рамках современных ML-проектов
* внимательно относитесь к деталям и умеете в коммуникацию с людьми.
Будет плюсом, если вы:
* разрабатывали AI-агентов (tool-using, planning, multi-step workflows), знакомы с агентными фреймворками и архитектурами
* умеете пользоваться инструментами логирования экспериментов (Weights & Biases, MLflow, Langfuse и тд.)
* умеете в оптимизацию инференса и хостинг моделей в production
* дизайнили и поддерживали eval-пайплайны для LLM с метриками, дашбордами, экспериментами, и проверками на регрессию моделей.### Мы предлагаем:
* комфортный современный офис г. Москва, рядом с метро Кутузовская
* возможность выбрать удобный график – офис/гибрид (с посещением офиса не менее 2х дней в неделю)
* ежегодный пересмотр зарплаты и годовая премия
* корпоративный спортзал и зоны отдыха
* более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
* ДМС, льготное страхование для семьи и корпоративная пенсионная программа
* гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
* бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров.