LLM Engineer / Inference Engineer (Центр Практического ИИ)

Центр практического ИИ — подразделение Сбера, которое занимается сложными AI-проектами и решает нетривиальные задачи банка и экосистемы Сбера. Наша команда строит и дообучает линейку LLM под банковские сценарии и запускает модели в пром в "жёстких" контурах: локальные устройства / закрытые контуры / строгие SLA по задержкам. Работа включает полный цикл: данные → дообучение → оценка качества → оптимизация инференса → нагрузочное тестирование → внедрение. Первый этап отбора на эту вакансию – общение с AI-рекрутером. После отклика вам на почту придет приглашение пройти первичное интервью с ГигаРекрутером в Telegram. Диалог займёт примерно 10 минут. Его задача — уточнить недостающие детали и ускорить рассмотрение вашей кандидатуры. ГигаРекрутер только начинает свой путь, поэтому просим относиться с пониманием. Ваш опыт и участие помогут сделать его удобным и полезным!### Вы будете: * обучать LLM на GPU-кластерах * собирать, очищать и готовть датасеты для pre-training и fine-tuning * анализировать результаты экспериментов и улучшать качество моделей на основе метрик * оптимизировать инференс, проводить нагрузочное тестирование и внедрять обученные модели.### Мы ожидаем, что вы: * имеете подтвержденный практический опыт обучения LLM (pre-training, fine-tuning, aligment) в исследовательских или production-задачах * глубоко понимаете теоретические и практические аспекты LLM: архитектура, токенизация, построение пайплайнов, batching, mixed precitions, распределенное обучение, дебаг неудачных итераций обучения * имеете опыт разработки на Python от 3 лет, пишете чистый и поддерживаемый код в рамках современных ML-проектов * внимательно относитесь к деталям и умеете в коммуникацию с людьми. Будет плюсом, если вы: * разрабатывали AI-агентов (tool-using, planning, multi-step workflows), знакомы с агентными фреймворками и архитектурами * умеете пользоваться инструментами логирования экспериментов (Weights & Biases, MLflow, Langfuse и тд.) * умеете в оптимизацию инференса и хостинг моделей в production * дизайнили и поддерживали eval-пайплайны для LLM с метриками, дашбордами, экспериментами, и проверками на регрессию моделей.### Мы предлагаем: * комфортный современный офис г. Москва, рядом с метро Кутузовская * возможность выбрать удобный график – офис/гибрид (с посещением офиса не менее 2х дней в неделю) * ежегодный пересмотр зарплаты и годовая премия * корпоративный спортзал и зоны отдыха * более 400 образовательных программ СберУниверситета для профессионального и карьерного развития * ДМС, льготное страхование для семьи и корпоративная пенсионная программа * гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ * бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров.

LLM Engineer / Inference Engineer (Центр Практического ИИ)

Similar jobs

ML Engineer (Прикладные исследования LLM и агентов)

AI Engineer

AI Platform Engineer (m/w/d)

General Application

JMP-Chief AI Software Technologist (BCSC)

Founding AI & ML Engineer