Руководитель направления обучения LLM

Мы ищем руководителя направления обучения больших языковых моделей, который будет отвечать за развитие качества моделей в доменной области через системное управление обучением, данными и оценкой.

Роль предполагает работу на стыке исследований, инженерии и продуктовых задач с фокусом на практическое применение моделей в бизнесе.

Обязанности

1. Развитие качества моделей

анализ современных методов обучения LLM (SFT, RLHF/DPO, synthetic data, дистилляция).
формирование стратегии обучения моделей под бизнес-задачи.
определение необходимых навыков модели (skills decomposition).

2. Работа с данными

проектирование и развитие пайплайна датасетов.
сбор, очистка, разметка, валидация.
создание обучающих и тестовых выборок.
разработка синтетических датасетов.

3. Бенчмарки и оценка

разработка и поддержка системы оценки качества моделей.
создание бенчмарков (включая domain-specific).
проведение регулярного тестирования и сравнительного анализа моделей.
контроль регресса.

4. Управление командой

руководство командой разметки (до 40 человек) и подготовки данных (4 человека).
постановка задач, контроль качества разметки.
разработка методологии разметки и инструкций.
работа с инструментами разметки (например, TagMe).

5. Взаимодействие с рисками и compliance

согласование подходов к обучению с управлением модельных рисков.
контроль аспектов, галлюцинации, bias, соответствие нормативным требованиям.
обеспечение прозрачности и воспроизводимости обучения.

6. Интеграция с продуктом

работа с продуктовыми командами (LLM-агенты, RAG-системы).
приоритизация задач обучения на основе бизнес-метрик.
участие в запуске моделей в прод.

7. Экономика и эффективность

оценка эффективности обучения (качество vs стоимость).
выбор оптимальных стратегий, дообучение vs архитектурные изменения.
оптимизация использования вычислительных ресурсов.

Требования

опыт работы с LLM / NLP от 3–5 лет.
практический опыт обучения моделей (SFT, RLHF/DPO или аналоги).
опыт построения датасетов и evaluation pipelines.
понимание архитектуры LLM и принципов их обучения.
опыт управления командой.
уверенное владение Python и ML-стеком (PyTorch / HuggingFace).

Будет плюсом:

опыт работы с доменными моделями (например, legal, finance).
опыт построения пайплайнов генерации синтетических данных.
опыт внедрения моделей в прод.
знание подходов к снижению галлюцинаций.

Условия

комфортный современный офис на ул. Вавилова, д. 19.
формат работы — фул-офис.
ежегодный пересмотр зарплаты, годовая премия.
корпоративный спортзал и зоны отдыха.
более 400 образовательных программ СберУниверситета для профессионального и карьерного развития.
расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа.
гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ.
бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров.
вознаграждение за рекомендацию друзей в команду Сбера.

Руководитель направления обучения LLM

Обязанности

Требования

Условия

Similar jobs

Руководитель направления обучения LLM

LLM Engineer (Reinforcement Learning)

Senior Data Scientist (LLM)

Senior Data Architect

Language Arts Curriculum Designer, Grades 6-12

Аналитик-разработчик (Gigachat B2C)