Руководитель направления обучения LLM

Мы ищем руководителя направления обучения больших языковых моделей, который будет отвечать за развитие качества моделей в доменной области через системное управление обучением, данными и оценкой. Роль предполагает работу на стыке исследований, инженерии и продуктовых задач с фокусом на практическое применение моделей в бизнесе.**1\. Развитие качества моделей** * анализ современных методов обучения LLM (SFT, RLHF/DPO, synthetic data, дистилляция) * формирование стратегии обучения моделей под бизнес-задачи * определение необходимых навыков модели (skills decomposition) **2\. Работа с данными** * проектирование и развитие пайплайна датасетов: * сбор, очистка, разметка, валидация * создание обучающих и тестовых выборок * разработка синтетических датасетов **3\. Бенчмарки и оценка** * разработка и поддержка системы оценки качества моделей * создание бенчмарков (включая domain-specific) * проведение регулярного тестирования и сравнительного анализа моделей * контроль регресса **4\. Управление командой** * руководство командой разметки (до 40 человек) и подготовки данных (4 человека) * постановка задач, контроль качества разметки * разработка методологии разметки и инструкций * работа с инструментами разметки (например, TagMe) **5\. Взаимодействие с рисками и compliance** * согласование подходов к обучению с управлением модельных рисков * контроль аспектов: галлюцинации, bias, соответствие нормативным требованиям * обеспечение прозрачности и воспроизводимости обучения **6\. Интеграция с продуктом** * работа с продуктовыми командами (LLM-агенты, RAG-системы) * приоритизация задач обучения на основе бизнес-метрик * участие в запуске моделей в прод **7\. Экономика и эффективность** * оценка эффективности обучения (качество vs стоимость) * выбор оптимальных стратегий: дообучение vs архитектурные изменения * оптимизация использования вычислительных ресурсов* опыт работы с LLM / NLP от 3–5 лет * практический опыт обучения моделей (SFT, RLHF/DPO или аналоги) * опыт построения датасетов и evaluation pipelines * понимание архитектуры LLM и принципов их обучения * опыт управления командой * уверенное владение Python и ML-стеком (PyTorch / HuggingFace) _Будет плюсом:_ * опыт работы с доменными моделями (например, legal, finance) * опыт построения пайплайнов генерации синтетических данных * опыт внедрения моделей в прод * знание подходов к снижению галлюцинаций * навыки работы с генеративными AI-моделями * опыт создания AI-агентов и использования их в работе будет преимуществом * опыт использования GigaChat, Kandinsky и аналогов в продуктах, навыки создания и использования AI-агентов.* комфортный современный офис на ул. Вавилова д. 19 * формат работы - фул офис * ежегодный пересмотр зарплаты, годовая премия * корпоративный спортзал и зоны отдыха * более 400 образовательных программ СберУниверситета для профессионального и карьерного развития * расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа * гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ * бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров * вознаграждение за рекомендацию друзей в команду Сбера.

Similar jobs