Senior Data Scientist NLP | RND TeamLead в LegaTech

Мы — R&D команда проекта GigaLegal в СБЕР, создающая решения в правовой сфере на основе LLM для автоматизации юридических процессов. Наша цель — трансформировать работу юристов, бизнеса и госструктур через: Автоматизацию анализа договоров и юридических документов Интеллектуальную генерацию правовых текстов Разработку специализированных юридических чат-ботов Создание автономных юридических ИИ-агентов Мы в поиске опытного TL|Senior-специалиста, который возьмет на себя ответственность за разработку и внедрение LLM-решений, способных масштабировать бизнес-процессы наших клиентов._LLM-ориентированные решения_ : * проектирование и реализация стратегий адаптации LLM (prompting, fine-tuning, LoRA, RLHF) под специфику юридических задач * проектирование и разработка пайплайнов для обработки юридических данных (RAG, агентские системы, семантический поиск) * проектирование навыков и обучение LLM и NLP/Сlassic ML моделей для реализации бизнес-задач * оптимизация производительности LLM в production (латентность, стоимость, точность). _Продакшен-инжиниринг_ : * внедрение DS-моделей в production с использованием MLOps-практик (CI/CD, мониторинг, A/B-тесты) * интеграция решений с внешними API, работа с векторными базами, поисковыми движками (ElasticSearch) * проектирование отказоустойчивых систем для обработки конфиденциальных юридических данных * работа с SQL/No SQL БД _Лидерство и экспертиза :_ * участие в постановке технических требований и взаимодействие с бизнес-заказчиками * проработка с юридическими экспертами, системными аналитиками, стороной заказчиков требований и вариантов решения задач * проработка с отделом обучения тестовой и обучающей разметки для обучения юридическим навыкам GigaChat и других LLM * менторство младших коллег, code review, разработка best practices для команды * анализ рисков и поиск компромиссов между качеством моделей, скоростью и стоимостью * возможно лидирование RND команды проекта и позиция TeamLead.* высшее образование * опыт работы от 5 лет в DS/NLP, включая от 1 года работы с LLM, опыт с production. * готовность как писать код, пайплайны, обучать модели, так и писать документацию, проектировать системы и готовить спецификации на модели, данные, пайплайны * глубокая экспертиза в адаптации LLM: SFT, RLHF, LoRA, prompt engineering * опыт построения RAG-систем, агентских пайплайнов и сервисов на основе LLM * знание современных фреймворков (PyTorch, Hugging Face, LangChain, LlamaIndex) * уверенная работа с инфраструктурой: Docker, Kubernetes, облачные платформы * понимание MLOps: CI/CD, мониторинг дрифта данных, логирование * опыт трансформации бизнес-задач в технические требования * умение оценивать ROI DS-решений и балансировать между инновациями и практичностью * умение быстро делать прототипы решений и искать баланс между скоростью/качеством/производительностью Будет плюсом: * навыки работы с генеративными AI-моделями * опыт создания AI-агентов и использования их в работе будет преимуществом * опыт использования GigaChat, Kandinsky и аналогов в продуктах, навыки создания и использования AI-агентов.* комфортный современный офис * гибридный формат работы * ежегодный пересмотр зарплаты, годовая премия * корпоративный спортзал и зоны отдыха * более 400 образовательных программ СберУниверситета для профессионального и карьерного развития * расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа * ипотека для сотрудников выгоднее до 7% * бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров * вознаграждение за рекомендацию друзей в команду Сбера.

Similar jobs