Senior Data Scientist NLP | RND TeamLead в LegaTech
Мы — R&D команда проекта GigaLegal в СБЕР, создающая решения в правовой сфере на основе LLM для автоматизации юридических процессов.
Наша цель — трансформировать работу юристов, бизнеса и госструктур через:
Автоматизацию анализа договоров и юридических документов
Интеллектуальную генерацию правовых текстов
Разработку специализированных юридических чат-ботов
Создание автономных юридических ИИ-агентов
Мы в поиске опытного TL|Senior-специалиста, который возьмет на себя ответственность за разработку и внедрение LLM-решений, способных масштабировать бизнес-процессы наших клиентов._LLM-ориентированные решения_ :
* проектирование и реализация стратегий адаптации LLM (prompting, fine-tuning, LoRA, RLHF) под специфику юридических задач
* проектирование и разработка пайплайнов для обработки юридических данных (RAG, агентские системы, семантический поиск)
* проектирование навыков и обучение LLM и NLP/Сlassic ML моделей для реализации бизнес-задач
* оптимизация производительности LLM в production (латентность, стоимость, точность).
_Продакшен-инжиниринг_ :
* внедрение DS-моделей в production с использованием MLOps-практик (CI/CD, мониторинг, A/B-тесты)
* интеграция решений с внешними API, работа с векторными базами, поисковыми движками (ElasticSearch)
* проектирование отказоустойчивых систем для обработки конфиденциальных юридических данных
* работа с SQL/No SQL БД
_Лидерство и экспертиза :_
* участие в постановке технических требований и взаимодействие с бизнес-заказчиками
* проработка с юридическими экспертами, системными аналитиками, стороной заказчиков требований и вариантов решения задач
* проработка с отделом обучения тестовой и обучающей разметки для обучения юридическим навыкам GigaChat и других LLM
* менторство младших коллег, code review, разработка best practices для команды
* анализ рисков и поиск компромиссов между качеством моделей, скоростью и стоимостью
* возможно лидирование RND команды проекта и позиция TeamLead.* высшее образование
* опыт работы от 5 лет в DS/NLP, включая от 1 года работы с LLM, опыт с production.
* готовность как писать код, пайплайны, обучать модели, так и писать документацию, проектировать системы и готовить спецификации на модели, данные, пайплайны
* глубокая экспертиза в адаптации LLM: SFT, RLHF, LoRA, prompt engineering
* опыт построения RAG-систем, агентских пайплайнов и сервисов на основе LLM
* знание современных фреймворков (PyTorch, Hugging Face, LangChain, LlamaIndex)
* уверенная работа с инфраструктурой: Docker, Kubernetes, облачные платформы
* понимание MLOps: CI/CD, мониторинг дрифта данных, логирование
* опыт трансформации бизнес-задач в технические требования
* умение оценивать ROI DS-решений и балансировать между инновациями и практичностью
* умение быстро делать прототипы решений и искать баланс между скоростью/качеством/производительностью
Будет плюсом:
* навыки работы с генеративными AI-моделями
* опыт создания AI-агентов и использования их в работе будет преимуществом
* опыт использования GigaChat, Kandinsky и аналогов в продуктах, навыки создания и использования AI-агентов.* комфортный современный офис
* гибридный формат работы
* ежегодный пересмотр зарплаты, годовая премия
* корпоративный спортзал и зоны отдыха
* более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
* расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
* ипотека для сотрудников выгоднее до 7%
* бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
* вознаграждение за рекомендацию друзей в команду Сбера.