Тимлид ML-команды (AI Search) в ML-сервисы Yandex Cloud
Вы возглавите ML-команду и будете отвечать за разработку базовых технологий для AI-сервисов Yandex Cloud. Наш фокус — создание мультитенантных поисковых и классификационных моделей. Ждём, что вы разрабатывали и выводили в прод ML-сервисы с высокими требованиями к надёжности и производительности.Команда
Вы будете управлять командой ML-разработчиков: проводить performance review, встречи 1-to-1, ставить цели, помогать разработчикам с карьерным развитием, наращивать знания и опыт команды. Понадобится декомпозировать продуктовые цели и превращать их в технический roadmap, формировать квартальные планы команды и отвечать за их реалистичность и стабильную сходимость. Разрабатывать и внедрять CI/CD для моделей, процессов код-ревью, тестирования и релизного цикла ML-артефактов. Представлять R&D-команды в рамках v-team, обеспечивать видимость и прозрачность деятельности R&D-команды, формировать технические требования и запросы к смежным командам (например, требования к данным и инфраструктуре). Разработка
Вы станете отвечать за исследование и разработку SOTA-моделей для сценариев RAG (поиск, ранжирование), классификации (few-shot/zero-shot, guards) и памяти, а также их интеграцию в инфраструктуру инференса. Нас вас будет лежать прямая ответственность за метрики качества моделей, а также за производительность и стабильность бэкендов инференса (в том числе за логирование, мониторинги и покрытие кода тестами). Кроме того, вам предстоит лично участвовать в разработке: писать код (до 30¬–40% времени), проводить код-ревью, помогать с архитектурой и диагностикой проблем, готовить релизы моделей и бэкендов.* Управляли ML-командой от одного года * Глубоко разбираетесь в современном ML (нейросети, трансформеры) с фокусом на NLP, Information Retrieval или Generative AI * Разрабатывали и выводили в продакшен ML-сервисы с высокими требованиями к надёжности и производительности * Уверенно владеете Python и PyTorch * Понимаете полный жизненный цикл ML-модели: от сбора требований и подготовки данных до эксплуатации в проде * Проактивны и способны самостоятельно формировать технический бэклог и roadmap, исходя из продуктовых целей* Использовали опенсорс-проекты и контрибьютили в них (особенно в библиотеки для инференса, такие как TensorRT, TensorRT-LLM, vLLM, SGLang) * Работали с C++ и низкоуровневыми оптимизациями (CUDA) * Работали в распределенной команде * Умеете или хотите выступать на публике, писать технические статьи или вести блог, чтобы повышать внешнюю видимость команды и продукта
Вы будете управлять командой ML-разработчиков: проводить performance review, встречи 1-to-1, ставить цели, помогать разработчикам с карьерным развитием, наращивать знания и опыт команды. Понадобится декомпозировать продуктовые цели и превращать их в технический roadmap, формировать квартальные планы команды и отвечать за их реалистичность и стабильную сходимость. Разрабатывать и внедрять CI/CD для моделей, процессов код-ревью, тестирования и релизного цикла ML-артефактов. Представлять R&D-команды в рамках v-team, обеспечивать видимость и прозрачность деятельности R&D-команды, формировать технические требования и запросы к смежным командам (например, требования к данным и инфраструктуре). Разработка
Вы станете отвечать за исследование и разработку SOTA-моделей для сценариев RAG (поиск, ранжирование), классификации (few-shot/zero-shot, guards) и памяти, а также их интеграцию в инфраструктуру инференса. Нас вас будет лежать прямая ответственность за метрики качества моделей, а также за производительность и стабильность бэкендов инференса (в том числе за логирование, мониторинги и покрытие кода тестами). Кроме того, вам предстоит лично участвовать в разработке: писать код (до 30¬–40% времени), проводить код-ревью, помогать с архитектурой и диагностикой проблем, готовить релизы моделей и бэкендов.* Управляли ML-командой от одного года * Глубоко разбираетесь в современном ML (нейросети, трансформеры) с фокусом на NLP, Information Retrieval или Generative AI * Разрабатывали и выводили в продакшен ML-сервисы с высокими требованиями к надёжности и производительности * Уверенно владеете Python и PyTorch * Понимаете полный жизненный цикл ML-модели: от сбора требований и подготовки данных до эксплуатации в проде * Проактивны и способны самостоятельно формировать технический бэклог и roadmap, исходя из продуктовых целей* Использовали опенсорс-проекты и контрибьютили в них (особенно в библиотеки для инференса, такие как TensorRT, TensorRT-LLM, vLLM, SGLang) * Работали с C++ и низкоуровневыми оптимизациями (CUDA) * Работали в распределенной команде * Умеете или хотите выступать на публике, писать технические статьи или вести блог, чтобы повышать внешнюю видимость команды и продукта