Разработчик рантайма в Алису

Мы хотим создать гомогенный рантайм Алисы на агентском стеке, который сможет обрабатывать быстрые запросы (сотни миллисекунд) и многошаговые задачи (десятки минут) без потери эффективности и надёжности. Вы будете участвовать в проектировании и разработке такого рантайма и влиять на работу Алисы в целом.Проектирование архитектуры Алисы
Вам предстоит проектировать прозрачную и понятную архитектуру. Алиса должна работать единообразно с долгими задачами (десятки минут) и с быстрыми запросами (сотни миллисекунд), причём без лишнего оверхеда. Входные данные: файлы, картинки, голос, текст. Разработка и поддержка высоконагруженного рантайма
Вы будете разрабатывать и поддерживать рантайм, который позволяет прокачивать и принимать систему в целом и любой её компонент (модели, тулы, агенты). Алиса должна обрабатывать десятки тысяч RPS и при этом оставаться надёжной (мы держим 9999), эффективной и масштабируемой. Больше о бэкенде в Яндексе — в канале Yandex for Backend* Разрабатывали распределённые системы, в которых важно управление состоянием, потоками данных и отказоустойчивостью * Умеете проектировать высоконагруженные серверные системы с жёсткими требованиями к latency и стабильности * Понимаете, как строятся асинхронные пайплайны с большим количеством сетевых вызовов (оркестрация LLM, тулов и внешних вызовов) * Готовы писать на C++* Работали с Temporal или другой системой оркестрации * Интересуетесь LLM и представляете, как они работают

Similar jobs