Руководитель группы рантайма в Алису
Алиса решает задачи пользователей с помощью LLM. Мы учим модели работать друг с другом, превращая их в агентов. Планируем создать новый единый рантайм, который сможет поддерживать как долгие агентские задачи, так и запросы, требующие мгновенного ответа.Проектировать архитектуру Алисы и разрабатывать рантайм
Алиса должна уметь работать как с долгими задачами (десятки минут), так и с быстрыми запросами (сотни миллисекунд), причём единообразно и без лишнего оверхеда.
Алиса должна оставаться надёжной, эффективной и масштабируемой, обрабатывать десятки тысяч RPS.
Алиса работает с разнообразными видами входных данных: файлами, картинками, голосом, текстом.
Рантайм позволяет прокачивать и принимать и систему в целом, и любой компонент (модели, тулы, агенты), траектории пишутся в единых терминах.
Архитектура должна быть прозрачной и понятной.
Больше о бэкенде в Яндексе — в канале Yandex for Backend* Умеете проектировать высоконагруженные серверные системы с жёсткими требованиями к latency и стабильности * Понимаете, как строятся асинхронные пайплайны с большим количеством сетевых вызовов (оркестрация LLM, tool’ов и внешних вызовов) * Разрабатывали распределённые системы, где важно управление состоянием, потоками данных и отказоустойчивостью * Готовы писать на C++* Работали с Temporal или другой системой оркестрации * Интересуетесь LLM и представляете, как они работают
Алиса должна уметь работать как с долгими задачами (десятки минут), так и с быстрыми запросами (сотни миллисекунд), причём единообразно и без лишнего оверхеда.
Алиса должна оставаться надёжной, эффективной и масштабируемой, обрабатывать десятки тысяч RPS.
Алиса работает с разнообразными видами входных данных: файлами, картинками, голосом, текстом.
Рантайм позволяет прокачивать и принимать и систему в целом, и любой компонент (модели, тулы, агенты), траектории пишутся в единых терминах.
Архитектура должна быть прозрачной и понятной.
Больше о бэкенде в Яндексе — в канале Yandex for Backend* Умеете проектировать высоконагруженные серверные системы с жёсткими требованиями к latency и стабильности * Понимаете, как строятся асинхронные пайплайны с большим количеством сетевых вызовов (оркестрация LLM, tool’ов и внешних вызовов) * Разрабатывали распределённые системы, где важно управление состоянием, потоками данных и отказоустойчивостью * Готовы писать на C++* Работали с Temporal или другой системой оркестрации * Интересуетесь LLM и представляете, как они работают