Senior Deep learning researcher engineer, sequence models (команда B2C)

Наша команда занимается исследованием и разработкой больших нейронных сетей на данных банка. Мы сфокусированы на создании новой модельной платформы: исследуем архитектуры, способы обучения и представления данных, чтобы построить универсальную большую мультимодальную модель на различных источниках клиентских сигналов. Тебе предстоит присоединиться к небольшой сильной команде, которая работает на стыке representation learning, sequence modeling, multimodality и foundation-моделей на финансовых данных и цифровых следах клиентов. У нас много данных, серьезные вычислительные ресурсы и редкая возможность не адаптировать чужие идеи, а формировать собственное направление исследований.* Проводить research полного цикла: формулировать сильные гипотезы, проектировать эксперименты, глубоко анализировать результаты и на их основе принимать решения о том, куда двигать модель дальше * Искать и прорабатывать направления улучшения больших моделей: новые источники данных, архитектурные решения, objective-функции, режимы обучения, способы объединения разнородных сигналов и подходы к мультимодальному обучению * Определять вектор развития направления: помогать коллегам в выборе решений, формировать и приоритизировать исследовательский backlog, удерживать высокий темп экспериментов и поддерживать техническую целостность работы команды * Автоматизировать исследовательскую рутину, превращая эксперименты в воспроизводимые пайплайны, удобные инструменты и инфраструктуру, которая позволяет быстро и качественно проверять гипотезы.* Сильный опыт работы в DS/ML/DL, желательно в роли senior researcher, staff-level individual contributor или tech lead * Отличное понимание современных deep learning подходов, прежде всего transformer-based архитектур, representation learning и практики обучения больших моделей * Отличное знание PyTorch (must, это то, без чего ты не сможешь работать) * Практический опыт distributed training больших моделей на терабайтных объемах данных: multi-GPU / multi-node обучение, эффективная загрузка и подготовка данных, оптимизация скорости и стабильности обучения * Опыт самостоятельного ведения исследований: от постановки гипотез и дизайна экспериментов до интерпретации результатов и выбора следующего исследовательского шага * Опыт работы с неидеальными, разнородными и масштабными данными и умение превращать их в работающие обучающие постановки. Будет плюсом: * Опыт работы с большими языковыми моделями, мультимодальными моделями, sequence modeling или representation learning на пользовательских событиях * Опыт обучения моделей на больших объемах слабоструктурированных данных, включая финансовые данные, клиентские события и цифровые следы * Опыт неформального или формального техлидства: помощь коллегам, формирование backlog исследований, приоритизация направлений и удержание высокого качества исследовательской работы команды * Сильный трек-рекорд в исследованиях: заметные результаты, open-source, ML-соревнования или другие подтверждения исследовательской силы * Опыт с distributed training, инфраструктурой экспериментов, data pipelines и инструментами, которые ускоряют цикл экспериментов * Навыки работы с генеративными AI-моделями; опыт создания AI-агентов и использования их в работе * Опыт использования GigaChat, Kandinsky и аналогов впродуктах, навыки создания и использования AI-агентов * Инструментальное владение AI для анализа, генерации и автоматизации.* Комфортный современный офис рядом с м. Кутузовская * Формат работы - гибрид * Ежегодный пересмотр зарплаты, годовая премия * Корпоративный спортзал и зоны отдыха * Более 400 образовательных программ СберУниверситета для профессионального и карьерного развития * Расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа * Гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ * Бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров * Вознаграждение за рекомендацию друзей в команду Сбера.

Similar jobs