Data engineer в команду GigaChat (TTS)
Наша команда отвечает за качество моделей TTS в GigaChat – той части нейросети, которая занимается звуком. Сейчас мы ищем ребят, которые будут работать над базовым качеством, мультимодальным Гигачатом и другими классными проектами.
_Первый этап отбора на эту вакансию – общение с AI-рекрутером. После отклика вам на почту и в чат на платформе HeadHunter придет приглашение пройти первичное интервью с ГигаРекрутером в Telegram. Диалог займёт примерно 10 минут. Его задача — уточнить недостающие детали и ускорить рассмотрение вашей кандидатуры. ГигаРекрутер только начинает свой путь, поэтому просим относиться с пониманием. Ваш опыт и участие помогут сделать его удобным и полезным!_Писать пайплайны обработки аудио/видео данных.
Хотим обрабатывать десятки тысяч часов в день на кластере
инферить опенсорсные и внутренние модели на гпу (денойзер, распознавание, тулы для оценки качества аудио)
поддержка сетевого хранилища данных* python и алгоритмы на хорошем уровне
* опыт с multithreading и multiprocess
* опыт обучения и/или инференса тяжелых моделей на нескольких гпу
* s3, dvc, git* гибридный или удаленный формат работы
* ежегодный пересмотр зарплаты и годовая премия
* корпоративный спортзал и зоны отдыха
* более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
* расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
* гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
* бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров