Lead Deep Learning/CUDA Engineer (GigaChat)

Мы — команда GigaChat, создающая и развивающая core-технологию генеративной языковой модели. Наша система умеет писать тексты, видеть изображения и даже ловить вайб в коде. Она отвечает на вопросы, ведёт диалоги, сочиняет стихи и рассказы, генерирует бизнес-идеи, пишет письма и многое другое. Недавно мы выпустили крутую русскоязычную модель GigaChat MAX 2 уровня GPT-4 , а ещё научили её слушать. Сейчас мы расширяем команду отдела production-внедрения. Мы развиваем инфраструктуру инференса больших языковых моделей: раскатка моделей, стабильность сервисов, производительность, cost optimization, взаимодействие с продуктовыми командами и эксплуатацией.* низкоуровневая оптимизация работы с «железом» * работа над инфраструктурой для нагрузок на кластеры и балансировки запросов * вывод новых архитектур в продуктив.* опыт работы в области глубокого обучения, в том числе с LLM * глубокое знание CUDA и Python * опыт использования GigaChat, Kandinsky и аналогов в продуктах * навыки создания и использования AI-агентов.* комфортный современный офис рядом с м. Кутузовская * возможность выбрать удобный график – офис/гибрид/удаленка (в РФ) * годовая премия * корпоративный спортзал и зоны отдыха * более 400 образовательных программ СберУниверситета для профессионального и карьерного развития * расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа * ипотека для сотрудников по дисконтной прогамме * бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров * вознаграждение за рекомендацию друзей в команду Сбера.

Similar jobs