Разработчик систем параллельных вычислений на GPU/NPU в Автономный транспорт
Мы создаём систему распознавания и прогнозирования для автономного транспорта. Чтобы ускорить её работу, используем алгоритмы машинного обучения — и их число постоянно растёт. Если вы увлекаетесь оптимизацией и распараллеливанием алгоритмов, хорошо знаете C++ и Python — ждём вас в команде!Повышение эффективности алгоритмов
Вам предстоит оптимизировать алгоритмы, учитывая аппаратные особенности платформ, автоматизировать тестирование алгоритмов и их адаптацию к платформе. Работа с платформами для вычислений
Вы будете исследовать современные платформы исполнения параллельных вычислений и подбирать оптимальную архитектуру параллельного исполнения алгоритмов на конкретной платформе. Больше о бэкенде в Яндексе — в канале Yandex for Backend* Работали с PyTorch (или TensorFlow), конвертировали ML-модели в ONNX и запускали на TensorRT, ONNX Runtime, TFLite или любом другом фреймворке * Использовали CUDA/OpenCL, оптимизировали и распараллеливали вычисления на CUDA/OpenCL или других архитектурах ускорителей * Хорошо знаете C++, Python * Уверенно владеете классическими структурами данных и алгоритмами * Знакомы с линейной алгеброй, теорией вероятностей * Можете объяснять свои решения и отстаивать их перед оппонентами * Умеете работать в команде* Решали прикладные задачи с помощью машинного обучения или Deep Learning * Писали кастомные плагины для ONNX, TensorRT или любого другого фреймворка с использованием C++, CUDA, OpenCL * Знакомы с методами сжатия, прунинга, квантизации нейросетей * Разбираетесь в дискретной математике и теории оптимизации * Хорошо знаете STL * Имеете опыт индустриальной разработки, не связанной с машинным обучением
Вам предстоит оптимизировать алгоритмы, учитывая аппаратные особенности платформ, автоматизировать тестирование алгоритмов и их адаптацию к платформе. Работа с платформами для вычислений
Вы будете исследовать современные платформы исполнения параллельных вычислений и подбирать оптимальную архитектуру параллельного исполнения алгоритмов на конкретной платформе. Больше о бэкенде в Яндексе — в канале Yandex for Backend* Работали с PyTorch (или TensorFlow), конвертировали ML-модели в ONNX и запускали на TensorRT, ONNX Runtime, TFLite или любом другом фреймворке * Использовали CUDA/OpenCL, оптимизировали и распараллеливали вычисления на CUDA/OpenCL или других архитектурах ускорителей * Хорошо знаете C++, Python * Уверенно владеете классическими структурами данных и алгоритмами * Знакомы с линейной алгеброй, теорией вероятностей * Можете объяснять свои решения и отстаивать их перед оппонентами * Умеете работать в команде* Решали прикладные задачи с помощью машинного обучения или Deep Learning * Писали кастомные плагины для ONNX, TensorRT или любого другого фреймворка с использованием C++, CUDA, OpenCL * Знакомы с методами сжатия, прунинга, квантизации нейросетей * Разбираетесь в дискретной математике и теории оптимизации * Хорошо знаете STL * Имеете опыт индустриальной разработки, не связанной с машинным обучением