Старший LLM-разработчик в команду Нейро

Нейро — это большой технологический проект, который объединяет LLM, LLM-агентов, ассистентов и поиск по веб-документам. Мы ищем LLM-разработчика, который усилит это направление. Приходите, если хорошо знаете Python, классические DL и NLP, решали NLP-задачи с использованием трансформеров.Создание и улучшение реворд-моделей
Для обучения генеративных моделей с помощью RL критически важно иметь хорошие реворды, которые умеют автоматически оценивать соответствие ответов требуемым свойствам. Мы обучаем дискриминативные и генеративные реворд-модели, используем все доступные современные методы для улучшения их качества: SFT, RL, ризонинг. Эта работа напрямую влияет на улучшение качества ответов для пользователей. Обучение LLM-асессора
Мы стремимся сделать процесс оценки качества ответов более эффективным и точным. Вы будете работать над созданием LLM-агентов, которые будут помогать человеку с фактчекингом и разметкой данных, благодаря чему эти процессы станут быстрее, дешевле и даже качественнее. Сжатие и удешевление LLM-асессора и реворд-моделей
Для обучения сильных LLM нужно большое количество данных, а значит, нам нужно запускать много процессов разметки и обучения. Вам предстоит экспериментировать с архитектурами и методами уменьшения моделей и ускорения инференса, чтобы все наши пайплайны сходились быстрее. Подробнее про [Alice AI](https://ya.ru/ai/aliceai#section-llm)* Знаете Python * Хорошо разбираетесь в классических DL и NLP * Решали NLP-задачи с использованием трансформеров * Понимаете, как устроены современные LLM, решали с их помощью прикладные задачи или имеете релевантный исследовательский опыт

Similar jobs