Исследовательская группа

Методы машинного обучения в области программной инженерии

Embeddings of Code Changes

Руководитель проекта: Тимофей Брыксин
Статус: Активный

Целью данного проекта является построение явных векторных представлений изменений программного кода, которые смогут эффективно кодировать ключевую информацию о самом изменение, и тем самым позволят задавать семантические трансформации над ним. Предлагаемый подход рассматривает программный код как последовательность токенов. Модель может быть обучена без учителя, что позволяет в дальнейшем предобучить нейронную сеть на большом количестве данных. Оценка подхода производится на задачах генерации сообщений к коммитам, классификации стабильных изменений и применении изменений к программному коду.