Исследовательская группа

Методы машинного обучения в области программной инженерии

Поиск клонов в коде

Руководитель проекта: Тимофей Брыксин
Статус: Активный

Проект по улучшению лексических методов поиска клонов в коде. В проекте реализуется подход, принципиально применимый для любых инструментов, основанных на сравнении токенов: клоны в коде ищутся с различными параметрами поиска, и результаты поисков объединяются. Данный метод подробно рассчитывается и тестируется для двух инструментов — SourcererCC и CloneWorks.

Модифицированная версия SourcererCC на GitHub.

Разработанная техника поиска клонов также используется для комплексного исследования Java-кода на GitHub на предмет плагиата.

Участники

Публикации