Исследовательская группа

Методы машинного обучения в области программной инженерии

Исследование нарушений лицензирования на GitHub

Руководитель проекта: Тимофей Брыксин
Статус: Активный

В данном проекте производится комплексное исследование плагиата в Java-коде на GitHub на уровне методов. Проект состоит из трёх частей: сбор обширного (1.5 Тб) корпуса Java-репозиториев, поиск в нём клонов (с использованием техники, предложенной в соответствующем проекте) и непосредственно анализа клонов на предмет плагиата и нарушения условий лицензирования. В проекте подробно исследуются найденные лицензии и отношения между ними, а найденные похожие фрагменты кода также ранжируются по вероятности нарушения лицензий.

Страница проекта на GitHub.

Участники

Публикации