Статья: МЕТОДИКА ИДЕНТИФИКАЦИИ АВТОРА ИСХОДНОГО КОДА ПРОГРАММЫ НА ОСНОВЕ MULTI-VIEW-ПРЕДСТАВЛЕНИЙ (2025)

Читать онлайн

Представлена новая методика идентификации автора программного кода, основанная на multi-view-подходе. Целью исследования является повышение точности и устойчивости идентификации авторства за счет объединения различных представлений программного кода: исходного кода, абстрактного синтаксического дерева, графа потока управления и дизассемблированного кода. Для построения моделей использовались современные методы машинного обучения, позволяющие интегрировать и анализировать комплексные признаки из разных источников. Нроведенные эксперименты показали, что разработанная multi-view-архитектура обеспечивает значительное улучшение качества идентификации по сравнению с традиционными подходами, использующими только одно представление кода. Так, на задачах с закрытым множеством авторов достигнуты значения точности и F1 -макро до 0,97, а на открытых множествах отмечена высокая устойчивость к появлению новых авторов и вариативности стилей программирования. В задаче верификации автора комплексные признаки позволили достичь точности до 0,98 и снизить EER до 0,04.

Ключевые фразы: программное обеспечение, ИСХОДНЫЙ КОД, дизассемблер, графовое представление, АВТОРСТВО, верификация
Автор (ы): Куртукова Анна Владимировна (Kurtukova A. V.)
Журнал: ДОКЛАДЫ ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА СИСТЕМ УПРАВЛЕНИЯ И РАДИОЭЛЕКТРОНИКИ

Предпросмотр статьи

Идентификаторы и классификаторы

SCI
Образование
УДК
004.85. Обучение
Для цитирования:
КУРТУКОВА А. В. МЕТОДИКА ИДЕНТИФИКАЦИИ АВТОРА ИСХОДНОГО КОДА ПРОГРАММЫ НА ОСНОВЕ MULTI-VIEW-ПРЕДСТАВЛЕНИЙ // ДОКЛАДЫ ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА СИСТЕМ УПРАВЛЕНИЯ И РАДИОЭЛЕКТРОНИКИ. 2025. Т. 28 № 3
Текстовый фрагмент статьи
Моя история просмотров (10)
Будьте первым, кто начнет обсуждение

Если у вас возникли вопросы или появились предложения по содержанию статьи, пожалуйста, направляйте их в рамках данной темы.