Статья: МЕТОДЫ ОТБОРА ПРИЗНАКОВ В ЗАДАЧЕ ОПРЕДЕЛЕНИЯ АВТОРСТВА В КОНТЕКСТЕ КИБЕРБЕЗОПАСНОСТИ
В работе рассмотрены методы определения авторства естественных и искусственно-сгенерированных текстов, важных в контексте кибербезопасности и защиты интеллектуальной собственности с целью предотвращения дезинформации и мошенничества. Использование методов определения автора текста обосновано выводами об эффективности рассмотренных в прошлых исследованиях fastText и метода опорных векторов (SVM). Алгоритм отбора признаков выбран на основе сравнения пяти различных методов - генетического алгоритма, прямого и обратного последовательных методов, регуляризационного отбора и метода Шепли. Рассмотренные алгоритмы отбора включают эвристические методы, элементы теории игр и итерационные алгоритмы. Наиболее эффективным методом признан алгоритм, основанный на регуляризации, в то время как методы, основанные на полном переборе, признаны неэффективными для любого множества авторов. Точность отбора на основе регуляризации и SVM в среднем составила 77 %, что превосходит другие методы от 3 до 10 % при идентичном количестве признаков. При тех же задачах средняя точность fastText - 84 %. Было проведено исследование, направленное на устойчивость разработанного подхода к генеративным образцам. SVM оказался более устойчив к запутыванию модели. Максимальная потеря точности для fastText составила 16 %, а для SVM - 12 %.
Информация о документе
- Формат документа
 - Кол-во страниц
 - 1 страница
 - Загрузил(а)
 - Лицензия
 - —
 - Доступ
 - Всем
 
Информация о статье
- EISSN
 - 2310-6018
 - Журнал
 - МОДЕЛИРОВАНИЕ, ОПТИМИЗАЦИЯ И ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ
 - Год публикации
 - 2024
 
Статистика просмотров
Статистика просмотров статьи за 2025 год.