Статья: МЕТОДЫ ОТБОРА ПРИЗНАКОВ В ЗАДАЧЕ ОПРЕДЕЛЕНИЯ АВТОРСТВА В КОНТЕКСТЕ КИБЕРБЕЗОПАСНОСТИ

Скачать

В работе рассмотрены методы определения авторства естественных и искусственно-сгенерированных текстов, важных в контексте кибербезопасности и защиты интеллектуальной собственности с целью предотвращения дезинформации и мошенничества. Использование методов определения автора текста обосновано выводами об эффективности рассмотренных в прошлых исследованиях fastText и метода опорных векторов (SVM). Алгоритм отбора признаков выбран на основе сравнения пяти различных методов - генетического алгоритма, прямого и обратного последовательных методов, регуляризационного отбора и метода Шепли. Рассмотренные алгоритмы отбора включают эвристические методы, элементы теории игр и итерационные алгоритмы. Наиболее эффективным методом признан алгоритм, основанный на регуляризации, в то время как методы, основанные на полном переборе, признаны неэффективными для любого множества авторов. Точность отбора на основе регуляризации и SVM в среднем составила 77 %, что превосходит другие методы от 3 до 10 % при идентичном количестве признаков. При тех же задачах средняя точность fastText - 84 %. Было проведено исследование, направленное на устойчивость разработанного подхода к генеративным образцам. SVM оказался более устойчив к запутыванию модели. Максимальная потеря точности для fastText составила 16 %, а для SVM - 12 %.

Информация о документе

Формат документа: PDF
Кол-во страниц: 1 страница
Загрузил(а): Романов Александр
Лицензия: —
Доступ: Всем

Информация о статье

EISSN: 2310-6018
Журнал: МОДЕЛИРОВАНИЕ, ОПТИМИЗАЦИЯ И ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ
Год публикации: 2024
Автор(ы): Романов А. С.
Ключевые фразы: ОТБОР ПРИЗНАКОВ, ОПРЕДЕЛЕНИЕ АВТОРА, машинное обучение, нейронные сети, АНАЛИЗ ТЕКСТА, информационная безопасность
УДК: 004.89. Прикладные системы искусственного интеллекта. Интеллектуальные системы, обладающие знаниями

Статистика просмотров

Статистика просмотров статьи за 2025 - 2026 год.

Ранее вы смотрели (10)

01. Статья: ДИСКУРСИВНЫЕ АСПЕКТЫ ПОСТЧЕЛОВЕЧЕСКИХ КОММУНИКАЦИЙ

02. Статья: ИСПОЛНИТЕЛЬСКАЯ ДЕЯТЕЛЬНОСТЬ ЕЛЕНЫ ГИЛЕЛЬС (К 75-ЛЕТИЮ СО ДНЯ РОЖДЕНИЯ)

03. Книга: О стиле Льва Толстого. «Диалектика души» в «Войне и мире». Монография

04. Статья: РАЗРАБОТКА МЕТОДА РЕШЕНИЯ ЗАДАЧИ ДЕФОРМАЦИИ ЛЕДЯНОГО ПОКРОВА ПОД ДЕЙСТВИЕМ ПРОИЗВОЛЬНО ДВИЖУЩЕЙСЯ НАГРУЗКИ

05. Статья: ОБЗОР МИРОВОГО РЫНКА СЕЛЕНА И ТЕЛЛУРА (Экономика селена и теллура)

06. Статья: ВСЕРОССИЙСКАЯ НАУЧНАЯ КОНФЕРЕНЦИЯ "ФОЛЬКЛОР - ЛИТЕРАТУРА - НАРОДНАЯ КУЛЬТУРА", ПОСВЯЩЕННАЯ ЮБИЛЕЮ ПРОФЕССОРА ННГУ КЛАРЫ ЕВГЕНЬЕВНЫ КОРЕПОВОЙ

07. Статья: КИНЕТИЧЕСКИЕ СВОЙСТВА НЕРАВНОВЕСНЫХ СИСТЕМ. ЧЕТВЕРТОЕ НАЧАЛО ТЕРМОДИНАМИКИ

08. Статья: ПРОЕКТНАЯ ДЕЯТЕЛЬНОСТЬ КАК СРЕДСТВО РАЗВИТИЯ ЛЮБОЗНАТЕЛЬНОСТИ У СТАРШИХ ДОШКОЛЬНИКОВ

09. Статья: ЛЕКЦИЯ-ВИЗУАЛИЗАЦИЯ ПО ВЫСШЕЙ МАТЕМАТИКЕ В ТЕХНИЧЕСКОМ ВУЗЕ

10. Статья: АНАЛИЗ ПОТРЕБИТЕЛЬСКОГО СПРОСА РОССИЯН В УСЛОВИЯХ САНКЦИОННОГО ДАВЛЕНИЯ

Будьте первым, кто начнет обсуждение

Если у вас возникли вопросы или появились предложения по содержанию статьи, пожалуйста, направляйте их в рамках данной темы.

Создать тему для обсуждения

Все права на тексты и товарные знаки принадлежат их законным владельцам. Подробнее...

Сайт https://scinetwork.ru (далее – Сайт) представляет собой платформу, на которой пользователи самостоятельно добавляют и публикуют метаинформацию о материалах разных видов (названия, обложки, аннотации, данные об авторах и т.п.). Администрация Сайта не занимается самостоятельным сбором или первоначальной публикацией этих сведений.

Модерация контента

На Сайте действует постмодерация. Это означает, что материалы, добавляемые пользователями, становятся общедоступными сразу после публикации и проверяются Администрацией Сайта постфактум в разумные сроки.

Использование информации

Администрация Сайта не использует метаданные и обложки документов в коммерческих или рекламных целях для продвижения товаров или услуг и не заявляет о каких-либо правах на представленные объекты интеллектуальной собственности. Все права на документы и сопутствующие материалы принадлежат их законным правообладателям.

Отказ от гарантий

Администрация Сайта не гарантирует точность, полноту и достоверность метаинформации, размещенной пользователями, поскольку не осуществляет ее предварительную проверку.

Ответственность

Сайт носит исключительно информационно-справочный характер. Администрация Сайта не несет ответственности за содержание и достоверность информации, добавленной пользователями, а также за любые убытки, возникшие в связи с использованием или невозможностью использования Сайта и размещенной на нем информации.