Нейронные сети (НС) являются эффективным инструментом решения трудно формализуемых задач, что сделало их незаменимым инструментом для их решения. Однако методики информационной защиты в данной области всё ещё не имеют достаточного уровня защиты, что делает их уязвимыми для киберпреступников. В данной статье исследуются состязательные атаки на НС, их особенности, а также предлагается новая методика обнаружения состязательных атак.
Современные генеративные языковые модели активно используются для автоматической генерации исходного кода, что приводит к необходимости разработки методов его обнаружения. Однако создание наборов данных для определения сгенерированного кода остается затруднительной задачей. В данной работе проводится анализ существующих наборов данных с выявлением их ограничений. Разработан авторский набор данных, включающий решения задач в виде кода на языке программирования Python, написанные людьми и сгенерированные современными языковыми моделями. Проведена экспериментальная оценка с использованием методов машинного обучения. Результаты демонстрируют перспективность предложенного набора, но указывают на необходимость его дальнейшего расширения или же проведения новых экспериментов для подбора наилучшей модели.
Применение систем искусственного интеллекта на основе методов машинного обучения в критически важных проблемных областях связано с высокими рисками и требует объяснения человеку полученного результата. Прогностические модели, обладающие таким свойством, называются интерпретируемыми. Отсутствие такой возможности снижает уровень доверия к результату и может быть причиной замедления общественного принятия и внедрения таких систем. Системы искусственного интеллекта на основе нечетких систем позволяют объяснить результат своего решения. Благодаря наличию базы продукционных правил они способны выражать знания в ориентированной на человека форме, используя термины естественного языка. Предложена методика построения нечетких классификаторов, направленная на улучшение интерпретируемости с учетом недостатков известных методов построения. Методика включает в себя применение алгоритмов смешанной многокритериальной оптимизации, дискретной оптимизации, градиентного спуска и метода разделения данных. Проведен эксперимент на 38 общедоступных наборах данных из различных проблемных областей для оценки эффективности классификаторов, построенных с помощью предлагаемой методики. Проведено статистическое сравнение с известными интерпретируемыми классификаторами - генетическими нечеткими системами FARC-HD и деревьями решений CART. Применение методики позволило при сопоставимой точности статистически значимо повысить интерпретируемость классификаторов путем уменьшения числа правил, числа признаков и общего числа нечетких терминов по сравнению с генетическими системами FARC-HD и числа правил и числа условий в правиле по сравнению с классификаторами на основе деревьев решений CART. Достигнутые результаты свидетельствуют о высоком уровне интерпретируемости классификаторов, построенных с помощью предлагаемой методики.
Возникновение аварийных ситуаций на предприятиях приводит к прекращению или ослаблению рабочего потока, что несёт экономические убытки независимо от того, насколько быстро аварии устранены. Следовательно, возможность заранее предупредить возникновение подобных ситуаций будет крайне востребована во многих отраслях экономики. В работе реализован подход к подготовке данных из БД SCADA-системы. используя алгоритм вычисления средних значений параметров за единицу времени и корреляционный анализ. На подготовленных данных обучена модель машинного обучения, использующая реализацию метода случайного леса для классификации текущего состояния участка технологического объекта как предаварийной для симуляции работы реальной системы в потоковом режиме. Получившаяся модель без тонкой настройки и оптимизации гиперпараметров показала высокие значения точности предсказания и других метрик, что позволяет говорить о возможности использования моделей машинного обучения для решения задачи.
Статья раскрывает нормативную базу работы государственной системы, направленной на выявление, предотвращение и устранение последствий кибератак на информационные ресурсы Российской Федерации. Автором представлена нотация процесса обнаружения таких атак в соответствии с серией стандартов ГОСТ 59709-59712. Предложена модификация методики выявления компьютерных атак, которая в отличие от существующих подходов, основанных на сигнатурном анализе, включает использование алгоритмов машинного обучения. В результате исследования сформулирована гибридная методика выявления компьютерных инцидентов, которая содержит формализованную нотацию процессов, обеспечивающую соответствие требованиям национальных стандартов и механизмы предиктивного анализа на основе машинного обучения.