Цель исследования: разработка методики аналитической обработки больших массивов данных сервисов и приложений в сетях последнего поколения для обнаружения инцидентов кибербезопасности и построения устойчивых систем защиты на основе состязательного машинного обучения. Метод исследования: анализ современных методов машинного обучения и нейросетевых технологий, синтез и формализация алгоритмов состязательных атак на модели машинного обучения. Результат исследования: в статье предложена методика построения устойчивой системы защиты от состязательных атак в беспроводных самоорганизующихся сетях последнего поколения. Формализованы основные виды состязательных атак, в том числе отравляющие атаки и атаки уклонения, а также описаны методы генерации состязательных примеров на табличные, текстовые и визуальные данные. Проведена генерация нескольких сценариев и исследовательский анализ наборов данных с помощью эмулятора DeepMIMO. Выделены потенциальные прикладные задачи бинарной классификации и прогнозирования затухания сигнала между пользователем и базовой станцией для проведения состязательных атак. Представлена алгоритмизация процессов построения и обучения устойчивой системы от состязательных атак в беспроводных сетях последнего поколения на примере эмулируемых данных.Научная новизна: представлена методика аналитической обработки больших массивов эмулируемых данных сервисов и приложений для обнаружения инцидентов кибербезопасности, которая обеспечивает задел в области исследования вопросов безопасности сложных интеллектуальных сервисов и приложений в инфраструктуре беспроводных сетей последнего поколения.
Настоящая научная статья посвящена разработке и перспективам внедрения новых методов наноскопического анализа органических структур с применением искусственного интеллекта (ИИ). Обзор существующих методов, таких как сканирующая туннельная микроскопия и атомно-силовая микроскопия, выявляет их преимущества и ограничения. В статье подробно рассматриваются перспективы внедрения ИИ для автоматизации и улучшения процессов анализа, включая распознавание структур, классификацию типов и определение свойств материалов. Обсуждаются преимущества, такие как повышение точности и скорости анализа, а также вызовы, связанные с обучением моделей на ограниченных данных.
Научная статья рассматривает актуальные методы машинного обучения для предсказания химических реакций и оптимизации условий синтеза. Сфера химического синтеза является ключевой в науке и промышленности, и внедрение методов машинного обучения представляет собой инновационный подход к решению сложных проблем в этой области. Статья обсуждает применение графовых нейронных сетей, рекуррентных нейронных сетей и генеративных моделей для предсказания реакций с высокой точностью. Также рассматриваются методы оптимизации условий синтеза, основанные на машинном обучении, с акцентом на предсказании оптимальных параметров реакции.
Рассмотрены вопросы, связанные с автоматизацией процедуры синтеза систем прикладной фотограмметрии. Такие системы служат для измерения и учета объектов по изображениям и в настоящее время широко применяются в различных областях деятельности, таких как картографирование, археология и аэрофотосъемка. Широкому применению также способствует повышение доступности и мобильности устройств для получения изображений. Все это обусловило проведение активных исследований, направленных на разработку методического обеспечения для систем прикладной фотограмметрии. Отслеживание в ручном режиме появления новых методов и алгоритмов фотограмметрической обработки информации для широкой номенклатуры областей применения достаточно затруднительно, что делает актуальной автоматизацию данной процедуры. Предлагаемое в статье решение основано на использовании базы знаний о методах обработки информации в системах прикладной фотограмметрии, основными элементами которой являются нечеткая онтология предметной области и база данных, что логично, т.к. информация о предметной области может быть достаточно легко структурирована. В качестве основы для онтологии было взято существующее решение, которое было дополнено на основе результатов анализа текущего состояния предметной области. Полученная онтология далее использована для поиска и классификации методов обработки информации в системах прикладной фотограмметрии и заполнения базы знаний. В связи с активизацией разработки новых методов обработки информации в системах прикладной фотограмметрии возникает необходимость модификации онтологии и пополнения базы данных, т. е. пополнения базы знаний. Важным источником информации для этого является Интернет. Для автоматизации поиска данных о методах обработки информации и пополнения базы знаний целесообразно использовать большие языковые модели, благодаря которым упрощается решение нескольких задач в области обработки естественного языка, которые включают кластеризацию и формирование новых сущностей для классификации. Соответствующий метод описан в статье. Для метода приведены результаты тестирования его работоспособности. В рамках решения задач проведён сравнительный анализ больших языковых моделей, в результате которого была вобрана модель RoBERTa.
Целью данной работы является решение проблемы внеплановых отказов подшипников качения, установленных на промышленном оборудовании, в результате их неправильного обслуживания в процессе эксплуатации. Известно, что до 50% всех внеплановых простоев промышленного оборудования происходит по причине разрушения подшипников. При этом основной причиной отказа подшипников являются нарушения режима смазки тел качения: избыточное и недостаточное количество смазочных материалов. Эти причины составляют до 36% от общего числа отказов подшипников. В процессе эксплуатации оборудования выявить и предупредить все проблемы со смазкой подшипников очень сложно, по причине большого разнообразия факторов, влияющих на их возникновение. Поэтому, актуальной задачей для исследования, становится разработка автоматизированной рекомендательной системы для управления сервисным обслуживанием промышленного оборудования, с контролем смазки подшипниковых узлов. В работе рассматривается метод классификации состояний подшипников в зависимости от их диагностических параметров: показателей виброскорости, виброускорения и температуры. С этой целью применяются алгоритмы классического машинного обучения: модели KNN, RandomForestClassifier и SVM. Для каждой модели определяются гиперпараметры, позволяющие достигать максимальных результатов во время обучения. В процессе проведения исследования выполнен анализ влияния каждого из диагностических параметров - признаков на показатели работы модели классификации. Понимание, какой показатель работы подшипника будет наиболее важным, позволит выбирать приборы контроля состояния оборудования на производственном предприятии осознанно, для решения конкретных производственных задач. Разработанный алгоритм позволяет качественно, с 98% точностью, производить оценку состояния смазки подшипников качения и выдавать рекомендации по проведению своевременного сервисного обслуживания оборудования. Модель - классификатор планируется использовать в составе комплекса по контролю за техническим состоянием оборудования, расширяя возможности диагностики: помимо сведений о вероятности отказа оборудования и прогнозных сроках службы, комплекс диагностики, совмещенный с предлагаемой моделью, позволит воздействовать на ходимость подшипников, путем улучшения качества их смазки.
Сложные социогуманитарные системы - это разновидность систем, которые изучаются в социологии, антропологии, экономике, политологии, и других гуманитарных науках. Эти системы характеризуются сложностью взаимодействий между их составляющими элементами, которые могут быть как людьми (индивидами, группами), так и культурными, социальными, экономическими и политическими аспектами. Например, общество как социогуманитарная система состоит из различных элементов, таких как люди, культура, институты, ценности и так далее. Они взаимодействуют между собой, образуя сложную сеть связей и влияний, которая определяет поведение и развитие общества. Чтобы лучше понять такие системы, используются различные подходы, включая системный анализ, социальную сетевую теорию, теорию сложности и другие методы. Эти подходы помогают выявить основные закономерности в функционировании сложных социогуманитарных систем и предсказать их развитие в будущем. В данной статье рассматриваются подходы к выявлению причинно-следственных связей, выделяются основные требования к построению этих связей в контексте сложных социогуманитарных систем, имеющих дело, в основном, со слабоструктурированной информацией, часто в виде естественного языка и текстов. Были определены слабые и сильные стороны выявленных подходов, а также рассмотрены примеры использования современных методов построения графов на разных задачах: выявление рисков в бизнесе, анализ социальных явлений, выявление наличия причинности в текстах. Исследование показало, что наиболее продуктивными являются методы машинного обучения, например языковые модели для извлечения знаний из текста в совокупности с нейросетевыми технологиями и графовым представлениями знаний. Они требуют уверенных знаний математики, статистики и программирования, как минимум на языке Python, имеющих самую внушительную инструментальную поддержку для решения задач машинного обучения. Также, выявление причинности основывается не только на корреляции, но и на других методах, таких как тест Грейнджера, используемый для анализа временных рядов.
Изменение свойств материала в процессе физико-механической обработки может существенно снизить рабочий ресурс производимого изделия, поэтому важно осуществлять контроль качества поверхностного слоя деталей. Для решения данной задачи на подшипниковых предприятиях применяются такие методики неразрушающего контроля, как травление, визуальный, капиллярный, магнитопорошковый, ультразвуковой, вибрационный, вихретоковый методы. Рассматриваются физические основы представленных методик, приводится их сравнительный анализ. Для автоматизации обработки результатов методов неразрушающего контроля поверхностного слоя деталей подшипников в рамках концепции «Индустрия 4.0» могут применяться машинное зрение и подходы цифровой обработки сигналов. С точки зрения производительности и возможности интеграции в производственную систему наиболее перспективным является вихретоковый метод, результатом контроля поверхности данным способом является массив цифровых значений. Развитие современных методов анализа информации позволяет эффективно обрабатывать большое количество данных, а машинное обучение позволяет решать задачи классификации, регрессии и т. д. Приводится методологическое обеспечение разработки и применения автоматизированной системы вихретокового контроля с использованием методов машинного обучения и интеллектуального анализа данных. Рассматриваются работы ученых, посвященные обработке результатов вихретокового контроля различных объектов, в том числе деталей подшипников, отмечается, что ранее не было уделено внимание вопросу обоснованного выбора модели машинного обучения для распознавания дефектов поверхности деталей. Показана возможность применения метода медианной полировки для преобразования вихретокового сигнала. Разработка и внедрение системы распознавания дефектов подшипников на основе методологического обеспечения, представленного в данной работе, могут существенно повысить эффективность контроля качества изделий и оптимизировать технологический процесс.
Нефтехимические заводы оснащены множеством приборов и большим количеством датчиков, которые собирают данные измерений для управления и мониторинга процесса. В то же время исследователи начали использовать большие объемы данных для построения прогнозных моделей, которые назвали виртуальными датчиками. Предложен анализ применения виртуальных датчиков в рамках процесса гидроочистки дизельных фракций. Представлена разработанная авторами классификация виртуальных датчиков, которая помогает определить и выбрать инструменты для мониторинга, что способствует повышению точности, гибкости и эффективности контрольных механизмов производства. Детально изложена процедура разработки виртуальных датчиков, подчеркивается их потенциал как стратегического актива, способного усилить технологическую продуктивность и улучшить конкурентоспособность предприятий. Также освещается разработка структурной схемы системы управления для процесса гидроочистки дизельных фракций, демонстрирующей интеграцию и применение виртуальных датчиков для совершенствования указанного процесса.
В статье показаны возможности применения методов машинного обучения для построения и анализа системы аутентификации на основе динамики нажатий клавиш. В работе обоснована необходимость улучшения многофакторной системы аутентификации. Предложен способ классификации работ поведенческой биометрии для сравнения и использования результатов исследований. Рассмотрены базовые возможности обработки и генерирования динамических и статических признаков динамики нажатий клавиш. Протестированы различные комбинации наборов признаков и выборок обучения, описана лучшая комбинация с равной частой ошибок (Equal Error Rate) 4,7%. Итеративный анализ качества системы позволяет установить важность первых символов последовательности ввода, а также нелинейную взаимосвязь степени ранжирования модели и EER. Высокие показатели, достигнутые бустинговой моделью, свидетельствуют о значительном потенциале поведенческой аутентификации для дальнейшего улучшения, развития и применения. Приводится значимость данного метода, его практическая полезность не только в задаче аутентификации, перспективы развития, включая использование нейросетевых методов и анализ динамики данных. Несмотря на достигнутые результаты, отмечается необходимость дальнейшей работы над моделью, включая разработку дополнительных моделей кластеризации, классификации, изменение набора признаков и построение каскада. Подчеркивается важность исследуемой области, способной принести значительный вклад в развитие информационной безопасности и технологий.
В статье показаны возможности применения семантического анализа постов пользователей социальной сети ВКонтакте для мониторинга и прогнозирования депрессии. Подчеркивается серьезность проблемы депрессии, ее негативное влияние на здоровье и социум, а также актуальность ранней диагностики и помощи. В работе также обоснована необходимость и перспективы анализа данных русскоязычных социальных сетей для предотвращения развития депрессии у пользователей. В статье предложен подход, который позволяет проводить анализ текстовых данных и использовать логистическую регрессию для классификации пользователей по наличию депрессии. Результаты исследования показывают высокую точность модели с использованием логистической регрессии, что представляет потенциал для автоматизации процессов выявления и поддержки пользователей, страдающих депрессией по данным пользовательской информации в социальных сетях. Также приводится значимость данного метода, его практическая полезность для персонализированных интервенций, преимущества и перспективы развития, включая использование нейросетевых методов и анализ динамики данных. Несмотря на достигнутые результаты, отмечается необходимость дальнейшей работы над моделью, включая изучение других методов машинного обучения и учет изменений в психическом состоянии пользователя со временем. Развитие методов прогнозирования депрессии на основе данных социальных сетей, предложенных в статье, является важным направлением, способным принести значительный вклад в области психологии, здравоохранения и информационных технологий.
В работе рассмотрены методы определения авторства любительских сочинений по мотивам популярных произведений литературы и кинематографа. Данные для проведения исследования включают тексты 5 самых популярных тематик онлайн-библиотеки Ficbook. Наиболее распространенной является задача атрибуции с закрытым набором. Относительно практических задач можно предполагать, что не всегда истинный автор анонимного текста будет присутствовать в списке кандидатов. Поэтому процесс определения автора рассматривался как усложненная модификация классической задачи классификации - приведению к виду открытого множества авторов. Предложенные методы основаны на авторской комбинации fastText и One-Class SVM с отбором информативных признаков и статистических оценках мер сходства векторных представлений. Статистические методы оказались наименее эффективны даже для простого, кросс-тематического, случая, в котором данные методы уступают в точности одноклассовому SVM до 15 %. Для той же кросс-тематической задачи средняя точность авторской методики на основе совместного применения fastText и One-Class SVM составляет 85 %. В сложном случае внутри тематической классификации авторов точность представленной методики варьируется от 75 до 78 % в зависимости от тематической группы
В работе рассмотрены методы определения авторства естественных и искусственно-сгенерированных текстов, важных в контексте кибербезопасности и защиты интеллектуальной собственности с целью предотвращения дезинформации и мошенничества. Использование методов определения автора текста обосновано выводами об эффективности рассмотренных в прошлых исследованиях fastText и метода опорных векторов (SVM). Алгоритм отбора признаков выбран на основе сравнения пяти различных методов - генетического алгоритма, прямого и обратного последовательных методов, регуляризационного отбора и метода Шепли. Рассмотренные алгоритмы отбора включают эвристические методы, элементы теории игр и итерационные алгоритмы. Наиболее эффективным методом признан алгоритм, основанный на регуляризации, в то время как методы, основанные на полном переборе, признаны неэффективными для любого множества авторов. Точность отбора на основе регуляризации и SVM в среднем составила 77 %, что превосходит другие методы от 3 до 10 % при идентичном количестве признаков. При тех же задачах средняя точность fastText - 84 %. Было проведено исследование, направленное на устойчивость разработанного подхода к генеративным образцам. SVM оказался более устойчив к запутыванию модели. Максимальная потеря точности для fastText составила 16 %, а для SVM - 12 %.