Предложен алгоритм построения нечеткого классификатора типа Min-Max с адаптацией параметра максимального размера гипербокса с помощью регрессионной модели. Модель для нахождения параметра разрабатывалась на основе методов машинного обучения. Для этого предложена система из 38 метапризнаков, характеризующих свойства наборов данных и вычисляемых рекуррентно для обеспечения онлайн-обучения. Проведен вычислительный эксперимент построения классификаторов предложенным алгоритмом для решения таких задач кибербезопасности, как обнаружение спама, обнаружение фишинговых сайтов и обнаружение атак на сетевые ресурсы. В задачах обнаружения спама и фишинговых сайтов предлагаемый алгоритм продемонстрировал статистически значимое увеличение точности по сравнению с алгоритмом классификации типа Min-Max без использования регрессионной модели.
Идентификаторы и классификаторы
- SCI
- Образование
- УДК
- 004.85. Обучение
Классификация является ключевой проблемой машинного обучения и анализа данных. Классификатор данных – это алгоритм (отображение), используемый для отнесения данных к предопределенным группам или классам на основе заданных признаков.
Если у вас возникли вопросы или появились предложения по содержанию статьи, пожалуйста, направляйте их в рамках данной темы.
Список литературы
1. Wang W. Towards Data-and Knowledge-Driven AI: A Survey on Neuro-Symbolic Computing / W. Wang, Y. Yang, F. Wu // IEEE Transactions on Pattern Analysis and Machine Intelligence. - 2025. - Vol. 47. - P. 878-899.
2. A comprehensive review of deep neuro-fuzzy system architectures and their optimization methods / N. Talpur, S.J. Abdulkadir, H. Alhussian, M.H. Hasan, N. Aziz, A. Bamhdi // Neural Computing and Applications. - 2022. - Vol. 34. -P. 1837-1875. EDN: WKUGQK
3. Аверкин А.Н. Обзор исследований в области разработки методов извлечения правил из искусственных нейронных сетей / А.Н. Аверкин, С.А. Ярушев // Известия РАН. Теория и системы управления. - 2021. - № 6. - С. 106-121. EDN: WMZFZJ
4. Simpson P.K. Fuzzy min-max neural networks-part 1: Classification // IEEE Transactions on Neural Networks. -1992. - Vol. 3, No. 5. - P. 776-786.
5. Simpson P.K. Fuzzy min-max neural networks-part 2: clustering // IEEE Transactions on Fuzzy Systems. - 1993. -Vol. 1, No. 1. - P. 32-45.
6. Нечеткий классификатор инкрементного обучения типа Min-Max для решения задач кибербезопасности / К.С. Сарин, Р.Е. Коломников, М.О. Светлаков, И.А. Хода-шинский // Научно-техническая информация. - Сер. 2: Информационные процессы и системы. - 2024. - № 9. -С. 11-21. EDN: AQEIHG
7. Khuat T.T. An online learning algorithm for a neuro-fuzzy classifier with mixed-attribute data / T.T. Khuat, B. Gab-rys // Applied Soft Computing. - 2023. - Vol. 137. - P. 110152. EDN: YHHXKU
8. Khuat T.T., Gabrys B. A comparative study of general fuzzy min-max neural networks for pattern classification problems // Neurocomputing. - 2020. - Vol. 386. - P. 110-125. EDN: YOLSRC
9. Kenger O.N. Fuzzy min-max neural networks: a bibliometric and social network analysis / O.N. Kenger, E. Ozceylan // Neural Computing and Applications. - 2023. - Vol. 35. -P. 5081-5111. EDN: SWISZO
10. Bangare S.L. Classification of optimal brain tissue using dynamic region growing and fuzzy min-max neural network in brain magnetic resonance images // Neuroscience Informatics. - 2022. - Vol. 2. - P. 100019. EDN: XBRYGF
11. Quality-aware fuzzy min-max neural networks for dynamic brain network analysis and its application to schizophrenia identification / T. Hou, W. Ding, J. Huang, S. Jiang, H. Yao, T. Zhou, H. Ju // Applied Soft Computing. - 2025. - Vol. 169. -Р. 112538. EDN: UYIHEH
12. A simplified adaptive fuzzy min-max neural network for pattern classification / M. Fu, S. Chen, X. Wei, J. Du, W. Wang, J. Liu // Neurocomputing. - 2025. - Vol. 630. -P. 129668. EDN: QLUUQJ
13. Сарин К.С. Нечеткий классификатор типа Min-Max: обзор // Доклады ТУСУР. - 2023. - Т. 26, № 1. - С. 65-75. EDN: CTAFFF
14. Vanschoren J. Meta-Learning Automated Machine Learning. The Springer Series on Challenges in Machine Learning / J. Vanschoren (eds.), F. Hutter, L. Kotthoff. - Cham, Switzerland: Springer, 2019. - P. 35-61.
15. Коломников Р.Е. Регрессионная модель для прогнозирования размера гипербокса нечеткого классификатора типа Min-Max / Р.Е. Коломников, К.С. Сарин // Электронные средства и системы управления: матер. междунар. науч.-практ. конф.: в 2 ч. - Томск: ТУСУР, В-Спектр (ИП В.М. Бочкарева), 2024. - Ч. 1. - С. 253-256.
16. Hancock J.T. CatBoost for big data: an interdisciplinary review / J.T. Hancock, T.M. Khoshgoftaar // Big Data. - 2020. - Vol. 7. - P. 94. DOI: 10.1186/s40537-020-00369-8 EDN: YFCPII
17. Antoniadis A. Random forests for global sensitivity analysis: A selective review // A. Antoniadis, S. Lambert-Lacroix, J. Poggi / Reliability Engineering & System Safety. - 2021. - Vol. 206. - P. 107312.
18. Omotehinwa T.O. Optimizing the light gradientboosting machine algorithm for an efficient early detection of coronary heart disease / T.O. Omotehinwa, D.O. Oyewola, E.G. Moung // Informatics and Health. - 2024. - Vol. 1, No. 2. -P. 70-81. EDN: NQYVGI
19. Mienye I.D. A survey of decision trees: concepts, algorithms, and applications / I.D. Mienye, N.R. Jere // IEEE Access. - 2024. - Vol. 12. - P. 86716-86727. EDN: KJERHC
20. Hopkins M. Spambase / M. Hopkins, E. Reeber, G. Forman, J. Suermondt / UCI Machine Learning Repository. - 1999 [Электронный ресурс]. - URL: https://ar-chive.ics.uci.edu (дата обращения: 15.05.2025).
21. Vrbancic G. Datasets for phishing websites detection / G. Vrbancic, I. Fister Jr., V. Podgorelec // Data in Brief. - 2020. -Vol. 33. - P. 2352-3409.
22. Moustafa N. UNSW-NB15: a comprehensive data set for network intrusion detection systems / N. Moustafa, J. Slay // Military Communications and Information Systems Conference (MilCIS). - Canberra, Australia: IEEE, 2015. - P. 1-6.
23. Practical incremental learning: Striving for better performance-efficiency trade-off / S. Xu, B. Ni, X. Nie, F. Zhu, Y. Li, J. Chang, G. Meng // Neurocomputing. - 2025. -Vol. 634. - P. 129831. EDN: MYMUCW
24. Demsar J. Statistical comparisons of classifiers // Journal of Machine Learning Research. - 2006. - Vol. 7. - P. 1-30.
Выпуск
Другие статьи выпуска
Работа посвящена применению методов цифрового моделирования для анализа изменений характеристик солнечной батареи космического аппарата в процессе её эксплуатации. Описывается процесс создания модели солнечной батареи с использованием современных инструментов моделирования, включая учёт особенностей функционирования в условиях космического пространства. Приводится методика расчёта освещённости панелей солнечной батареи для околоземных орбит. Для верификации модели проведено сравнение выходных данных моделирования с телеметрическими данными солнечных батарей, находящихся в эксплуатации на реальных космических аппаратах. Особое внимание уделено практическим рекомендациям по применению модели на этапе проектирования и наземных испытаний.
Проведен сравнительный анализ вольтодобавочной и изолированной топологий резонансного LLC-преобразователя с двухполярным выходным напряжением. Установлено, что вольтодобавочная топология позволяет снизить массогабаритные параметры и потери трансформатора, сохраняя при этом требуемые выходные параметры при колебаниях нагрузки. Проведена оценка действующих значений тока резонансных контуров, определяющая статические потери, показывающая увеличение действующего тока резонансного контура вольтодобавочной топологии в 1,5 раза относительно изолированного аналога. Результаты работы свидетельствуют о значительном улучшении массогабаритных показателей с сохранением прежней энергоэффективности предложенного преобразователя по сравнению с классическими изолированными решениями.
Для кластеризации имеющейся выборки статистических данных предложена списочная регрессионная модель, содержащая в каждом уравнении списка полный набор входных переменных. Задача оценивания неизвестных параметров этой модели с помощью метода наименьших модулей сведена к задаче частично булевого линейного программирования. Для контроля количества регрессоров в уравнениях списка оптимизационная задача расширена дополнительными ограничениями. Решение этой задачи позволяет получить наилучший состав входящих в уравнения списка регрессоров, коэффициенты уравнений и правило их переключения. Проведены вычислительные эксперименты, подтвердившие корректность разработанного математического аппарата.
Проводится сравнительный анализ архитектурных особенностей ROS1 и ROS2 применительно к задаче обработки облаков точек LIDAR. Учитывая требования горнодобывающей отрасли к надежности, масштабируемости и устойчивости к отказам, рассмотрены ключевые компоненты обеих версий ROS, их архитектурные различия, ограничения ROS1 и преимущества ROS2. Особое внимание уделено реализации конвейера предобработки LiDAR-данных в ROS2, вопросам интеграции с модулями SLAM и обнаружения объектов, а также проблемам конфигурации DDS и настройки QoS. Также рассматриваются сложности, возникающие при переходе с ROS1 на ROS2, и предлагаются рекомендации по их преодолению, включая использование мостов для совместной работы узлов. Представленные результаты могут быть полезны при проектировании надежных и эффективных систем управления беспилотными транспортными средствами в условиях карьеров и других сложных производственных сред.
Проведён технический анализ трёх типов аналогово-цифровых преобразователей (АЦП) поразрядного взвешивания: классический АЦП, нейронный самомаршрутизирующийся АЦП (НС АЦП) и НС АЦП с модулем расширенной внутренней диагностики (НС АЦП МРВД). Рассмотрены особенности каждого варианта, включая время преобразования, точность преобразования, возможность многоканального преобразования сигналов, динамическое изменение разрядности и диагностику точности. Показано, что как НС АЦП, так и НС АЦП МРВД позволяют обеспечить требуемую скорость получения данных в контуре управления (4 мс на цикл для приведенного примера) без использования внешнего мультиплексора, а внедрение МРВД сокращает число отдельных измерений на ~25% при сохранении полного объёма информации и повышает быстродействие измерительной подсистемы.
Рассматриваются принципы построения и внедрения программного комплекса «SZMK», предназначенного для цифровизации бизнес-процесса производства металлических конструкций. Предложено архитектурное решение, реализующее сквозное цифровое сопровождение проектной документации на всех этапах жизненного цикла - от моделирования 3D-конструкций до их архивирования, передачи в производство и синхронизации с ERP-системой. Описаны реализованные модули, включающие инструменты верификации моделей, маршрутизации чертежей, автоматической идентификации и визуализации степени готовности изделий. Особое внимание уделено механизму унификации проектных элементов, направленному на сокращение дублирования и стандартизацию проектных решений. Проведён анализ функциональных возможностей системы и её роли в формировании единого информационного пространства предприятия. Представленные решения демонстрируют эффективность цифровой трансформации процессов управления проектной информацией в условиях реального производства.
Представлен расширенный сравнительный анализ современных программных средств, предназначенных для моделирования различных процессов и систем в широком диапазоне областей - от физики, химии и математики до электротехники и систем управления. Рассматриваются как коммерческие, так и открытые программные платформы, включая COMSOL Multiphysics, Ansys Fluent, MatLab/Simulink, OpenFOAM, DWSIM, LTSpice и др. Особое внимание уделено классификации систем моделирования по области применения, типу лицензирования, уровню абстракции и используемым парадигмам моделирования. Статья подробно анализирует особенности и архитектуру двух российских систем моделирования - МАРС и SimInTech, их функциональные возможности, интеграционные решения, лицензирование, документацию и области применения. Выполнен сравнительный анализ этих отечественных решений с зарубежными аналогами, выявлены их преимущества, недостатки и потенциальные ниши применения. Также обсуждаются ключевые тенденции в развитии средств моделирования, включая рост значимости открытого программного обеспечения, развитие цифровых двойников, интеграцию с ИИ и облачными платформами, а также стандартизацию через такие инициативы, как Modelica, FMI и CAPE-OPEN. Статья представляет интерес как для исследователей и инженеров, так и для преподавателей и студентов технических направлений.
ГРАФОВЫЕ МОДЕЛИ, КОРРЕЛЯЦИЯ ИНЦИДЕНТОВ, ИНФОРМАЦИОННАЯ БЕЗОПАСНОСТЬ, SOC, SIEM, EDR, NTA, CVSS, MITRE ATT&CK, TF-IDF, АВТОМАТИЗАЦИЯ АНАЛИЗА, АНАЛИЗ ИНЦИДЕНТОВ
Проблема восстановления изображений в условиях пониженной видимости остаётся актуальной, и для её решения разработано множество методов, однако универсального решения, одинаково эффективного для всех условий съёмки, не существует. Выполнен сравнительный анализ алгоритмов CLAHE, Retinex, физической модели тёмного канала (DCP) и нейросетевого подхода DehazeNet. Качество восстановленных изображений оценивалось по метрике BRISQUE, позволяющей объективно сравнивать результаты при отсутствии эталонных данных. Тестирование на реальных изображениях показало, что метод тёмного канала стабильно обеспечивает лучшие значения метрики среди рассматриваемых подходов, подтверждая свою универсальность и надёжность для практических приложений компьютерного зрения в условиях тумана и дымки.
Рассматриваются процесс управления и проблемы проектной деятельности в университете. Приводятся результаты моделирования и разработки информационной системы, обеспечивающей, помимо традиционного учета проектов, участников и результатов, внедрение методов отслеживания уровня готовности продуктов, учета сквозной проектной деятельности в рамках дисциплин и анализа проектной деятельности по различным критериям.
Рассмотрены основные задачи автоматизации и управления технологическим процессом экстракционной очистки актиноидов, а также представлен подход к моделированию экстракционной колонны в формате метода блочно-компонентных цепей (МБКЦ) в среде моделирования МАРС (моделирование и автоматический расчет систем) и автоматизации экстракционного процесса с учетом различных воздействий. При моделировании колонного аппарата для описания экстракционного процесса за основу была взята диффузионная модель, позволяющая учитывать условия массопереноса. Полученные результаты подтверждают возможность использования метода блочно-компонентных цепей для моделирования сложных химико-технологических систем и аппаратов с последующей интеграцией модели в автоматизированную систему управления (АСУ) для оптимизации и повышения эффективности технологических процессов.
Представлена новая методика идентификации автора программного кода, основанная на multi-view-подходе. Целью исследования является повышение точности и устойчивости идентификации авторства за счет объединения различных представлений программного кода: исходного кода, абстрактного синтаксического дерева, графа потока управления и дизассемблированного кода. Для построения моделей использовались современные методы машинного обучения, позволяющие интегрировать и анализировать комплексные признаки из разных источников. Нроведенные эксперименты показали, что разработанная multi-view-архитектура обеспечивает значительное улучшение качества идентификации по сравнению с традиционными подходами, использующими только одно представление кода. Так, на задачах с закрытым множеством авторов достигнуты значения точности и F1 -макро до 0,97, а на открытых множествах отмечена высокая устойчивость к появлению новых авторов и вариативности стилей программирования. В задаче верификации автора комплексные признаки позволили достичь точности до 0,98 и снизить EER до 0,04.
Возникновение аварийных ситуаций на предприятиях приводит к прекращению или ослаблению рабочего потока, что несёт экономические убытки независимо от того, насколько быстро аварии устранены. Следовательно, возможность заранее предупредить возникновение подобных ситуаций будет крайне востребована во многих отраслях экономики. В работе реализован подход к подготовке данных из БД SCADA-системы. используя алгоритм вычисления средних значений параметров за единицу времени и корреляционный анализ. На подготовленных данных обучена модель машинного обучения, использующая реализацию метода случайного леса для классификации текущего состояния участка технологического объекта как предаварийной для симуляции работы реальной системы в потоковом режиме. Получившаяся модель без тонкой настройки и оптимизации гиперпараметров показала высокие значения точности предсказания и других метрик, что позволяет говорить о возможности использования моделей машинного обучения для решения задачи.
Статья раскрывает нормативную базу работы государственной системы, направленной на выявление, предотвращение и устранение последствий кибератак на информационные ресурсы Российской Федерации. Автором представлена нотация процесса обнаружения таких атак в соответствии с серией стандартов ГОСТ 59709-59712. Предложена модификация методики выявления компьютерных атак, которая в отличие от существующих подходов, основанных на сигнатурном анализе, включает использование алгоритмов машинного обучения. В результате исследования сформулирована гибридная методика выявления компьютерных инцидентов, которая содержит формализованную нотацию процессов, обеспечивающую соответствие требованиям национальных стандартов и механизмы предиктивного анализа на основе машинного обучения.
Нефтегазовая индустрия Российской Федерации - мощный драйвер развития экономики страны - напрямую зависит от скорости ввода в эксплуатацию новых месторождений по добыче полезных ископаемых. Снижение точности прогнозирования объемов добычи углеводородов российскими компаниями является следствием ухудшения качества их ресурсной базы. В данном исследовании оценивается эффективность прогностических моделей на основе машинного обучения для прогнозирования объемов добычи углеводородов. Изложен метод обучения прогностических моделей нейронных сетей, включающий в себя массив геолого-физических и проектных показателей разработки месторождений нефти и газа. Восстановлены недостающие геолого-геофизические данные при помощи различных методов аугментации.
Рассматривается разработка интерактивного лабораторного комплекса (ИЛК) для полигона учебных лабораторий, интегрирующего реальные установки, виртуальные модели и учебно-методические сервисы. Предлагается многоуровневая архитектура полигона и ИЛК, включая объектный, логический и визуальный уровни, среду моделирования МАРС, информационную систему управления лабораторией и микроконтроллерную часть. Демонстрационный пример с аппаратом воздушного охлаждения иллюстрирует взаимодействие цифрового двойника и реального объекта. Анализ показал, что ИЛК сочетает преимущества физических и виртуальных лабораторий, обеспечивая доступность и достоверность обучения.
Рассматриваются современные методы усовершенствования и адаптации полярных кодов, класса помехоустойчивых кодов, обладающих теоретически доказанной способностью приближаться к пределу Шеннона. Полярные коды были стандартизированы в 5G NR для управляющих каналов и рассматриваются в качестве одного из перспективных кандидатов для использования в системах связи 6G благодаря их высокой эффективности, гибкости и масштабируемости. Кратко изложены основные принципы построения полярных кодов, включая процесс поляризации каналов и базовые алгоритмы декодирования. Представлена реализация полярных кодов в спецификациях 5G, включая процедуры сегментации, добавления циклического избыточного кода (Cyclic Redundancy Check, CRC), перемежения и согласование скоростей. Далее рассмотрены современные направления развития полярных кодов: усовершенствованные схемы декодирования, в том числе с применением алгоритма распространения доверия и быстрого упрощенного последовательного исключения, коды на основе мультиядер, адаптация к условиям многолучевых каналов, а также подходы на базе нейронных сетей, направленные на оптимизацию декодеров и конструкций кодов под конкретные условия передачи. В заключении обсуждаются проанализированные методы, существующие проблемы и открытые вопросы, а также перспективы дальнейшего развития полярных кодов в контексте требований будущих беспроводных систем связи.
Представлены этапы разработки монолитных интегральных схем отражающего и поглощающего типа SPDT-переключателей, работающих в широкой полосе частот от 10 МГц до 67 ГГц, изготовленных на технологии 0,1 мкм GaAs-pHEMT. Описаны схемы переключателей, процесс моделирования и экспериментальное исследование микросхем. Представлено сравнение полученных параметров с текущим уровнем техники на различных технологиях. Предложен способ увеличения развязки переключателей с показателем более 32 дБ и с обеспечением значения вносимых потерь в открытом канале менее 3,4 дБ в диапазоне частот: 0,01-67 ГГц.
Издательство
- Издательство
- ТУСУР
- Регион
- Россия, Томск
- Почтовый адрес
- 634050, Томская обл, г Томск, пр-кт Ленина, д 40
- Юр. адрес
- 634050, Томская обл, г Томск, пр-кт Ленина, д 40
- ФИО
- Рулевский Виктор Михайлович (РЕКТОР)
- E-mail адрес
- schkarupo.anastasia@yandex.ru
- Контактный телефон
- +7 (902) 7689232
- Сайт
- https://tusur.ru/ru