ПРОГРАММНЫЕ ПРОДУКТЫ И СИСТЕМЫ
Архив статей журнала
Исследуется контроль стабильности многопараметрического технологического процесса, когда через определенные промежутки времени проводится мониторинг множества показателей этого процесса. При мониторинге рассеяния коррелированных показателей применяется алгоритм обобщенной дисперсии. В статье предложен подход, основанный на поиске оптимальных параметров этого алгоритма по критерию минимума затрат, связанных с контролем. Для мониторинга стабильности показателей процесса и выявления нарушений с целью его своевременной корректировки используется статистический контроль - широко распространенный метод диагностики и управления технологическими процессами. При контроле многопараметрического процесса часть его показателей коррелированы, в этом случае для контроля среднего уровня применяют карты Хотеллинга, а для контроля многомерного рассеяния - алгоритм обобщенной дисперсии. Для минимизации параметров алгоритма обобщенной дисперсии использованы три численных метода оптимизации. Программа написана на языке Python. В работе предложена методика и разработана соответствующая программа для оптимизации параметров многомерного статистического контроля рассеяния процесса по критерию минимизации затрат, связанных с контролем частоты взятия выборок (интервала между выборками), объема выборки и положения контрольных границ. Применение этой методики проиллюстрировано на примере данных конкретного технологического процесса: получены численные значения параметров контроля и ожидаемые затраты. Многомерный статистический контроль применяется как для мониторинга стабильности технологических процессов (например, механической обработки, производства лекарств, контроля качества очистки питьевой воды), так и для диагностики функционирования систем различного назначения (например, вибраций гидроагрегата). Этим объясняются актуальность и практическая значимость исследований.
Предметом данного исследования является технический объект, работа которого определяется множеством факторов, а качество функционирования характеризуется некоторым показателем. Требуется построить математическую модель, связывающую этот показатель со значениями факторов. В качестве примера исследуется влияние различных факторов на эффективность работы горелочных устройств (нагрузки, расхода воздуха, метана и биогаза, составов топлива и окислителя и других). Эффективность (качество функционирования) горелочного устройства оценивается по температуре дымовых газов. Задача решается методами машинного обучения, поскольку классические методы регрессионного анализа показали недостаточную точность. В настоящей статье исследуется эффективность метода опорных векторов, случайного леса и бустинга деревьев решений. Для численных расчетов использована локализованная версия 13.3 системы Statistica. Все три подхода машинного обучения показали существенное повышение точности модели на тестовой выборке. Наилучшие результаты в рассматриваемом примере дал метод бустинга деревьев решений. Рекомендуемая технология построения модели, обеспечивающая необходимую точность прогнозирования, сводится вначале к апробации классического регрессионного анализа (если полученная модель обеспечит необходимую точность, то она предпочтительна с точки зрения ее интерпретируемости). При недостаточной точности используются три рассмотренных метода машинного обучения, вместе с тем важен подбор параметров каждого из них, который, с одной стороны, обеспечивал бы необходимую точность, а с другой - не приводил бы к переобучению модели. Полученная модель может быть использована для оценки влияния различных факторов на эффективность работы технического объекта, а также для прогнозирования качества его функционирования, в частности, температуры дымовых газов.