Рассматривается сравнительный анализ методов построения виртуальных анализаторов с использованием робастной регрессии, гребневой регрессии, метода ортогональных проекций на скрытые структуры на основе ядра (англ. K-OPLS), метода чередующихся условных математических ожиданий (англ. ACE) и нейросетей прямого распространения. Данные модели в составе виртуальных анализаторов предназначены для оценки значений точек фракционного состава керосиновой фракции - продукта колонны фракционирования - в режиме реального времени. В ходе построения моделей рассмотрен вопрос усреднения значений входных переменных за определенный промежуток времени для привязки к значениям выходных переменных. В отличие от существующих работ, в данном исследовании обучение и тестирование моделей осуществляется на ограниченных по значениям выходной переменной сегментах данных, т. е. в условиях пропусков данных в обучающей выборки. Показано влияние ширины интервала усреднения значений входной переменной на точность оценки получаемых моделей. Также показано, что наименьшее значение средней абсолютной ошибки при оценке точек фракционного состава обеспечивают модели на основе нейронных сетей и K-OPLS при различных вариантах обучения и тестирования.
Идентификаторы и классификаторы
- SCI
- Математика
В химической технологии нефтепереработка – один из самых нагруженных процессов с точки зрения компонентного состава входящих и выходящих из аппаратов потоков, что сильно усложняет управление технологическим процессом (ТП) и контроль качества выпускаемой продукции. Системы управления и мониторинга современных установок нефтепереработки позволяют отслеживать и изменять множество показателей качества продуктов ТП [1]. С целью обеспечения выпуска всех выделяемых фракций с требуемым составом осуществляется лабораторный контроль, периодичность которого редко превышает 1–2 раза в сутки. В ходе лабораторного анализа зачастую определяются точки фракционного состава (ФС): температура начала кипения и температуры выкипания определенных объемных долей смеси углеводородов
Список литературы
1. Kadlec, P. Data-driven soft sensors in the process industry / P. Kadlec, B. Gabrys, S. Strandt // Computers and Chemical Engineering. 2009. - Vol. 33, iss. 4. - P. 795-814. DOI: 10.1016/j.compchemeng.2008.12.012
2. Iplik, E. Hydrocracking: a perspective towards digitalization / E. Iplik, I. Aslanidou, K. Kyprianidis // Sustainability (Switzerland). 2020. - Vol. 12, iss. 17. - 26 p. 10.3390/ su12177058. DOI: 10.3390/su12177058 EDN: UTDPFA
3. The role of artificial intelligence-driven soft sensors in advanced sustainable process industries: A critical review / Y.S. Perera, D.A.A.C. Ratnaweera, C.H. Dasanayaka, C. Abeykoon // Engineering Applications of Artificial Intelligence. 2023. - Vol. 121, iss. 105988. - 24 p. DOI: 10.1016/j.engappai.2023.105988 EDN: SSUWCV
4. King, M. Process control. A practical approach / M. King // Wiley. - 2016. - 2 Ed. - 623 p.
5. Data-driven prediction of product yields and control framework of hydrocracking unit / Z. Pang, P. Huang, C. Lian, C. Peng, X. Fang, H. Liu // Chemical Engineering Science. 2024. - Vol. 283, iss. 119386 - 10 p. DOI: 10.1016/j.ces.2023.119386 EDN: KNTXJG
6. A layer-wise data augmentation strategy for deep learning networks and its soft sensor application in an industrial hydrocracking Process / X. Yuan, C. Ou, Y. Wang, C. Yang, W. Gui // IEEE Trans Neural Netw Learn Syst. 2021. - Vol. 32, iss. 8. - P. 3296-3305. 10.1109/ TNNLS.2019.2951708. DOI: 10.1109/TNNLS.2019.2951708 EDN: VCNNXT
7. Rani, A. Development of soft sensor for neural network based control of distillation column / A. Rani, V. Singh, J.R.P. Gupta // ISA Transactions. 2013. - Vol. 52, iss. 3. - P. 438-449. DOI: 10.1016/j.isatra.2012.12.009
8. Wang, Y. A two-layer ensemble learning framework for data-driven soft sensor of the diesel attributes in an industrial hydrocracking process / Y. Wang, D. Wu, X. Yuan // Journal of Chemometrics. 2019. - Vol. 33, iss. 12. - 14 p. DOI: 10.1002/cem.3185 EDN: CRRSIV
9. Popoola, L.T. A Review of an expert system design for crude oil distillation column using the neural networks model and process optimization and control using genetic algorithm framework / L.T. Popoola, G. Babagana, A.A. Susu // Advances in Chemical Engineering and Science. 2013. - Vol. 3, iss. 2. - P. 164-170. DOI: 10.4236/aces.2013.32020
10. Soft-sensor design for a crude distillation unit using statistical learning methods / A. Urhan, N.G. Ince, R. Bondy, B. Alakent // Computer Aided Chemical Engineering. 2018. - Vol. 44. - P. 2269-2274. DOI: 10.1016/B978-0-444-64241-7.50373-6
11. Kano, M. The state of the art in advanced chemical process control in Japan / M. Kano, M. Ogawa // IFAC Proceedings Volumes. 2009. - Vol. 7, iss. 1. - P. 10-25. 10.3182/ 20090712-4-TR-2008.00005. DOI: 10.3182/20090712-4-TR-2008.00005
12. Hinich, M.J. A simple method for robust regression / M.J. Hinich, P.P. Talwar // Journal of the American Statistical Association. 1975. - Vol. 70, iss. 349. - P. 113-119. 10.1080/ 01621459.1975.10480271. DOI: 10.1080/01621459.1975.10480271
13. Дрейпер, Н. Прикладной регрессионный анализ / Н. Дрейпер, Г. Смит. - М.: Финансы и статистика, 1986. - Кн. 2. - 351 с.
14. Alheety, M.I. Choosing ridge parameters in the linear regression model with AR(1): A comparative simulation study / M.I. Alheety, B.M.G. Kibria // International Journal of Statistics and Economics. - 2011. - Vol. 7, iss. 11. - 18 p.
15. Khalaf, G. Choosing ridge parameter for regression problems / G. Khalaf, G. Shukur // Communications in statistics - Theory and Methods. 2005. - Vol. 34, iss. 5. - P. 1177-1182. DOI: 10.1081/STA-200056836
16. K-OPLS package: kernel-based orthogonal projections to latent structures for prediction and interpretation in feature space / M. Bylesjo, M. Rantalainen, J. K. Nicholson, E. Holmes, J. Trygg // BMC Bioinformatics. 2008. - Vol. 9, iss. 106. - 7 p. DOI: 10.1186/1471-2105-9-106 EDN: KYZHCD
17. Correlating Bacharach Opacity in Fuel Oil Exhaust. Prediction of the Operating Parameters that Reduce It / M. Blanco, J. Coello, S. Maspoch, A. Puigdomenech, X. Peralta, J.M. Gonzalez, J. Torres // Oil & Gas Science and Technology. - 2000. - Vol. 55, iss. 5. - P. 533-541. : 2000040. DOI: 10.2516/ogst
18. Wang, D. Identifying nonlinear relationships in regression using the ACE Algorithm / D. Wang, M. Murphy // Journal of Applied Statistics. 2005. - Vol. 32, iss. 3. - P. 243-258. DOI: 10.1080=02664760500054517.
19. Li, Yang. On hyperparameter optimization of machine learning algorithms: theory and practice / Yang Li, Abdallah Shami. // Neurocomputing. 2020. - Vol. 415. - P. 295-316. DOI: 10.1016/j.neucom.2020.07.061 EDN: LGLMYN
20. ASTM D86 - 23. Standard test method for distillation of petroleum products at atmospheric pressure // American National Standard. ASTM International. - 2023. - 22 p.
Выпуск
Другие статьи выпуска
Работа посвящена использованию методов математического моделирования для разработки методического подхода к оценке эффективности организаций, деятельность которых связана с инновационным развитием. Раскрывается особенность инновационного развития и определяется роль организаций, участвующих в научно-технической политике государства. В результате анализа отображаются основные виды организаций инновационной инфраструктуры, их функциональное назначение и поддержка со стороны органов исполнительной власти. Теоретической частью исследования является формирование сводного перечня показателей эффективности деятельности организаций инновационной инфраструктуры с целью дальнейшего использования в практической составляющей работы. На основании ранее проведенного исследования обосновывается выбор математического инструментария для разработки методики оценки, который предусматривает использование теории нечетких множеств и нечеткой логики, метода анализа иерархии, анализа временных рядов. Перечисленный набор методов моделирования применяется с точки зрения комплексности объекта исследования: учитываются количественные и качественные показатели, расставляются приоритеты задействованным переменным, принимаются во внимание проанализированные внешние факторы влияния. Такой подход позволяет повысить объективность результатов оценки. В качестве примера предлагаемый методический подход используется для оценки одного из элементов инновационной инфраструктуры. Подчеркивается необходимость комплексной оценки и уточняется практическая применимость предлагаемого подхода. Методика может быть использована органами государственной власти для целесообразного распределения финансовых ресурсов и других мер стимулирования организаций инновационной инфраструктуры. Также методика применима для внутреннего аудита деятельности рассмотренных в работе элементов с целью выработки рекомендаций по повышению собственной эффективности.
Исследуется проблема разницы между требованиями к проекту в отношении сроков окончания, а именно повышение эффективности принятия решений в проектном управлении относительно вероятных сроков окончания проекта. На основе математических моделей, без специальных допущений относительно природы проекта показано, что задачи минимизации среднего значения длительности проекта, его наиболее вероятной продолжительности, медианного срока выполнения, а также такого срока, который гарантирует выполнение проекта с заданной вероятностью, не сводимы друг к другу и требуют различных управленческих решений. Сделан вывод, что популярные в проектном управлении математические модели, которые сводят неопределенность в сроках к единственному параметру, неадекватно отражают эту разницу в требованиях и могут быть усовершенствованы, чтобы их практические следствия были прозрачнее для проектных менеджеров, а также, что при принятии решений в рамках управления реальными проектами следует конкретизировать требования заказчика и однозначно определять, какой из сроков для него является ключевым. В результате исследования доказано, что в рамках любого достаточно сложного проекта всегда существуют такие управленческие решения, которые будут оправданы с точки зрения минимизации среднего срока, но приведут к увеличению медианного или наиболее вероятного срока завершения.
Представлен анализ различных методов прогнозирования спроса для телекоммуникационной компании «Триколор» с использованием как статистической модели SARIMA, так и современных подходов, включая XGBoost и рекуррентные нейронные сети. Исследование охватывает применение этих методов для оценки будущих изменений спроса на тарифные планы, учитывая сезонные колебания и другие влияющие факторы. Освещены вопросы настройки моделей, выбора параметров, а также вызовы и решения, связанные с каждым из методов, чтобы повысить точность прогнозов. Работа подчеркивает значимость интеграции разнообразных методов прогнозирования в стратегическое планирование и оперативное управление компанией в условиях рыночной конкуренции и изменчивости потребительских предпочтений. Результаты могут быть использованы для формирования гибких стратегий управления спросом и оптимизации предложений компании.
Исследование направлено на разработку подходов управления рисками сокращения продолжительности жизни. Оценка рисков сокращения продолжительности жизни рассматривается как основа управления санитарно-гигиеническим благополучием населения. Разработаны алгоритмы управления и модели оценки риска сокращения продолжительности жизни с использованием контекстных диаграмм. Рассмотрена количественная модель оценки рисков сокращения продолжительности жизни, учитывающая характеристики негативных факторов окружающей среды и фоновые показатели здоровья населения территорий. Расчетные коэффициенты модели адаптированы к специфике данных санитарно-гигиенического мониторинга территорий РФ. Выполнена оценка рисков сокращения продолжительности жизни населения Сибирского федерального округа по четырем возрастным группам от воздействия загрязнения атмосферного воздуха диоксидом азота, являющегося одним из самых распространенных загрязняющих веществ. Оценка рисков выполнялась для болезней системы кровообращения и органов дыхания, характеризующихся наибольшей зависимостью состояния здоровья от влияния факторов окружающей среды. Выполнено сопоставление полученных значений рисков для населения Сибирского федерального округа с рисками для населения стран Европы. Наибольшее значение рисков сокращения продолжительности жизни получены для женщин в возрастной группе 75 лет и мужчин в возрасте от 60 до 74 лет. Предложены мероприятия по управлению рисками сокращения продолжительности жизни.
Рассматривается применение нейронных сетей для детектирования пространственных ключевых точек человека при выполнении спортивных упражнений. Технология детекции ключевых точек позволяет отслеживать движения спортсменов в реальном времени, проводить глубокий анализ их техники и автоматизировать выполнение упражнений. Это помогает тренерам выявлять слабые места и совершенствовать навыки спортсменов. Основное внимание уделено методам 2D- и 3D-детекции ключевых точек, их применению в спорте и анализу эффективности. Приводятся результаты 3D-детекции ключевых точек для спортсмена выполняющего упражнение.
Основная задача факторного анализа - это выявление неявных факторов, объясняющих связи между наблюдаемыми переменными. Это дает возможность получить более полное и точное представление об изучаемых явлениях и процессах, что позволяет установить скрытые закономерности и тенденции, которые далеко не всегда возможно определить при визуальном анализе данных. Эти скрытые переменные могут быть использованы для упрощения данных и понимания основных механизмов, лежащих в основе изучаемого явления. Количественная оценка влияния каждой переменной на результат с помощью математических методов может быть выполнена с использованием различных подходов и инструментов. Приводится краткий обзор основного инструментария. Выбор конкретного метода зависит от характера данных, целей исследования и доступных ресурсов. Известно, что основным недостатком факторного анализа является невыполнение переместительного (коммуникативного) закона умножения, что объясняется возникновением неразложимого остатка. Неразложимый остаток объясняется тем, что рассматриваемая модель не полностью учитывает все факторы, влияющие на изучаемое явление, а поэтому вариация признака не будет определяться только рассматриваемыми факторами, то есть останется какая-то часть, не распределенная между факторами. В связи с этим величина влияния факторов на изменение результативного показателя меняется в зависимости от места, на которое поставлен тот или иной фактор в детерминированной модели. С увеличением числа факторов-сомножителей резко возрастает количество равноправных вариантов расчетов, так как увеличивается число возможных перестановок факторов. Таким образом, вариантов расчета степени влияния факторов на результирующий показатель достаточно много и выбор способа расчета зависит от целей исследования. При этом следует отметить, что количество вариантов, рассматриваемых возможных перестановок факторов можно уменьшить за счет агрегирования некоторых факторов. Важно только четко обосновать экономический смысл такого агрегированного показателя. Это обстоятельство дает возможность построения процедуры, позволяющей оценить неразложимый остаток. В статье рассматривается методика оценки неразложимого остатка. Величина неразложимого остатка может быть определена как разность данных, полученных в двух формах расчета, между значениями показателя в мультипликативной модели, где этот показатель стоит на последнем месте, и по другому способу расчета, где этот же фактор поставлен на первое место. Показано, что в ходе проведения факторного анализа имеется инвариантная константа, не зависящая от способа расчета. Приводится также способы уменьшения размерности исходной задача за счет агрегирования исходных факторов. Важно только четко обосновать экономический смысл такого агрегированного показателя. В статье приводится пример трехфакторной модели производительности труда, когда результативный показатель будет определяться тремя факторами: фондоотдачей, механовооруженностью рабочих и долей рабочих в общей численности предприятия. За счет объединения первых двух факторов в один произошла редукция задачи к двухфакторной модели производительности труда, зависящей от двух факторов: средней выработки рабочих и доли рабочих в общей численности работников предприятия.
Представлены основные особенности моделирования сложных распределенных процессов, отражена актуальность исследования и важность моделирования таких процессов. Рассматривается развитие окрестностного подхода, труды отечественных и зарубежных авторов, внесших значительный вклад в развитие математического моделирования сложных динамических систем. Приведены виды окрестностных моделей и отражено положение нового направления иерархических динамических нейро-окрестностных моделей в классе окрестностных моделей. Представлены преимущества развития данного подхода, а именно улучшение интерпретируемости модели при одновременном обеспечении достаточной точности с обобщающей способностью и устойчивостью к шуму. Выделены основные этапы построения и представлены сферы применения иерархических динамических нейро-окрестностных моделей. Отмечено три способа представления их структуры: графический, теоретико-множественный и матричный. Графический способ представления основывается на графах, разделенных на два слоя, которые описывают связи между узлами по переходам и по выходам соответственно. Показаны схемы слоев и общая схема узла исследуемой модели по переходам и выходам. Теоретико-множественный способ описывает модель в виде множеств узлов и иерархических окрестностных связей между ними. Матричный способ позволяет представить модель в виде матриц смежности для переходов и выходов по состояниям и по внешним воздействиям соответственно. Приведено подробное описание иерархических динамических нейро-окрестностных моделей и нейронных сетей в узлах. Описан алгоритм идентификации разработанного подхода, показана схема алгоритма идентификации. Приведен пример построения иерархической динамической нейро-окрестностной модели прогноза общего энергопотребления бытовой техники в доме с учетом отопления и погодных условий в реализованной программе Python с автоматическим подбором оптимальных параметров модели. Приведено описание исходных данных, взятых с сайта Kaggle. Проведена подготовка данных, на основе которых выполнено обучение и тестирование полученной модели. Показана схема иерархической динамической нейро-окрестностной модели прогнозируемого процесса. Сделаны выводы по проделанному исследованию.
Рассматривается развитие теории робастного оценивания параметров статистических моделей с привлечением аппарата теории информации. Анализируется подход А. М. Шурыгина, основанный на модели серии выборок со случайным точечным засорением (модели байесовского точечного засорения). В первой части нашей работы описан непараметрический способ выбора распределения засоряющей точки - посредством максимизации энтропии Шеннона или перекрестной энтропии в окрестности модельного распределения, ограниченной величиной дивергенции Кульбака - Лейблера. Такой способ нахождения плотности распределения засоряющей точки позволяет рассматривать получаемые оценки как робастные, причем обладающие свойством оптимальности. Полученные оценки мы называем обобщенными радикальными, поскольку их частным случаем являются радикальные оценки А. М. Шурыгина. Во второй части работы получено другое оптимальное решение на основе формализма А. Реньи (или эквивалентного с точки зрения нашей задачи формализма К. Цаллиса), дающее новое семейство оценок, частными случаями которого также являются некоторые известные оценки. Для выбора одной оценки из семейства, определяемого разными ограничениями на дивергенцию, предложен оптимизационный подход. Основные теоретические результаты, полученные в работе, иллюстрируются на примере оценивания параметра сдвига косинусного распределения.
Большое количество физических, биологических и других явлений и процессов описываются нагруженными уравнениями. Нелинейное гиперболическое уравнение Кирхгофа моделирует некоторые колебательные процессы и содержит нагрузку в виде рациональной степени m/n линейной функции от нормы искомого решения в пространстве H 1(Ω). Подобную нагрузку будем называть интегральной. В работе для данного уравнения рассматривается вторая смешанная задача с однородными граничными условиями. В силу сложности интегрирования нелинейных дифференциальных уравнений во многих случаях они с разной степенью точности аппроксимируются линейными уравнениями. При этом может оказаться, что линеаризованное уравнение весьма условно моделирует исследуемое явление. Целью настоящей работы является установление априорных оценок для интегральной нагрузки уравнения Кирхгофа, которые используются для его «корректной» линеаризации. Соответствующие результаты формулируются в виде теорем. В случае положительной степени m/n полученная оценка действительна для любых значений m и n. В отрицательном случае устанавливаются отдельные оценки для m < n, m = n и m > n. Во всех случаях производится переход от нестрого равенства априорной оценки к равенству, связывающему интегральную нагрузку с некоторой линейной функцией, зависящей от начальных условий и правой части уравнения. Для редукции уравнения Кирхгофа к линейному уравнению его интегральная нагрузка заменяется полученной функцией. Способ применим к уравнениям с интегральной нагрузкой как в главной части, так и в младших членах.
Издательство
- Издательство
- ПНИПУ
- Регион
- Россия, Пермь
- Почтовый адрес
- 614990, Пермский край, г. Пермь, Комсомольский проспект, д. 29
- Юр. адрес
- 614990, Пермский край, г. Пермь, Комсомольский проспект, д. 29
- ФИО
- ТАШКИНОВ АНАТОЛИЙ АЛЕКСАНДРОВИЧ (ИСПОЛНЯЮЩИЙ ОБЯЗАННОСТИ РЕКТОРА)
- E-mail адрес
- rector@pstu.ru
- Контактный телефон
- +7 (342) 2198067
- Сайт
- https://pstu.ru