В статье исследуется система с разделением и параллельным обслуживанием заявок, называемая также fork-join системой массового обслуживания, с Парето-распределением времени обслуживания и различными вариантами распределений промежутков между поступлениями заявок для входящего потока, а именно, распределением Эрланга, показательным распределением, а также гиперэкспоненциальным распределением (смесью двух показательных). Предлагается новый подход к оценке квантилей распределения времени пребывания заявки в fork-join системе. Определение данной характеристики является не менее важной задачей, чем более традиционная оценка математического ожидания и, соответственно, моментов более высокого порядка времени отклика системы, поскольку дает более широкое преставление о необходимом количестве ресурсов для обслуживания требований, поступающих в систему, математической моделью которой является система с разделением и параллельным обслуживанием. В частности, с помощью fork-join структур моделируются процессы функционирования систем с использованием распределенных или параллельных вычислений либо систем, использующих разделение исходной задачи на части с целью оптимизации рабочих процессов. Подход основывается на аппроксимации распределения времени отклика системы распределением Фреше, параметры которого определяются статистически с помощью метода моментов. Алгоритм нахождения оценок квантилей также включает в себя имитационное моделирование и метод оптимизации, который позволяет значительно снизить погрешность аппроксимации исходных формул. Численный эксперимент показал хорошее качество приближения для квантилей времени отклика высоких уровней, средняя относительная погрешность аппроксимации при этом во всех трех случаях не превышает 2 %, а максимальная - 5 %.
Идентификаторы и классификаторы
- SCI
- Информатика
Данное предложение подтверждается экспериментальными данными. Так, на рис. 2 а) и 2 б) в качестве примера представлены эмпирические (выборочные) плотности распределения времени отклика fork-join системы массового обслуживания в случае с распределением Эрланга (с параметром формы m = 3) времени между соседними поступлениями заявок для K = 2 и K = 20. Как следует из вида гистограмм, распределение времени отклика fork-join системы схоже с видом аналитической плотности распределения для случайной величины, имеющей распределение Фреше.
Список литературы
1. Nelson R. Approximate analysis of fork/join synchronization in parallel queues / R. Nelson, A. N. Tantawi // IEEE Transactions on Computers. - 1988. - Vol. 37. - P. 739-743.
2. Thomasian A. Analysis of fork/join and related queueing systems / A. Thomasian // ACM Computing Surveys (CSUR). - 2014. -Vol. 47, No 2. - P. 17:1-17:71. DOI: 10.1145/2628913
3. Боровков А. А. Математическая статистика. Оценка параметров, проверка гипотез / А. А. Боровков. - М.: Наука, 1984. - 472 с.
4. Феллер В. Введение в теорию вероятностей и ее приложения / В. Феллер. - Т. 1. - М.: Мир, 1984. - 509 с.
5. Oliveira D. C. M. Data-intensive workflow management: For clouds and data-intensive and scalable computing environments / D. C. M. Oliveira, J. Liu, E Pacitt. - Morgan & Claypool Publishers, 2019. - 161 p.
6. Beyond the mean in fork-join queues: Efficient approximation for response-time tails / Z. Qiu [et al.] // Performance Evaluation. -2015. - Vol. 91. - P. 99-116. DOI: 10.1016/j.peva.2015.06.007
7. ForkTail: A black-box fork-join tail latency prediction model for user-facing data-center workloads / M. Nguyen [et al.] // in Proc. 27th Int. Symp. High-Perform. Parallel Distrib.Comput. - Tempe, AZ, USA, 2018. - P. 206-217.
8. A Black-Box Fork-Join Latency Prediction Model for Data-Intensive Applications / Nguyen M. [et al.] // IEEE Transactions on Parallel and Distributed Systems. - 2020. - Vol. 31, No 9. -P. 1983-2000. EDN: JPCFGL
9. Gorbunova A. V. Copulas and Quantiles in Fork-Join Queueing Systems / A. V. Gorbunova, A V. Lebedev // Advances in Systems Science and Applications. - 2024. - Vol. 24, No. 1. - P.1-19.
10. Горбунова А. В. О новом подходе к оценке квантилей времени отклика системы с разделением и параллельным обслуживанием заявок / А. В. Горбунова, А. В. Лебедев // Управление большими системами. - Выпуск 108. - С.6-21.
11. David H. A. Order Statistics / H. A. David, H. N. Nagaraja - New York: John Wiley & Sons, Inc., 2003. - 482 p.
12. Leadbetter M. R. Extremes and Related Properties of Random Sequences and Processes / M. R. Leadbetter, G. Lindgren, H. Rootzen, -Springer-Verlag New York Inc., 1983 - 336 p.
13. Embrechts P Modelling Extremal Events for Insurance and Finance / P. Embrechts, C. Kluppelberg, T. Mikosch. - Springer-Verlag Berlin Heidelberg, 1997. - 648 p.
14. Nelsen R. An introduction to copulas / R. Nelsen. - Berlin, Germany: Springer, 2006. - 286 p.
15. Gudendorf G. Extreme-Value Copulas / G. Gudendorf, J. Segers // in book: Copula theory and Its Application. - Springer, 2010. - P. 127-145.
16. Gorbunova A. V. Nonlinear approximation of characteristics of a fork-join queueing system with Pareto service as a model of parallel structure of data processing / A. V. Gorbunova, A. V. Lebedev // Mathematics and Computers in Simulation. - 2023. - Vol. 214. - P. 409-428. EDN: USRKYX
17. Gorbunova A. V. Response Time Estimate for a Fork-Join System with Pareto Distributed Service Time as a Model of a Cloud Computing System Using Neural Networks / A. V. Gorbunova, A. V. Lebedev // Communications in Computer and Information Science. - 2022. -Vol. 1552. - P. 318-332. EDN: EMDWNP
18. Raaijmakers Y. Fork-join and redundancy systems with heavy-tailed job sizes / Y. Raaijmakers, S. Borst, O. Boxma // Queueing Systems. -2023. - Vol. 103. - P. 131-159. EDN: PUCSSF
Выпуск
Другие статьи выпуска
В статье представлен новый метод сжатия аудиоданных с потерями. Метод базируется на психоакустических принципах восприятия звука человеком. Учет данных принципов позволяет получить метод сжатия аудиоданных различной природы: музыкальных композиций, речевого сигнала, различных звуков другого происхождения. Стоит отметить, что каждый из них имеет свои особенности. Речевые сигналы содержат паузы и имеют менее разнообразный частотный диапазон по отношению к музыке, что приводит к разработке специфических методов их компрессии. Целью построения представленной теории сжатия аудиоданных с потерями является достижение равенства исходного и восстановленного сигналов в перцептуальном смысле. Именно такой подход позволяет получить метод сжатия аудиоданных, который позволяет в значительной степени уменьшить битовое представление аудиосигнала, оставляя его на слух очень близким к оригиналу. Большое внимание при разработке метода уделено квантованию по уровню, причем при квантовании спектральных составляющих сигнала используется теория едва заметных изменений звука. Представляется целесообразным учет этой теории, поскольку она является значимой при обработке аудиосигналов, однако, до сих пор не была использована при разработке методов сжатия аудиоданных. Предлагаемая в статье процедура квантования по уровню сочетает в себе преимущества как адаптивного, так и равномерного квантования. Для адаптивного квантования основное преимущество это значительно меньшее число уровней квантования, которое необходимо для достижения сопоставимого с равномерным квантованием уровня шума квантования. Представленный метод квантования, который являясь по сути неравномерным (адаптивным) не требует передачи значения каждого из уровней квантования (или шага квантования). Кроме того, ошибка квантования в разработанном методе не превышает 1 дБ, что является порогом едваразличимых изменений звука.
В статье приводится описание разработанного экспериментального метода оценки существующих OCR инструментов для решения проблемы присутствия сканированных документов в наборах данных, использующихся для задач классификации текста. Для классификации документов сканированные документы и документы, в которых невозможно получить текст с помощью программных средств извлечения текста, необходимо преобразовать в машиночитаемый текст, и для этой задачи используется технология оптического распознавания символов (OCR). Цель данной статьи заключается в том, чтобы экспериментально сравнить существующие OCR инструменты, а именно качество перевода сканированных документов в текст. Основными критериями для выбора инструмента OCR были: OCR инструмент должен быть свободно распространяемым, иметь встроенную поддержку русского языка и быть активно развивающимся проектом. Под эти критерии подходили три инструмента: Tesseract, EasyOCR и PaddleOCR. Для данной задачи был составлен корпус цифровых документов, половина из которых являлась отсканированными документами. Документы были взяты из открытых источников: 4 из 6 представленных классов являлись документами, связанными с процессом обучения в высших учебных заведениях Российской Федерации, остальные 2 представляли документы с государственных закупок: договоры и технические задания. Экспериментальная схема включала в себя обучение классификатора Longformer, трансформера для обработки длинных документов, на наборах данных, созданных тремя различными инструментами OCR. Оценка OCR-инструментов производилась по качеству классификации текста, достигнутому Longformer. Результаты эксперимента показали, что Tesseract OCR демонстрирует превосходство в точности распознавания текста, что и повиляло на результирующую точность классификации извлеченного из документов текста.
Рассматривается задача прогнозирования поведения динамической системы с резко меняющимися стохастическими свойствами. Динамическая система представлена соответствующим числовым временным рядом показателей системы. Решение такой задачи требует определения моментов времени изменения стохастических свойств, разладки поведения временного ряда и выделения временных сегментов с однородным поведением. На таких сегментах можно строить статистические модели для краткосрочного прогнозирования. Для краткосрочного прогнозирования предложено вместо числовых статистических моделей, таких как ARIMA, рекуррентных нейронных сетей, использовать модель дискретной цепи Маркова для нечетких состояний. В этом случае задача регрессии заменяется на задачу нечеткой классификации и объектом исследования становится временной ряд нечетких состояний, порождаемый исходным числовым временным рядом. Такой подход позволяет упростить получение решения и повысить достоверность прогноза. Разработан алгоритм рекуррентного оценивания стохастической матрицы модели цепи Маркова с нечеткими состояниями. Для выделения однородных сегментов временного ряда нечетких состояний предложено на каждом шаге рекуррентного оценивания стохастической матрицы рассчитывать вектор стационарных вероятностей (собственный вектор матрицы) и на основе анализа его поведения выделять однородные сегменты. Работоспособность и эффективность предложенного подхода иллюстрируется примерами краткосрочного прогнозирования поведения временных рядов курсов различных активов Московской биржи.
Графовые нейронные сети в настоящее время являются объектом все возрастающего интереса в области машинного обучения и анализа данных. Их специализированная архитектура позволяет эффективно моделировать и анализировать сложные структуры данных на графах, такие как социальные сети, биоинформационные сети, транспортные сети и другие. С возрастанием объема данных, представленных в виде графов, растет их значимость как инструмента для понимания и прогнозирования сложных взаимосвязей и паттернов. Данная работа направлена на оценку эффективности метода L2-регуляризации, применяемого при машинном обучении в контексте задачи кластеризации узлов графа. Под кластеризацией понимается объединение узлов в группы, выделяемые по степени их связности. При обучении используется специальный метод регуляризации и реализующий его алгоритм распространения меток LPA (Label Propagation Algorithm), а также расширение данного подхода на две популярные архитектуры графовых нейронных сетей: GraphSAGE (Graph Sample and Aggregation) и GAT (Graph Attention Networks). В рамках исследования проводится сравнительный анализ эффективности применения метода LPA на различных датасетах, широко применяемых в научных и практических задачах. Результаты исследования показывают заметное улучшение точности анализа графовых моделей данных при использовании анализируемого подхода. Проведенное исследование способствует более глубокому пониманию воздействия общего подхода L2-регуляризации в плане обучения графовых нейронных сетей.
В данной обзорной статье представлен анализ основных направлений исследований по теме классификация объектов на изображении методами компьютерного зрения. Методы компьютерного зрения позволяют автоматизировать процесс выделения семантического смысла из изображений. Под классификацией объектов на изображении понимается локализация объектов, интересующих исследователя, и соотнесение их с определенным классом. Актуальность данной темы закреплена в государственной программе: национальная стратегия развития искусственного интеллекта на период до 2030 года. Так же в статье приведена статистика публикационной активности научных авторов по теме «компьютерное зрение», которая показывает актуальность данного направления. Работа имеет следующую структуру: во введении статьи приведены различные статистики, отражающие актуальность темы. Далее приведен обзор научных исследований посвященных решению прикладных аспектов задачи классификации объектов на изображении в различных областях человеческой деятельности. Основной упор сделан на следующие прикладные области: медицина, промышленность, безопасность, транспорт и военное дело. Далее приведен анализ методов, которые используются для решения задачи классификации объектов на изображении. Автор выделяет две группы методов: классические и нейросетевые методы. Под классическими алгоритмами и методами понимается подход к решению задачи классификации объектов на изображении, в котором не используются искусственные нейронные сети. Выводы. Тема исследования на сегодня является актуальной, что подтверждено статистикой и государственными программами. Для классических методов выявлены следующие недостатки: для каждой новой прикладной задачи требуется построение алгоритма ее решения, трудоемкость выделения значимых признаков и неустойчивость при работе с определенными видами данных. Для нейросетевых методов основным недостатком является зависимость конечной модели от качества набора данных, на котором она обучается.
Многоагентные системы относятся к технологиям искусственного интеллекта, а агент-ориентированный подход позиционируется как универсальное решение, которое способно конкурировать с другими технологиями в широком классе приложений. В данной статье рассматриваются традиционные и современные варианты формализации и интерпретации понятия агента в многоагентных системах, представлен обзор постановок задач, которые решаются при разработке таких систем для формирования признаков и свойств различных типов агентов.
Работа посвящена использованию методов математического моделирования как основного инструмента исследований функционирования водных экосистем, а именно прогнозирования изменения концентрации фитопланктона в летний период в мелководном водоеме с применением спутниковых данных. Системный подход на основе синтеза математического моделирования с методами усвоения данных дистанционного зондирования позволил выполнить комплексный анализ динамики изменения биогео-химических процессов, протекающих в пространстве и во времени, с учетом совокупного действия физико-химических, биологических и антропогенных факторов, влияющих на изучаемую водную экосистему. Разработанная математическая модель, коррелирующая со спутниковой информацией, позволяет осуществлять прогнозирование поведения летнего фитопланктона в мелководном водоеме, изменения плотности выделенных планктонных популяций в условиях ускоренного времени, описывать окислительно-восстановительные процессы водной среды, сульфатредукции, трансформации биогенных веществ (минерального питания фитопланктона), изучать развитие заморных явлений, возникающих в результате антропогенной эвтрофикации, строить прогнозы изменения кислородного и биогенного режимов функционирования водоема. Для прогнозирования поведения летнего фитопланктона построен и реализован исследовательско-прогнозный комплекс, а также алгоритм его взаимодействия с ГИС. Разработанный программно-алгоритмический аппарат позволяет оценивать масштабы развития стихийных катаклизмов (эвтрофирования, «цветения», загрязнение водных систем различной этиологии и пр.), но и строить кратко- и среднесрочные прогнозы их развития в ускоренном времени для дальнейшего предотвращения негативных последствий экономического и социального характеров. Разработан оперативный алгоритм восстановления параметров качества вод Азовского моря, которой базируется на методе многомерной оптимизации Левенберга - Марквардта. В качестве входных данных использовано пространственное распределение фитопланктонных популяций, являющееся результатом применения метода локальных бинарных шаблонов к спутниковым снимкам, полученным авторами данного метода
Разработана платформа, предназначенная для многоагентного моделирования социально-экономической динамики гипотетических обществ бронзового века. Эта система объединяет данные геоинформационной системы для создания реалистичного окружения и имитацию взаимодействия агентов, представляющих древние человеческие популяции. Агенты занимаются управлением ресурсами и популяцией, миграцией и конфликтами, также реагируя на наличие и истощение таких ресурсов, как медь и скот. Моделирование показывает, как факторы распределения ресурсов и окружающей среды могли влиять на поведение общества и изменения популяции в древние времена. Область применения включает в себя как образовательные цели, так и тестирование археологических гипотез.
Издательство
- Издательство
- ВГУ
- Регион
- Россия, Воронеж
- Почтовый адрес
- 394018, Воронежская область, город Воронеж, Университетская пл., д. 1
- Юр. адрес
- 394018, Воронежская область, город Воронеж, Университетская пл., д. 1
- ФИО
- Ендовицкий Дмитрий Александрович (РЕКТОР)
- E-mail адрес
- imo@interedu.vsu.ru
- Контактный телефон
- +7 (473) 2204133
- Сайт
- https://www.vsu.ru/