ВОЗМОЖНОСТИ МНОГОЯДЕРНЫХ ПРОЦЕССОРОВ MALT В ЗАДАЧАХ ОБРАБОТКИ ИЗОБРАЖЕНИЙ (2020)
В статье рассматриваются результаты экспериментальной оценки производительности и энерго-эффективности многоядерных процессоров MALT в задачах обработки изображений на примере фильтрации изображения с помощью оператора Собеля. Измерения осуществлялись с использованием низкоуровневого эмулятора MALTemu, прототипа процессора в ПЛИС и экспериментальной СБИС модели MALT-Cv2 Rev1. Полученные результаты сравниваются с аналогичными результатами для процессоров общего назначения (последовательная реализация) и графических процессоров с поддержкой технологии CUDA.
Идентификаторы и классификаторы
- eLIBRARY ID
- 43988507
Одним из наиболее активно развивающихся классов задач, связанных с большими данными и высокопроизводительными вычислениями, являются задачи в области обработки изображений. Компьютерная обработка изображений — одна из ключевых технологий в самых различных областях: от беспилотных автомобилей и летательных аппаратов до систем безопасности [1–3]. В последнее время производительность отдельных процессорных ядер практически не растет. Общая производительность вычислительных систем повышается за счет увеличения количества процессорных ядер. Кроме того, для повышения производительности вычислений в задачах, связанных с обработкой изображений, все чаще используются специализированные ускорители разной степени универсальности: графические процессоры (GPU) [4], программируемые логические интегральные схемы (ПЛИС или FPGA) [5], тензорные процессоры (TPU) [6], специализированные микросхемы (ASIC) [7]. Таким образом, современные вычислительные системы становятся не только многоядерными, но и гетерогенными (неоднородными): для решения различных подзадач используются различные вычислительные устройства, и тип этих устройств зависит от решаемой задачи. В данной работе будут исследоваться возможности специализированного многоядерного процессора MALT [8] для решения задач обработки изображений
Список литературы
- Fan R., Jiao J., Ye H., et al. Key ingredients of self-driving cars. ArXiv preprint: 1906.02939 [cs.RO]. Ithaca: CornellUniv. Library, 2019. https://arxiv.org/abs/1906.02939.
- Kanellakis C., Nikolakopoulos G. Survey on computer vision for UAVs: current developments and trends // J. Intell.Robot. Syst. 2017. 87. 141-168.
- Bučka P., Szabová M., Dekan M., et al. Image processing of motion for security applications // European ScientificJournal. 2017. 13, N 27. 44-58.
- Payne B.R., Belkasim S.O., Owen G.S., et al. Accelerated 2D image processing on GPUs // Lecture Notes inComputer Science. Vol. 3515. Berlin: Springer, 2005. 256-264.
- Zohouri H.R. High performance computing with FPGAs and OpenCL. ArXiv preprint: 1810.09773 [cs.DC]. Ithaca:Cornell Univ. Library, 2018. https://arxiv.org/abs/1810.09773.
- Jouppi N.P., Young C., Patil N., et al. In-datacenter performance analysis of a tensor processing unit. ArXiv preprint:1704.04760 [cs.AR]. Ithaca: Cornell Univ. Library, 2017. https://arxiv.org/abs/1704.04760.
- Valle M., Nateri G., Caviglia D.D., et al. An ASIC design for real-time image processing in industrial applications //Proc. the European Design and Test Conference. New York: IEEE Press, 1995. 385-390.
- Елизаров С.Г., Лукьянченко Г.А., Марков Д.С. и др. Программируемые на языках высокого уровня энергоэффективные специализированные СБИС для решения задач информационной безопасности // Системы высокойдоступности. 2018. 14, № 3. 40-48.
- Пирогова Л.А., Грекул В.И., Поклонов Б.Е. Оценка совокупной стоимости владения центром обработки данных// Бизнес-информатика. 2016. 36, № 2. 32-40. EDN: WFLNXF
-
Handa P., Kalra M., Sachdeva R. A survey on green computing using GPU in image processing // Internationaljournal of computer and technology. 2015. 14, N 10. 6135-6141.
-
Yanovskaya O., Yanovsky M., Kharchenko V. The concept of green Cloud infrastructure based on distributedcomputing and hardware accelerator within FPGA as a Service // Proc. IEEE East-West Design and Test Symposium.New York: IEEE Press, 2014. 1-4. EDN: XNJZTZ
-
LeCun Y., Haffner P., Bottou L., Bengio Y. Object recognition with gradient-based learning // Lecture Notes inComputer Science. Vol. 1681. Berlin: Springer, 1999. 319-345.
-
Sobel I. An Isotropic3×3Image Gradient Operator. Presentation at Stanford A.I. Project. 1968.https://en.wikipedia.org/wiki/Sobel_operator.
-
Canny J. A computational approach to edge detection // IEEE Transactions on Pattern Analysis and MachineIntelligence. 1986. 8, N 6. 679-698.
-
Baumgartner D., Roessler P., Kubinger W., et al. Benchmarks of low-level vision algorithms for DSP, FPGA, and Mobile PC processors // Embedded Computer Vision. Advances in Pattern Recognition. London: Springer, 2009.101-120.
-
Geekbench 5 Compute Workloads. Toronto: Primate Labs Inc. 2019. https://www.geekbench.com/doc/geekbench5-compute-workloads.pdf.
-
MicroBlaze Processor Reference Guide. San Jose: Xilinx Inc. 2008. https://www.xilinx.com/support/documentation/sw_manuals/mb_ref_guide.pdf.
-
Руководство программиста MALT SW. М.: МГУ, 2019. https://maltsystem.ru/images/pdf/malt_sdk02.pdf.
Выпуск
Другие статьи выпуска
Предложен новый метод восстановления изображений, имеющих три неизвестные градации яркости. Для их определения используются фрагменты изображения, гистограммы которых согласуются с заданным распределением шума. Далее все пиксели распределяются по найденным уровням яркости посредством бинарной классификации. Выполнен вычислительный эксперимент, по результатам которого оказалось, что ошибка оценки исходных яркостей не превысила 3%. При относительно низком уровне шума доля неверно классифицированных пикселей от их общего числа составила менее 0.006.
Рассматривается нелинейная модификация стохастической модели галактического динамо, в рамках которой коэффициент, отвечающий за турбулентную диффузию, полагается случайным процессом с обновлением. Показано, что при малых значениях напряженности магнитного поля его статистические моменты ведут себя примерно так же, как и в линейной модели (в частности, продемонстрировано наличие эффекта перемежаемости). Получены оценки для характерных времен выхода моментов на стабилизацию, которая наступает по мере приближения поля к равновесному значению. Проведено сопоставление результатов численного эксперимента, полученных при усреднении различных объемов выборки независисмых случайных реализаций поля.
Функционалы Минковского являются важным инструментом для изучения морфологии пористых сред. Настоящая работа посвящена построению алгоритма вычисления функционалов Минковского четырехмерных цифровых изображений, возникающих, в частности, при описании динамики изменения порового пространства среды. В работе впервые программно реализован алгоритм вычисления функционалов Минковского четырехмерных цифровых изображений.
Рассматривается задача упаковки шаров двух типов в замкнутое ограниченное множество в трехмерном пространстве как с евклидовой, так и со специальной неевклидовой метрикой. Требуется максимизировать радиус шаров при известном количестве шаров каждого типа и заданном отношении между радиусами. Предложен вычислительный алгоритм, основанный на комбинации метода бильярдного моделирования и оптико-геометрического подхода, базирующегося на фундаментальных физических принципах Ферма и Гюйгенса. Приведены результаты вычислительного эксперимента.
Приведено описание программного комплекса для математического моделирования эволюции термопороупругой среды с учетом ее разрушения. Используемая математическая модель является модификацией модели Био для случая термопороупругих сред и позволяет моделировать изменение напряженно-деформированного состояния среды, фильтрацию флюида, неизотермические эффекты, а также разрушение среды. Разрушение среды описывается с использованием подхода континуальной механики разрушения путем введения дополнительной переменной, называемой параметром повреждаемости. Этот параметр характеризует степень разрушения среды, а его эволюция определяется заданным кинетическим уравнением. Вычислительный алгоритм основан на методе конечных элементов. Дискретизация уравнений по времени производится по неявной схеме для перемещений, давления и температуры и по явной для параметра повреждаемости. В качестве конечных элементов выбраны элементы Тейлора-Худа, имеющие второй порядок аппроксимации по перемещениям и первый по давлению и температуре. Система уравнений решается в рамках “монолитной” постановки без итерационного связывания между группами уравнений. Рассмотрены результаты расчетов с использованием программного модуля на примере задачи термического воздействия на нефтяной пласт.
Статья посвящена развитию гибридного метода крупных частиц применительно к двумерным течениям с развитием физической неустойчивости на поверхностях раздела неоднородных газовых смесей. Высокая разрешающая способность метода продемонстрирована при решении задач взаимодействия ударной волны с цилиндрическим пузырем легкого или тяжелого газов в сравнении с экспериментом и расчетами по другим схемам повышенного порядка аппроксимации.
Издательство
- Издательство
- МГУ
- Регион
- Россия, Москва
- Почтовый адрес
- оссийская Федерация, 119991, Москва, Ленинские горы, д. 1
- Юр. адрес
- оссийская Федерация, 119991, Москва, Ленинские горы, д. 1
- ФИО
- Садовничий Виктор Антонович (РЕКТОР)
- E-mail адрес
- info@rector.msu.ru
- Контактный телефон
- +7 (495) 9391000
- Сайт
- https://msu.ru/