EISSN 1726-3522
Язык: ru

Архив статей журнала

ОНТОЛОГИЧЕСКИЙ АНАЛИЗ ПРЕДМЕТНОЙ ОБЛАСТИ ЦИФРОВОЙ ПЛАТФОРМЫ ALGO500 (2023)
Выпуск: Т. 24 № 1 (2023)
Авторы: Антонов Александр Сергеевич, Майер Р. В.

Проект создания цифровой платформы Algo500 направлен на решение задачи совместного анализа свойств алгоритмов и особенностей архитектур суперкомпьютеров. В статье на основе методологии онтологического анализа рассматриваются и предлагаются понятия, модели и метамодели данных, обосновываются подходы к описанию некоторых понятий из мира высокопроизводительных вычислений (HPC), устанавливаются новые требования к моделям данных, которые должны обеспечить выполнение задач, поставленных при создании платформы Algo500.

Сохранить в закладках
СОЗДАНИЕ ПЕРЕНОСИМОГО ПРОГРАММНОГО КОМПЛЕКСА ДЛЯ МОНИТОРИНГА И АНАЛИЗА ПРОИЗВОДИТЕЛЬНОСТИ СУПЕРКОМПЬЮТЕРНЫХ ПРИЛОЖЕНИЙ (2023)
Выпуск: Т. 24 № 1 (2023)
Авторы: Воеводин Вадим Владимирович, Стефанов Константин Сергеевич

Современные суперкомпьютеры востребованы в самых разных областях науки и техники. Однако их вычислительные ресурсы зачастую используются не в полной мере. Причина нередко кроется в низкой эффективности выполнения пользовательских приложений. Решить возникшую проблему весьма непросто, что связано как с чрезвычайной сложностью строения современных суперкомпьютеров, так и с недостатком теоретических знаний и практического опыта в создании высокоэффективных параллельных приложений у пользователей вычислительных систем. Более того, пользователи зачастую и не знают, что их приложения работают неэффективно. Поэтому важно, чтобы администраторы суперкомпьютеров могли постоянно контролировать и анализировать весь поток выполняющихся приложений. Для этих целей можно использовать различные существующие системы мониторинга и анализа производительности, однако подобные решения в большинстве своем либо не предоставляют достаточный функционал в части изучения производительности, либо не переносимы. В данной работе описывается прототип разрабатываемого программного комплекса, который предоставляет широкие возможности по сбору и автоматическому анализу данных о производительности приложений и при этом является переносимым.

Сохранить в закладках
PREPROCESSING OF SYSTEM MONITORING DATA FOR WORKLOAD ANALYSIS OF HPC SYSTEMS (2021)
Выпуск: Т. 22 № 3 (2021)
Авторы: Мартышов М. Н., Никитенко Дмитрий Александрович

HPC systems are complex in architecture and contain millions of components. To ensure reliable operation and efficient output, functioning of most subsystems should be supervised. This is done on the basis of collected data from various logging and monitoring systems. This means that different data sources are used, and accordingly, data analysis can face multiple issues processing this data. Some of the data subsets can be incorrect due to the malfunctioning of used sensors, monitoring system data aggregation errors, etc. This is why it is crucial to preprocess such monitoring data before analyzing it, taking into the consideration the analysis goals. The aim of this paper is, being based on the MSU HPC Center monitoring data, to propose an approach to data preprocessing of HPC monitoring systems, giving some real life examples of issues that may be faced, and recommendations for further analysis of similar datasets.

Сохранить в закладках
ВЫСОКОПРОИЗВОДИТЕЛЬНЫЕ ВЫЧИСЛИТЕЛЬНЫЕ ПЛАТФОРМЫ: ТЕКУЩИЙ СТАТУС И ТЕНДЕНЦИИ РАЗВИТИЯ (2021)
Выпуск: Т. 22 № 2 (2021)
Авторы: Антонов Александр Сергеевич, Афанасьев И. В., Воеводин Владимир Валентинович

В данной статье представлен обзор современного состояния суперкомпьютерной техники. Обзор сделан с разных точек зрения - начиная от особенностей построения современных вычислительных устройств до особенностей архитектуры больших суперкомпьютерных комплексов. В данный обзор вошли описания самых мощных суперкомпьютеров мира и России по состоянию на начало 2021 г., а также некоторых менее мощных систем, интересных с других точек зрения. Также делается акцент на тенденциях развития суперкомпьютерной отрасли и описываются наиболее известные проекты построения будущих экзафлопсных суперкомпьютеров.

Сохранить в закладках
DEVELOPING A MODEL FOR HOLISTIC WORKLOAD ANALYSIS OF LARGE SUPERCOMPUTER SYSTEMS (2021)
Выпуск: Т. 22 № 1 (2021)
Авторы: Швец Павел Артёмович, Воеводин Вадим Владимирович, Жуматий Сергей Анатольевич

Any modern supercomputer has an extremely complex architecture, and efficient usage of its resources is often a very difficult task, even for experienced users. At the same time, the field of high-performance computing is becoming more and more in demand, so the issue of efficient utilization of supercomputers is very urgent. Therefore, users should know everything important about performance of their jobs running on a supercomputer in order to be able to optimize them, and administrators should be able to monitor and analyze all the nuances of the efficient functioning of such systems. However, there is currently no complete understanding of what data are best to be studied (and how it should be analyzed) in order to have a whole picture of the state of the supercomputer and the processes taking place there. In this paper, we make our first attempt to answer this question. To do this, we are developing a model that describes all the potential factors that may be important when analyzing the performance of supercomputer applications and the HPC system as a whole. The paper provides both a detailed description of this model for users and administrators and some interesting real-life examples discovered on the Lomonosov-2 supercomputer using a software implementation based on the proposed model.

Сохранить в закладках