ВЫЧИСЛИТЕЛЬНЫЕ МЕТОДЫ И ПРОГРАММИРОВАНИЕ
Архив статей журнала
This paper is concerned with implementation of wave tomography algorithms on modern SIMD CPU and GPU computing platforms. The field of wave tomography, which is currently under development, requires powerful computing resources. Main applications of wave tomography are medical imaging, nondestructive testing, seismic studies. Practical applications depend on computing hardware. Tomographic image reconstruction via wave tomography technique involves solving coefficient inverse problems for the wave equation. Such problems can be solved using iterative gradient-based methods, which rely on repeated numerical simulation of wave propagation process. In this study, finite-difference time-domain (FDTD) method is employed for wave simulation. This paper discusses software implementation of the algorithms and compares the performance of various computing devices: multi-core Intel and ARM-based CPUs, NVidia graphics processors.
Схема КАБАРЕ, являющаяся представителем семейства балансно-характеристических методов, широко используется при решении многих задач для систем дифференциальных уравнений гиперболического типа в эйлеровых переменных. Возрастающая актуальность задач взаимодействия деформируемых тел с потоками жидкости и газа требует адаптации этого метода на лагранжевы и смешанные эйлерово-лагранжевы переменные. Ранее схема КАБАРЕ была построена для одномерных уравнений газовой динамики в массовых лагранжевых переменных, а также для трехмерных уравнений динамической упругости. В первом случае построенную схему не удалось обобщить на многомерные задачи, а во втором - использовался необратимый по времени алгоритм передвижения сетки. В данной работе представлено обобщение метода КАБАРЕ на двумерные уравнения газовой динамики и динамической упругости в смешанных эйлерово-лагранжевых и лагранжевых переменных. Построенный метод является явным, легко масштабируемым и обладает свойством временной обратимости. Метод тестируется на различных одномерных и двумерных задачах для обеих систем уравнений (соударение упругих тел, поперечные колебания упругой балки, движение свободной границы идеального газа).
Выделенные свойства циклов DFS-базиса блока карты простого графа позволили составить математическую модель вычисления циклов ячеек карты графа. По данной модели предложен практический алгоритм вычисления циклов ячеек карты графа. Алгоритм имеет квадратическую сложность относительно числа вершин в графе.
В настоящей работе представлен новый метод решения уравнений движения заряженных частиц в электромагнитных полях и проведено его сравнение с различными известными модификациями метода Бориса. Созданные двумерный и трехмерный алгоритмы основаны на использовании точного решения дифференциального уравнения для скорости заряженной частицы на шаге по времени. Сравнительный анализ метода Бориса и его модификаций проводился как по точности методов, так и по времени их работы. Новая модификация метода Бориса позволяет точнее вычислять траекторию и скорость заряженной частицы без значительного увеличения сложности расчетов. Показано, что при выборе модификации метода Бориса для решения задачи в первую очередь следует обращать внимание на точность решения, так как более простая и быстрая схема может не дать выигрыша по времени.
Работа связана с изучением нелинейных параболических систем, возникающих при моделировании и управлении физико-химическими процессами, в которых происходят изменения внутренних свойств материалов. Исследовано оптимальное управление одной из таких систем, которая включает в себя краевую задачу третьего рода для квазилинейного параболического уравнения с неизвестным коэффициентом при производной по времени, а также уравнение изменения по времени этого коэффициента. Обоснована постановка оптимальной задачи с финальным наблюдением искомого коэффициента, в которой управлением является граничный режим на одной из границ области. Получено явное представление дифференциала минимизируемого функционала через решение сопряженной задачи. Доказаны условия ее однозначной разрешимости в классе гладких функций. Полученные результаты имеют практическое значение для приложений в различных технических областях, медицине, геологии и т.п. Приведены некоторые примеры таких приложений.
В статье представлен параллельный алгоритм валидации решений задач линейного программирования. Идея метода состоит в том, чтобы генерировать регулярный набор точек на гиперсфере малого радиуса, центрированной в точке тестируемого решения. Целевая функция вычисляется для каждой точки валидационного множества, принадлежащей допустимой области. Если все полученные значения меньше или равны значению целевой функции в точке, проверяемой как решение, то эта точка считается корректным решением. Параллельная реализация алгоритма VaLiPro выполнена на языке C++ с использованием параллельного BSF-каркаса, инкапсулирующего в проблемно-независимой части своего кода все аспекты, связанные с распараллеливанием программы на базе библиотеки MPI. Приводятся результаты масштабных вычислительных экспериментов на кластерной вычислительной системе, подтверждающие эффективность предложенного подхода.
Системы SAPFOR и DVM были спроектированы и предназначены для упрощения разработки параллельных программ научно-технических расчетов. Главной целью системы SAPFOR является автоматизация процесса отображения последовательных программ на параллельные архитектуры в модели DVMH. В некоторых случаях пользователь системы SAPFOR может рассчитывать на полностью автоматическое распараллеливание, если программа была написана или приведена к потенциально параллельному виду. DVMH модель представляет собой расширение стандартных языков C и Fortran спецификациями параллелизма, которые оформлены в виде директив и не видимы стандартным компиляторам. В статье будет рассмотрено автоматизированное дополнительное распараллеливание существующих MPI-программ с помощью системы SAPFOR, где, в свою очередь, будут использованы новые возможности DVMH модели по распараллеливанию циклов в MPI программе внутри узла. Данный подход позволяет существенно снизить трудоемкость распараллеливания MPI программ на графические ускорители и многоядерные процессоры, сохранив при этом удобство сопровождения уже написанной программы. Данная возможность в системе SAPFOR была реализована для языков Fortran и C. Эффективность данного подхода показана на примере некоторых приложений из пакета NAS Parallel Benchmarks.
HPC systems are complex in architecture and contain millions of components. To ensure reliable operation and efficient output, functioning of most subsystems should be supervised. This is done on the basis of collected data from various logging and monitoring systems. This means that different data sources are used, and accordingly, data analysis can face multiple issues processing this data. Some of the data subsets can be incorrect due to the malfunctioning of used sensors, monitoring system data aggregation errors, etc. This is why it is crucial to preprocess such monitoring data before analyzing it, taking into the consideration the analysis goals. The aim of this paper is, being based on the MSU HPC Center monitoring data, to propose an approach to data preprocessing of HPC monitoring systems, giving some real life examples of issues that may be faced, and recommendations for further analysis of similar datasets.
Исследованы возможности численного метода коллокации и наименьших квадратов (КНК) на примерах кусочно-полиномиального решения задачи Дирихле для уравнений Пуассона и типа диффузии-конвекции с особенностями в виде больших градиентов и разрыва решения на границах раздела двух подобластей. Предложены и реализованы новые hp-варианты метода КНК, основанные на присоединении внутри области малых и/или вытянутых нерегулярных ячеек, отсекаемых криволинейной границей раздела от исходных прямоугольных ячеек сетки, к соседним самостоятельным ячейкам. Выписываются с учетом особенности условия согласования между собой кусков решения в ячейках, примыкающих с разных сторон к границе раздела. Проведено сравнение результатов, полученных методом КНК и другими высокоточными методами. Показаны преимущества и достоинства метода КНК. Для ускорения итерационного процесса применены современные алгоритмы и методы: предобуславливание; свойства локальной системы координат в методе КНК; ускорение, основанное на подпространствах Крылова; операция продолжения на многосеточном комплексе; распараллеливание. Исследовано влияние этих способов на количество итераций и время расчетов при аппроксимации полиномами различных степеней.
Статья посвящена синтезу многослойных диэлектрических отражательных дифракционных решеток, с высокой эффективностью обеспечивающих спектральное сложение пучков с различной длиной волны в заданном дифракционном порядке. Приводятся результаты решения задачи синтеза многослойных диэлектрических дифракционных решеток, обеспечивающих спектральное сложение в первом или минус первом порядке дифракции. Кроме того, решается задача синтеза для таких решеток с учетом возможных технологических ограничений на высоту профиля (глубину травления). Решение задачи синтеза проводится путем минимизации зависящего от параметров решетки целевого функционала методом Нелдера-Мида. Решение прямой задачи на каждом шаге минимизации осуществляется при помощи комбинации неполного метода Галеркина и метода матриц рассеяния.
Рассматривается численное моделирование газодинамических процессов, сопровождающих формирование и распространение вихревых колец, получаемых при помощи поршневого генератора. Обсуждается влияние характеристик вихревого кольца на перенос пассивной примеси. Для численных расчетов применяются нестационарные уравнения Навье—Стокса, для дисукретизации которых применяется метод конечных объемов. Результаты численного моделирования позволяют получить геометрические и динамические характеристики вихревого кольца, которые соответствуют автомодельному теории вихревого кольца и экспериментальным данным. Помимо традиционных подходов к визуализации вихревых течений, основанных на построении линий уровня различных характеристик потока, для визуализации вихревых структур применяются инварианты тензора градиента скорости и метод показателей Ляпунова на конечном промежутке времени.
В данной статье представлен обзор современного состояния суперкомпьютерной техники. Обзор сделан с разных точек зрения - начиная от особенностей построения современных вычислительных устройств до особенностей архитектуры больших суперкомпьютерных комплексов. В данный обзор вошли описания самых мощных суперкомпьютеров мира и России по состоянию на начало 2021 г., а также некоторых менее мощных систем, интересных с других точек зрения. Также делается акцент на тенденциях развития суперкомпьютерной отрасли и описываются наиболее известные проекты построения будущих экзафлопсных суперкомпьютеров.