ИЕРАРХИЧЕСКИЙ АЛГОРИТМ РАСПАРАЛЛЕЛИВАНИЯ ВЫЧИСЛЕНИЙ ПРИ РЕШЕНИИ ТРЕХМЕРНОГО УРАВНЕНИЯ ПЕРЕНОСА НЕЙТРОНОВ НА ГИБРИДНЫХ СУПЕР-ЭВМ
А. А. Нуждин Вопросы атомной науки и техники. Сер. Математическое моделирование физических процессов 2022. Вып.3. С. 48-62.
Представлен иерархический алгоритм распараллеливания, который основан на выделении уровней архитектуры гибридной супер-ЭВМ с GPU и применении принципа геометрической декомпозиции на каждом из уровней. Внутри компактной группы нитей используется распараллеливание по элементам гиперплоскости фиксированного размера, состоящей из ячеек сетки. Между блоками одного GPU используется KBA-алгоритм на основе двумерной декомпозиции по столбцам и гиперплоскостям. Между различными GPU используется KBA-алгоритм на основе трехмерной декомпозиции. Программная реализация выполнена на примере тестовой программы ПАУК с помощью технологии CUDA. Эффективность адаптации теста ПАУК к одному GPU подтверждена результатами профилирования и сравнением с производительностью CPU-версии программы. Масштабируемость теста ПАУК в режиме multi-GPU исследована методом умножения (рис. - 5, табл. - 6, список лит. - 14). Ключевые слова: GPU, CUDA, Sn-метод, алгоритм бегущего счета, KBA-алгоритм.
Полный текст статьи
|