ОПТИМИЗАЦИЯ АЛГОРИТМОВ В ПРИКЛАДНОМ МЕТОДИЧЕСКОМ ТЕСТЕ MD ДЛЯ ЭФФЕКТИВНОГО ИСПОЛЬЗОВАНИЯ GPU
А. М. Ерофеев, М. В. Ветчинников Вопросы атомной науки и техники. Сер. Математическое моделирование физических процессов 2022. Вып.3. С. 63-72.
Описываются алгоритмы тестовой программы молекулярной динамики (MD), позволившие осуществить полный перенос всех вычислений на GPU и тем самым избавить от постоянной необходимости обмена между устройствами информацией о частицах. В результате взаимодействие между GPU и CPU необходимо только для организации пересылок граничной информации между отдельными GPU с помощью MPI на CPU, а это значительно меньше, чем пересылки в первоначальном коде, о чем свидетельствуют тестовые замеры эффективности. На разных по размеру задачах на одном GPU получено ускорение алгоритма относительно первоначального от 8,7 до 12,5 раза. При задействовании двух GPU такое ускорение составило от 6,6 до 12,5 раза. Эффективность распараллеливания на двух GPU V100 составила 76,3-79,6 % на задачах с числом частиц от 4 млн, на двух GPU А100 - 77,3-81,8 % на задачах с числом частиц от 13,5 млн (рис. - 4, табл. - 6, список лит. - 12). Ключевые слова: молекулярная динамика, эффективность, GPU, CUDA, алгоритмы.
Полный текст статьи
|