Издается с 1978 года
в г. Сарове (Арзамас-16) Нижегородской области

РОССИЙСКИЙ ФЕДЕРАЛЬНЫЙ
ЯДЕРНЫЙ ЦЕНТР -
ВСЕРОССИЙСКИЙ НИИ
ЭКСПЕРИМЕНТАЛЬНОЙ ФИЗИКИ
 
 Русский |  English
О ЖУРНАЛЕ РЕДКОЛЛЕГИЯ ПУБЛИКАЦИОННАЯ ЭТИКА ПРАВИЛА ДЛЯ АВТОРОВ АВТОРЫ АРХИВ ПОСЛЕДНИЙ ВЫПУСК СЛЕДУЮЩИЙ ВЫПУСК СТАТЬЯ ГОДА




Реализация модели общей циркуляции атмосферы на массивно-параллельной ЭВМ с распределенной памятью

Глухов В. Н.
Вопросы атомной науки и техники. Сер. Математическое моделирование физических процессов. Тезисы докл. Междунар. математич. конф 1997. Вып.1. С. 17-18.

      Задачи прогноза погоды и изменений климата требуют для своего решения больших вычислительных мощностей. Одним из путей выхода из создавшегося положения является применение многопроцессорных ЭВМ.
      Доклад посвящен проблемам, связанным с распараллеливанием модели общей циркуляции атмосферы ИВМ РАН на многопроцессорной вычислительной системе MBG-100 (ИЦМ им. М.В. Келдыша РАН), и полученным результатам. Данная модель разрабатывалась в течение многих лет и активно участвует в различных международных экспериментах (AMIP, FANGIO),
      В основе модели лежит система полных нелинейных уравнений гидротермодинамики атмосферы в форме Лэмба на сфере с использованием вертикальной σ-координаты. Разностная аппроксимация пространственного оператора по горизонтали выполнена на сдвинутой С-сетке Аракавы, регулярной по долготе и широте. Шаг сетки вдоль кругов широты Δα = 5°, вдоль меридианов - Δφ= 4°; по вертикали применяется равномерное разбиение на 7 уровней. Интегрирование по времени производится по полунеявной схеме с шагом в 20”. На каждом шаге интегрирования решается уравнение Гельмгольца на сфере методом редукции по переменной λ.
      Применялись два способа распараллеливания: в первом случае данные распределялись между, процессорами по широте, во втором случае — по широте и долготе. Для решения уравнения Гельмгольца был организован конвейер, а для суммирования данных по процессорам использовалась схема спаривания.
      Предполагалось, что если одному процессору для выполнения задачи требуется время t, то р процессоров смогут решить ее за время t/р. Однако это идеальное ускорение удается получить лишь в очень специальных ситуациях. Проведенные эксперименты показали, что производительность с увеличением числа процессоров растет нелинейно и есть некоторое количество процессоров, на котором достигается максимальное быстродействие. Так, для первого способа распараллеливания время счета удалось сократить примерно лишь в 4 раза, причем минимум наблюдался на 9 процессорах.
      Просуммировав время работы отдельных процедур по процессорам, можно выявить те из них, для которых суммарное время выполнения растет, и те, для которых оно практически не меняется. Можно заметить, что те процедуры, для которых суммарное время растет, содержат в себе зависимости по данным, принадлежащим различным процессорам.
      Для первого способа распараллеливания максимальная производительность оценивалась приблизительно в 10,3 Mflops (без использования оптимизации при компиляции).
      Ресурсы вычислительной системы не удается использовать полностью из-за необходимости обмена данными между процессорами. Второй способ должен быть эффективнее первого, так как при его выборе объем пересылаемых данных с увеличением количества процессоров уменьшается, а при выборе первого способа остается постоянным.



 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
[ Возврат ]


 
 
 
© ФГУП "РФЯЦ-ВНИИЭФ", 2000-2024