Введение в практику разработки параллельных программ в стандарте MPI. Баканов В.М - 34 стр.

UptoLike

Составители: 

- 34 -
3. Лабораторная работа 3. Определение параметров
коммуникационной сети вычислительного кластера
Общие сведения. В вычислительных кластерах наиболееузким местом
обычно является сеть, осуществляющая связь между вычислительными узла-
ми (фактически эта сеть является аналогом общей шины, связывающей раз-
личные узлы любой ЭВМ).
Даже весьма быстродействующая сеть обладает свойством латентности
(‘времени разгона
до номинальной производительности); латентность особо
сильно снижает реальную производительность сети при частом обмене (не-
большими по объему) сообщениями (при задержке поступления очередного
порции информации вычислительному узлу он вынужденно простаивает,
рис.2).
В случае одностороннего обмена сообщениями между двумя узлами (об-
мен типаточка-точка’) затрачиваемое на передачу время Т (сек) оценивается
как
:
T=X/S+L,
где X – длина сообщения (Mбайт),
S – пропускная способность сетевого каналаточка-точка’ (мгновенная
скорость передачи данных), Мбайт/сек,
L – время разгона операции обмена (не зависит от длины сообщения),
сек.
Иногда бывает удобно оперировать латентностью, приведенной к скорости
(цена обмена P, Мбайт):
P=L
×S,
Цена обменаразмер блока данных, которые каналточка-точкамог бы
передать при нулевой латентности.
При определении реальной (с учетом латентности) пропускной способно-
сти сети на операциях обмена типаточка-точка используют пару
простейшиx блокирующих (блокирующие функции возвращают управление
вызывающему процессу только после того, как данные приняты или переда-
ны или скопированы во временный буфер) MPI-предписаний
MPI_Send/MPI_Recv, причем каждая операция повторяется много раз (с целью
статистического усреднения).
Следует иметь в виду, что тестирование коммуникационной сети кластера
на операцияхточка-точка является всего лишь важной, однако частью об-
щей процедуры тестирования (более полный набор тестов можно получить с
http://parallel.ru/testmpi).
Для виртуального кластера максимально достижимая реальная произво-
  3. Лабораторная работа 3. Определение параметров
     коммуникационной сети вычислительного кластера

   Общие сведения. В вычислительных кластерах наиболее ‘узким местом’
обычно является сеть, осуществляющая связь между вычислительными узла-
ми (фактически эта сеть является аналогом общей шины, связывающей раз-
личные узлы любой ЭВМ).
   Даже весьма быстродействующая сеть обладает свойством латентности
(‘времени разгона’ до номинальной производительности); латентность особо
сильно снижает реальную производительность сети при частом обмене (не-
большими по объему) сообщениями (при задержке поступления очередного
порции информации вычислительному узлу он вынужденно простаивает,
рис.2).
   В случае одностороннего обмена сообщениями между двумя узлами (об-
мен типа ‘точка-точка’) затрачиваемое на передачу время Т (сек) оценивается
как:

  T=X/S+L,

  где X – длина сообщения (Mбайт),
      S – пропускная способность сетевого канала ‘точка-точка’ (мгновенная
          скорость передачи данных), Мбайт/сек,
      L – время разгона операции обмена (не зависит от длины сообщения),
          сек.

  Иногда бывает удобно оперировать латентностью, приведенной к скорости
(цена обмена P, Мбайт):

  P=L × S,

   Цена обмена – размер блока данных, которые канал ‘точка-точка’ мог бы
передать при нулевой латентности.
   При определении реальной (с учетом латентности) пропускной способно-
сти сети на операциях обмена типа ‘точка-точка’ используют пару
простейшиx блокирующих (блокирующие функции возвращают управление
вызывающему процессу только после того, как данные приняты или переда-
ны или скопированы во временный буфер) MPI-предписаний
MPI_Send/MPI_Recv, причем каждая операция повторяется много раз (с целью
статистического усреднения).
    Следует иметь в виду, что тестирование коммуникационной сети кластера
на операциях ‘точка-точка’ является всего лишь важной, однако частью об-
щей процедуры тестирования (более полный набор тестов можно получить с
http://parallel.ru/testmpi).
    Для виртуального кластера максимально достижимая реальная произво-

                                     - 34 -