Высокопроизводительные вычисления на кластерах. Беликов Д.А - 108 стр.

UptoLike

108
пересчитываются. На (
1
q
)-м шаге работает только один ПЭ и вы-
числяются коэффициенты с индексом
1
2
q
. Пересылки проводятся
на всех уровнях редукции, кроме первого и последнего, каждый ПЭ
выполняет 2 двусторонних обмена. На рис. 6.3 представлена диа-
грамма маршрутизации прямого хода циклической редукции для
128 , 8 , 17 , 7 , 3
n size m q r
.
Рис. 6.3 Диаграмма маршрутизации прямого хода циклической редукции
На первом шаге обратного хода (
l q
) на ПЭ с номером
( / 2 1)
size
вычисляется
1
2
q
x
и рассылается на 1-й и
( 2)
size
ПЭ. На втором (
1
l q
), третьем (
l q
) и т.д. шагах вычисля-
ются неизвестные, кратные
2
2
q
и не кратные
1
2
q
, кратные
3
2
q
и
не кратные
2
2
q
, и т.д. до нахождения всех неизвестных с нечетны-
ми номерами. При обратном ходе сначала работает только один ПЭ,
затем за
r
шагов начинают работать остальные. С
1
r
-го шага
все ПЭ начинают работать автономно без межпроцессорных обме-
нов (рис. 6.4). Пересылки производятся до
( 1)
r
-го шага и на по-
следнем шаге.
Таким образом, при прямом ходе наблюдается максимальная
степень параллелизма до
( )
q r
-го шага, затем она начинает падать.
Это связано с остановкой ПЭ, на которых коэффициенты редукции