Лекции по параллельным вычислениям. Гергель В.П - 126 стр.

UptoLike

Составители: 

126
К временным затратам, определяемым соотношениями (9.25), (9.26), сле-
дует еще добавить время, необходимое на окончательную «сборку» результи-
рующего вектора:
1 / /
s w m s
.
С учетом этих затрат общее время выполнения параллельного алгоритма
для указанных способов передачи данных соответственно
1
2 / 1 1 / 2 1 2 / /
s
T m n s s m s s w m s
,
/s/mwslogss/mss/nmT
s
2112
2
2
.
Если матрица квадратная размерности
n
n
, а n кратно числу процессоров,
т.е.
s
/
n
целое число, ускорение и эффективность для первого типа тополо-
гии сети соответственно
/snws
s
nn
nn
R
212
12
12
, (9.27)
2 1
2 1 2 1 2 /
s
n n
E
n n s s w n s
. (9.28)
Для второго типа топологии сети имеем соответственно
2
2 1
2 1
1 log 2 /
n n
R
n n
s s w n s
s
, (9.29)
2
2 1
2 1 1 log 2 /
s
n n
E
n n s s s w n s
. (9.30)
В данном случае также отсутствуют операции, которые могут выполняться
только последовательно, поэтому без учета потерь на коммуникации (9.25),
(9.26) максимально возможные теоретические значения ускорения и эффектив-
ности в соответствии с (9.29), (9.30) равны соответственно R=s, E
s
=1.