Лекции по параллельным вычислениям. Гергель В.П - 123 стр.

UptoLike

Составители: 

123
2
2 1
2 1 log / 1 /
s
n n
R
E
s n n s s w n s s
. (9.21)
Из соотношений (9.21) видно, что для сохранения требуемого уровня эф-
фективности при увеличении числа используемых процессоров соответственно
должна возрастать вычислительная сложность задачи (размерности матрицы и
вектора). Заметим также, что если в (9.20), (9.21) пренебречь затратами на пе-
редачу данных, будем иметь
sTTR
s
1
,
1
s
E R s
.
Высокий внутренний параллелизм задачи связан с тем, что в данном случае от-
сутствуют операции, которые не поддаются распараллеливанию.
9.5 Умножение матрицы на вектор, разделение по столбцам
При параллельном умножении матрицы на вектор с разделением данных
по столбцам каждый столбец матрицы А умножается на один (соответствую-
щий ему) элемент вектора b. Если за процессором закреплена полоса, элементы
столбцов, из которых она составлена, умножаются на соответствующие эле-
менты вектора b, которые также должны быть закреплены за этим процессором.
После умножения полученные значения суммируются для каждой m строки
матрицы А в отдельности:
nm,baiс
l
j
jj
jmj
'
m
1
0
0 ,
где (j
0
и j
l-1
– начальный и конечный индексы столбцов подзадачи i,
n
i
0
).
Вычислительные затраты для вычисления одного элемента промежуточного
вектора на этом – первом этапе могут быть оценены как
2 / 1
n s
. (9.22)
В результате реализации первого этапа на каждом процессоре получается стол-
бец промежуточных значений.