Лекции по параллельным вычислениям. Гергель В.П - 125 стр.

UptoLike

Составители: 

125
Заметим, что здесь в соответствии с (9.22)
2 / 1
m n s
оценка максимального числа операций (умножения и сложения) для вычисле-
ния всех элементов одного промежуточного m×1-вектора.
Количество суммируемых значений для каждого элемента результирующе-
го вектора на втором этапе равно числу промежуточных векторов, т.е. совпада-
ет с числом процессоров s. Максимальный размер блока результирующего век-
тора, закрепленный за одним процессором-получателем в общем случае равен
m/s. Следовательно, оценка числа операций на этом (втором) этапе равна
sm/s.
Оценим теперь ускорение и эффективность параллельного алгоритма с
учетом затрат времени на пересылку данных. Временные затраты на передачу
данных, необходимых процессору-получателю для вычисления одного блока
результирующего вектора составят
/ /
w m s
, (9.24)
где α латентность сети передачи данных, β пропускная способность сети, w
– размер элемента данных в байтах.
Общие временные затраты на коммуникации зависят от топологии сети.
Если имеется возможность одновременно отправлять и принимать сообщения
между любой парой процессоров, тогда временные затраты с учетом (9.24) со-
ставят
1
s
T s w m s
. (9.25)
Если топология вычислительной системы представлена в виде гиперкуба,
передача всех данных может быть выполнена за slog
2
шагов, на каждом из ко-
торых максимально возможная (т.к. в общем случае размеры закрепляемых за
процессором блоков различаются) длина передаваемых и получаемых сообще-
ний
/
m s
элементов
2
2
log / /
s
T s w m s
. (9.26)