Лекции по параллельным вычислениям. Гергель В.П - 120 стр.

UptoLike

Составители: 

120
рах при ленточном разбиении по строкам. Здесь цифрами 1-8 обозначены опе-
рации ввода данных, цифрами 9-16 операции умножения выделенных каждо-
му процессору полос на вектор. В результате выполнения этих операций на ка-
ждом процессоре будет получена 1/8 часть искомого вектора. Цифрами 21-27
обозначены операции «сборки». Сборка осуществляется за три шага. После
первого шага (выполнения операций 21-24) на 4 процессорах окажется по 1/4
части искомого вектора. На следующем шаге (операции 25-26) на двух процес-
сорах будет сформировано по 1/2 части искомого вектора. Наконец на завер-
шающем 3шаге в результате выполнения операции 27 будет получен резуль-
тирующий вектор.
При ленточном разбиении по столбцам схема формирования результи-
рующего вектора существенно отличается. Сборке результирующего вектора в
этом случае предшествует формирование промежуточных векторов. Соответст-
вующий пример будет приведен в разделе 9.5.
а) б)
Рис. 9.3 Граф алгоритма (а) и временная диаграмма (б)
при разделении матрицы по строкам
При блочной декомпозиции матрица делится на прямоугольные фрагменты
обычно из подряд идущих элементов. Если количество процессоров
q
p
s
,
количество строк матрицы кратно p, а количество столбцов – q (
p
m
,