Лекции по параллельным вычислениям. Гергель В.П - 120 стр.

UptoLike

Составители:

Рубрика:

120

рах при ленточном разбиении по строкам. Здесь цифрами 1-8 обозначены опе-

рации ввода данных, цифрами 9-16 – операции умножения выделенных каждо-

му процессору полос на вектор. В результате выполнения этих операций на ка-

ждом процессоре будет получена 1/8 часть искомого вектора. Цифрами 21-27

обозначены операции «сборки». Сборка осуществляется за три шага. После

первого шага (выполнения операций 21-24) на 4 процессорах окажется по 1/4

части искомого вектора. На следующем шаге (операции 25-26) на двух процес-

сорах будет сформировано по 1/2 части искомого вектора. Наконец на завер-

шающем 3-м шаге в результате выполнения операции 27 будет получен резуль-

тирующий вектор.

При ленточном разбиении по столбцам схема формирования результи-

рующего вектора существенно отличается. Сборке результирующего вектора в

этом случае предшествует формирование промежуточных векторов. Соответст-

вующий пример будет приведен в разделе 9.5.

а) б)

Рис. 9.3 Граф алгоритма (а) и временная диаграмма (б)

при разделении матрицы по строкам

При блочной декомпозиции матрица делится на прямоугольные фрагменты

обычно из подряд идущих элементов. Если количество процессоров





количество строк матрицы кратно p, а количество столбцов – q (



