ВУЗ:
Составители:
124
Для получения элементов результирующего вектора (второй этап) подза-
дачи должны обменяться этими промежуточными данными между собой. При-
том процессор-отправитель должен отослать на процессор-получатель только
ту часть промежуточного вектора (m/s), за вычисление которой в результи-
рующем векторе «отвечает» процессор-получатель. После обмена данными ме-
жду подзадачами каждый процессор суммирует полученные значения для сво-
его блока результирующего вектора. Завершающая операция – «сборка» ре-
зультирующего вектора.
На рис. 9.4 в качестве примера приведены граф-схема и временная диа-
грамма умножения матрицы на вектор при разбиении матрицы по столбцам на
4 процессора. Здесь цифрами 1-4 обозначены операции умножения столбца или
выделенной полосы (операции ввода данных для простоты не показаны) на со-
ответствующий элемент (фрагмент) вектора, цифрами 5-8 – операции формиро-
вания (пересылка и суммирование) закрепленных за каждым процессором
фрагментов искомого вектора, а операция 9 – завершающий этап «сборки»
результирующего вектора.
а) б)
Рис. 9.4 Граф алгоритма (а) и временная диаграмма (б) вычислений при разде-
лении матрицы по столбцам на 4 процессора
С учетом сказанного общее время выполнения вычислительных операций па-
раллельного алгоритма на первом и втором этапах вместе составит:
2 / 1 1 /
s
T m n s s m s
. (9.23)
Страницы
- « первая
- ‹ предыдущая
- …
- 122
- 123
- 124
- 125
- 126
- …
- следующая ›
- последняя »