Алгоритмы параллельных вычислений и программирование. Бурова И.Г - 111 стр.

UptoLike

сигнала не превосходит скорость света), удалось значительно уве-
личить быстродействие всей системы. Следует отметить, что каж-
дая такая система позволяет решать задачи лишь из весьма узкого
класса.
Остановимся на идее конструирования рассматриваемых си-
стем более подробно. Пусть в нашем распоряжении имеется доста-
точно большое число функциональных устройств, которые могут
реализовывать операции одного или нескольких типов.
(А) Предположим, что входы и выходы этих функциональных
устройств выведены на их поверхность, так что соединение функ-
циональных устройств между собой можно выполнять непосред-
ственно, располагая их вплотную друг к другу (например, в виде
некоторого многоугольника).
Определение 3.1. Функциональные устройства со свойством
(А) называются систолическими ячейками (или процессорными
элементами, или элементарными процессорами, или чипами).
Определение 3.2. Массив систолических ячеек, располо-
женных вплотную с соединенными соседними элементами, так, что
полученная система способна выполнять определенный алгоритм,
называется систолическим массивом, соответствующим задан-
ному алгоритму (или просто систолическим массивом).
Пример. Пусть требуется построить специализированную вы-
числительную систему, на которой достаточно быстро реализуется
операция вычисления матрицы
D = C + AB, (3.1)
где A, B, C ленточные матрицы порядка n × n следующего вида:
A =
a
11
a
12
0 0 0 0 . . . 0
a
21
a
22
a
23
0 0 0 . . . 0
a
31
a
32
a
33
a
34
0 0 . . . 0
0 a
42
a
43
a
44
a
45
0 . . . 0
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
0 0 0 0 0 0 . . . a
nn
,
112