Параллельные вычисления. Баканов В.М. - 60 стр.

UptoLike

Составители: 

- 60 -
очень высоким быстродействием, но каждый из них ориентирован на реше-
ние очень узкого класса задач.
В работе [7] описано использование систолических массивов (СМ) для ре-
шения специальной задачи умножения и сложения матриц [D]=[C]+[A]
×
[B]
(частный случай афинного преобразования), причем все матрицыленточ-
ные порядка N; матрица [A] имеет одну диагональ выше и две диагонали ни-
же главной; матрица [B] — одну диагональ ниже и две диагонали выше глав-
ной; матрица [C] по три диагонали выше и ниже главной. Каждый входящий
в систолический массив ПЭ выполняет скалярную операцию c+ab
и одно-
временно осуществляет передачу данных (имеет три входа a,b,c и три выхо-
да a,b,c, причем (in) и выходные (out) данные связаны соотношениями
a
out
=a
in
, b
out
=b
in
, c
out
=c
in
+a
in
×
b
in
, точка в обозначении систолической ячей-
ки определяет ее ориентация на плоскости, рис.16).
Рисунок 16 Систолический массив для реализации матричной операции
[D]=[C]+[A]
×
[B] (слевапринятое обозначение систолической ячейки для выпол-
нения скалярной операции c+a
×
b и передачи данных).
Ячейки расположены в узлах регулярной косоугольной решетки, исходные
данные поступают слева сверху, справа сверху и снизу (элементы матрицы
[A], [B] и [C] соответственно), за каждый такт все данные перемещаются в
соседние узлы по указанным стрелками направлениям. Рис.16 иллюстрирует
состояние СМ в некоторый момент времени, при следующем такте все дан-
ные переместятся на один
узел и элементы a
11
, b
11
и c
11
окажутся в одном
                                        - 60 -


очень высоким быстродействием, но каждый из них ориентирован на реше-
ние очень узкого класса задач.
  В работе [7] описано использование систолических массивов (СМ) для ре-
шения специальной задачи умножения и сложения матриц [D]=[C]+[A] × [B]
(частный случай афинного преобразования), причем все матрицы — ленточ-
ные порядка N; матрица [A] имеет одну диагональ выше и две диагонали ни-
же главной; матрица [B] — одну диагональ ниже и две диагонали выше глав-
ной; матрица [C] по три диагонали выше и ниже главной. Каждый входящий
в систолический массив ПЭ выполняет скалярную операцию c+ab и одно-
временно осуществляет передачу данных (имеет три входа a,b,c и три выхо-
да a,b,c, причем (in) и выходные (out) данные связаны соотношениями
aout=ain, bout=bin, cout=cin+ain × bin, точка в обозначении систолической ячей-
ки определяет ее ориентация на плоскости, рис.16).




Рисунок 16 — Систолический массив для реализации матричной операции
     [D]=[C]+[A] × [B] (слева – принятое обозначение систолической ячейки для выпол-
     нения скалярной операции c+a × b и передачи данных).

  Ячейки расположены в узлах регулярной косоугольной решетки, исходные
данные поступают слева сверху, справа сверху и снизу (элементы матрицы
[A], [B] и [C] соответственно), за каждый такт все данные перемещаются в
соседние узлы по указанным стрелками направлениям. Рис.16 иллюстрирует
состояние СМ в некоторый момент времени, при следующем такте все дан-
ные переместятся на один узел и элементы a11, b11 и c11 окажутся в одном