Высокопроизводительные вычисления на кластерах. Беликов Д.А - 86 стр.

UptoLike

ВУЗ:

ТГУ | Томск

Составители:

Рубрика:

Программирование

! записываем с

из быстрой памяти в медленную

end do

Выполним подсчет числа обмена данными между основной и

кэш-памятью. Для передачи элементов матрицы

потребуется

обращений,

–

. В итоге получим

3 2

n n

   обра-

щений.

Теперь покажем, что подход, основанный на блочных скалярных

произведениях (5.2), приводит к более эффективному использова-

нию кэш-памяти. Рассмотрим блочную версию матричного умно-

жения:

do i = 1, N

do j = 1, N

! считываем блок C

в быструю память

do k = 1, N

! считываем блок A

в быструю память

! считываем блок B

в быструю память

c(i, j) = c(i, j)+a(i, k)*b(k, j)

end do

! записываем C

из быстрой памяти в медленную

end do

По этому алгоритму число передаваемых данных будет следую-

щим: для матрицы

–

3 2 2 2

( / )

N n N Nn

 , для матрицы

– также

, а для чтения и записи блоков матрицы

–

2 2 2 2

( / )

N n N n



Всего получается





2 2

2 1 2

N n Nn

    обращений к быстрой

кэш-памяти. Поэтому чтобы минимизировать число обращений,

нужно взять как можно меньшее значение

. Но

подчиняется

ограничению, что





2 2

3 /

M n N

 , которое означает, что в кэш-

памяти может разместиться по одному блоку матриц

, ,

A B C

. Отсю-

да получаем

3 /

N n M

 и

2 3 /

n M

  . Тогда отношение





1 2

/ / 2 3

M   , и видно, что блочные скалярные произведе-

ния имеют решительное преимущество. Продемонстрируем это на

Заказать работу

Высокопроизводительные вычисления на кластерах. Беликов Д.А - 86 стр.

UptoLike

ВУЗ:

Беликов Д.А.

Говязов И.В.

Данилкин Е.А.

Лаева В.И.

Проханов С.А.

Старченко А.В.

Программирование

Вы здесь

Высокопроизводительные вычисления на кластерах. Беликов Д.А - 86 стр.

UptoLike

ВУЗ:

Беликов Д.А.

Говязов И.В.

Данилкин Е.А.

Лаева В.И.

Проханов С.А.

Старченко А.В.

Программирование

Страницы