Высокопроизводительные вычисления на кластерах. Беликов Д.А - 43 стр.

UptoLike

43
Зададим значения коэффициентам α и β соответственно 1 и 0 и
получим простое перемножение матрицы А на В. Результат времени
умножения матриц с использованием DGEMM будем сопоставлять
с временем, полученным при оптимизированном перемножении
блочных матриц на основе пользовательского кода.
2,82
0,69
2,5
0,252
0
0,5
1
1,5
2
2,5
3
Celeron D Xeon 5150
User program
MKL
Рис. 2.4 Процессорное время при умножении матриц 1000х1000
163
43
157
14
1
10
100
1000
Celeron D
Xeon 5150
User program
MKL
Рис. 2.5 Процессорное время при умножении матриц 4000х4000
На рис. 2.4–2.5 показано сравнение процессорного времени пе-
ремножения матриц, полученного с использованием обычного алго-
ритма блочных скалярных произведений, и специализированных
процедур MKL. На рис. 2.4 приведены результаты при перемноже-
нии матриц размерностью 1000х1000 элементов. Видно, что приме-
нение MKL позволяет получить результат в 4-5 раз быстрее. По-
добные сравнительные расчеты проводились и с матрицами
4000х4000 элементов (рис. 2.5). Из рисунков видно, что
обнаруженный эффект повышения быстродействия вычислений