Высокопроизводительные вычисления на кластерах. Беликов Д.А - 140 стр.

UptoLike

140
niy
n
itty
dt
dy
n
j
ji
i
,...,1,
1
/))cos((
1
с начальными усло-
виями
(0) 1, 1,...,
i
y i n
.
При ее запусках на разном числе используемых процессов при
n
=1000 были получены следующие результаты таймирования вы-
полнения программы (в с):
Size = 1 time = 326,
Size = 2 time = 182,
Size = 4 time = 118,
Size = 5 time = 153,
Size = 10 time = 177.
Эти данные указывают на большие коммуникационные затраты
созданного параллельного алгоритма при рассмотренном объеме
вычислительной работы. Ускорение параллельной версии получает-
ся в случае, когда вычислительные затраты на расчет правых частей
превосходят время, необходимое для сборки на всех процессах век-
тора прогноза решения
1
m
y
.
7.6 Задания
1. Используя представленную в п. 7.5 программу, решить сис-
тему линейных однородных ОДУ вида (7.1), в которой матрица яв-
ляется нижнетреугольной с единичными ненулевыми элементами.
В качестве начальных условий принять
(0) 1, 1,
i
y i n
. Для обес-
печения равномерной загрузки процессоров применить цикличе-
скую схему распределения уравнений по процессам. На основе тес-
товых расчетов при заданном
n
определить значение параметра
,
при котором теоретические оценки ускорения наилучшим образом
соответствуют расчетным данным.
2. Используя представленную в п. 7.5 программу, решить сис-
тему линейных однородных ОДУ вида (7.1), в которой матрица яв-
ляется верхнетреугольной с единичными ненулевыми элементами.
В качестве начальных условий принять
(0) 1, 1,
i
y i n
. Для обес-
печения равномерной загрузки процессоров применить схему с от-
ражениями для распределения уравнений по процессам. На основе
тестовых расчетов при заданном
n
определить значение параметра