ВУЗ:
Составители:
Рубрика:
- 76 -
• Студент по заданию преподавателя проводит анализ полученных дан-
ных (для этого файл выдачи
Listing.out
переписывается на клиентскую
машину – ранее описанная закладка
Перепись файлов
программы
PULT;
для файлов размером менее 64 kb возможен просмотр без переписи – за-
кладка
Перепись файлов
, кнопка
edit
).
Индивидуальные задания для студентов:
• Реализовать счетчик времени выполнения операции умножения матриц.
Для этого в С-программе область вызова функции
Pmatrix(a,b,c);
сле-
дует окаймить вызовами
MPI_WTIME()
следующим образом (переменную
t
включить в описания
DOUBLE
-переменных):
t=MPI_Wtime();
Pmatrix(a,b,c); // этот оператор уже существует
t=MPI_Wtime() – t;
file8=fopen(“Listing.out”, ”wt”); // этот оператор уже существует
fprintf(file8, “Time=%10.3f sec\n”, t);
В Fortran-программе соответствующий текст должен выглядеть так
(необходимо дополнить идентификатором
t
описание переменных типа
DOUBLE PRECISION
):
t=PMPI_WTIME()
CALL Pmatrix(a,b,c)
t=PMPI_WTIME() – t
OPEN(UNIT=8, FILE=’Listing.out’)
write(8, 113) t
113 format(f10.3)
•
Выполнить замеры времени выполнения операции произведения матриц
размерностью 10
3
×
10
3
чисел двойной точности на 2,3,4…10 процессо-
рах; полученные данные (первая строка файла
Listing.out
) свести в табли-
цу и представить графически, сделать выводы о характере роста произ-
водительности с увеличением числа процессоров.
•
Выполнить замеры времени выполнения операции произведения матриц
размерностью N
×
N чисел двойной точности (N=100, 300, 500, 700, 1000)
на фиксированном числе процессоров (обычно 5
÷
10); полученные дан-
ные свести в таблицу и представить графически, сделать выводы о ха-
рактере снижения производительности с увеличением размерности ум-
ножаемых матриц.
•
Обдумать варианты комбинации индексов в инструкции
DISTRIBU-
TION INDEX
, обеспечивающие максимум производительности (при ли-
нейной топологии возможные варианты –
ij, ik, jk
плюс случаи множест-
венности измерений по
i,j,k
при единичности измерения по другому па-
раметру), составить план эксперимента (общее число процессоров
- 76 - • Студент по заданию преподавателя проводит анализ полученных дан- ных (для этого файл выдачи Listing.out переписывается на клиентскую машину – ранее описанная закладка Перепись файлов программы PULT; для файлов размером менее 64 kb возможен просмотр без переписи – за- кладка Перепись файлов, кнопка edit). Индивидуальные задания для студентов: • Реализовать счетчик времени выполнения операции умножения матриц. Для этого в С-программе область вызова функции Pmatrix(a,b,c); сле- дует окаймить вызовами MPI_WTIME() следующим образом (переменную t включить в описания DOUBLE-переменных): t=MPI_Wtime(); Pmatrix(a,b,c); // этот оператор уже существует t=MPI_Wtime() – t; file8=fopen(“Listing.out”, ”wt”); // этот оператор уже существует fprintf(file8, “Time=%10.3f sec\n”, t); В Fortran-программе соответствующий текст должен выглядеть так (необходимо дополнить идентификатором t описание переменных типа DOUBLE PRECISION): t=PMPI_WTIME() CALL Pmatrix(a,b,c) t=PMPI_WTIME() – t OPEN(UNIT=8, FILE=’Listing.out’) write(8, 113) t 113 format(f10.3) • Выполнить замеры времени выполнения операции произведения матриц 3 3 размерностью 10 × 10 чисел двойной точности на 2,3,4…10 процессо- рах; полученные данные (первая строка файла Listing.out) свести в табли- цу и представить графически, сделать выводы о характере роста произ- водительности с увеличением числа процессоров. • Выполнить замеры времени выполнения операции произведения матриц размерностью N × N чисел двойной точности (N=100, 300, 500, 700, 1000) на фиксированном числе процессоров (обычно 5 ÷ 10); полученные дан- ные свести в таблицу и представить графически, сделать выводы о ха- рактере снижения производительности с увеличением размерности ум- ножаемых матриц. • Обдумать варианты комбинации индексов в инструкции DISTRIBU- TION INDEX, обеспечивающие максимум производительности (при ли- нейной топологии возможные варианты – ij, ik, jk плюс случаи множест- венности измерений по i,j,k при единичности измерения по другому па- раметру), составить план эксперимента (общее число процессоров