Параллельное программирование в стандарте MPI. Баканов В.М - 64 стр.

UptoLike

Составители: 

- 64 -
Сравнить эффективность алгоритма Фокса с программой
MM_MPI_2.C
(определить время выполнения при различной размерности умножаемых
матриц и числе процессоров).
Вопросы для самопроверки:
1. В каком случае время умножения матриц будет большев случае выпол-
нения
MM_SER
или
MM_MPI_0
при числе процессоров N=2 (включая управ-
ляющую ЭВМ)?
2. Какими соображениями следует пользоваться при разработке стратегии
распределения вычислений и блоков данных между процессами при распа-
раллеливании алгоритмов?
3. Каким образом целесообразно распределить блоки исходных и вычислен-
ной матриц в случае процедуры нахождения матричного произведения?
При умножении/делении матрицы на скаляр? При транспонировании
мат-
рицы?
4. Оценить (в единицах умножения элементов двумерного массиваплаваю-
щихчисел двойной точности с последующим сложением частичных сумм
оных) размер гранулы (зерна, блока) параллелизма для случая параллель-
ного умножения матриц ленточным способом. В каком случае коэффици-
ент ускорения вычислений большепри большей или меньшей
размерно-
сти умножаемых матриц (предположение проверить экспериментально)?
5. Предложить и обосновать более эффективную (относительно вышеразо-
бранных) стратегию распределения больших матриц по вычислительным
узлам (обязательно учесть некратность числа строк и столбцов матрицы
числу процессоров).
                                    - 64 -

 • Сравнить эффективность алгоритма Фокса с программой MM_MPI_2.C
  (определить время выполнения при различной размерности умножаемых
  матриц и числе процессоров).

  Вопросы для самопроверки:

1. В каком случае время умножения матриц будет больше – в случае выпол-
   нения MM_SER или MM_MPI_0 при числе процессоров N=2 (включая управ-
   ляющую ЭВМ)?
2. Какими соображениями следует пользоваться при разработке стратегии
   распределения вычислений и блоков данных между процессами при распа-
   раллеливании алгоритмов?
3. Каким образом целесообразно распределить блоки исходных и вычислен-
   ной матриц в случае процедуры нахождения матричного произведения?
   При умножении/делении матрицы на скаляр? При транспонировании мат-
   рицы?
4. Оценить (в единицах умножения элементов двумерного массива ‘плаваю-
   щих’ чисел двойной точности с последующим сложением частичных сумм
   оных) размер гранулы (зерна, блока) параллелизма для случая параллель-
   ного умножения матриц ленточным способом. В каком случае коэффици-
   ент ускорения вычислений больше – при большей или меньшей размерно-
   сти умножаемых матриц (предположение проверить экспериментально)?
5. Предложить и обосновать более эффективную (относительно вышеразо-
   бранных) стратегию распределения больших матриц по вычислительным
   узлам (обязательно учесть некратность числа строк и столбцов матрицы
   числу процессоров).