ВУЗ:
Составители:
Рубрика:
- 64 -
• Сравнить эффективность алгоритма Фокса с программой
MM_MPI_2.C
(определить время выполнения при различной размерности умножаемых
матриц и числе процессоров).
Вопросы для самопроверки:
1. В каком случае время умножения матриц будет больше – в случае выпол-
нения
MM_SER
или
MM_MPI_0
при числе процессоров N=2 (включая управ-
ляющую ЭВМ)?
2. Какими соображениями следует пользоваться при разработке стратегии
распределения вычислений и блоков данных между процессами при распа-
раллеливании алгоритмов?
3. Каким образом целесообразно распределить блоки исходных и вычислен-
ной матриц в случае процедуры нахождения матричного произведения?
При умножении/делении матрицы на скаляр? При транспонировании
мат-
рицы?
4. Оценить (в единицах умножения элементов двумерного массива ‘плаваю-
щих’ чисел двойной точности с последующим сложением частичных сумм
оных) размер гранулы (зерна, блока) параллелизма для случая параллель-
ного умножения матриц ленточным способом. В каком случае коэффици-
ент ускорения вычислений больше – при большей или меньшей
размерно-
сти умножаемых матриц (предположение проверить экспериментально)?
5. Предложить и обосновать более эффективную (относительно вышеразо-
бранных) стратегию распределения больших матриц по вычислительным
узлам (обязательно учесть некратность числа строк и столбцов матрицы
числу процессоров).
- 64 - • Сравнить эффективность алгоритма Фокса с программой MM_MPI_2.C (определить время выполнения при различной размерности умножаемых матриц и числе процессоров). Вопросы для самопроверки: 1. В каком случае время умножения матриц будет больше – в случае выпол- нения MM_SER или MM_MPI_0 при числе процессоров N=2 (включая управ- ляющую ЭВМ)? 2. Какими соображениями следует пользоваться при разработке стратегии распределения вычислений и блоков данных между процессами при распа- раллеливании алгоритмов? 3. Каким образом целесообразно распределить блоки исходных и вычислен- ной матриц в случае процедуры нахождения матричного произведения? При умножении/делении матрицы на скаляр? При транспонировании мат- рицы? 4. Оценить (в единицах умножения элементов двумерного массива ‘плаваю- щих’ чисел двойной точности с последующим сложением частичных сумм оных) размер гранулы (зерна, блока) параллелизма для случая параллель- ного умножения матриц ленточным способом. В каком случае коэффици- ент ускорения вычислений больше – при большей или меньшей размерно- сти умножаемых матриц (предположение проверить экспериментально)? 5. Предложить и обосновать более эффективную (относительно вышеразо- бранных) стратегию распределения больших матриц по вычислительным узлам (обязательно учесть некратность числа строк и столбцов матрицы числу процессоров).
Страницы
- « первая
- ‹ предыдущая
- …
- 62
- 63
- 64
- 65
- 66
- …
- следующая ›
- последняя »