ВУЗ:
Составители:
5. Более оптимальная работа с временными файлами. Например, если программа
создает временные файлы в текущем каталоге, то более разумно будет перейти на
использование локальных дисков на узлах. Если на узле работают два процесса и
каждый из них создает временные файлы, и при этом на узле доступны два локаль-
ных диска, то нужно, чтобы эти два процесса создавали файлы на разных дисках.
6. Использование наиболее подходящих типов данных. Например, в некоторых
случаях вместо 64-разрядных чисел с плавающей точкой двойной точности (double)
может быть целесообразным использовать 32-разрядные числа одинарной точности
(float) или даже целые числа (int).
Более подробно о тонкой оптимизации программ можно почитать в руководстве
по оптимизации для процессоров Intel и в других материалах по этой теме на веб-
сайте Intel.
Оценка и улучшение качества распараллеливания
Для ускорения работы параллельных программ стоит принять меры для сниже-
ния накладных расходов на синхронизацию и обмены данными. Возможно, прием-
лемым подходом окажется совмещение асинхронных пересылок и вычислений. Для
исключения простоя отдельных процессоров нужно наиболее равномерно распреде-
лить вычисления между процессами, причем в некоторых случаях может понадо-
биться динамическая балансировка.
Важным показателем, который говорит о том, эффективно ли в программе реа-
лизован параллелизм, является загрузка вычислительных узлов, на которых работа-
ет программа. Если загрузка на всех или на части узлов далека от 100 % – значит,
программа неэффективно использует вычислительные ресурсы, т. е. создает боль-
шие накладные расходы на обмены данными или неравномерно распределяет вы-
числения между процессами. Пользователи кластера ТПУ могут посмотреть загруз-
ку через веб-интерфейс для просмотра состояния узлов
(http://cluster.tpu.ru/qacces.shtml).
В некоторых случаях для того, чтобы понять, в чем причина низкой производи-
тельности программы и какие именно места в программе необходимо модифициро-
вать, чтобы добиться увеличения производительности, имеет смысл использовать
специальные средства анализа производительности – профилировщики и трасси-
ровщики.
Наблюдение прохождения своего задания на кластере
Суперкомпьютерный кластер «СКИФ-политех», как и многие другие суперком-
пьютеры имеет веб-интерфейс для мониторинга за ходом выполнения заданий. Его
примеры приведены на рис. П.4.1– П.4.3.
221
Страницы
- « первая
- ‹ предыдущая
- …
- 220
- 221
- 222
- 223
- 224
- …
- следующая ›
- последняя »