Высокопроизводительные вычисления на кластерах. Беликов Д.А - 27 стр.

UptoLike

27
Уровни оптимизации
Опция
Описание
-O0
Отключает оптимизацию
-O1
или
-O2
Базовая оптимизация, ориентированная на скорость работы. Отключа-
ется инлайн-вставка библиотечных функций. Для компилятора С++ эти
опции дают одинаковую оптимизацию, для компилятора Фортрана опция
-O2 предпочтительнее, т.к. включает еще раскрутку циклов. Раскрутка
циклов заключается в дублировании тела цикла и сокращении числа ите-
раций. Кроме того, необходимо позаботиться, чтобы все вхождения пере-
менной цикла в тело были заменены выражениями, вычисляющими тре-
буемые значения с учетом измененных значений переменной цикла
-O3
Более мощная оптимизация, включая преобразования циклов, пред-
выборку данных, использование OpenMP. На некоторых программах
может не гарантироваться повышенная производительность по сравне
нию
с -O2. Имеет смысл использовать вместе с опциями векторизации -xK и
-xW
-unroll[n]
Включает раскрутку циклов до n раз
Оптимизации под конкретный процессор
Опция
Описание
-tpp6
Оптимизация для процессоров Penitum Pro, Pentium II и Pentium III
-tpp7
Оптимизация для процессоров Penitum 4 (эта опция включена по
умолчанию для компилятора на IA-32)
-xM
Генерация кода с использованием расширений MMX, специфических
для процессоров Pentium MMX, Pentium II и более поздних
-xK
Генерация кода с использованием расширений SSE, специфических
для процессоров Pentium III
-xW
Генерация кода с использованием расширений SSE2, специфических
для процессоров Pentium 4
Межпроцедурная оптимизация
-ip
Включается межпроцедурная оптимизация внутри одного файла. Ес
ли
при этом указать опцию -ip_no_inlining, то отключаются инлайнставки
функций
-ipo
Включается межпроцедурная оптимизация между различными фай-
лами
Оптимизации с использованием профилей
-prof_gen
Генерируется «профилировочный» код, который будет использован
для профилировки, т.е. сбор
а данных о частоте прохождения тех или иных
участков программы
-prof_use
Производится оптимизация на основе данных, полученных на этапе
профилировки. Имеет смысл использовать вместе с опцией межпроцедур-
ной оптимизации -ipo
Распараллеливание для SMP-систем
-openmp
Включается поддержка стандарта OpenMP 2.0
-parallel
Включается автоматическое распараллеливание циклов
Более подробное описание можно посмотреть в руководстве
пользователя Intel Fortran Compiler User's Guide.