Высокопроизводительные вычисления на кластерах. Беликов Д.А - 40 стр.

UptoLike

40
значение переменной системного окружения
OMP_NUM_THREADS. Например, так:
export OMP_NUM_THREADS=4
После этого запуск исполняемой программы осуществлялся по
команде:
qsub ./script.sh
Скрипт script.sh имеет вид:
#!/bin/sh
#PBS -l nodes=1:ppn=4
#PBS -v OMP_NUM_THREADS
cd $PBS_O_WORKDIR
ulimit -s unlimited
./example.exe
При перемножении матриц размерности 1000х1000 (рис. 2.1)
было получено, что при распараллеливании матричных вычислений
на два или четыре потока получается ускорение в два и четыре раза
соответственно по сравнению с обычной последовательной про-
граммой.
Рис. 2.1 Процессорное время при умножении матриц 1000х1000