Параллельные вычисления. Баканов В.М. - 9 стр.

UptoLike

Составители: 

- 9 -
вительственная программаУскоренная стратегическая компьютерная ини-
циатива’ (ASCI, Accelerated Strategic Computing Initiative,
http://www.llnl.gov/asci
), программы NPACI (National Partnership for Advanced
Computational Infrastructure,
http://www.npaci.edu
), CASC (Coalition of Aca-
demic Supercomputing Centers,
http://www.osc.edu/casc.html
) и др. Государствен-
ная поддержка прямо связана с тем, что независимость в области производст-
ва и использования вычислительной техники отвечает интересам националь-
ной безопасности, а научный потенциал страны непосредственно связан и в
большой мере определяется уровнем развития вычислительной техники и ма-
тематического обеспечения.
Так, в рамках принятой в США еще
в 1995 г. программы ASCI ставилась
задача увеличения производительности супер-ЭВМ в 3 раза каждые 18 меся-
цев и достижение уровня производительности в 100 триллионов (100
×
10
12
)
операций с плавающей точкой в секунду (100 Терафлопс) к 2004 г. (для срав-
нениянаиболее мощныеперсоналкиимеют производительность не более
1 Гигафлопс).
С целью объективности при сравнении производительность супер-ЭВМ
рассчитывается на основе выполнения заранее известной тестовой задачи
(‘бенчмарка’, от англ. benchmark); в качестве последней обычно используется
тест LINPACK (
http://www.netlib.org/utk/people/JackDongarra/faq-linpack.html
),
предполагающий решение плотнозаполненных систем линейных алгебраиче-
ских уравнений (СЛАУ) большой размерности методом исключения Гаусса
(другой метод не допускается) с числами с плавающей точкой двойной точ-
ности (число выполняемых операций при этом априори известно и равно
nn
23
23/2 ×+×
, где nпорядок матрицы, обычно n
1000; такой тест выбран
вследствие того, что большое количество практических задач сводится имен-
но к решению СЛАУ большой (
1001
64
÷
n
) размерности. Для параллельных
машин используется параллельная версия LINPACK – пакет HPL (High
Performance Computing Linpack Benchmark,
http://www.netlib.org/benchmark/hpl
).
LINPACK-производительность вычисляется как
t
/
n
n
R
max
23
3
2
+
×=
, где t
время выполнения теста (время выполнения сложений и умножений прини-
мается одинаковым). Пиковое (максимальное) быстродействие в общем слу-
чае определяется в виде
t
γ
p
R
i
ki
i
i
peak
=
=
=
1
, где pчисло процессоров или
АЛУ; kчисло различных команд в списке команд ЭВМ,
γ
i
- удельный
вес команд i-го типа в программе,
t
i
время выполнения команды типа i;
веса команд определяются на основе сбора статистики по частотам команд в
реальных программах (известны стандартные смеси команд Гибсона, Флин-
на и др.), обычно
R
R
peak
max
×
=
÷
0,95)(0,5
. Т.о. пиковая производительность
                                          -9-


вительственная программа ‘Ускоренная стратегическая компьютерная ини-
циатива’            (ASCI,      Accelerated  Strategic     Computing        Initiative,
http://www.llnl.gov/asci), программы NPACI (National Partnership for Advanced
Computational Infrastructure, http://www.npaci.edu), CASC (Coalition of Aca-
demic Supercomputing Centers, http://www.osc.edu/casc.html) и др. Государствен-
ная поддержка прямо связана с тем, что независимость в области производст-
ва и использования вычислительной техники отвечает интересам националь-
ной безопасности, а научный потенциал страны непосредственно связан и в
большой мере определяется уровнем развития вычислительной техники и ма-
тематического обеспечения.
    Так, в рамках принятой в США еще в 1995 г. программы ASCI ставилась
задача увеличения производительности супер-ЭВМ в 3 раза каждые 18 меся-
                                                                                     12
цев и достижение уровня производительности в 100 триллионов (100 × 10 )
операций с плавающей точкой в секунду (100 Терафлопс) к 2004 г. (для срав-
нения – наиболее мощные ‘персоналки’ имеют производительность не более
1 Гигафлопс).
   С целью объективности при сравнении производительность супер-ЭВМ
рассчитывается на основе выполнения заранее известной тестовой задачи
(‘бенчмарка’, от англ. benchmark); в качестве последней обычно используется
тест LINPACK (http://www.netlib.org/utk/people/JackDongarra/faq-linpack.html),
предполагающий решение плотнозаполненных систем линейных алгебраиче-
ских уравнений (СЛАУ) большой размерности методом исключения Гаусса
(другой метод не допускается) с числами с плавающей точкой двойной точ-
ности (число выполняемых операций при этом априори известно и равно
2 × n3 / 3 + 2 × n2 , где n – порядок матрицы, обычно n ≥ 1000; такой тест выбран
вследствие того, что большое количество практических задач сводится имен-
но к решению СЛАУ большой ( n ≈ 104 ÷ 106 ) размерности. Для параллельных
машин используется параллельная версия LINPACK – пакет HPL (High
Performance Computing Linpack Benchmark, http://www.netlib.org/benchmark/hpl).
                                                                  n3 / 3 + n 2
     LINPACK-производительность вычисляется как R max = 2 ×                    , где t –
                                                                          t
время выполнения теста (время выполнения сложений и умножений прини-
мается одинаковым). Пиковое (максимальное) быстродействие в общем слу-
                                         i =k
чае определяется в виде R peak = p       ∑ γi t i , где p — число процессоров или
                                         i =1
АЛУ; k — число различных команд в списке команд ЭВМ, γi - удельный
вес команд i-го типа в программе, t i — время выполнения команды типа i;
веса команд определяются на основе сбора статистики по частотам команд в
реальных программах (известны стандартные смеси команд Гибсона, Флин-
на и др.), обычно R max = (0,5 ÷ 0,95) × R peak . Т.о. пиковая производительность