Параллельные вычисления. Баканов В.М. - 10 стр.

UptoLike

Составители: 

- 10 -
определяется максимальным числом операций, которое может быть выпол-
нено за единичное время при отсутствии связей между функциональными
устройствами, характеризует потенциальные возможности аппаратуры и
(вообще говоря) не зависит от выполняемой программы.
Именно на основе LINPACK-теста регулярно составляются мировой спи-
сок наиболее быстродействующих вычислительных систем ‘Top-500’
(
http://www.top500.org
) в мире и внутри российский список ‘Top-50’
(
http://www.supercomputers.ru
). Более приближенным к реальным задачкам яв-
ляется набор тестов NPB (NAS Parallel Benchmarks,
http://www.nas.nasa.gov/NAS/NPB
).
Недостатком метода оценки пиковой производительности как числа вы-
полняемых компьютером команд в единицу времени (MIPS, Million Instruc-
tion Per Second) дает только самое общее представление о быстродействии,
т.к. не учитывает специфику конкретных программ (априори трудно предска-
зуемо, в какое число и каких именно инструкций процессора отобразится
пользовательская программа).
Введенная в строй еще в
1999 г. в Sandia National Laboratories многопро-
цессорная система ASCI Red (Intel Paragon, США) имеет предельную (пико-
вую) производительность 3,2 триллионов операций в секунду (3,2 Тераф-
лопс), включает 9’632 микропроцессора Pentium Pro, общий объем оператив-
ной памяти 500 Гбайт и оценивается в сумму около 50 млн. $US. Список
‘Top-500’ некоторое время возглавлял созданный для моделирования клима-
тических изменений на основе полученных со спутников данных многопро-
цессорный
комплекс Earth Simulator (NEC Vector, Япония), состоящий из 640
узлов (каждый узел включает 8 микропроцессоров SX-6 производительно-
стью 8 Гфлопс каждый), общий объем оперативной памяти 8 Тбайт, суммар-
ная пиковая производительностью 40 Тфлоп/сек (занимает площадь размера-
ми 65
×
50 м
в специально построенном двухъярусном здании с системами
антисейсмики, кондиционирования воздуха и защиты от электромагнитных
излучений). 70-ти терафлопный Blue Gene/L заказан Минэнергетики США и
установлен в специализирующейся на ядерных проблемах Ливерморской ла-
боратории. Отечественная система МВС-15000ВМ (установлена в МСЦ -
Межведомственном суперкомпьютерном центре РАН,
http://www.jscc.ru
) пред-
ставляет собой кластер из 462 серверов IBM, каждый из которых включает
два процессора PowerPC 970 с частотой 2,2 ГГц и 4 Гб оперативной памяти,
производительность МВС-15000ВМ в тесте LINPACK равна 5,4 Тфлопс при
пиковой производительноcти в 8,1 Тфлопс на 56 месте в ‘Top-500’ (июнь
2005 г.).
Китай планирует в течение 11-й китайской пятилетки (2006
÷
2010 г.г.) вве-
сти в строй суперкомпьютер производительностью не менее 1 Петафлопс (1
Пфлопс=10
15
плавающих операций в секунду), однако Япония приблизи-
тельно к этому сроку планирует построить суперкомпьютер на 10 Пфлопс
                                     - 10 -


определяется максимальным числом операций, которое может быть выпол-
нено за единичное время при отсутствии связей между функциональными
устройствами, характеризует потенциальные возможности аппаратуры и
(вообще говоря) не зависит от выполняемой программы.
    Именно на основе LINPACK-теста регулярно составляются мировой спи-
сок наиболее быстродействующих вычислительных систем ‘Top-500’
(http://www.top500.org) в мире и внутри российский список ‘Top-50’
(http://www.supercomputers.ru). Более приближенным к реальным задачкам яв-
ляется       набор      тестов     NPB      (NAS    Parallel    Benchmarks,
http://www.nas.nasa.gov/NAS/NPB).
   Недостатком метода оценки пиковой производительности как числа вы-
полняемых компьютером команд в единицу времени (MIPS, Million Instruc-
tion Per Second) дает только самое общее представление о быстродействии,
т.к. не учитывает специфику конкретных программ (априори трудно предска-
зуемо, в какое число и каких именно инструкций процессора отобразится
пользовательская программа).
   Введенная в строй еще в 1999 г. в Sandia National Laboratories многопро-
цессорная система ASCI Red (Intel Paragon, США) имеет предельную (пико-
вую) производительность 3,2 триллионов операций в секунду (3,2 Тераф-
лопс), включает 9’632 микропроцессора Pentium Pro, общий объем оператив-
ной памяти 500 Гбайт и оценивается в сумму около 50 млн. $US. Список
‘Top-500’ некоторое время возглавлял созданный для моделирования клима-
тических изменений на основе полученных со спутников данных многопро-
цессорный комплекс Earth Simulator (NEC Vector, Япония), состоящий из 640
узлов (каждый узел включает 8 микропроцессоров SX-6 производительно-
стью 8 Гфлопс каждый), общий объем оперативной памяти 8 Тбайт, суммар-
ная пиковая производительностью 40 Тфлоп/сек (занимает площадь размера-
ми 65 × 50 м в специально построенном двухъярусном здании с системами
антисейсмики, кондиционирования воздуха и защиты от электромагнитных
излучений). 70-ти терафлопный Blue Gene/L заказан Минэнергетики США и
установлен в специализирующейся на ядерных проблемах Ливерморской ла-
боратории. Отечественная система МВС-15000ВМ (установлена в МСЦ -
Межведомственном суперкомпьютерном центре РАН, http://www.jscc.ru) пред-
ставляет собой кластер из 462 серверов IBM, каждый из которых включает
два процессора PowerPC 970 с частотой 2,2 ГГц и 4 Гб оперативной памяти,
производительность МВС-15000ВМ в тесте LINPACK равна 5,4 Тфлопс при
пиковой производительноcти в 8,1 Тфлопс на 56 месте в ‘Top-500’ (июнь
2005 г.).
   Китай планирует в течение 11-й китайской пятилетки (2006 ÷ 2010 г.г.) вве-
сти в строй суперкомпьютер производительностью не менее 1 Петафлопс (1
             15
Пфлопс=10 ‘плавающих’ операций в секунду), однако Япония приблизи-
тельно к этому сроку планирует построить суперкомпьютер на 10 Пфлопс