Введение в практику разработки параллельных программ в стандарте MPI. Баканов В.М - 19 стр.

UptoLike

Составители: 

- 19 -
Заметим, что при запуске задачи на N вычислительных узлах львиную до-
ля вычислительной работы обычно выполняют N-1 рабочих SLAVE-узлов;
один управляющий (MASTER)-узел координирует работу остальных (подго-
тавливает и рассылает SLAVE-узлам данные для расчета, собирает данные и
осуществляет их дополнительную обработку).
На каждом узле в данный момент исполняется единственная задача (про-
цесс); в
случае недоступности требуемого количества узлов (выключены со-
ответствующие ПЭВМ, не загружен Linux или узлы в данный момент заняты
сторонними задачами) задание ставится в очередь до момента освобождения
нужного количества узлов.
При регистрации в системе МВС-900 нового пользователя
user_name соз-
дается его личный (‘домашний’) каталог
/home/user_name, в котором и про-
исходит вся работа пользователя. Выдача программой
my_program данных в
поток
stdout (например, при использовании функции printf) перенаправляется
в файл
/home/user_name/current_dir/my_program.N/output (где current_dirтеку-
щий подкаталог в домашнем каталоге;
N обычно =1); дополнительно в этом
же каталоге создаются файлы
.hosts (список участвующих в решении вычис-
лительных узлов),
errors (информация о происшедших при выполнении
ошибках),
manager.log (история прохождения задания в системе МВС-900) и
runmvs.bat (полный текст пакетного файла запуска задания).
Просмотр очереди заданий выполняется командой:
mtask –n <идентификатор_задачи> [-q <очередь>]
Задача с идентификатором
ID из очереди удаляется командами (от имени
пользователя и администратора соответственно):
mqdel имя_задачи
mqdelete /имя_user’a/имя_задачи
Также можно пользоваться командами mkill (cнятие задачи со счета, в слу-
чае
mkill ‘*’ снимается исполняющаяся задача пользователя), mfree (узнать чис-
ло свободных число свободных процессоров),
mqinfo (просмотр очереди).
Администратор кластера имеет возможность работать непосредственно с
консоли HOST-машины или в режиме удаленного доступа, используя
Telnet
или
SSH-клиентcкие программы (см. ниже). Пользователю в режиме удален-
ного доступа доступны следующие действия:
Обмен (двусторонний) файлами между своей (клиентской) машиной и
HOST-машиной кластера
Управление файловой системой (создание/изменение/удаление файлов и
каталогов и т.п.)
   Заметим, что при запуске задачи на N вычислительных узлах львиную до-
ля вычислительной работы обычно выполняют N-1 рабочих SLAVE-узлов;
один управляющий (MASTER)-узел координирует работу остальных (подго-
тавливает и рассылает SLAVE-узлам данные для расчета, собирает данные и
осуществляет их дополнительную обработку).
   На каждом узле в данный момент исполняется единственная задача (про-
цесс); в случае недоступности требуемого количества узлов (выключены со-
ответствующие ПЭВМ, не загружен Linux или узлы в данный момент заняты
сторонними задачами) задание ставится в очередь до момента освобождения
нужного количества узлов.
   При регистрации в системе МВС-900 нового пользователя user_name соз-
дается его личный (‘домашний’) каталог /home/user_name, в котором и про-
исходит вся работа пользователя. Выдача программой my_program данных в
поток stdout (например, при использовании функции printf) перенаправляется
в файл /home/user_name/current_dir/my_program.N/output (где current_dir – теку-
щий подкаталог в домашнем каталоге; N обычно =1); дополнительно в этом
же каталоге создаются файлы .hosts (список участвующих в решении вычис-
лительных узлов), errors (информация о происшедших при выполнении
ошибках), manager.log (история прохождения задания в системе МВС-900) и
runmvs.bat (полный текст пакетного файла запуска задания).
   Просмотр очереди заданий выполняется командой:

  mtask –n <идентификатор_задачи> [-q <очередь>]

  Задача с идентификатором ID из очереди удаляется командами (от имени
пользователя и администратора соответственно):

  mqdel имя_задачи

  mqdelete /имя_user’a/имя_задачи

  Также можно пользоваться командами mkill (cнятие задачи со счета, в слу-
чае mkill ‘*’ снимается исполняющаяся задача пользователя), mfree (узнать чис-
ло свободных число свободных процессоров), mqinfo (просмотр очереди).
  Администратор кластера имеет возможность работать непосредственно с
консоли HOST-машины или в режиме удаленного доступа, используя Telnet
или SSH-клиентcкие программы (см. ниже). Пользователю в режиме удален-
ного доступа доступны следующие действия:

• Обмен (двусторонний) файлами между своей (клиентской) машиной и
  HOST-машиной кластера
• Управление файловой системой (создание/изменение/удаление файлов и
  каталогов и т.п.)

                                       - 19 -