Распределенная обработка данных. Найханова Л.В. - 32 стр.

UptoLike

Составители: 

32
важные особенности:
1. Каждая из шести стратегий представляет собой один из возможных подходов к
решению этой проблемы, несмотря на очень значительные вариации во времени передачи
данных.
2. Интенсивность обмена данными и задержка доступа являются важными фактора-
ми, влияющими на выбор той или иной стратегии.
3. Для плохих стратегий продолжительность операций вычисления и ввода-вывода
данных пренебрежимо мала по сравнению со временем передачи данных. (Это в большей
или меньшей мере может относиться и к более совершенным стратегиям.)
В дополнение к сказанному выше следует отметить, что некоторые стратегии
позволяют выполнять параллельную обработку на двух узлах. Таким образом, время от-
клика в такой системе может оказаться меньше времени отклика в централизованной
системе. Обратите внимание, что в данном обсуждении игнорировался вопрос о том,
какой узел получает окончательные результаты.
Управление каталогом
Каталог распределенной системы содержит не только обычные данные, касающиеся
базовых отношений, представлений, индексов, пользователей и т.д., но также и всю ин-
формацию, необходимую для обеспечения независимости размещения, фрагментации и
репликации. В таком случае возникает вопрос: где и как следует хранить системный ка-
талог? Ниже перечислены некоторые варианты хранения системного каталога.
1. Централизованный каталог. Весь каталог хранится в одном месте, т.е. на цен-
тральном узле.
2. Полностью реплицированный каталог. Весь каталог полностью хранится на каж-
дом узле.
3. Секционированный каталог. На каждом узле содержится его собственный каталог
для объектов, хранимых на этом узле. Общий каталог является объединением
всех разъединенных локальных каталогов.
4. Комбинация первого и третьего вариантов. На каждом узле хранится собствен-
ный локальный каталог (как в п. 3), кроме того, на одном центральном узле хра-
нится унифицированная копия всех этих локальных каталогов (как в п. 1).
Для каждого подхода характерны определенные недостатки и проблемы. В первом
подходе, очевидно, не достигается "независимость от центрального узла". Во втором
утрачивается автономность функционирования, поскольку при обновлении каждого ка-
талога это обновление придется распространить на каждый узел. В третьем выполнение
нелокальных операций становится весьма дорогостоящим (для поиска удаленного объекта
потребуется в среднем осуществить доступ к половине имеющихся узлов). Четвертый
подход более эффективен, чем третий (для поиска удаленного объекта потребуется
осуществить доступ только к одному удаленному каталогу), но в нем снова не достигается
"независимость от центрального узла". В традиционных системах могут использовать
другие подходы. В качестве примера здесь рассматривается подход, использованный в
системе R*.
Для того чтобы описать структуру каталога системы R*, необходимо прежде всего
рассмотреть принятый в ней порядок именования объектов. Именование объектов
является существенным аспектом распределенных систем, поскольку, если два разных
узла А и В содержат хранимое отношение под одинаковым именем R, это приводит к
необходимости выработки некоторого метода обеспечения уникальности имен в рамках
всей системы. Однако при указании пользователю уточненного имени (например, A.R и
B.R) нарушается требование независимости расположения. В таком случае необходимо
отображение известных пользователям имен на соответствующие системные имена.
В системе R* используется следующий подход к этой проблеме. В ней вводятся
понятия печатного имени, т.е. имени объекта, на которое обычно ссылаются пользо-
 важные особенности:
       1. Каждая из шести стратегий представляет собой один из возможных подходов к
решению этой проблемы, несмотря на очень значительные вариации во времени передачи
данных.
       2. Интенсивность обмена данными и задержка доступа являются важными фактора-
ми, влияющими на выбор той или иной стратегии.
       3. Для плохих стратегий продолжительность операций вычисления и ввода-вывода
данных пренебрежимо мала по сравнению со временем передачи данных. (Это в большей
или меньшей мере может относиться и к более совершенным стратегиям.)
       В дополнение к сказанному выше следует отметить, что некоторые стратегии
 позволяют выполнять параллельную обработку на двух узлах. Таким образом, время от-
 клика в такой системе может оказаться меньше времени отклика в централизованной
 системе. Обратите внимание, что в данном обсуждении игнорировался вопрос о том,
 какой узел получает окончательные результаты.

      Управление каталогом
      Каталог распределенной системы содержит не только обычные данные, касающиеся
 базовых отношений, представлений, индексов, пользователей и т.д., но также и всю ин-
 формацию, необходимую для обеспечения независимости размещения, фрагментации и
 репликации. В таком случае возникает вопрос: где и как следует хранить системный ка-
 талог? Ниже перечислены некоторые варианты хранения системного каталога.
      1. Централизованный каталог. Весь каталог хранится в одном месте, т.е. на цен-
         тральном узле.
      2. Полностью реплицированный каталог. Весь каталог полностью хранится на каж-
         дом узле.
      3. Секционированный каталог. На каждом узле содержится его собственный каталог
         для объектов, хранимых на этом узле. Общий каталог является объединением
         всех разъединенных локальных каталогов.
      4. Комбинация первого и третьего вариантов. На каждом узле хранится собствен-
         ный локальный каталог (как в п. 3), кроме того, на одном центральном узле хра-
         нится унифицированная копия всех этих локальных каталогов (как в п. 1).
      Для каждого подхода характерны определенные недостатки и проблемы. В первом
 подходе, очевидно, не достигается "независимость от центрального узла". Во втором
 утрачивается автономность функционирования, поскольку при обновлении каждого ка-
 талога это обновление придется распространить на каждый узел. В третьем выполнение
 нелокальных операций становится весьма дорогостоящим (для поиска удаленного объекта
 потребуется в среднем осуществить доступ к половине имеющихся узлов). Четвертый
 подход более эффективен, чем третий (для поиска удаленного объекта потребуется
 осуществить доступ только к одному удаленному каталогу), но в нем снова не достигается
 "независимость от центрального узла". В традиционных системах могут использовать
 другие подходы. В качестве примера здесь рассматривается подход, использованный в
 системе R*.
      Для того чтобы описать структуру каталога системы R*, необходимо прежде всего
 рассмотреть принятый в ней порядок именования объектов. Именование объектов
 является существенным аспектом распределенных систем, поскольку, если два разных
 узла А и В содержат хранимое отношение под одинаковым именем R, это приводит к
 необходимости выработки некоторого метода обеспечения уникальности имен в рамках
 всей системы. Однако при указании пользователю уточненного имени (например, A.R и
 B.R) нарушается требование независимости расположения. В таком случае необходимо
 отображение известных пользователям имен на соответствующие системные имена.
      В системе R* используется следующий подход к этой проблеме. В ней вводятся
 понятия печатного имени, т.е. имени объекта, на которое обычно ссылаются пользо-

 32