Распределенная обработка данных. Найханова Л.В. - 32 стр.

UptoLike

ВУЗ:

ВСГУТУ | Улан-Удэ

Составители:

Найханова Л.В.

Рубрика:

Информационные системы и базы данных

важные особенности:

1. Каждая из шести стратегий представляет собой один из возможных подходов к

решению этой проблемы, несмотря на очень значительные вариации во времени передачи

данных.

2. Интенсивность обмена данными и задержка доступа являются важными фактора-

ми, влияющими на выбор той или иной стратегии.

3. Для плохих стратегий продолжительность операций вычисления и ввода-вывода

данных пренебрежимо мала по сравнению со временем передачи данных. (Это в большей

или меньшей мере может относиться и к более совершенным стратегиям.)

В дополнение к сказанному выше следует отметить, что некоторые стратегии

позволяют выполнять параллельную обработку на двух узлах. Таким образом, время от-

клика в такой системе может оказаться меньше времени отклика в централизованной

системе. Обратите внимание, что в данном обсуждении игнорировался вопрос о том,

какой узел получает окончательные результаты.

Управление каталогом

Каталог распределенной системы содержит не только обычные данные, касающиеся

базовых отношений, представлений, индексов, пользователей и т.д., но также и всю ин-

формацию, необходимую для обеспечения независимости размещения, фрагментации и

репликации. В таком случае возникает вопрос: где и как следует хранить системный ка-

талог? Ниже перечислены некоторые варианты хранения системного каталога.

1. Централизованный каталог. Весь каталог хранится в одном месте, т.е. на цен-

тральном узле.

2. Полностью реплицированный каталог. Весь каталог полностью хранится на каж-

дом узле.

3. Секционированный каталог. На каждом узле содержится его собственный каталог

для объектов, хранимых на этом узле. Общий каталог является объединением

всех разъединенных локальных каталогов.

4. Комбинация первого и третьего вариантов. На каждом узле хранится собствен-

ный локальный каталог (как в п. 3), кроме того, на одном центральном узле хра-

нится унифицированная копия всех этих локальных каталогов (как в п. 1).

Для каждого подхода характерны определенные недостатки и проблемы. В первом

подходе, очевидно, не достигается "независимость от центрального узла". Во втором

утрачивается автономность функционирования, поскольку при обновлении каждого ка-

талога это обновление придется распространить на каждый узел. В третьем выполнение

нелокальных операций становится весьма дорогостоящим (для поиска удаленного объекта

потребуется в среднем осуществить доступ к половине имеющихся узлов). Четвертый

подход более эффективен, чем третий (для поиска удаленного объекта потребуется

осуществить доступ только к одному удаленному каталогу), но в нем снова не достигается

"независимость от центрального узла". В традиционных системах могут использовать

другие подходы. В качестве примера здесь рассматривается подход, использованный в

системе R*.

Для того чтобы описать структуру каталога системы R*, необходимо прежде всего

рассмотреть принятый в ней порядок именования объектов. Именование объектов

является существенным аспектом распределенных систем, поскольку, если два разных

узла А и В содержат хранимое отношение под одинаковым именем R, это приводит к

необходимости выработки некоторого метода обеспечения уникальности имен в рамках

всей системы. Однако при указании пользователю уточненного имени (например, A.R и

B.R) нарушается требование независимости расположения. В таком случае необходимо

отображение известных пользователям имен на соответствующие системные имена.

В системе R* используется следующий подход к этой проблеме. В ней вводятся

понятия печатного имени, т.е. имени объекта, на которое обычно ссылаются пользо-

важные особенности:
1. Каждая из шести стратегий представляет собой один из возможных подходов к
решению этой проблемы, несмотря на очень значительные вариации во времени передачи
данных.
2. Интенсивность обмена данными и задержка доступа являются важными фактора-
ми, влияющими на выбор той или иной стратегии.
3. Для плохих стратегий продолжительность операций вычисления и ввода-вывода
данных пренебрежимо мала по сравнению со временем передачи данных. (Это в большей
или меньшей мере может относиться и к более совершенным стратегиям.)
В дополнение к сказанному выше следует отметить, что некоторые стратегии
позволяют выполнять параллельную обработку на двух узлах. Таким образом, время от-
клика в такой системе может оказаться меньше времени отклика в централизованной
системе. Обратите внимание, что в данном обсуждении игнорировался вопрос о том,
какой узел получает окончательные результаты.

Управление каталогом
Каталог распределенной системы содержит не только обычные данные, касающиеся
базовых отношений, представлений, индексов, пользователей и т.д., но также и всю ин-
формацию, необходимую для обеспечения независимости размещения, фрагментации и
репликации. В таком случае возникает вопрос: где и как следует хранить системный ка-
талог? Ниже перечислены некоторые варианты хранения системного каталога.
1. Централизованный каталог. Весь каталог хранится в одном месте, т.е. на цен-
тральном узле.
2. Полностью реплицированный каталог. Весь каталог полностью хранится на каж-
дом узле.
3. Секционированный каталог. На каждом узле содержится его собственный каталог
для объектов, хранимых на этом узле. Общий каталог является объединением
всех разъединенных локальных каталогов.
4. Комбинация первого и третьего вариантов. На каждом узле хранится собствен-
ный локальный каталог (как в п. 3), кроме того, на одном центральном узле хра-
нится унифицированная копия всех этих локальных каталогов (как в п. 1).
Для каждого подхода характерны определенные недостатки и проблемы. В первом
подходе, очевидно, не достигается "независимость от центрального узла". Во втором
утрачивается автономность функционирования, поскольку при обновлении каждого ка-
талога это обновление придется распространить на каждый узел. В третьем выполнение
нелокальных операций становится весьма дорогостоящим (для поиска удаленного объекта
потребуется в среднем осуществить доступ к половине имеющихся узлов). Четвертый
подход более эффективен, чем третий (для поиска удаленного объекта потребуется
осуществить доступ только к одному удаленному каталогу), но в нем снова не достигается
"независимость от центрального узла". В традиционных системах могут использовать
другие подходы. В качестве примера здесь рассматривается подход, использованный в
системе R*.
Для того чтобы описать структуру каталога системы R*, необходимо прежде всего
рассмотреть принятый в ней порядок именования объектов. Именование объектов
является существенным аспектом распределенных систем, поскольку, если два разных
узла А и В содержат хранимое отношение под одинаковым именем R, это приводит к
необходимости выработки некоторого метода обеспечения уникальности имен в рамках
всей системы. Однако при указании пользователю уточненного имени (например, A.R и
B.R) нарушается требование независимости расположения. В таком случае необходимо
отображение известных пользователям имен на соответствующие системные имена.
В системе R* используется следующий подход к этой проблеме. В ней вводятся
понятия печатного имени, т.е. имени объекта, на которое обычно ссылаются пользо-

Заказать работу

Вы здесь

Распределенная обработка данных. Найханова Л.В. - 32 стр.

UptoLike

ВУЗ:

Найханова Л.В.

Информационные системы и базы данных

Страницы