Распределенная обработка данных. Найханова Л.В. - 64 стр.

UptoLike

Составители: 

64
Лекция 6. Разновидности распределенных систем
Возможны однородные и неоднородные распределенные базы данных. В
однородном случае каждая локальная база данных управляется одной и той же СУБД. В
неоднородной системе локальные базы данных могут относиться даже к разным моделям
данных. Сетевая интеграция неоднородных баз данных - это актуальная, но очень сложная
проблема. Многие решения известны на теоретическом уровне, но пока не удается
справиться с главной проблемой - недостаточной эффективностью интегрированных
систем.
Заметим, что более успешно практически решается промежуточная задача -
интеграция неоднородных SQL-ориентированных систем. Понятно, что этому в большой
степени способствует стандартизация языка SQL и общее следование производителей
СУБД принципам открытых систем. Мы ограничимся рассмотрением проблем интеграции
однородных распределенных СУБД на примере гипотетической системы System R*. Но
прежде чем перейти к ним рассмотрим внутреннюю организацию многопользовательских
реляционных СУБД.
Внутренняя организация реляционных СУБД
Реляционные СУБД обладают рядом особенностей, влияющих на организацию
внешней памяти. К наиболее важным особенностям можно отнести следующие:
- Наличие двух уровней системы: уровня непосредственного управления данными
во внешней памяти (а также обычно управления буферами оперативной памяти,
управления транзакциями и журнализацией изменений БД) и языкового уровня
(например, уровня, реализующего язык SQL). При такой организации подсистема
нижнего уровня должна поддерживать во внешней памяти набор базовых
структур, конкретная интерпретация которых входит в число функций
подсистемы верхнего уровня.
- Поддержание отношений-каталогов. Информация, связанная с именованием
объектов базы данных и их конкретными свойствами (например, структура
ключа индекса), поддерживается подсистемой языкового уровня. С точки зрения
структур внешней памяти отношение-каталог ничем не отличается от обычного
отношения базы данных.
- Регулярность структур данных. Поскольку основным объектом реляционной
модели данных является плоская таблица, главный набор объектов внешней
памяти может иметь очень простую регулярную структуру. При этом
необходимо обеспечить возможность эффективного выполнения операторов
языкового уровня как над одним отношением (простые селекция и проекция), так
и над несколькими отношениями (наиболее распространено и трудоемко
соединение нескольких отношений). Для этого во внешней памяти должны
поддерживаться дополнительные "управляющие" структуры - индексы.
- Избыточность хранения данных Это свойство необходимо поддерживать для
выполнения требования надежного хранения баз данных, что обычно реализуется
в виде журнала изменений базы данных и копий базы данных.
Соответственно возникают следующие разновидности объектов во внешней памяти
базы данных:
- строки отношений - основная часть базы данных, большей частью
непосредственно видимая пользователям;
- управляющие структуры - индексы, создаваемые по инициативе пользователя
(администратора) или верхнего уровня системы из соображений повышения
Лекция 6. Разновидности распределенных систем
     Возможны однородные и неоднородные распределенные базы данных. В
однородном случае каждая локальная база данных управляется одной и той же СУБД. В
неоднородной системе локальные базы данных могут относиться даже к разным моделям
данных. Сетевая интеграция неоднородных баз данных - это актуальная, но очень сложная
проблема. Многие решения известны на теоретическом уровне, но пока не удается
справиться с главной проблемой - недостаточной эффективностью интегрированных
систем.
     Заметим, что более успешно практически решается промежуточная задача -
интеграция неоднородных SQL-ориентированных систем. Понятно, что этому в большой
степени способствует стандартизация языка SQL и общее следование производителей
СУБД принципам открытых систем. Мы ограничимся рассмотрением проблем интеграции
однородных распределенных СУБД на примере гипотетической системы System R*. Но
прежде чем перейти к ним рассмотрим внутреннюю организацию многопользовательских
реляционных СУБД.


     Внутренняя организация реляционных СУБД
     Реляционные СУБД обладают рядом особенностей, влияющих на организацию
внешней памяти. К наиболее важным особенностям можно отнести следующие:
     - Наличие двух уровней системы: уровня непосредственного управления данными
        во внешней памяти (а также обычно управления буферами оперативной памяти,
        управления транзакциями и журнализацией изменений БД) и языкового уровня
        (например, уровня, реализующего язык SQL). При такой организации подсистема
        нижнего уровня должна поддерживать во внешней памяти набор базовых
        структур, конкретная интерпретация которых входит в число функций
        подсистемы верхнего уровня.
     - Поддержание отношений-каталогов. Информация, связанная с именованием
        объектов базы данных и их конкретными свойствами (например, структура
        ключа индекса), поддерживается подсистемой языкового уровня. С точки зрения
        структур внешней памяти отношение-каталог ничем не отличается от обычного
        отношения базы данных.
     - Регулярность структур данных. Поскольку основным объектом реляционной
        модели данных является плоская таблица, главный набор объектов внешней
        памяти может иметь очень простую регулярную структуру. При этом
        необходимо обеспечить возможность эффективного выполнения операторов
        языкового уровня как над одним отношением (простые селекция и проекция), так
        и над несколькими отношениями (наиболее распространено и трудоемко
        соединение нескольких отношений). Для этого во внешней памяти должны
        поддерживаться дополнительные "управляющие" структуры - индексы.
     - Избыточность хранения данных Это свойство необходимо поддерживать для
        выполнения требования надежного хранения баз данных, что обычно реализуется
        в виде журнала изменений базы данных и копий базы данных.
     Соответственно возникают следующие разновидности объектов во внешней памяти
базы данных:
     - строки отношений - основная часть базы данных, большей частью
        непосредственно видимая пользователям;
     - управляющие структуры - индексы, создаваемые по инициативе пользователя
        (администратора) или верхнего уровня системы из соображений повышения



64