Корпоративные информационные системы. Борисов Д.Н. - 12 стр.

UptoLike

Составители: 

5. Согласование и консолидация. Как только имя и адрес
очищены, для устранения дублированных данных о клиентах в рамках
каждого списка и соединения данных из различных источников
применяется функция согласования. Большинство таких средств содержат
алгоритмы расстановки приоритетов между полями (в процессе
согласования) и контроля очередности сравнения полей.
1.3.2.2. Структура хранилища данных
В состав хранилища данных, как правило, входит:
виртуальное хранилище данных;
витрины данных;
глобальное хранилище данных;
многоуровневая архитектура хранилища данных.
Виртуальное хранилище данных. В его основе лежит репозиторий
метаданных, который описывается источниками информации (БД
транзакционных систем, внешние файлы и др.), SQL-запросами для их
считывания и процедурами обработки и предоставления информации.
Непосредственный доступ к последним обеспечивает программное
обеспечение промежуточного слоя. В этом случае избыточность данных
нулевая. Конечные пользователи фактически работают с транзакционными
системами напрямую со всеми вытекающими отсюда плюсами (доступ к
не агрегированным данным в реальном времени) и минусами
(интенсивный сетевой трафик, снижение производительности OLTP-
систем и реальная угроза их работоспособности вследствие неудачных
действий пользователей-аналитиков).
Витрина данных. Витрина данных (Data Mart) – это облегченный
вариант хранилища данных, содержащий только тематически
объединенные данные. Целевая база данных максимально приближена к
конечному пользователю и может содержать тематически
ориентированные агрегатные данные. Витрина данных существенно
меньше по объему, чем хранилище данных, поэтому его реализации не
требуется мощная вычислительная техника.
Глобальное хранилище данных. В последнее время все более
популярной становится идея совместить концепции хранилища и витрины
данных в одной реализации и использовать хранилище данных в качестве
единственного источника интегрированных данных для всех витрин
данных. Тогда естественной становится следующая трехуровневая
архитектура системы.
На первом уровне реализуется корпоративное хранилище данных на
основе одной из развитых современных реляционных СУБД. Это
хранилище состоит, в основном, из детализированных данных.
Реляционные СУБД обеспечивают эффективное хранение и управление
данными очень большого объема, но не слишком хорошо соответствуют
12
    5. Согласование и консолидация. Как только имя и адрес
очищены, для устранения дублированных данных о клиентах в рамках
каждого списка и соединения данных из различных источников
применяется функция согласования. Большинство таких средств содержат
алгоритмы расстановки приоритетов между полями (в процессе
согласования) и контроля очередности сравнения полей.

1.3.2.2. Структура хранилища данных
     В состав хранилища данных, как правило, входит:
     – виртуальное хранилище данных;
     – витрины данных;
     – глобальное хранилище данных;
     – многоуровневая архитектура хранилища данных.
     Виртуальное хранилище данных. В его основе лежит репозиторий
метаданных, который описывается источниками информации (БД
транзакционных систем, внешние файлы и др.), SQL-запросами для их
считывания и процедурами обработки и предоставления информации.
Непосредственный доступ к последним обеспечивает программное
обеспечение промежуточного слоя. В этом случае избыточность данных
нулевая. Конечные пользователи фактически работают с транзакционными
системами напрямую со всеми вытекающими отсюда плюсами (доступ к
не агрегированным данным в реальном времени) и минусами
(интенсивный сетевой трафик, снижение производительности OLTP-
систем и реальная угроза их работоспособности вследствие неудачных
действий пользователей-аналитиков).
     Витрина данных. Витрина данных (Data Mart) – это облегченный
вариант хранилища данных, содержащий только тематически
объединенные данные. Целевая база данных максимально приближена к
конечному      пользователю    и    может     содержать   тематически
ориентированные агрегатные данные. Витрина данных существенно
меньше по объему, чем хранилище данных, поэтому его реализации не
требуется мощная вычислительная техника.
     Глобальное хранилище данных. В последнее время все более
популярной становится идея совместить концепции хранилища и витрины
данных в одной реализации и использовать хранилище данных в качестве
единственного источника интегрированных данных для всех витрин
данных. Тогда естественной становится следующая трехуровневая
архитектура системы.
     На первом уровне реализуется корпоративное хранилище данных на
основе одной из развитых современных реляционных СУБД. Это
хранилище состоит, в основном, из детализированных данных.
Реляционные СУБД обеспечивают эффективное хранение и управление
данными очень большого объема, но не слишком хорошо соответствуют

                                 12