ВУЗ:
Составители:
172
Важнейшим элементом хранилища являются так называемые метаданные.
Метаданные описывают структуру, размещение, трансформацию данных, используе-
мых любыми процессами хранилища.
Метаданные могут быть востребованы для различных целей, например: извлечения и
загрузки данных; обслуживания хранилища и запросов.
Метаданные для различных процессов могут иметь различную структуру, т. е. для од-
ного и того же элемента данных может существовать несколько вариантов метаданных.
4.4.2. Информационные потоки данных в хранилище
В технологии хранилищ данных можно выделить пять основных информационных по-
токов данных (Рис. 4.7) [15].
Входной поток представляет процессы извлечения, очистки и загрузки исходных дан-
ных в хранилище. Поступающие данные в хранилище подвергаются перестройке в соответ-
ствии с определенными требованиями. Перестройка может включать следующие действия:
• очистку данных;
• преобразование данных;
• проверку внутренней непротиворечивости данных и их непротиворечивости по отно-
шению к данным хранилища.
Сложность процесса извлечения информации зависит от степени согласованности меж-
ду различными источниками информации.
Восходящий поток связан повышением ценности сохраняемых в хранилище данных и
включает следующие процессы:
• обобщение данных посредством, как реляционных операций, так и проведения слож-
ного статистического анализа данных для получения удобных и полезных для пользователя
представлений информации;
• упаковку данных с преобразованием в более удобный формат представления (элек-
тронные таблицы, диаграммы и многое другое);
• распределение исходных данных на соответствующие группы для повышения их под-
готовленности к использованию и доступности.
Нисходящий поток определяет архивирование и резервное копирование данных. Нис-
ходящий поток включает также процедуры, обеспечивающие возможность восстановления
текущего состояния хранилища в случае потери данных после сбоев в программном или ап-
паратном обеспечении.
Выходной поток — предоставление данных пользователям. Для его формирования
пользователю должна предоставляться среда с эффективно работающими инструментами,
позволяющими создавать разнообразные запросы, обеспечивая доступ к наиболее подходя-
щим данным хранилища. Данный поток может содержать и публикации различных объектов,
которые доставляются по рассылке на рабочие станции конечным пользователям.
Метапоток определяет управление метаданными. Он связан с перемещением самих
метаданных. Поскольку метаданные содержат описание информации хранилища данных, ко-
торое со временем меняется, то и сам метапоток должен соответственно обновляться во вре-
мени.
Важнейшим элементом хранилища являются так называемые метаданные.
Метаданные описывают структуру, размещение, трансформацию данных, используе-
мых любыми процессами хранилища.
Метаданные могут быть востребованы для различных целей, например: извлечения и
загрузки данных; обслуживания хранилища и запросов.
Метаданные для различных процессов могут иметь различную структуру, т. е. для од-
ного и того же элемента данных может существовать несколько вариантов метаданных.
4.4.2. Информационные потоки данных в хранилище
В технологии хранилищ данных можно выделить пять основных информационных по-
токов данных (Рис. 4.7) [15].
Входной поток представляет процессы извлечения, очистки и загрузки исходных дан-
ных в хранилище. Поступающие данные в хранилище подвергаются перестройке в соответ-
ствии с определенными требованиями. Перестройка может включать следующие действия:
• очистку данных;
• преобразование данных;
• проверку внутренней непротиворечивости данных и их непротиворечивости по отно-
шению к данным хранилища.
Сложность процесса извлечения информации зависит от степени согласованности меж-
ду различными источниками информации.
Восходящий поток связан повышением ценности сохраняемых в хранилище данных и
включает следующие процессы:
• обобщение данных посредством, как реляционных операций, так и проведения слож-
ного статистического анализа данных для получения удобных и полезных для пользователя
представлений информации;
• упаковку данных с преобразованием в более удобный формат представления (элек-
тронные таблицы, диаграммы и многое другое);
• распределение исходных данных на соответствующие группы для повышения их под-
готовленности к использованию и доступности.
Нисходящий поток определяет архивирование и резервное копирование данных. Нис-
ходящий поток включает также процедуры, обеспечивающие возможность восстановления
текущего состояния хранилища в случае потери данных после сбоев в программном или ап-
паратном обеспечении.
Выходной поток — предоставление данных пользователям. Для его формирования
пользователю должна предоставляться среда с эффективно работающими инструментами,
позволяющими создавать разнообразные запросы, обеспечивая доступ к наиболее подходя-
щим данным хранилища. Данный поток может содержать и публикации различных объектов,
которые доставляются по рассылке на рабочие станции конечным пользователям.
Метапоток определяет управление метаданными. Он связан с перемещением самих
метаданных. Поскольку метаданные содержат описание информации хранилища данных, ко-
торое со временем меняется, то и сам метапоток должен соответственно обновляться во вре-
мени.
172
Страницы
- « первая
- ‹ предыдущая
- …
- 170
- 171
- 172
- 173
- 174
- …
- следующая ›
- последняя »
