Информационные технологии: Электронный учебник. Рагулин П.Г. - 172 стр.

UptoLike

Составители: 

172
Важнейшим элементом хранилища являются так называемые метаданные.
Метаданные описывают структуру, размещение, трансформацию данных, используе-
мых любыми процессами хранилища.
Метаданные могут быть востребованы для различных целей, например: извлечения и
загрузки данных; обслуживания хранилища и запросов.
Метаданные для различных процессов могут иметь различную структуру, т. е. для од-
ного и того же элемента данных может существовать несколько вариантов метаданных.
4.4.2. Информационные потоки данных в хранилище
В технологии хранилищ данных можно выделить пять основных информационных по-
токов данных (Рис. 4.7) [15].
Входной поток представляет процессы извлечения, очистки и загрузки исходных дан-
ных в хранилище. Поступающие данные в хранилище подвергаются перестройке в соответ-
ствии с определенными требованиями. Перестройка может включать следующие действия:
очистку данных;
преобразование данных;
проверку внутренней непротиворечивости данных и их непротиворечивости по отно-
шению к данным хранилища.
Сложность процесса извлечения информации зависит от степени согласованности меж-
ду различными источниками информации.
Восходящий поток связан повышением ценности сохраняемых в хранилище данных и
включает следующие процессы:
обобщение данных посредством, как реляционных операций, так и проведения слож-
ного статистического анализа данных для получения удобных и полезных для пользователя
представлений информации;
упаковку данных с преобразованием в более удобный формат представления (элек-
тронные таблицы, диаграммы и многое другое);
распределение исходных данных на соответствующие группы для повышения их под-
готовленности к использованию и доступности.
Нисходящий поток определяет архивирование и резервное копирование данных. Нис-
ходящий поток включает также процедуры, обеспечивающие возможность восстановления
текущего состояния хранилища в случае потери данных после сбоев в программном или ап-
паратном обеспечении.
Выходной потокпредоставление данных пользователям. Для его формирования
пользователю должна предоставляться среда с эффективно работающими инструментами,
позволяющими создавать разнообразные запросы, обеспечивая доступ к наиболее подходя-
щим данным хранилища. Данный поток может содержать и публикации различных объектов,
которые доставляются по рассылке на рабочие станции конечным пользователям.
Метапоток определяет управление метаданными. Он связан с перемещением самих
метаданных. Поскольку метаданные содержат описание информации хранилища данных, ко-
торое со временем меняется, то и сам метапоток должен соответственно обновляться во вре-
мени.
     Важнейшим элементом хранилища являются так называемые метаданные.
     Метаданные описывают структуру, размещение, трансформацию данных, используе-
мых любыми процессами хранилища.
     Метаданные могут быть востребованы для различных целей, например: извлечения и
загрузки данных; обслуживания хранилища и запросов.
     Метаданные для различных процессов могут иметь различную структуру, т. е. для од-
ного и того же элемента данных может существовать несколько вариантов метаданных.



     4.4.2. Информационные потоки данных в хранилище

     В технологии хранилищ данных можно выделить пять основных информационных по-
токов данных (Рис. 4.7) [15].
     Входной поток представляет процессы извлечения, очистки и загрузки исходных дан-
ных в хранилище. Поступающие данные в хранилище подвергаются перестройке в соответ-
ствии с определенными требованиями. Перестройка может включать следующие действия:
     • очистку данных;
     • преобразование данных;
    • проверку внутренней непротиворечивости данных и их непротиворечивости по отно-
шению к данным хранилища.
     Сложность процесса извлечения информации зависит от степени согласованности меж-
ду различными источниками информации.
    Восходящий поток связан повышением ценности сохраняемых в хранилище данных и
включает следующие процессы:
     • обобщение данных посредством, как реляционных операций, так и проведения слож-
ного статистического анализа данных для получения удобных и полезных для пользователя
представлений информации;
     • упаковку данных с преобразованием в более удобный формат представления (элек-
тронные таблицы, диаграммы и многое другое);
     • распределение исходных данных на соответствующие группы для повышения их под-
готовленности к использованию и доступности.
     Нисходящий поток определяет архивирование и резервное копирование данных. Нис-
ходящий поток включает также процедуры, обеспечивающие возможность восстановления
текущего состояния хранилища в случае потери данных после сбоев в программном или ап-
паратном обеспечении.
     Выходной поток — предоставление данных пользователям. Для его формирования
пользователю должна предоставляться среда с эффективно работающими инструментами,
позволяющими создавать разнообразные запросы, обеспечивая доступ к наиболее подходя-
щим данным хранилища. Данный поток может содержать и публикации различных объектов,
которые доставляются по рассылке на рабочие станции конечным пользователям.
     Метапоток определяет управление метаданными. Он связан с перемещением самих
метаданных. Поскольку метаданные содержат описание информации хранилища данных, ко-
торое со временем меняется, то и сам метапоток должен соответственно обновляться во вре-
мени.

                                          172