ВУЗ:
Составители:
Рубрика:
– во время загрузки в ХД записи сортируются, очищаются от
ненужной информации и приводят к единому формату. После такой
обработки это уже совсем другие данные.
1.3.2.3. Классификация данных в хранилище данных
Все данные в хранилище данных делятся на три основных категории:
– метаданные;
– детальные (текущие) данные;
– агрегированные данные.
В отличие от ОБД ХД имеет хорошо развитую структуру метаданных
(или данных о данных). Метаданные играют роль справочника,
содержащего сведения об источниках первичных данных, алгоритмах
обработки, которым исходные данные были подвергнуты и т. д. Наличие
метаданных позволяет осуществлять быструю и удобную навигацию по
различным уровням данных, а также сильно упрощает реализацию и
использование средств анализа.
Детальные (текущие) данные в ХД являются денормализованными, по
сравнению с нормализованными данными в большинстве ОБД. Это
свойство ХД позволяет существенно повысить скорость доступа к
необходимым данным, хотя и требует большей емкости носителей
информации.
Наличие хорошо развитой иерархии агрегированных данных по
уровням агрегации является отличительной чертой хранилища данных.
Проведенные исследования показали, что большинство конечных
пользователей не работают с детальными данными, а обращаются в
основном к агрегированным показателям. Структура ХД отражает эту
ситуацию и позволяет конечному пользователю быстро и удобно получать
интересующую его агрегированную информацию с последующей
навигацией по всем уровням агрегирования.
В процессе эксплуатации необходимость в ряде детальных данных
может сильно упасть, что является причиной подразделения детальных
данных на текущие и старые (рис. 1.3). В то время как текущие данные
регулярно используются и поэтому хранятся на накопителях с быстрым
доступом (в основном на жестких дисках), старые детальные данные могут
храниться на более емких накопителях с более медленным доступом
(например, на оптических дисках или магнитных лентах).
При создании хранилища данных крайне нежелательно использование
оптимизированных структур (многомерных, звездообразных и др.), ввиду
свойственной им негибкости. Использование реляционной,
нормализованной модели в качестве основы хранилища данных
максимально облегчит дальнейшее развитие такого хранилища. Если при
этом, запросы пользователя поступают только в витрины данных, то от
хранилища данных потребуется вместо необходимости поддерживать
16
во время загрузки в ХД записи сортируются, очищаются от ненужной информации и приводят к единому формату. После такой обработки это уже совсем другие данные. 1.3.2.3. Классификация данных в хранилище данных Все данные в хранилище данных делятся на три основных категории: метаданные; детальные (текущие) данные; агрегированные данные. В отличие от ОБД ХД имеет хорошо развитую структуру метаданных (или данных о данных). Метаданные играют роль справочника, содержащего сведения об источниках первичных данных, алгоритмах обработки, которым исходные данные были подвергнуты и т. д. Наличие метаданных позволяет осуществлять быструю и удобную навигацию по различным уровням данных, а также сильно упрощает реализацию и использование средств анализа. Детальные (текущие) данные в ХД являются денормализованными, по сравнению с нормализованными данными в большинстве ОБД. Это свойство ХД позволяет существенно повысить скорость доступа к необходимым данным, хотя и требует большей емкости носителей информации. Наличие хорошо развитой иерархии агрегированных данных по уровням агрегации является отличительной чертой хранилища данных. Проведенные исследования показали, что большинство конечных пользователей не работают с детальными данными, а обращаются в основном к агрегированным показателям. Структура ХД отражает эту ситуацию и позволяет конечному пользователю быстро и удобно получать интересующую его агрегированную информацию с последующей навигацией по всем уровням агрегирования. В процессе эксплуатации необходимость в ряде детальных данных может сильно упасть, что является причиной подразделения детальных данных на текущие и старые (рис. 1.3). В то время как текущие данные регулярно используются и поэтому хранятся на накопителях с быстрым доступом (в основном на жестких дисках), старые детальные данные могут храниться на более емких накопителях с более медленным доступом (например, на оптических дисках или магнитных лентах). При создании хранилища данных крайне нежелательно использование оптимизированных структур (многомерных, звездообразных и др.), ввиду свойственной им негибкости. Использование реляционной, нормализованной модели в качестве основы хранилища данных максимально облегчит дальнейшее развитие такого хранилища. Если при этом, запросы пользователя поступают только в витрины данных, то от хранилища данных потребуется вместо необходимости поддерживать 16
Страницы
- « первая
- ‹ предыдущая
- …
- 14
- 15
- 16
- 17
- 18
- …
- следующая ›
- последняя »