ВУЗ:
Составители:
Рубрика:
реляционных, либо в многомерных структурах. В связи с этим в настоящее
время применяются три способа хранения многомерных данных:
MOLAP (Multidimensional OLAP) – исходные и агрегатные данные
хранятся в многомерной базе данных. Хранение данных в многомерных
структурах позволяет манипулировать данными как многомерным
массивом, благодаря чему скорость вычисления агрегатных значений
одинакова для любого из измерений. Однако в этом случае многомерная
база данных оказывается избыточной, так как многомерные данные
полностью содержат исходные реляционные данные.
Эти системы обеспечивают полный цикл OLAP-обработки. Они либо
включают в себя, помимо серверного компонента, собственный
интегрированный клиентский интерфейс, либо используют для связи с
пользователем внешние программы работы с электронными таблицами.
ROLAP (Relational OLAP) – исходные данные остаются в той же
реляционной базе данных, где они изначально и находились. Агрегатные
же данные помещают в специально созданные для их хранения служебные
таблицы в той же базе данных.
HOLAP (Hybrid OLAP) – исходные данные остаются в той же
реляционной базе данных, где они изначально находились, а агрегатные
данные хранятся в многомерной базе данных.
Некоторые OLAP-средства поддерживают хранение данных только в
реляционных структурах, некоторые – только в многомерных. Однако
большинство современных серверных OLAP-средств поддерживают все
три способа хранения данных. Выбор способа хранения зависит от объема
и структуры исходных данных, требований к скорости выполнения
запросов и частоты обновления OLAP-кубов.
1.3.3.3. Интеллектуальный анализ данных (Data Mining)
Термин Data Mining обозначает процесс поиска корреляций,
тенденций и взаимосвязей посредством различных математических и
статистических алгоритмов: кластеризации, регрессионного и
корреляционного анализа и т. д. для систем поддержки принятия решений.
При этом накопленные сведения автоматически обобщаются до
информации, которая может быть охарактеризована как знания.
В основу современной технологии Data Mining положена концепция
шаблонов, отражающих закономерности, свойственные подвыборкам
данных и составляющие так называемые скрытые знания (рис. 1.21).
Поиск шаблонов производится методами, не использующими никаких
априорных предположений об этих подвыборках. Важной особенностью
Data Mining является нестандартность и неочевидность разыскиваемых
шаблонов. Иными словами, средства Data Mining отличаются от
инструментов статистической обработки данных и средств OLAP тем, что
вместо проверки заранее предполагаемых пользователями взаимосвязей
37
реляционных, либо в многомерных структурах. В связи с этим в настоящее время применяются три способа хранения многомерных данных: MOLAP (Multidimensional OLAP) исходные и агрегатные данные хранятся в многомерной базе данных. Хранение данных в многомерных структурах позволяет манипулировать данными как многомерным массивом, благодаря чему скорость вычисления агрегатных значений одинакова для любого из измерений. Однако в этом случае многомерная база данных оказывается избыточной, так как многомерные данные полностью содержат исходные реляционные данные. Эти системы обеспечивают полный цикл OLAP-обработки. Они либо включают в себя, помимо серверного компонента, собственный интегрированный клиентский интерфейс, либо используют для связи с пользователем внешние программы работы с электронными таблицами. ROLAP (Relational OLAP) исходные данные остаются в той же реляционной базе данных, где они изначально и находились. Агрегатные же данные помещают в специально созданные для их хранения служебные таблицы в той же базе данных. HOLAP (Hybrid OLAP) исходные данные остаются в той же реляционной базе данных, где они изначально находились, а агрегатные данные хранятся в многомерной базе данных. Некоторые OLAP-средства поддерживают хранение данных только в реляционных структурах, некоторые только в многомерных. Однако большинство современных серверных OLAP-средств поддерживают все три способа хранения данных. Выбор способа хранения зависит от объема и структуры исходных данных, требований к скорости выполнения запросов и частоты обновления OLAP-кубов. 1.3.3.3. Интеллектуальный анализ данных (Data Mining) Термин Data Mining обозначает процесс поиска корреляций, тенденций и взаимосвязей посредством различных математических и статистических алгоритмов: кластеризации, регрессионного и корреляционного анализа и т. д. для систем поддержки принятия решений. При этом накопленные сведения автоматически обобщаются до информации, которая может быть охарактеризована как знания. В основу современной технологии Data Mining положена концепция шаблонов, отражающих закономерности, свойственные подвыборкам данных и составляющие так называемые скрытые знания (рис. 1.21). Поиск шаблонов производится методами, не использующими никаких априорных предположений об этих подвыборках. Важной особенностью Data Mining является нестандартность и неочевидность разыскиваемых шаблонов. Иными словами, средства Data Mining отличаются от инструментов статистической обработки данных и средств OLAP тем, что вместо проверки заранее предполагаемых пользователями взаимосвязей 37
Страницы
- « первая
- ‹ предыдущая
- …
- 35
- 36
- 37
- 38
- 39
- …
- следующая ›
- последняя »