Корпоративные информационные системы. Борисов Д.Н. - 37 стр.

UptoLike

Составители: 

реляционных, либо в многомерных структурах. В связи с этим в настоящее
время применяются три способа хранения многомерных данных:
MOLAP (Multidimensional OLAP) – исходные и агрегатные данные
хранятся в многомерной базе данных. Хранение данных в многомерных
структурах позволяет манипулировать данными как многомерным
массивом, благодаря чему скорость вычисления агрегатных значений
одинакова для любого из измерений. Однако в этом случае многомерная
база данных оказывается избыточной, так как многомерные данные
полностью содержат исходные реляционные данные.
Эти системы обеспечивают полный цикл OLAP-обработки. Они либо
включают в себя, помимо серверного компонента, собственный
интегрированный клиентский интерфейс, либо используют для связи с
пользователем внешние программы работы с электронными таблицами.
ROLAP (Relational OLAP) – исходные данные остаются в той же
реляционной базе данных, где они изначально и находились. Агрегатные
же данные помещают в специально созданные для их хранения служебные
таблицы в той же базе данных.
HOLAP (Hybrid OLAP) исходные данные остаются в той же
реляционной базе данных, где они изначально находились, а агрегатные
данные хранятся в многомерной базе данных.
Некоторые OLAP-средства поддерживают хранение данных только в
реляционных структурах, некоторыетолько в многомерных. Однако
большинство современных серверных OLAP-средств поддерживают все
три способа хранения данных. Выбор способа хранения зависит от объема
и структуры исходных данных, требований к скорости выполнения
запросов и частоты обновления OLAP-кубов.
1.3.3.3. Интеллектуальный анализ данных (Data Mining)
Термин Data Mining обозначает процесс поиска корреляций,
тенденций и взаимосвязей посредством различных математических и
статистических алгоритмов: кластеризации, регрессионного и
корреляционного анализа и т. д. для систем поддержки принятия решений.
При этом накопленные сведения автоматически обобщаются до
информации, которая может быть охарактеризована как знания.
В основу современной технологии Data Mining положена концепция
шаблонов, отражающих закономерности, свойственные подвыборкам
данных и составляющие так называемые скрытые знания (рис. 1.21).
Поиск шаблонов производится методами, не использующими никаких
априорных предположений об этих подвыборках. Важной особенностью
Data Mining является нестандартность и неочевидность разыскиваемых
шаблонов. Иными словами, средства Data Mining отличаются от
инструментов статистической обработки данных и средств OLAP тем, что
вместо проверки заранее предполагаемых пользователями взаимосвязей
37
реляционных, либо в многомерных структурах. В связи с этим в настоящее
время применяются три способа хранения многомерных данных:
     MOLAP (Multidimensional OLAP) – исходные и агрегатные данные
хранятся в многомерной базе данных. Хранение данных в многомерных
структурах позволяет манипулировать данными как многомерным
массивом, благодаря чему скорость вычисления агрегатных значений
одинакова для любого из измерений. Однако в этом случае многомерная
база данных оказывается избыточной, так как многомерные данные
полностью содержат исходные реляционные данные.
     Эти системы обеспечивают полный цикл OLAP-обработки. Они либо
включают в себя, помимо серверного компонента, собственный
интегрированный клиентский интерфейс, либо используют для связи с
пользователем внешние программы работы с электронными таблицами.
     ROLAP (Relational OLAP) – исходные данные остаются в той же
реляционной базе данных, где они изначально и находились. Агрегатные
же данные помещают в специально созданные для их хранения служебные
таблицы в той же базе данных.
     HOLAP (Hybrid OLAP) – исходные данные остаются в той же
реляционной базе данных, где они изначально находились, а агрегатные
данные хранятся в многомерной базе данных.
     Некоторые OLAP-средства поддерживают хранение данных только в
реляционных структурах, некоторые – только в многомерных. Однако
большинство современных серверных OLAP-средств поддерживают все
три способа хранения данных. Выбор способа хранения зависит от объема
и структуры исходных данных, требований к скорости выполнения
запросов и частоты обновления OLAP-кубов.

1.3.3.3. Интеллектуальный анализ данных (Data Mining)
     Термин Data Mining обозначает процесс поиска корреляций,
тенденций и взаимосвязей посредством различных математических и
статистических    алгоритмов:     кластеризации,   регрессионного   и
корреляционного анализа и т. д. для систем поддержки принятия решений.
При этом накопленные сведения автоматически обобщаются до
информации, которая может быть охарактеризована как знания.
     В основу современной технологии Data Mining положена концепция
шаблонов, отражающих закономерности, свойственные подвыборкам
данных и составляющие так называемые скрытые знания (рис. 1.21).
     Поиск шаблонов производится методами, не использующими никаких
априорных предположений об этих подвыборках. Важной особенностью
Data Mining является нестандартность и неочевидность разыскиваемых
шаблонов. Иными словами, средства Data Mining отличаются от
инструментов статистической обработки данных и средств OLAP тем, что
вместо проверки заранее предполагаемых пользователями взаимосвязей

                                 37