ВУЗ:
Составители:
Рубрика:
Предметная ориентированность. Информация в хранилище данных организована в соответствии с основными аспек-
тами деятельности предприятия (заказчики, продажи, склад и т.п.). Это отличает хранилище данных от оперативной базы
данных, где данные организованы в соответствии с процессами (выписка счетов, отгрузка товара и т.п.). Предметная органи-
зация данных в хранилище способствует как значительному упрощению анализа, так и повышению скорости выполнения
аналитических запросов.
Интегрированность. Исходные данные извлекаются из оперативных баз данных, проверяются, очищаются, приводятся
к единому виду, в нужной степени агрегируются (т.е. вычисляются суммарные показатели) и загружаются в хранилище. Та-
кие интегрированные данные намного проще анализировать.
Привязка ко времени. Данные в хранилище всегда напрямую связаны с определенным периодом времени. Данные, вы-
бранные из оперативных баз данных, накапливаются в хранилище в виде «исторических слоев», каждый из которых отно-
сится к конкретному периоду времени. Это позволяет анализировать тенденции в развитии бизнеса.
Неизменяемость. Попав в определенный «исторический слой» хранилища, данные уже никогда не будут изменены. Это
также отличает хранилище от оперативной базы данных, в которой данные все время меняются, и один и тот же запрос, выпол-
ненный дважды с интервалом в 10 минут, может дать разные результаты. Стабильность данных также облегчает их анализ.
Хранилища данных могут быть разбиты на два типа: корпоративные хранилища данных (enterprise data warehouses) и киоски
данных (data marts).
Корпоративные хранилища данных содержат информацию, относящуюся ко всей корпорации и собранную из множест-
ва оперативных источников для консолидированного анализа. Обычно такие хранилища охватывают целый ряд аспектов
деятельности корпорации и используются для принятия как тактических, так и стратегических решений. Корпоративное
хранилище содержит детальную и обобщающую информацию. Стоимость создания и поддержки корпоративных хранилищ
может быть очень высокой. Обычно их созданием занимаются централизованные отделы информационных технологий,
причем создаются они сверху вниз, то есть сначала проектируется общая схема, и только затем начинается заполнение дан-
ными. Такой процесс может занимать несколько лет.
Киоски данных содержат подмножество корпоративных данных и строятся для отделов или подразделений внутри ор-
ганизации. Киоски данных часто строятся силами самого отдела и охватывают конкретный аспект, интересующий сотрудни-
ков данного отдела. Киоск данных может получать данные из корпоративного хранилища (зависимый киоск) или, что более
распространено, данные могут поступать непосредственно из оперативных источников (независимый киоск).
После создания хранилищ данных наступает этап их использования для решения задач принятия решений. Технологии
позволяют пользователям осуществить доступ к данным, сделать запросы, анализ и визуализацию данных. Технологии рабо-
ты с хранилищами включают запросы к базам данных, системы интеллектуального анализа данных, оперативную аналити-
ческую обработку.
В качестве основных сфер применения хранилищ данных можно назвать:
• сегментацию рынка;
• планирование продаж, прогнозирование и управление;
• проектирование и разработку новых видов продукции;
• интеграцию цепочек поставок;
• интеллектуальные технологии в организации бизнеса.
8.3. ТЕХНОЛОГИЯ ОПЕРАТИВНОГО АНАЛИЗА ДАННЫХ
После того как данные получены, очищены, приведены к единому виду и помещены в хранилище, их необходимо ана-
лизировать. Для этого используется технология OLAP – это OnLine Analytical Processing, т.е. оперативный анализ данных.
OLAP – это один из способов добычи и анализа данных. Суть заключается в том, что информация представляется в виде
многомерного куба с возможностью произвольного манипулирования ею.
Технологии OLAP обеспечивают быстрый анализ разделяемой многомерной информации, который требует, чтобы
OLAP-приложение предоставляло следующие возможности: высокую скорость, анализ, разделение доступа, многомерность,
работу с информацией.
Высокая скорость. Анализ должен производиться одинаково быстро по всем аспектам информации.
Анализ. Должна существовать возможность производить основные типы числового и статистического анализа – предо-
пределенного разработчиком приложения или произвольно определяемого пользователем.
Разделение доступа. Доступ к данным должен быть многопользовательским, при этом должен контролироваться доступ
к конфиденциальной информации.
Многомерность. OLAP предоставляет максимально удобные и быстрые средства доступа, просмотра и анализа деловой
информации за счет интуитивно понятной модели данных, организуя их в виде многомерных кубов. Осями многомерной
системы координат служат основные атрибуты анализируемого бизнес-процесса. Практически всегда в качестве одного из
измерений используется время. Внутри куба находятся данные, количественно характеризующие процесс, – так называемые
меры. Пользователь, анализирующий информацию, может исследовать куб по разным направлениям, получать сводные (на-
пример, по годам) или, наоборот, детальные (по неделям) данные и осуществлять прочие операции, которые необходимы
ему для анализа.
Работа с информацией. Приложение должно иметь возможность обращаться к любой нужной информации, независимо
от ее объема и места хранения.
Основное назначение OLAP-систем – поддержка аналитической деятельности, т.е. произвольных запросов пользовате-
лей-аналитиков. Если системы регламентированной отчетности отвечают на вопросы типа «сколько было продано товара?»
или «какова прибыль за последний месяц», то OLAP призван дать ответы на вопросы, «насколько надо увеличить расходы на
рекламу, чтобы прибыль выросла на 15 %?» или «какие продукты будут в пятерке лучших по показателю прибыльности из
наиболее продаваемых?». Цель OLAP-анализа – проверка возникающих гипотез.
Страницы
- « первая
- ‹ предыдущая
- …
- 35
- 36
- 37
- 38
- 39
- …
- следующая ›
- последняя »