Интеллектуальный анализ данных в менеджменте. Кричевский М.Л. - 109 стр.

UptoLike

Составители: 

109
1
1
1
()
,
i
n
iR i
i
n
i
i
rv r
c
r
1
2
2
где n – число правил; r
i
– степень, с которой правило R
i
активируется.
Как видно из рис. 2.24, такая система представляет собой прямо"
направленную нейронную сеть. X, R" и С"модули могут рассматри"
ваться как нейроны сети, а m" и v"модули – в качестве адаптируемых
весов. X и С слои идентифицируются как входной и выходной слои
сети, соответственно; R"слой – скрытый слой сети. Тот факт, что один
m"модуль соединен более, чем с одним R"модулем, эквивалентен со"
единениям весов в нейронной сети.
Среди специальных приемов для формирования базы правил зас"
луживает внимания применение программных продуктов класса
«Data Mining» («Извлечение знаний из данных») [10]. Такой подход
в последнее время начинает стремительно развиваться и выделяется
в отдельное направление в сфере информационных технологий. В
основе использования таких приемов лежит построение деревьев ре"
шений, что является самым распространенным способом к выявле"
нию и изображению логических закономерностей. Применяемый в
таких задачах алгоритм типа ID3 (Interactive Dixotomizer – интерак"
тивный дихотомайзер) циклически разделяет обучающие примеры
на классы в соответствии с переменной, имеющей наибольшую клас"
сифицирующую силу. Каждое подмножество объектов, выделяемое
такой переменной, вновь разбивается на классы с использованием
следующей переменной с наибольшей классифицирующейся способ"
ностью и т. д. Разделение завершается, когда в подмножестве оказы"
ваются объекты только одного класса. В ходе процесса образуется
дерево решений. Пути движения по дереву с верхнего уровня на са"
мые нижние определяют логические правила в виде цепочек конъюн"
кций.
Одной из таких систем для обнаружения знаний в базах данных
является программа See5 компании RuleQuest. Результат работы
программы представляется в виде деревьев решений. Система проста
в обращении и не требует от пользователя обширных знаний в обла"
сти статистики и принятия решений. Демонстрационная версия этой
системы ограничена количеством анализируемых объектов (до 200).
Иногда полученное дерево решений оказывается слишком сложным
для восприятия. В этом случае в программе предусмотрена возмож"