Интеллектуальные информационные системы. Макаренко С.И. - 88 стр.

UptoLike

Составители: 

87
Рисунок 10.1 – Стадии интеллектуального анализа данных
Все методы ИАД подразделяются на две большие группы по
принципу работы с исходными обучающими данными:
1. Методы рассуждений на основе анализа прецедентов - исходные
данные могут храниться в явном детализированном виде и могут
непосредственно использоваться для прогностического
моделирования и/или анализа исключений.
Главной проблемой этой группы методов является затруднительность их
использования на больших объемах данных, хотя именно при анализе
информации из больших хранилищ данных методы ИАД приносят наибольшую
пользу.
2. Методы, в которых информация вначале извлекается из первичных
данных и преобразуется в некоторые формальные конструкции (их
вид зависит от конкретного метода). Согласно предыдущей
классификации, этот этап выполняется на стадии свободного поиска,
которая у методов первой группы в принципе отсутствует. Таким
образом, для прогностического моделирования и анализа исключений
используются результаты этой стадии, которые гораздо более
компактны, чем сами массивы исходных данных. При этом полученные
конструкции могут быть либо «прозрачными» (интерпретируемыми),
либо «черными ящиками» (не трактуемыми).
Различают следующие подходы к отбору параметров для поиска
функциональных зависимостей и вида (или выбора) класса самих
зависимостей:
1. Пользователь сам выдвигает гипотезы относительно
зависимостей между данными. Фактически традиционные
технологии анализа развивали именно этот подход. Действительно,
        Рисунок 10.1 – Стадии интеллектуального анализа данных

    Все методы ИАД подразделяются на две большие группы по
принципу работы с исходными обучающими данными:
    1. Методы рассуждений на основе анализа прецедентов - исходные
       данные могут храниться в явном детализированном виде и могут
       непосредственно      использоваться     для  прогностического
       моделирования и/или анализа исключений.
     Главной проблемой этой группы методов является затруднительность их
использования на больших объемах данных, хотя именно при анализе
информации из больших хранилищ данных методы ИАД приносят наибольшую
пользу.
    2. Методы, в которых информация вначале извлекается из первичных
       данных и преобразуется в некоторые формальные конструкции (их
       вид зависит от конкретного метода). Согласно предыдущей
       классификации, этот этап выполняется на стадии свободного поиска,
       которая у методов первой группы в принципе отсутствует. Таким
       образом, для прогностического моделирования и анализа исключений
       используются результаты этой стадии, которые гораздо более
       компактны, чем сами массивы исходных данных. При этом полученные
       конструкции могут быть либо «прозрачными» (интерпретируемыми),
       либо «черными ящиками» (не трактуемыми).
    Различают следующие подходы к отбору параметров для поиска
функциональных зависимостей и вида (или выбора) класса самих
зависимостей:
       1. Пользователь    сам     выдвигает    гипотезы     относительно
          зависимостей между данными. Фактически традиционные
          технологии анализа развивали именно этот подход. Действительно,

                                   87