Анализ данных. Салмин А.А. - 106 стр.

UptoLike

Составители: 

106
как и в теории баз данных принято называть записями, а
колонки полями.
2. Предварительная обработка данных с
одинаковыми значениями для всех колонок. Например,
очистка” данных по столбцам и строкам таблицы по
признакам. Любая реальная база данных обычно содержит
ошибки, очень неточно определенные значения, записи,
соответствующие каким-то редким, исключительным
ситуациям, и другие дефекты, которые могут резко
понизить эффективность методов Data Mining,
применяемых на следующих этапах анализа.
3. Применение методов Data Mining. Сценарии этого
применения могут быть самыми различными и включать
сложную комбинацию разных методов, особенно если
используемые методы позволяют проанализировать
данные с разных точек зрения. Собственно этот этап
исследования и принято называть Data Mining (дословно,
«разработка данных»).
4. Верификация и проверка получившихся
результатов.
5. Интерпретация автоматически полученных
знаний человеком в целях их использования для принятия
решений, добавление получившихся правил и
зависимостей в базы знаний и т.д.
10.2.2. Типы закономерностей
Выделяют пять стандартных типов закономерностей:
1. Классификация. Она позволяет выявить признаки,
характеризующие однотипные группы объектов классы,
чтобы по известным значениям этих характеристик можно
было отнести новый объект к тому или иному классу.
Ключевым моментом выполнения этой задачи является
анализ множества классифицированных объектов.
как и в теории баз данных принято называть записями, а
колонки – полями.
     2. Предварительная       обработка    данных     с
одинаковыми значениями для всех колонок. Например,
“очистка” данных по столбцам и строкам таблицы по
признакам. Любая реальная база данных обычно содержит
ошибки, очень неточно определенные значения, записи,
соответствующие каким-то редким, исключительным
ситуациям, и другие дефекты, которые могут резко
понизить     эффективность     методов   Data   Mining,
применяемых на следующих этапах анализа.
     3. Применение методов Data Mining. Сценарии этого
применения могут быть самыми различными и включать
сложную комбинацию разных методов, особенно если
используемые методы позволяют проанализировать
данные с разных точек зрения. Собственно этот этап
исследования и принято называть Data Mining (дословно,
«разработка данных»).
     4. Верификация      и     проверка   получившихся
результатов.
     5. Интерпретация      автоматически    полученных
знаний человеком в целях их использования для принятия
решений,     добавление    получившихся     правил   и
зависимостей в базы знаний и т.д.

      10.2.2. Типы закономерностей
     Выделяют пять стандартных типов закономерностей:
   1. Классификация. Она позволяет выявить признаки,
характеризующие однотипные группы объектов – классы,
чтобы по известным значениям этих характеристик можно
было отнести новый объект к тому или иному классу.
Ключевым моментом выполнения этой задачи является
анализ   множества    классифицированных     объектов.
106