Составители:
Рубрика:
92
терминологии это именуется препроцессором данных по
обнаружению функционально-связанных кластеров в массивах
данных; фильтрация шума и случайных выбросов).
Если удается установить взаимозависимость, даже слабую, об этом
будет сделано сообщение с указанием статистических характеристик, с
визуализацией значимой области и выпавших точек, а близость оценивается
классической суммой наименьших квадратов отклонений.
2. Построение линейной многомерной зависимости специально
выделяется в отдельную задачу. Какая бы зависимость в общем
случае ни обнаружилась, всегда полезно иметь под рукой наиболее
простую.
3. На третьем этапе программа автоматически порождает и
отбрасывает различные гипотезы о взаимозависимости данных в
форме функциональных процедур. При этом она не нуждается ни в
каких предположениях о форме гипотез: степенные, показательные,
тригонометрические и их комбинации, составные «если ..., то», а
также алгоритмы. Если предложенных средств окажется
недостаточно, класс может быть расширен.
10.4 Пример функционирования системы интеллектуального
анализа данных
Рассмотрим этапы подготовки данных к анализу. Попутно
подчеркнем те особенности системы ИАД, которые важны для успешного
выполнения этой задачи.
Возьмем в качестве примера базу данных, содержащую записи о
клиентах, значения целевой переменной для которых— «объем продаж за
последний год» — известны.
1. Сначала рассмотрим записи только о тех клиентах, контакт с
которыми поддерживается уже более года и которые получили две наши
почтовые рекламы за последний год.
Обычно для работы достаточно взять только часть данных — от 2-3 до
50 тысяч записей. Этого вполне достаточно для построения значимой
модели. Поэтому система ИАД, должна быть способна обработать такое
число записей. Помимо этого она должна обладать механизмами свободного
манипулирования данными, поскольку может понадобиться разбить данные
на некоторые подгруппы и оставить часть данных для тестирования,
объединить данные или привести их во взаимодействие. Например, полагая,
что клиенты различных возрастных категорий будут обладать различными
покупательскими особенностями, может понадобиться разделить их на
группы и изучать каждую из них отдельно.
терминологии это именуется препроцессором данных по
обнаружению функционально-связанных кластеров в массивах
данных; фильтрация шума и случайных выбросов).
Если удается установить взаимозависимость, даже слабую, об этом
будет сделано сообщение с указанием статистических характеристик, с
визуализацией значимой области и выпавших точек, а близость оценивается
классической суммой наименьших квадратов отклонений.
2. Построение линейной многомерной зависимости специально
выделяется в отдельную задачу. Какая бы зависимость в общем
случае ни обнаружилась, всегда полезно иметь под рукой наиболее
простую.
3. На третьем этапе программа автоматически порождает и
отбрасывает различные гипотезы о взаимозависимости данных в
форме функциональных процедур. При этом она не нуждается ни в
каких предположениях о форме гипотез: степенные, показательные,
тригонометрические и их комбинации, составные «если ..., то», а
также алгоритмы. Если предложенных средств окажется
недостаточно, класс может быть расширен.
10.4 Пример функционирования системы интеллектуального
анализа данных
Рассмотрим этапы подготовки данных к анализу. Попутно
подчеркнем те особенности системы ИАД, которые важны для успешного
выполнения этой задачи.
Возьмем в качестве примера базу данных, содержащую записи о
клиентах, значения целевой переменной для которых— «объем продаж за
последний год» — известны.
1. Сначала рассмотрим записи только о тех клиентах, контакт с
которыми поддерживается уже более года и которые получили две наши
почтовые рекламы за последний год.
Обычно для работы достаточно взять только часть данных — от 2-3 до
50 тысяч записей. Этого вполне достаточно для построения значимой
модели. Поэтому система ИАД, должна быть способна обработать такое
число записей. Помимо этого она должна обладать механизмами свободного
манипулирования данными, поскольку может понадобиться разбить данные
на некоторые подгруппы и оставить часть данных для тестирования,
объединить данные или привести их во взаимодействие. Например, полагая,
что клиенты различных возрастных категорий будут обладать различными
покупательскими особенностями, может понадобиться разделить их на
группы и изучать каждую из них отдельно.
92
Страницы
- « первая
- ‹ предыдущая
- …
- 91
- 92
- 93
- 94
- 95
- …
- следующая ›
- последняя »
