Составители:
Рубрика:
93
Заметим, что практически всегда нужны сочетания атрибутов числовых,
логических и категориальных типов. Например, в данных «пол» и
«арендатор/владелец» — логические переменные, тогда как «ZIP код» —
категориальный тип. Поэтому система ИАД, должна поддерживать все типы
атрибутов. К тому же большинство задач по маркетингу содержат даты, и
поэтому временной формат должен также ею поддерживаться.
Пусть необходимо подсчитать количество дней, прошедшее с
некоторого события. Например, вместо даты первого контакта, рассмотрим,
сколько времени прошло с тех пор. Для этого мы должны вычислить новую
переменную, вычитая соответствующую дату из сегодняшней.
2. Создаем новую базу данных, содержащую только те переменные,
которые мы собираемся включить в исследование. Например, переменные
«дата» заменяем на переменные, указывающие временной промежуток
между некоторыми событиями. Исключаем переменные, описывающие
недавние торговые сделки, поскольку они не могут влиять на общий объем
продаж за предыдущий год, и изменяем тип переменной «ZIP код» с
числового на категориальный.
Например, мы считаем, что 10% ваших клиентов составляют одинокие
мужчины в возрасте 30-35 лет с годовым доходом более 40 000$. Применим
это правило его к исследуемому набору данных в качестве новой
переменной, описывающей наши предположения. Включим эту новую
независимую переменную при запуске одного из методов исследования.
Таким образом, мы посоветуем системе, какое правило применить первым.
Если наше предположение верно — соответствующая переменная будет
строго включена в конечную формулу. Если же система не включит
созданную переменную в конечный результат — нам лучше пересмотреть
свою точку зрения.
3. Автоматическое построение эмпирической модели, которая
описывает зависимость целевой переменной от независимых. Если
полученная модель не удовлетворяет точности, надежности и легкости
понимания полученных зависимостей, которые предсказывают будущее
значение целевой переменной, то такая система, фактически бесполезна.
Теперь запускаем метод исследования «Найти закон», выбрав в качестве
целевой переменной общий объем продаж за последний год и установив
желаемую ошибку — 10%. Система определяет ясный вид отношения,
связывающего целевую переменную с независимыми параметрами,
характеризующими клиента.
В качестве конечного продукта система генерирует отчет, который
содержит одно текстовое и два графических окна. В текстовом окне в ясном
виде показывается лучшая из найденных моделей, которая объясняет данные
наиболее надежно, точно и значимо. Точность характеризуется стандартной
ошибкой, с которой построенная модель будет предсказывать значения
Заметим, что практически всегда нужны сочетания атрибутов числовых,
логических и категориальных типов. Например, в данных «пол» и
«арендатор/владелец» — логические переменные, тогда как «ZIP код» —
категориальный тип. Поэтому система ИАД, должна поддерживать все типы
атрибутов. К тому же большинство задач по маркетингу содержат даты, и
поэтому временной формат должен также ею поддерживаться.
Пусть необходимо подсчитать количество дней, прошедшее с
некоторого события. Например, вместо даты первого контакта, рассмотрим,
сколько времени прошло с тех пор. Для этого мы должны вычислить новую
переменную, вычитая соответствующую дату из сегодняшней.
2. Создаем новую базу данных, содержащую только те переменные,
которые мы собираемся включить в исследование. Например, переменные
«дата» заменяем на переменные, указывающие временной промежуток
между некоторыми событиями. Исключаем переменные, описывающие
недавние торговые сделки, поскольку они не могут влиять на общий объем
продаж за предыдущий год, и изменяем тип переменной «ZIP код» с
числового на категориальный.
Например, мы считаем, что 10% ваших клиентов составляют одинокие
мужчины в возрасте 30-35 лет с годовым доходом более 40 000$. Применим
это правило его к исследуемому набору данных в качестве новой
переменной, описывающей наши предположения. Включим эту новую
независимую переменную при запуске одного из методов исследования.
Таким образом, мы посоветуем системе, какое правило применить первым.
Если наше предположение верно — соответствующая переменная будет
строго включена в конечную формулу. Если же система не включит
созданную переменную в конечный результат — нам лучше пересмотреть
свою точку зрения.
3. Автоматическое построение эмпирической модели, которая
описывает зависимость целевой переменной от независимых. Если
полученная модель не удовлетворяет точности, надежности и легкости
понимания полученных зависимостей, которые предсказывают будущее
значение целевой переменной, то такая система, фактически бесполезна.
Теперь запускаем метод исследования «Найти закон», выбрав в качестве
целевой переменной общий объем продаж за последний год и установив
желаемую ошибку — 10%. Система определяет ясный вид отношения,
связывающего целевую переменную с независимыми параметрами,
характеризующими клиента.
В качестве конечного продукта система генерирует отчет, который
содержит одно текстовое и два графических окна. В текстовом окне в ясном
виде показывается лучшая из найденных моделей, которая объясняет данные
наиболее надежно, точно и значимо. Точность характеризуется стандартной
ошибкой, с которой построенная модель будет предсказывать значения
93
Страницы
- « первая
- ‹ предыдущая
- …
- 92
- 93
- 94
- 95
- 96
- …
- следующая ›
- последняя »
