Анализ данных. Салмин А.А. - 75 стр.

UptoLike

Составители: 

75
Точки диаграммы
должны располагаться на
прямой.
Рис. 7.6. Проверка плотности вероятности остатков
7.3. Пошаговая регрессия
Пошаговая регрессия множественная регрессия,
при которой переменные одна за другой включаются в
подмножество согласно предварительно заданному
критерию. Некоторая переменная может быть заменена
другой переменной, не входящей в набор, либо удалена из
него. Совокупность критериев, определяющих, какие
переменные включать, заменять и удалять, называется
пошаговой процедурой.
С помощью пошаговой процедуры включается
упорядоченный список предикторов. Например, при p=5
список может иметь вид
34152
,,,, xxxxx
. Для
определения «наилучшего» подмножества из этого списка
выбираются m <= p первых переменных так, чтобы они
возможно лучше предсказывали y и их число m было по
возможности меньше. Т.е., может быть составлен
экономный набор из переменных упорядоченного списка,
которые имеют наиболее высокую предсказывающую
способность. Процедура определения числа m называется
правилом остановки.
Правила остановки:
1) Стандартная пошаговая процедура (F-метод)
Включение и удаление переменных
осуществляется с помощью t-критерия.
                                  Точки         диаграммы
                              должны    располагаться  на
                              прямой.




Рис. 7.6. Проверка плотности вероятности остатков


     7.3. Пошаговая регрессия
     Пошаговая регрессия – множественная регрессия,
при которой переменные одна за другой включаются в
подмножество согласно предварительно заданному
критерию. Некоторая переменная может быть заменена
другой переменной, не входящей в набор, либо удалена из
него. Совокупность критериев, определяющих, какие
переменные включать, заменять и удалять, называется
пошаговой процедурой.
     С помощью пошаговой процедуры включается
упорядоченный список предикторов. Например, при p=5
список может иметь вид          x 2 , x 5 , x1 , x 4 , x 3 . Для
определения «наилучшего» подмножества из этого списка
выбираются m <= p первых переменных так, чтобы они
возможно лучше предсказывали y и их число m было по
возможности меньше. Т.е., может быть составлен
экономный набор из переменных упорядоченного списка,
которые имеют наиболее высокую предсказывающую
способность. Процедура определения числа m называется
правилом остановки.
     Правила остановки:
   1) Стандартная пошаговая процедура (F-метод)
        Включение       и    удаление              переменных
        осуществляется    с    помощью               t-критерия.

                                                             75