Прикладной регрессионный анализ. Многофакторная регрессия. Шашков В.Б. - 48 стр.

UptoLike

Составители: 

48
которое называется максимальным относительным отклонением и подчиня-
ется распределению Стьюдента. Крайнее значение отбрасывается как грубо
ошибочное при условии
х-хsr
/s>t
1-p
где
t
1-p
есть квантиль распределения Стьюдента при данном объеме
выборки.
После исключения аномального значения из вариационного ряда стати-
стические характеристики данной выборки пересчитываются для нового объ-
ема и новый крайний элемент может быть подвергнут новой проверке. По-
скольку при использовании выборочных оценок возникает их смещение от-
носительно оцениваемой величины, в рабочую статистику должна быть вве-
дена поправка
t
раб
=
х-хsr
/(s
n
n
1
).
В работе /1/ показано, что границы критической зоны
τ
р
(где р- про-
центная точка нормированного выборочного отклонения) выражаются через
квантели этой точки распределения Стьюдента
t
р,n-2
по соотношению/1/
2
2,
2,
,
)()2(
1
+
=
np
np
np
tn
nt
τ
. (55).
С учетом этого уравнения для выборок большого объема (при
n боль-
ше 25) рекомендуют /1/ следующую процедуру отсева аномальных данных:
- выбирают значение
x
i
c максимальным отклонением от среднего
x
i
-xsr
;
- вычисляют значение рабочей статистики
t
раб
=
х-хsr
/(s
n
n 1
);
- по таблице
t- распределения находят точки t
0,05;n-2
и t
0,001;n-2
;
- по уравнению (55) находят критические границы
τ
0,05;n
и
τ
0,001;n
.
Эти точки ограничивают три зоны:
- левую до границы
t
0,05;n-2
;
- среднюю между границами
t
0,05;n-2
и t
0,001;n-2
;
- правую от границы
t
0,001;n-2
.
Если значение рабочей статистики попадает в левую зону, крайнее зна-
чение не является аномальным. Если оно в средней зоне, то необходим про-
фессиональный анализ ситуации и выработка дополнительных аргументов в
пользу того или иного решения. Если
t
раб
в правой зоне, крайнее значение
безусловно отбрасывается.
которое называется максимальным относительным отклонением и подчиня-
ется распределению Стьюдента. Крайнее значение отбрасывается как грубо
ошибочное при условии
                             х-хsr/s>t1-p
     где t1-p есть квантиль распределения Стьюдента при данном объеме
выборки.
      После исключения аномального значения из вариационного ряда стати-
стические характеристики данной выборки пересчитываются для нового объ-
ема и новый крайний элемент может быть подвергнут новой проверке. По-
скольку при использовании выборочных оценок возникает их смещение от-
носительно оцениваемой величины, в рабочую статистику должна быть вве-
                                         n −1
дена поправка       tраб= х-хsr/(s          ).
                                           n
     В работе /1/ показано, что границы критической зоны τр (где р- про-
центная точка нормированного выборочного отклонения) выражаются через
квантели этой точки распределения Стьюдента tр,n-2 по соотношению/1/

                             t p,n−2 ⋅ n −1
                 τ p, n =                              .             (55).
                                                   2
                            (n − 2) + (t p,n−2 )

     С учетом этого уравнения для выборок большого объема (при n боль-
ше 25) рекомендуют /1/ следующую процедуру отсева аномальных данных:
     - выбирают значение xi c максимальным отклонением от среднего
         xi-xsr ;
                                                                n −1
     - вычисляют значение рабочей статистики tраб= х-хsr/(s        );
                                                                  n
      - по таблице t- распределения находят точки t0,05;n-2 и t0,001;n-2;
      - по уравнению (55) находят критические границы τ0,05;n и τ0,001;n.
      Эти точки ограничивают три зоны:
      - левую до границы t0,05;n-2;
      - среднюю между границами t0,05;n-2 и t0,001;n-2;
      - правую от границы t0,001;n-2.
      Если значение рабочей статистики попадает в левую зону, крайнее зна-
чение не является аномальным. Если оно в средней зоне, то необходим про-
фессиональный анализ ситуации и выработка дополнительных аргументов в
пользу того или иного решения. Если tраб в правой зоне, крайнее значение
безусловно отбрасывается.




48