Прикладной регрессионный анализ. Многофакторная регрессия. Шашков В.Б. - 47 стр.

UptoLike

Составители: 

47
Кроме вопроса о причине аномальности результатов данного наблюде-
ния есть и другой вопросс какогокритическогозначения считать данный
показатель аномальным?
В литературе содержится много рекомендаций для отсева грубых по-
грешностей наблюдений /9/. Строго научный анализ массива наблюдений в
этом отношении может быть проведен только статистическими методами.
Каждая грубая ошибка вызывает нарушение закона распределения изучаемой
величины, изменение его параметровнарушается
однордность наблюде-
ний. Поэтому выявление грубых ошибок можно трактовать как проверку од-
нородности испытаний или опытов.
Показателем ошибочности данного наблюдения может служить лишь
величина его отклонения от других наблюдений. Сомнительными могут быть
крайние отклонения от среднегокак в ту, так и в другую сторону. Если
ориентироваться на закон нормального распределения, то такие отклонения
симметричны и исследуются одинаково, т.е. можно говорить об общем
крайнемзначении данной выборки.
В случае нормального распределения для единичного значения данной
случайной величины
х при доверительной вероятности 1-р оценкой одно-
родности будет соблюдение неравенства
х-М{х}
<=U
1-p
⋅σ
, (53)
где
М{х}
и
σ
- известные параметры распределения;
U
1-p
квантиль стандартного нормального распределения.
Нарушение этого неравенства, т.е. условие
х-М{х}
>U
1-p
⋅σ
b ,и будет при-
знаком грубой ошибочности данного значения.
Для выборки объемом
n элементов соответствующая доверительная
вероятность будет равна
(1-p)
n
, т.е. вероятность однородности всех n собы-
тий уменьшается с ростом
n и при n
→∞
эта вероятность стремиться к нулю.
Если
х есть крайний элемент выборки , то доверительной оценке (53)
соответствует вероятность
(1-p)
n
1-np.
Тогда доверительной вероятности 1-р для одного крайнего элемента
соответствует оценка [6]
х-М{х}
<=U
1-p/n
⋅σ
, (54)
т.е. элемент будет считаться грубо ошибочным, если на уровне значимости
р
х-М{х}
>U
1-p/n
⋅σ
.
Все вышеизложенное справедливо для случая, когда известны пара-
метры распределения
М{х} и
σ
. Если же они не известны, то приходится
использовать их выборочные оценки
xsr и s. Тогда для крайнего элемента
рабочей статистикой будет условие
t
раб
=
х-хsr
/s,
      Кроме вопроса о причине аномальности результатов данного наблюде-
ния есть и другой вопрос – с какого “критического” значения считать данный
показатель аномальным?
      В литературе содержится много рекомендаций для отсева грубых по-
грешностей наблюдений /9/. Строго научный анализ массива наблюдений в
этом отношении может быть проведен только статистическими методами.
Каждая грубая ошибка вызывает нарушение закона распределения изучаемой
величины, изменение его параметров – нарушается однордность наблюде-
ний. Поэтому выявление грубых ошибок можно трактовать как проверку од-
нородности испытаний или опытов.
      Показателем ошибочности данного наблюдения может служить лишь
величина его отклонения от других наблюдений. Сомнительными могут быть
крайние отклонения от среднего – как в ту, так и в другую сторону. Если
ориентироваться на закон нормального распределения, то такие отклонения
симметричны и исследуются одинаково, т.е. можно говорить об общем
“крайнем” значении данной выборки.
      В случае нормального распределения для единичного значения данной
случайной величины х при доверительной вероятности 1-р оценкой одно-
родности будет соблюдение неравенства
                   х-М{х}<=U1-p⋅σ ,                                  (53)
      где М{х} и σ - известные параметры распределения;
          U1-p – квантиль стандартного нормального распределения.
Нарушение этого неравенства, т.е. условие х-М{х}>U1-p⋅σ b ,и будет при-
знаком грубой ошибочности данного значения.
      Для выборки объемом n элементов соответствующая доверительная
                              n
вероятность будет равна (1-p) , т.е. вероятность однородности всех n собы-
тий уменьшается с ростом n и при n→∞ эта вероятность стремиться к нулю.
      Если х есть крайний элемент выборки , то доверительной оценке (53)
 соответствует вероятность
                     (1-p)n≅1-np.
       Тогда доверительной вероятности 1-р для одного крайнего элемента
соответствует оценка [6]
                    х-М{х}<=U1-p/n⋅σ ,                              (54)
т.е. элемент будет считаться грубо ошибочным, если на уровне значимости р
                  х-М{х}>U1-p/n⋅σ .
     Все вышеизложенное справедливо для случая, когда известны пара-
метры распределения М{х} и σ. Если же они не известны, то приходится
использовать их выборочные оценки xsr и s. Тогда для крайнего элемента
рабочей статистикой будет условие
                       tраб= х-хsr/s,


                                                                        47