Математическая статистика. Воскобойников Ю.Е - 32 стр.

UptoLike

63 64
Обратим внимание на то, что в результате проверки гипотезы
0
H
могут быть приняты правильные решения двух следующих видов:
принимается гипотеза
0
H тогда, когда она верна (т.е.
0
H имеет
место в генеральной совокупности); вероятность этого решения
равна
α
=
1)/(
00
HHP (почему?);
не принимается гипотеза
0
H (т.е. принимается гипотеза
1
H ) то-
гда, когда и на самом деле она неверна (т.е. справедлива гипотеза
1
H
), вероятность этого решения равна (почему?)
β
= 1)/(
11
HHP
. (5.3)
Этап 3. Определяют величину
K
такую, что: а) ее значения зави-
сят от выборочных данных
n
xxx ,...,,
21
, т.е. ),...,,(
21 n
xxxKK
=
;
б) будучи величиной случайной (в силу случайности выборки
n
xx ,...,
1
), величина
K
подчиняется при выполнении гипотезы
0
H
некоторому известному закону распределения; в) ее значения позволя-
ют судить о расхождении гипотезы
0
H с выборочными данными. Ве-
личину
K
называют критерием.
Обратимся к нашему примеру. Пусть
1000
S количество обсле-
дуемых, предрасположенных к заболеванию
R в выборке из 1000 чело-
век. Если гипотеза
0
H верна, т.е. 1.0
01
=
= pp , то случайная вели-
чина
1000
S распределена по биномиальному закону и ее числовые ха-
рактеристики равны
100)(
1000
=SM , 90
1000
=
)S(D (почему?) С
другой стороны, ее распределение близко к нормальному. Поэтому слу-
чайная величина
487.9
100
1000
=
S
K
(5.4)
распределена по закону, близкому к нормальному
).1.0(N
Заметим, что если вероятность события
A
возросла после строи-
тельства химического комбината, то случайная величина
K
преимуще-
ственно будет принимать положительные значения (почему?) и это мо-
жет трактоваться в пользу принятия гипотезы
1
H . Видно, что величина
(5.4) удовлетворяет требованиям а), б), в) и может быть принята при
проверке гипотезы
010
: ppH
=
при альтернативной
011
: ppH > .
Этап 4. В области всевозможных значений критерия
K
выде-
ляют подобласть
ω
, называемую критической областью. Значения
критерия, попавшие в критическую область, свидетельствуют о сущест-
венном расхождении выборки с гипотезой
0
H . Поэтому руководству-
ются следующим правилом: если вычисленное по выборке значение
критерия попадает в критическую область
ω
, то гипотеза
0
H отверга-
ется и принимается альтернативная
1
H . При этом следует помнить, что
такое решение может быть ошибочнымна самом деле гипотеза
0
H
может быть справедливой. Таким образом, ориентируясь на критиче-
скую область, можно совершить ошибку первого рода, вероятность ко-
торой задана заранее и равна
α
. Отсюда вытекает следующее требова-
ние к критической области
ω
:
Вероятность принятия критерием
K
значения из критической об-
ласти
ω
при справедливости гипотезы
0
H должна быть равна
α
,
т.е.
α
ω
=
)(KP . (5.5)
Однако критическая область определяется равенством (5.5) неоднознач-
но. Пусть
)(xp
K
является плотностью распределения критерия
K
.
Тогда нетрудно увидеть, что на оси
существует бесчисленное мно-
жество интервалов таких, что площади построенных на них криволи-
нейных трапеций, ограниченных сверху кривой
)(xp
K
, равны
α
. По-
этому, кроме требования (5.5), выдвигается следующее: критическая
область
ω
должна быть расположена так, чтобы при заданной вероят-
ности
α
ошибки первого рода вероятность
β
ошибки второго рода
(см. (5.1)) была минимальной.
Обычно этому требованию удовлетворяют три случая расположения
критической области (в зависимости от вида нулевой и альтернативной
гипотез, формы и распределения критерия
К):
правосторонняя критическая область (рис.5.1, а), состоящая из
интервала
),(
,
+
α
пр
x , где точка
α
,пр
x определяется из усло-
вия:
α
α
=
> )(
,пр
xKP (5.6)
   Обратим внимание на то, что в результате проверки гипотезы H 0                   (5.4) удовлетворяет требованиям а), б), в) и может быть принята при
могут быть приняты правильные решения двух следующих видов:                         проверке гипотезы H 0 : p1 = p0 при альтернативной H 1 : p1 > p0 .
                                                                                       Э т а п 4 . В области всевозможных значений критерия K выде-
   • принимается гипотеза H 0 тогда, когда она верна (т.е. H 0 имеет                ляют подобласть ω , называемую критической областью. Значения
     место в генеральной совокупности); вероятность этого решения                   критерия, попавшие в критическую область, свидетельствуют о сущест-
     равна P ( H 0 / H 0 ) = 1 − α (почему?);                                       венном расхождении выборки с гипотезой H 0 . Поэтому руководству-
                                                                                    ются следующим правилом: если вычисленное по выборке значение
   • не принимается гипотеза H 0 (т.е. принимается гипотеза H 1 ) то-
                                                                                    критерия попадает в критическую область ω , то гипотеза H 0 отверга-
     гда, когда и на самом деле она неверна (т.е. справедлива гипотеза
                                                                                    ется и принимается альтернативная H 1 . При этом следует помнить, что
      H 1 ), вероятность этого решения равна (почему?)
                                                                                    такое решение может быть ошибочным — на самом деле гипотеза H 0
                        P( H 1 / H 1 ) = 1 − β .                            (5.3)   может быть справедливой. Таким образом, ориентируясь на критиче-
                                                                                    скую область, можно совершить ошибку первого рода, вероятность ко-
Э т а п 3 . Определяют величину K такую, что: а) ее значения зави-
                                                                                    торой задана заранее и равна α . Отсюда вытекает следующее требова-
сят от выборочных данных x1 , x 2 ,..., x n , т.е. K = K ( x1 , x 2 ,..., x n ) ;   ние к критической области ω :
б) будучи величиной случайной (в силу случайности выборки                              Вероятность принятия критерием K значения из критической об-
x1 ,..., x n ), величина K подчиняется при выполнении гипотезы H 0                  ласти ω при справедливости гипотезы H 0 должна быть равна α ,
некоторому известному закону распределения; в) ее значения позволя-                 т.е.
ют судить о расхождении гипотезы H 0 с выборочными данными. Ве-
                                                                                                         P(K ∈ ω ) = α .                                (5.5)
личину K называют критерием.
   Обратимся к нашему примеру. Пусть S1000 — количество обсле-                      Однако критическая область определяется равенством (5.5) неоднознач-
дуемых, предрасположенных к заболеванию R в выборке из 1000 чело-                   но. Пусть p K (x ) является плотностью распределения критерия K .
век. Если гипотеза H 0 верна, т.е. p1 = p0 = 0.1 , то случайная вели-               Тогда нетрудно увидеть, что на оси X существует бесчисленное мно-
                                                                                    жество интервалов таких, что площади построенных на них криволи-
чина S1000 распределена по биномиальному закону и ее числовые ха-                   нейных трапеций, ограниченных сверху кривой p K (x ) , равны α . По-
рактеристики равны M ( S1000 ) = 100 , D( S1000 ) = 90 (почему?) С                  этому, кроме требования (5.5), выдвигается следующее: критическая
другой стороны, ее распределение близко к нормальному. Поэтому слу-                 область ω должна быть расположена так, чтобы при заданной вероят-
чайная величина                                                                     ности α – ошибки первого рода вероятность β – ошибки второго рода
                                                                                    (см. (5.1)) была минимальной.
                              S1000 − 100                                              Обычно этому требованию удовлетворяют три случая расположения
                        K=                                                  (5.4)   критической области (в зависимости от вида нулевой и альтернативной
                                 9.487                                              гипотез, формы и распределения критерия К):
распределена по закону, близкому к нормальному           N (0.1).                      •   правосторонняя критическая область (рис.5.1, а), состоящая из
   Заметим, что если вероятность события A возросла после строи-                           интервала ( x пр ,α ,+∞ ) , где точка xпр ,α определяется из усло-
тельства химического комбината, то случайная величина K преимуще-
ственно будет принимать положительные значения (почему?) и это мо-                         вия:
жет трактоваться в пользу принятия гипотезы H 1 . Видно, что величина                                 P( K > xпр ,α ) = α                               (5.6)
                                         63                                                                              64