Математическая статистика с примерами в Excel. Воскобойников Ю.Е - 46 стр.

UptoLike

93
неральной совокупности гипотезы Н
0
;
по выборке принимается решение о справедливости для ге-
неральной совокупности гипотезы Н
1
.
Вернемся к нашему примеру. Обозначим через А событие, со-
стоящее в том, что случайно выбранный человек в данном регионе
предрасположен к заболеванию R. До строительства химического
предприятия вероятность события А была равна 0.1. В качестве ги-
потезы Н
0
рассмотрим гипотезу о том, что после строительства хи-
мического предприятия вероятность события А не изменилась. Та-
ким образом, если р
1
вероятность события А после строительства
предприятия, то в качестве нулевой (основной) гипотезы принима-
ется
Н
0
: р
1
= р
0
.
Учитывая, что: а) строительство комбината вряд ли улучшило эко-
логическую обстановку в регионе; б) при выборке из 1000 человек
у 120 человек обнаружено заболевание R, что соответствует отно-
сительной частоте р* = 120/1000 = 0.12 > 0.1, в качестве альтерна-
тивной гипотезы примем:
Н
1
: р
1
> р
0
.
Этап 2. Задается вероятность
α
, которую называют уров-
нем значимости. Эта вероятность имеет следующий смысл.
Решение о том, можно ли считать высказывание Н
0
справед-
ливым для генеральной совокупности, принимается по выбороч-
ным данным, т.е. по ограниченному объему информации. Следова-
тельно, это решение может быть ошибочным. При этом может
иметь место ошибка двух родов:
ошибка первого рода совершается при отклонении гипоте-
зы Н
0
(т.е. принимается альтернативная Н
1
), тогда как на
самом деле гипотеза Н
0
верна; вероятность такой ошибки
обозначим
10
(/ );PH H
ошибка второго рода совершается при принятии гипотезы
Н
0
, тогда как на самом деле высказывание Н
0
неверно и
следовало бы принять гипотезу Н
1
; вероятность ошибки
второго рода обозначим как
01
(/)PH H
β
= . (5.1)
94
Тогда уровень значимости
α
определяет ошибку первого рода, т.е.
10
(/)PH H
α
=
. (5.2)
Поэтому вероятность
α
задается малым числом, поскольку это
вероятность ошибочного высказывания. При этом обычно исполь-
зуются стандартные значения: 0.05; 0.01; 0.005. Например,
05.0=
α
означает следующее: если гипотезу Н
0
проверять по каж-
дой из 100 выборок одинакового объема, то в среднем в 5 случаях
из 100 совершим ошибку первого рода.
Обратим внимание на то, что в результате проверки гипотезы
Н
0
могут быть приняты правильные решения двух следующих ви-
дов:
принимается гипотеза Н
0
тогда, когда она верна (т.е. Н
0
имеет место в генеральной совокупности); вероятность это-
го решения равна
00
(/)1PH H
α
=
(почему?);
не принимается гипотеза Н
0
(т.е. принимается гипотеза Н
1
)
тогда, когда и на самом деле она неверна (т.е. справедлива
гипотеза Н
1
), вероятность этого решения равна (почему?)
11
(/)1PH H
β
=
. (5.3)
Этап 3. Определяют величину
K
такую, что: а) ее значения
зависят от выборочных данных
n
xxx ,...,,
21
, т.е.
),...,,(
21 n
xxxKK = ; б) будучи величиной случайной (в силу слу-
чайности выборки
n
xx ,...,
1
), величина
K
подчиняется при выпол-
нении гипотезы Н
0
некоторому известному закону распределения;
в) ее значения позволяют судить о расхождении гипотезы Н
0
с вы-
борочными данными. Величину
K
называют критерием.
Обратимся к нашему примеру. Пусть
1000
S количество об-
следуемых, предрасположенных к заболеванию R в выборке из
1000 человек. Если гипотеза Н
0
верна, т.е.
10
0.1pp
= , то случай-
ная величина
1000
S распределена по биномиальному закону и ее
числовые характеристики равны
1000
( ) 100MS
=
,
1000
()90DS = (по-
чему?). С другой стороны, ее распределение близко к нормально-
му. Поэтому случайная величина
       неральной совокупности гипотезы Н0;                           Тогда уровень значимости α определяет ошибку первого рода, т.е.
     • по выборке принимается решение о справедливости для ге-
                                                                                                     α = P ( H1 / H 0 ) .                (5.2)
       неральной совокупности гипотезы Н1.
     Вернемся к нашему примеру. Обозначим через А событие, со-       Поэтому вероятность α задается малым числом, поскольку это
стоящее в том, что случайно выбранный человек в данном регионе       вероятность ошибочного высказывания. При этом обычно исполь-
предрасположен к заболеванию R. До строительства химического         зуются стандартные значения: 0.05; 0.01; 0.005. Например,
предприятия вероятность события А была равна 0.1. В качестве ги-     α = 0.05 означает следующее: если гипотезу Н0 проверять по каж-
потезы Н0 рассмотрим гипотезу о том, что после строительства хи-     дой из 100 выборок одинакового объема, то в среднем в 5 случаях
мического предприятия вероятность события А не изменилась. Та-       из 100 совершим ошибку первого рода.
ким образом, если р1 – вероятность события А после строительства          Обратим внимание на то, что в результате проверки гипотезы
предприятия, то в качестве нулевой (основной) гипотезы принима-      Н0 могут быть приняты правильные решения двух следующих ви-
ется                                                                 дов:
                             Н0 : р1 = р0.                                • принимается гипотеза Н0 тогда, когда она верна (т.е. Н0
Учитывая, что: а) строительство комбината вряд ли улучшило эко-              имеет место в генеральной совокупности); вероятность это-
логическую обстановку в регионе; б) при выборке из 1000 человек              го решения равна P ( H 0 / H 0 ) = 1 − α (почему?);
у 120 человек обнаружено заболевание R, что соответствует отно-           • не принимается гипотеза Н0 (т.е. принимается гипотеза Н1)
сительной частоте р* = 120/1000 = 0.12 > 0.1, в качестве альтерна-           тогда, когда и на самом деле она неверна (т.е. справедлива
тивной гипотезы примем:                                                      гипотеза Н1), вероятность этого решения равна (почему?)
                           Н1 : р1 > р0.                                                         P ( H1 / H1 ) = 1 − β .                 (5.3)
    Э т а п 2 . Задается вероятность α , которую называют уров-          Э т а п 3. Определяют величину K такую, что: а) ее значения
нем значимости. Эта вероятность имеет следующий смысл.
                                                                     зависят    от    выборочных     данных    x1 , x 2 ,..., x n , т.е.
    Решение о том, можно ли считать высказывание Н0 справед-
ливым для генеральной совокупности, принимается по выбороч-          K = K ( x1 , x 2 ,..., x n ) ; б) будучи величиной случайной (в силу слу-
ным данным, т.е. по ограниченному объему информации. Следова-        чайности выборки x1 ,..., x n ), величина K подчиняется при выпол-
тельно, это решение может быть ошибочным. При этом может
                                                                     нении гипотезы Н0 некоторому известному закону распределения;
иметь место ошибка двух родов:
                                                                     в) ее значения позволяют судить о расхождении гипотезы Н0 с вы-
    • ошибка первого рода совершается при отклонении гипоте-         борочными данными. Величину K называют критерием.
      зы Н0 (т.е. принимается альтернативная Н1), тогда как на            Обратимся к нашему примеру. Пусть S1000 – количество об-
      самом деле гипотеза Н0 верна; вероятность такой ошибки
                                                                     следуемых, предрасположенных к заболеванию R в выборке из
      обозначим P ( H1 / H 0 );
                                                                     1000 человек. Если гипотеза Н0 верна, т.е. p1 = p0 = 0.1 , то случай-
    • ошибка второго рода совершается при принятии гипотезы
                                                                     ная величина S1000 распределена по биномиальному закону и ее
      Н0, тогда как на самом деле высказывание Н0 неверно и
      следовало бы принять гипотезу Н1; вероятность ошибки           числовые характеристики равны M ( S1000 ) = 100 , D( S1000 ) = 90 (по-
      второго рода обозначим как                                     чему?). С другой стороны, ее распределение близко к нормально-
                                                                     му. Поэтому случайная величина
                          β = P ( H 0 / H1 ) .               (5.1)
                                  93                                                                     94