Математическая статистика. Воскобойников Ю.Е - 31 стр.

UptoLike

61 62
признаки заболевания R. Можно ли утверждать: а) полученные данные
не противоречат предположению, что строительство не повлияло на
уровень заболевания R, или б) изменение экологической обстановки по-
сле строительства комбината повлияло на распространение заболевания
R? Приведенный пример является типичной задачей проверки статисти-
ческой гипотезы. Под статистической гипотезой понимается всякое
высказывание о генеральной
совокупности (случайной величине X),
проверяемое по выборочной совокупности (по результатам наблюде-
ний). В нашем примере высказывание формулируется в терминах веро-
ятности
0
p события А = {наличие у человека заболевания R}. Не рас-
полагая сведениями о всей генеральной совокупности, высказанную ги-
потезу сопоставляют по определенным правилам с выборочными дан-
ными и делают вывод о том, можно принять гипотезу или нет. Эта про-
цедура сопоставления называется проверкой гипотезы.
Рассмотрим этапы проверки гипотезы и используемые при
этом по-
нятия.
Э т а п 1. Располагая выборочными данными и руководствуясь кон-
кретными условиями рассматриваемой задачи, формулируют гипотезу
0
H , которую называют основной или нулевой, и гипотезу
1
H , конку-
рирующую с гипотезой
0
H . Гипотезу
1
H называют также альтерна-
тивной.
Термин "конкурирующая" означает, что являются взаимоисклю-
чающими следующие два события:
по выборке принимается решение о справедливости для генераль-
ной совокупности гипотезы
0
H ;
по выборке принимается решение о справедливости для генераль-
ной совокупности гипотезы
1
H .
Вернемся к нашему примеру. Обозначим через А событие, состоящее
в том, что случайно выбранный человек в данном регионе предраспо-
ложен к заболеванию R. До строительства химического предприятия ве-
роятность события А была равна 0.1. В качестве гипотезы
0
H рас-
смотрим гипотезу о том, что после строительства химического предпри-
ятия вероятность события А не изменилась. Таким образом, если
1
p
вероятность события А после строительства предприятия, то в качестве
нулевой (основной) гипотезы принимается
010
: ppH = .
Учитывая, что: а) строительство комбината вряд ли улучшило экологи-
ческую обстановку в регионе; б) при выборке из 1000 человек у 120 че-
ловек обнаружено заболевание R, что соответствует относительной час-
тоте р* = 120/1000 = 0.12 > 0.1, в качестве альтернативной гипотезы
примем:
011
pp:H > .
Этап 2. Задается вероятность
α
, которую называют уровнем
значимости. Эта вероятность имеет следующий смысл.
Решение о том, можно ли считать высказывание
0
H справедливым
для генеральной совокупности, принимается по выборочным данным,
т.е. по ограниченному объему информации. Следовательно это решение
может быть ошибочным. При этом может иметь место ошибка двух ро-
дов:
ошибка первого рода совершается при отвержении гипотезы
0
H
(т.е. принимается альтернативная
1
H ), тогда как на самом деле
гипотеза
0
H верна; вероятность такой ошибки обозначим
);/(
01
HHP
ошибка второго рода совершается при принятии гипотезы
0
H , то-
гда как на самом деле высказывание
0
H
неверно и следовало бы
принять гипотезу
1
H ; вероятность ошибки второго рода обозна-
чим как
)/(
10
HHP
=
β
. (5.1)
Тогда уровень значимости
α
определяет ошибки первого рода, т.е.
)/(
01
HHP
=
α
. (5.2)
Поэтому вероятность
α
задается малым числом, поскольку это ве-
роятность ошибочного высказывания, при этом обычно используются
стандартные значения
: 0.05; 0.01; 0.005. Например,
05.0
=
α
означает
следующее: если гипотезу
0
H проверять по каждой из 100 выборок
одинакового объема, то в среднем в 5 случаях из 100 совершим ошибку
первого рода.
признаки заболевания R. Можно ли утверждать: а) полученные данные      Учитывая, что: а) строительство комбината вряд ли улучшило экологи-
не противоречат предположению, что строительство не повлияло на        ческую обстановку в регионе; б) при выборке из 1000 человек у 120 че-
уровень заболевания R, или б) изменение экологической обстановки по-   ловек обнаружено заболевание R, что соответствует относительной час-
сле строительства комбината повлияло на распространение заболевания    тоте р* = 120/1000 = 0.12 > 0.1, в качестве альтернативной гипотезы
R? Приведенный пример является типичной задачей проверки статисти-     примем:
ческой гипотезы. Под статистической гипотезой понимается всякое
высказывание о генеральной совокупности (случайной величине X),                                    H1 : p1 > p0 .
проверяемое по выборочной совокупности (по результатам наблюде-
                                                                          Э т а п 2 . Задается вероятность α , которую называют уровнем
ний). В нашем примере высказывание формулируется в терминах веро-
                                                                       значимости. Эта вероятность имеет следующий смысл.
ятности p 0 события А = {наличие у человека заболевания R}. Не рас-
                                                                          Решение о том, можно ли считать высказывание H 0 справедливым
полагая сведениями о всей генеральной совокупности, высказанную ги-
                                                                       для генеральной совокупности, принимается по выборочным данным,
потезу сопоставляют по определенным правилам с выборочными дан-
                                                                       т.е. по ограниченному объему информации. Следовательно это решение
ными и делают вывод о том, можно принять гипотезу или нет. Эта про-
                                                                       может быть ошибочным. При этом может иметь место ошибка двух ро-
цедура сопоставления называется проверкой гипотезы.
                                                                       дов:
   Рассмотрим этапы проверки гипотезы и используемые при этом по-
нятия.                                                                    • ошибка первого рода совершается при отвержении гипотезы H 0
   Э т а п 1. Располагая выборочными данными и руководствуясь кон-
кретными условиями рассматриваемой задачи, формулируют гипотезу             (т.е. принимается альтернативная H 1 ), тогда как на самом деле
H 0 , которую называют основной или нулевой, и гипотезу H 1 , конку-        гипотеза    H 0 верна; вероятность такой ошибки обозначим
рирующую с гипотезой H 0 . Гипотезу H 1 называют также альтерна-            P ( H 1 / H 0 );
тивной.
   Термин "конкурирующая" означает, что являются взаимоисклю-             • ошибка второго рода совершается при принятии гипотезы H 0 , то-
чающими следующие два события:
   • по выборке принимается решение о справедливости для генераль-
                                                                           гда как на самом деле высказывание     H0   неверно и следовало бы
      ной совокупности гипотезы H 0 ;                                      принять гипотезу H 1 ; вероятность ошибки второго рода обозна-
   • по выборке принимается решение о справедливости для генераль-         чим как
      ной совокупности гипотезы H 1 .                                                      β = P( H 0 / H 1 ) .                           (5.1)
   Вернемся к нашему примеру. Обозначим через А событие, состоящее
в том, что случайно выбранный человек в данном регионе предраспо-         Тогда уровень значимости   α   определяет ошибки первого рода, т.е.
ложен к заболеванию R. До строительства химического предприятия ве-
роятность события А была равна 0.1. В качестве гипотезы H 0 рас-
                                                                                           α = P( H 1 / H 0 ) .                           (5.2)

смотрим гипотезу о том, что после строительства химического предпри-      Поэтому вероятность α задается малым числом, поскольку это ве-
ятия вероятность события А не изменилась. Таким образом, если p1 —     роятность ошибочного высказывания, при этом обычно используются
вероятность события А после строительства предприятия, то в качестве   стандартные значения: 0.05; 0.01; 0.005. Например, α = 0.05 означает
нулевой (основной) гипотезы принимается                                следующее: если гипотезу H 0 проверять по каждой из 100 выборок
                            H 0 : p1 = p 0 .                           одинакового объема, то в среднем в 5 случаях из 100 совершим ошибку
                                                                       первого рода.


                                  61                                                                        62