Теория вероятностей и математическая статистика. Соппа М.С - 30 стр.

UptoLike

Составители: 

61
Проверка гипотезы о виде распределения генеральной
совокупности. Критерий согласия Пирсона
Нередко в приложениях математической статистики фигу-
рируют задачи, в которых закон распределения генеральной со-
вокупности заранее неизвестен, но есть основания предполо-
жить, выдвинуть гипотезу, что он имеет определённый вид.
Проверка гипотезы о предполагаемом законе неизвестного рас-
пределения производится так же, как и проверка гипотезы о па-
раметрах распределения, т.е. при
помощи специально подобран-
ной случайной величиныкритерия согласия (или критерия χ
2
)
К. Пирсона. С этой целью сравниваются эмпирические n
i
(на-
блюдаемые) и теоретические n'
i
(вычисленные в предположении
о правильности гипотезы) частоты.
Приступим к проверке нулевой гипотезы: генеральная сово-
купность распределена нормально. В качестве критерия провер-
ки нулевой гипотезы применяем случайную величину
=
=χ
m
i
iii
nnn
1
'2'2
)(
. (12)
Ясно, что чем меньше различаются эмпирические и теорети-
ческие частоты, тем меньше величина критерия (12), следователь-
но, он в некоторой степени характеризует близость эмпирического
и теоретического распределений. Доказано, что случайная величи-
на (12) распределена по закону χ
2
с k степенями свободы. Число
степеней свободы находят по формуле k = m 1 – r, где mчисло
интервалов в группированном статистическом ряде, а rчисло па-
раметров предполагаемого распределения, которые оценены по
данным выборки. Если предполагаемое распределениенормаль-
ное, то оценивают два параметра (математическое ожидание и
среднее квадратическое отклонение), поэтому r = 2. Основным для
проверки гипотезы на уровне значимости α служит соотношение:
Р(χ
2
>χ
2
кр
(α; k)) = α.
Если гипотеза Н
0
несправедлива, то критерий принимает
большое положительное значение, поэтому строим правосто-
роннюю критическую область, определяемую неравенством
χ
2
>χ
2
кр
(α; k).
Таблица расчета χ
2
набл
имеет следующий вид (в качестве
примера взят случай выборки, на основе которой построен груп-
пированный статистический ряд, m = 5):
62
i
i1i
zz ÷
i
n
2
1
)(
S
xz
вi
)
)(
(
2
1
S
xz
Ф
вi
i
p
i
np
i
ii
np
npn
2
)(
1 –
,
4.75
4 –
–0.5 0.08 4 0
2 4.75,
6.05
11 –1.4 –0.419 0.2 10 0.1
3 6.05,
7.35
15 –0.57 –0.216 0.38 19 0.84
4 7.35,
8.65
13 0.3 0.12 0.26 13 0
5 8.65,
7 1.17 0.38 0.12 6 0.15
– – –
0.5 –
50 1 50 1.09
Таким образом, наблюдаемое значение критерия
=
=χ
m
i
iii
nnn
1
'2'2
)( = 1.09. Теперь по таблице критических точек
распределения χ
2
, по заданному уровню значимости α и числу
степеней свободы k = 2 находим критическую точку χ
2
кр
(α; k).
Если χ
2
набл
< χ
2
кр
нет оснований отвергнуть нулевую гипотезу.
Если χ
2
набл
> χ
2
кр
нулевая гипотеза отвергается, а принимается
конкурирующая гипотеза, состоящая в том, что исследуемая ге-
неральная совокупность имеет другой (отличный от нормально-
го) закон распределения.
Вопросы для самопроверки
1. Что понимается под статистической гипотезой?
2.
Перечислить этапы проверки статистических гипотез.
3.
Дать определение ошибки первого и второго рода.
4.
Как связана величина уровня значимости с границами
критической области?
5.
Какова связь между выбором вида конкурирующей ги-
потезы и типом критической области?
6.
Привести виды критериев, используемых в задачах о
проверке статистических гипотез.
    Проверка гипотезы о виде распределения генеральной                   i        z i −1 ÷ z i    ni   ( zi −1 − xв )
                                                                                                                         Ф(
                                                                                                                              ( zi −1 − xв )
                                                                                                                                               )       pi    np i   (ni − npi ) 2
         совокупности. Критерий согласия Пирсона                                                             S2                     S2                                  npi
    Нередко в приложениях математической статистики фигу-
                                                                         1            –∞,         4      –∞                    –0.5                   0.08   4            0
рируют задачи, в которых закон распределения генеральной со-
вокупности заранее неизвестен, но есть основания предполо-                            4.75
жить, выдвинуть гипотезу, что он имеет определённый вид.                 2           4.75,        11      –1.4               –0.419                   0.2    10         0.1
Проверка гипотезы о предполагаемом законе неизвестного рас-                          6.05
пределения производится так же, как и проверка гипотезы о па-            3           6.05,        15     –0.57               –0.216                   0.38   19        0.84
раметрах распределения, т.е. при помощи специально подобран-                         7.35
ной случайной величины – критерия согласия (или критерия χ2)             4           7.35,        13       0.3                 0.12                   0.26   13           0
К. Пирсона. С этой целью сравниваются эмпирические ni (на-                           8.65
блюдаемые) и теоретические n'i (вычисленные в предположении              5           8.65,        7       1.17                 0.38                   0.12   6         0.15
о правильности гипотезы) частоты.                                                     ∞
    Приступим к проверке нулевой гипотезы: генеральная сово-             –            –           –       ∞         0.5                                –     –      –
купность распределена нормально. В качестве критерия провер-
ки нулевой гипотезы применяем случайную величину
                                                                        ∑                         50      –          –                                 1    50    1.09
                               m                                             Таким               образом,   наблюдаемое                            значение    критерия
                         χ =∑
                           2
                                      (ni − ni' ) 2   ni'   .   (12)          m

                               i =1                                    χ 2 = ∑ (ni − ni' ) 2 ni' = 1.09. Теперь по таблице критических точек
                                                                              i =1
     Ясно, что чем меньше различаются эмпирические и теорети-
ческие частоты, тем меньше величина критерия (12), следователь-        распределения χ2, по заданному уровню значимости α и числу
но, он в некоторой степени характеризует близость эмпирического        степеней свободы k = 2 находим критическую точку χ2кр(α; k).
и теоретического распределений. Доказано, что случайная величи-        Если χ2набл < χ2кр – нет оснований отвергнуть нулевую гипотезу.
на (12) распределена по закону χ2 с k степенями свободы. Число         Если χ2набл > χ2кр – нулевая гипотеза отвергается, а принимается
степеней свободы находят по формуле k = m – 1 – r, где m – число       конкурирующая гипотеза, состоящая в том, что исследуемая ге-
интервалов в группированном статистическом ряде, а r – число па-       неральная совокупность имеет другой (отличный от нормально-
раметров предполагаемого распределения, которые оценены по             го) закон распределения.
данным выборки. Если предполагаемое распределение – нормаль-
ное, то оценивают два параметра (математическое ожидание и                                Вопросы для самопроверки
среднее квадратическое отклонение), поэтому r = 2. Основным для              1. Что понимается под статистической гипотезой?
проверки гипотезы на уровне значимости α служит соотношение:                 2. Перечислить этапы проверки статистических гипотез.
                       Р(χ2 >χ2кр(α; k)) = α.                                3. Дать определение ошибки первого и второго рода.
     Если гипотеза Н0 несправедлива, то критерий принимает                   4. Как связана величина уровня значимости с границами
большое положительное значение, поэтому строим правосто-                        критической области?
роннюю критическую область, определяемую неравенством                        5. Какова связь между выбором вида конкурирующей ги-
χ2 >χ2кр(α; k).                                                                 потезы и типом критической области?
     Таблица расчета χ2набл имеет следующий вид (в качестве                  6. Привести виды критериев, используемых в задачах о
примера взят случай выборки, на основе которой построен груп-                   проверке статистических гипотез.
пированный статистический ряд, m = 5):
                                61                                                                                      62