Составители:
Рубрика:
61
Проверка гипотезы о виде распределения генеральной
совокупности. Критерий согласия Пирсона
Нередко в приложениях математической статистики фигу-
рируют задачи, в которых закон распределения генеральной со-
вокупности заранее неизвестен, но есть основания предполо-
жить, выдвинуть гипотезу, что он имеет определённый вид.
Проверка гипотезы о предполагаемом законе неизвестного рас-
пределения производится так же, как и проверка гипотезы о па-
раметрах распределения, т.е. при
помощи специально подобран-
ной случайной величины – критерия согласия (или критерия χ
2
)
К. Пирсона. С этой целью сравниваются эмпирические n
i
(на-
блюдаемые) и теоретические n'
i
(вычисленные в предположении
о правильности гипотезы) частоты.
Приступим к проверке нулевой гипотезы: генеральная сово-
купность распределена нормально. В качестве критерия провер-
ки нулевой гипотезы применяем случайную величину
∑
=
−=χ
m
i
iii
nnn
1
'2'2
)(
. (12)
Ясно, что чем меньше различаются эмпирические и теорети-
ческие частоты, тем меньше величина критерия (12), следователь-
но, он в некоторой степени характеризует близость эмпирического
и теоретического распределений. Доказано, что случайная величи-
на (12) распределена по закону χ
2
с k степенями свободы. Число
степеней свободы находят по формуле k = m – 1 – r, где m – число
интервалов в группированном статистическом ряде, а r – число па-
раметров предполагаемого распределения, которые оценены по
данным выборки. Если предполагаемое распределение – нормаль-
ное, то оценивают два параметра (математическое ожидание и
среднее квадратическое отклонение), поэтому r = 2. Основным для
проверки гипотезы на уровне значимости α служит соотношение:
Р(χ
2
>χ
2
кр
(α; k)) = α.
Если гипотеза Н
0
несправедлива, то критерий принимает
большое положительное значение, поэтому строим правосто-
роннюю критическую область, определяемую неравенством
χ
2
>χ
2
кр
(α; k).
Таблица расчета χ
2
набл
имеет следующий вид (в качестве
примера взят случай выборки, на основе которой построен груп-
пированный статистический ряд, m = 5):
62
i
i1i
zz ÷
−
i
n
2
1
)(
S
xz
вi
−
−
)
)(
(
2
1
S
xz
Ф
вi
−
−
i
p
i
np
i
ii
np
npn
2
)( −
1 –
∞
,
4.75
4 –
∞
–0.5 0.08 4 0
2 4.75,
6.05
11 –1.4 –0.419 0.2 10 0.1
3 6.05,
7.35
15 –0.57 –0.216 0.38 19 0.84
4 7.35,
8.65
13 0.3 0.12 0.26 13 0
5 8.65,
∞
7 1.17 0.38 0.12 6 0.15
– – –
∞
0.5 – – –
∑
50 – – 1 50 1.09
Таким образом, наблюдаемое значение критерия
∑
=
−=χ
m
i
iii
nnn
1
'2'2
)( = 1.09. Теперь по таблице критических точек
распределения χ
2
, по заданному уровню значимости α и числу
степеней свободы k = 2 находим критическую точку χ
2
кр
(α; k).
Если χ
2
набл
< χ
2
кр
– нет оснований отвергнуть нулевую гипотезу.
Если χ
2
набл
> χ
2
кр
– нулевая гипотеза отвергается, а принимается
конкурирующая гипотеза, состоящая в том, что исследуемая ге-
неральная совокупность имеет другой (отличный от нормально-
го) закон распределения.
Вопросы для самопроверки
1. Что понимается под статистической гипотезой?
2.
Перечислить этапы проверки статистических гипотез.
3.
Дать определение ошибки первого и второго рода.
4.
Как связана величина уровня значимости с границами
критической области?
5.
Какова связь между выбором вида конкурирующей ги-
потезы и типом критической области?
6.
Привести виды критериев, используемых в задачах о
проверке статистических гипотез.
Проверка гипотезы о виде распределения генеральной i z i −1 ÷ z i ni ( zi −1 − xв ) Ф( ( zi −1 − xв ) ) pi np i (ni − npi ) 2 совокупности. Критерий согласия Пирсона S2 S2 npi Нередко в приложениях математической статистики фигу- 1 –∞, 4 –∞ –0.5 0.08 4 0 рируют задачи, в которых закон распределения генеральной со- вокупности заранее неизвестен, но есть основания предполо- 4.75 жить, выдвинуть гипотезу, что он имеет определённый вид. 2 4.75, 11 –1.4 –0.419 0.2 10 0.1 Проверка гипотезы о предполагаемом законе неизвестного рас- 6.05 пределения производится так же, как и проверка гипотезы о па- 3 6.05, 15 –0.57 –0.216 0.38 19 0.84 раметрах распределения, т.е. при помощи специально подобран- 7.35 ной случайной величины – критерия согласия (или критерия χ2) 4 7.35, 13 0.3 0.12 0.26 13 0 К. Пирсона. С этой целью сравниваются эмпирические ni (на- 8.65 блюдаемые) и теоретические n'i (вычисленные в предположении 5 8.65, 7 1.17 0.38 0.12 6 0.15 о правильности гипотезы) частоты. ∞ Приступим к проверке нулевой гипотезы: генеральная сово- – – – ∞ 0.5 – – – купность распределена нормально. В качестве критерия провер- ки нулевой гипотезы применяем случайную величину ∑ 50 – – 1 50 1.09 m Таким образом, наблюдаемое значение критерия χ =∑ 2 (ni − ni' ) 2 ni' . (12) m i =1 χ 2 = ∑ (ni − ni' ) 2 ni' = 1.09. Теперь по таблице критических точек i =1 Ясно, что чем меньше различаются эмпирические и теорети- ческие частоты, тем меньше величина критерия (12), следователь- распределения χ2, по заданному уровню значимости α и числу но, он в некоторой степени характеризует близость эмпирического степеней свободы k = 2 находим критическую точку χ2кр(α; k). и теоретического распределений. Доказано, что случайная величи- Если χ2набл < χ2кр – нет оснований отвергнуть нулевую гипотезу. на (12) распределена по закону χ2 с k степенями свободы. Число Если χ2набл > χ2кр – нулевая гипотеза отвергается, а принимается степеней свободы находят по формуле k = m – 1 – r, где m – число конкурирующая гипотеза, состоящая в том, что исследуемая ге- интервалов в группированном статистическом ряде, а r – число па- неральная совокупность имеет другой (отличный от нормально- раметров предполагаемого распределения, которые оценены по го) закон распределения. данным выборки. Если предполагаемое распределение – нормаль- ное, то оценивают два параметра (математическое ожидание и Вопросы для самопроверки среднее квадратическое отклонение), поэтому r = 2. Основным для 1. Что понимается под статистической гипотезой? проверки гипотезы на уровне значимости α служит соотношение: 2. Перечислить этапы проверки статистических гипотез. Р(χ2 >χ2кр(α; k)) = α. 3. Дать определение ошибки первого и второго рода. Если гипотеза Н0 несправедлива, то критерий принимает 4. Как связана величина уровня значимости с границами большое положительное значение, поэтому строим правосто- критической области? роннюю критическую область, определяемую неравенством 5. Какова связь между выбором вида конкурирующей ги- χ2 >χ2кр(α; k). потезы и типом критической области? Таблица расчета χ2набл имеет следующий вид (в качестве 6. Привести виды критериев, используемых в задачах о примера взят случай выборки, на основе которой построен груп- проверке статистических гипотез. пированный статистический ряд, m = 5): 61 62
Страницы
- « первая
- ‹ предыдущая
- …
- 28
- 29
- 30
- 31
- 32
- …
- следующая ›
- последняя »