ВУЗ:
Составители:
Рубрика:
4.6. Проверка непараметрических гипотез.
Критерий согласия Пирсона
Пусть имеется некоторая с.в. X и выборка ее значений
n
xx ,,
1
…
.
Требуется выяснить, может ли быть, что с.в. X имеет заданное распределение
(
)
xP
. Иначе говоря, что генеральная со-
вокупность имеет это распределение. Такую гипотезу называют непараметрической, поскольку в ней идет речь не о пара-
метрах, а о самом виде распределения.
Проверку строят следующим образом. Разбивают предполагаемый диапазон возможных значений изучаемой с.в. X на m
подынтервалов. Это можно делать различным образом. Но, обычно, рекомендуют
•
диапазон принимать равным
minmax
xx −=∆ ,
•
количество интервалов разбиения, в соответствии с формулой Стерджеса,
()
nm ln322,31+
=
.
Далее находят, какое количество
i
m элементов выборки попадают в i -й подынтервал, и рассчитывают наблюдаемую
относительную частоту
n
m
i
i
=ν .
Исходя из
()
xP рассчитывают теоретические вероятности
i
p попадания значений с.в
X
в соответствующие подын-
тервалы.
Рассматриваемую гипотезу формально записывают так
mm
pppH
=
ν
=
ν
=
ν ...,,,:
22110
.
Таким образом, следует сравнить наблюдаемые относительные частоты и теоретические вероятности. Ясно, что возможно ис-
пользование различных мер их близости. Эти меры называют критериями согласия (иногда этот термин понимают более широ-
ко [4]). Известны и находят практическое применение критерии согласия Колмогорова, Романовского, Ястремского,
ω
-
критерий и др. Но чаще всего, используется критерий согласия Пирсона
()
∑
=
⋅
⋅−
=
m
i
i
ii
n
pn
pnm
T
1
2
,
который в случае истинности нулевой гипотезы и при 20>n имеет распределение, приближающееся к
()
1~
2
−−χ kmT ,
где k – число параметров теоретического распределения
(
)
xP , уже оцененных по данным имеющейся выборки.
При использовании этого и других критериев согласия должны иметься статистики достаточно большого объема. Счи-
тается что должно быть
105 ÷≥
i
m , для mi ,1=∀ . В частности поэтому не рекомендуют сильно дробить диапазон возмож-
ных значений с.в.
Критерий Пирсона используется для решения различных задач, в частности, такой важной, как проверка, что имеющая-
ся выборка является выборкой значений нормально распределенной с.в. (взята из нормальной генеральной совокупности).
Отметим, что для этой задачи проще использовать другой подход, состоящий в расчете следующих эмпирических коэффи-
циентов
3
)(
)(
A
3
2
1
3
1
−
−
−
=
∑
∑
=
=
n
i
i
n
i
i
c
Xx
Xx
,
2
2
1
4
1
)(
)(
Э
−
−
=
∑
∑
=
=
n
i
i
n
i
i
k
Xx
Xx
,
называемых коэффициентами асимметрии и эксцесса, соответственно. Для нормальной выборки их значения близки к нулю.
Имеются таблицы [21] критических значений этих коэффициентов для проверки соответствующей гипотезы при различных
уровнях значимости.
Критерий Пирсона используется также для такой важной и часто встречающейся на практике задачи как установление
связи между признаками некоторых объектов, когда эти признаки не выражаются численно (если они выражаются численно,
как бывает обычно, то можно использовать коэффициент корреляции). Рассмотрим суть этой задачи и методику расчетов на
примере.
Пример. На некотором предприятии решили выяснить, имеется ли зависимость между процентом выполнения плана ра-
бочими и тем, учатся ли они в настоящее время на курсах повышения квалификации или на заочном отделении. Собранные
статистические данные были сведены в табл. 5.3.
Таблица 5.3.
Выполнение нормы выработки, %
85 – 99 100 – 105 106 – 116 117 – 130
Отношение
к учебе
1 2 3 4
Всего
Учатся 2 5 10 20 37
Страницы
- « первая
- ‹ предыдущая
- …
- 46
- 47
- 48
- 49
- 50
- …
- следующая ›
- последняя »