Математическая статистика с примерами в Excel. Воскобойников Ю.Е - 63 стр.

UptoLike

127
Возникает вопрос о критерии проверки по выборочным дан-
ным гипотезы о том, что случайная величина Х подчиняется рас-
пределению с плотностью
)(xpy = . Такие критерии называются
критериями согласия. Рассмотрим лишь один критерий согласия,
использующий
χ
2
-распределение и получивший название критерия
согласия Пирсона (или критерия
χ
2
). Выдвигая гипотезу о виде
распределения генеральной совокупности, мы должны различать
два случая. В первом из них вид функции плотности определен в
гипотезе полностью. Например, мы выдвигаем гипотезу о том, что
генеральная совокупность распределена по нормальному закону с
параметрами
0
=
a
и 1
=
σ
. Такие гипотезы называются просты-
ми. Если же гипотеза состоит лишь в том, что функция плотности
р(х) принадлежит к некоторому семейству функций, то такая гипо-
теза называется сложной. Например, можно выдвинуть гипотезу о
том, что генеральные совокупности распределены по показатель-
ному закону, не оговаривая значений параметров
λ
и
0
x . Такая
гипотеза будет сложной.
Остановимся вначале на простой гипотезе, предполагая, что
генеральная совокупность распределена непрерывно. В качестве
нулевой гипотезы принимается предположение, что неизвестная
плотность распределения р
X
(х) исследуемой случайной величины
Х совпадает с предполагаемой плотностью р(х), т.е.
0
:() ()
X
H
px px= . (5.60)
В качестве предполагаемой (теоретической) плотности могут
быть рассмотрены различные плотности (нормальная, показатель-
ная и т.д). Выберем наименьшее и наибольшее значения в данной
выборке:
},...,max{},,...,min{
11 nn
xxbxxa == . Промежуток
],[ ba разобьем на l промежутков равной длины
l
ab
h
=
. Гра-
ницы этих промежутков обозначим
01
, ,...,
l
zaz zb
=
=
, где
hzz
ii
+=
+1
при 1,...,0
=
li . Считаем, что гипотеза верна. Вы-
числим частоту
),...,1( lim
i
=
попадания элементов генеральной
совокупности на каждый промежуток. Понятно, что
128
nm...mm
l
=
+
+
+
21
. Сдвинем границу левого интервала на, а
правого на +, т.е. вместо первого интервала
),(
10
zz рассмотрим
интервал
);(
1
z
, а вместо последнего ),(
1 ll
zz
интервал
),(
1
l
z . Вычислим вероятность попадания случайной величины
Х на каждый из полученных промежутков
l
Δ
Δ
,...,
1
, воспользо-
вавшись известной формулой:
( ) , 1, 2,..., .
i
i
p
pxdx i l
Δ
==
Заметим, что первый и последний из интегралов являются не-
собственными. Полученные вероятности p
1
,…, p
n
должны удовле-
творять условию p
1
+ p
2
+ … + p
n
= 1.
Рассмотрим п опытов, каждый из которых состоит в выборе
случайного значения величины Х и события
i
A = {значение попа-
ло в интервал
i
Δ
}. Событие
i
A в каждом опыте происходит с ве-
роятностью
i
p . Поэтому ожидаемое количество появлений собы-
тия А в п опытах равно
i
np (математическое ожидание биномиаль-
ного распределения). Понятно, что если гипотеза верна, то между
фактическими частотами
i
m и теоретическими
i
np попаданий на
i-й интервал не должно быть "больших" расхождений, т.е. величи-
ны
l
npnp ,...,
1
и числа
l
mm ,...,
1
должны быть соответственно
близки друг к другу. В качестве меры расхождения между ними
используем сумму квадратов взвешенных расхождений:
i
ii
i
np
npm
Y
= .
Случайная величина
=
==
l
i
i
ii
l
i
i
np
npm
Y
1
2
1
2
)(
при большом объеме
выборки
n имеет распределение, близкое к
χ
2
с
)1(
l
степенями
свободы. Поэтому эта случайная величина принимается за крите-
рий
     Возникает вопрос о критерии проверки по выборочным дан-                         m1 + m2 + ... + ml = n . Сдвинем границу левого интервала на –∞, а
ным гипотезы о том, что случайная величина Х подчиняется рас-
                                                                                     правого на +∞, т.е. вместо первого интервала ( z0 , z1 ) рассмотрим
пределению с плотностью y = p (x ) . Такие критерии называются
критериями согласия. Рассмотрим лишь один критерий согласия,                         интервал ( −∞; z1 ) , а вместо последнего ( zl −1 , zl ) – интервал
использующий χ2-распределение и получивший название критерия                         ( zl −1 , ∞) . Вычислим вероятность попадания случайной величины
согласия Пирсона (или критерия χ2). Выдвигая гипотезу о виде
                                                                                     Х на каждый из полученных промежутков Δ1 ,..., Δ l , воспользо-
распределения генеральной совокупности, мы должны различать
два случая. В первом из них вид функции плотности определен в                        вавшись известной формулой:
гипотезе полностью. Например, мы выдвигаем гипотезу о том, что
генеральная совокупность распределена по нормальному закону с
                                                                                                          pi =   ∫ p( x)dx,
                                                                                                                 Δi
                                                                                                                                   i = 1, 2,..., l.

параметрами a = 0 и σ = 1 . Такие гипотезы называются просты-
                                                                                         Заметим, что первый и последний из интегралов являются не-
ми. Если же гипотеза состоит лишь в том, что функция плотности
                                                                                     собственными. Полученные вероятности p1,…, pn должны удовле-
р(х) принадлежит к некоторому семейству функций, то такая гипо-
                                                                                     творять условию p1 + p2 + … + pn = 1.
теза называется сложной. Например, можно выдвинуть гипотезу о
том, что генеральные совокупности распределены по показатель-                            Рассмотрим п опытов, каждый из которых состоит в выборе
ному закону, не оговаривая значений параметров λ и x0 . Такая                        случайного значения величины Х и события Ai = {значение попа-
гипотеза будет сложной.                                                              ло в интервал Δ i }. Событие Ai в каждом опыте происходит с ве-
     Остановимся вначале на простой гипотезе, предполагая, что                       роятностью pi . Поэтому ожидаемое количество появлений собы-
генеральная совокупность распределена непрерывно. В качестве
                                                                                     тия А в п опытах равно npi (математическое ожидание биномиаль-
нулевой гипотезы принимается предположение, что неизвестная
плотность распределения рX (х) исследуемой случайной величины                        ного распределения). Понятно, что если гипотеза верна, то между
Х совпадает с предполагаемой плотностью р(х), т.е.                                   фактическими частотами mi и теоретическими npi попаданий на
                        H 0 : p X ( x) = p( x) .                          (5.60)     i-й интервал не должно быть "больших" расхождений, т.е. величи-
                                                                                     ны np1 ,..., npl и числа m1 ,..., ml должны быть соответственно
    В качестве предполагаемой (теоретической) плотности могут
быть рассмотрены различные плотности (нормальная, показатель-                        близки друг к другу. В качестве меры расхождения между ними
ная и т.д). Выберем наименьшее и наибольшее значения в данной                        используем сумму квадратов взвешенных расхождений:
выборке: a = min{x1 ,..., x n }, b = max{x1 ,..., x n } . Промежуток                                                         mi − npi
                                                                                                                  Yi =                .
                                                                     b−a                                                        npi
[a, b] разобьем на l промежутков равной длины h =                           . Гра-
                                                                       l                                   l        ( mi − npi ) 2
                                                                                                                         l
ницы   этих    промежутков       обозначим         z0 = a, z1 ,..., zl = b , где     Случайная величина ∑ Yi2 = ∑                  при большом объеме
                                                                                                        i =1   i =1      npi
zi +1 = zi + h при i = 0,..., l − 1 . Считаем, что гипотеза верна. Вы-               выборки n имеет распределение, близкое к χ2 с (l − 1) степенями
числим частоту mi (i = 1,..., l ) попадания элементов генеральной                    свободы. Поэтому эта случайная величина принимается за крите-
совокупности      на    каждый         промежуток.          Понятно,         что     рий

                                   127                                                                                       128