Математическая статистика с примерами в Excel. Воскобойников Ю.Е - 66 стр.

UptoLike

133
тервала заменена на, а правая граница последнего интервала
заменена на +. В графе 5 вычислены значения
1i
zx
s
, в графе 6
вероятности
i
p , в графе 7 – математические ожидания
i
np , а в
графе 8 – взвешенные отклонения
i
ii
np
npm
2
)(
. Так как для 9-го и
10-го интервалов
102.7
9
<
=
np и 1032.3
10
<
=np , то эти интер-
валы объединяем. Для полученного интервала
105210 >
=
.np
(см. графу 7). Числовое значение критерия
19.7
=
наб
K (см. итог
графы 8). По табл. П3 при
98.01 ==
α
γ
и
6129
=
=
k
нахо-
дим
0.15)98.0(
2
=
χ
,
0.15
,
=
α
пр
x
. Так как 0.15
<
наб
K , то гипоте-
за
0
H о нормальности распределения генеральной совокупности
принимается на уровне значимости
02.0=
α
.
5.10. Проверка гипотезы о независимости
двух генеральных совокупностей с применением
критерия
χ
2
Пусть ),( YX двухмерная генеральная совокупность, причем
все значения случайной величины
X
исчерпываются числами
l
aa ,...,
1
, а все значения случайной величины
Y
числами
s
bb ,...,
1
. Выборка объема п в этом случае состоит из пар
),(),...,,(
11 nn
yxyx , где
i
x и
i
y соответствующие значения слу-
чайных величин
X
и
. Заполним таблицу, называемую кор-
реляционной, в первой строке которой перечислим все различные
значения случайной величины
Y
, в первом столбцевсе различ-
ные значения случайной величины
X
, а на пересечении i-й строки
и j-го столбца поместим число
ij
n
количество пар ),(
ii
ba , встре-
чающихся в выборке. Сумму элементов
=
s
j
ij
n
1
i-й строки обозна-
134
чим
i
n . Аналогично
=
=
l
i
jij
nn
1
. Ясно, что
11 11 1 1
ls sl s l
ij ij j i
ij ji j i
nnnnn
••
== == = =
=
===
∑∑ ∑∑
.
Если числа
ij
n концентрируются вдоль диагонали, идущей из
левого верхнего угла к правому нижнему, то между величинами Х
и Y можно предположить тесную прямую связь.
Если числа
ij
n
сосредоточены вдоль другой диагонали, то
между случайными величинами
X
и
вероятна обратная связь,
т.е. с ростом
X
значения
Y
убывают. Если числа
ij
n
распределены по большинству ячеек таблицы, то между
X
и
скорее всего нет связи.
Предположим, что анализ корреляционной таблицы позволил
нам выдвинуть гипотезы: основную
0
H
случайные величины
X
и
Y
независимы и альтернативную
1
H
случайные величины
X
и
Y
зависимы. Используем критерий
χ
2
для проверки этих гипотез.
Если гипотеза
0
H
верна, то
)()(),(
jiji
bYPaXPbYaXP
=
=
=
=
=
.
Корреляционная таблица
X
1
b
2
b
...
b
s
1
2
l
a
a
a
K
11
21
2l
n
n
n
K
12
22
2l
n
n
n
K
...
...
...
K
1
2
s
s
ls
n
n
n
K
Пусть значение
i
X
a
=
встречается среди чисел
n
xx ,...,
1
i
n
раз. Тогда относительная частота события
}{
i
aX
=
равна nn
i
.
Она является состоятельной и несмещенной оценкой параметра
тервала заменена на –∞, а правая граница последнего интервала                                                                                      l
                                               z −x                            чим              ni • .            Аналогично                      ∑ nij = n• j .   Ясно,   что
заменена на +∞. В графе 5 вычислены значения i −1    , в графе 6                                                                                  i =1
                                                 s                              l    s               s   l          s                l

– вероятности pi , в графе 7 – математические ожидания npi , а в               ∑∑ n = ∑∑ n = ∑ n
                                                                               i =1 j =1
                                                                                           ij
                                                                                                 j =1 i =1
                                                                                                             ij
                                                                                                                   j =1
                                                                                                                             •j   = ∑ ni• = n .
                                                                                                                                    i =1
                                        (mi − npi ) 2
графе 8 – взвешенные отклонения                       . Так как для 9-го и
                                            npi                                          Если числа nij концентрируются вдоль диагонали, идущей из
10-го интервалов np9 = 7.2 < 10 и np10 = 3.32 < 10 , то эти интер-             левого верхнего угла к правому нижнему, то между величинами Х
                                                                               и Y можно предположить тесную прямую связь.
валы объединяем. Для полученного интервала np = 10.52 > 10
                                                                                    Если числа nij сосредоточены вдоль другой диагонали, то
(см. графу 7). Числовое значение критерия K наб = 7.19 (см. итог
                                                                               между случайными величинами X и Y вероятна обратная связь,
графы 8). По табл. П3 при γ = 1 − α = 0.98 и k = 9 − 2 − 1 = 6 нахо-
                                                                               т.е. с ростом X значения Y убывают. Если числа nij
дим χ 2 (0.98) = 15.0 , xпр ,α = 15.0 . Так как K наб < 15.0 , то гипоте-
                                                                               распределены по большинству ячеек таблицы, то между X и
за H 0 о нормальности распределения генеральной совокупности                   Y скорее всего нет связи.
принимается на уровне значимости α = 0.02 . ☻                                      Предположим, что анализ корреляционной таблицы позволил
                                                                               нам выдвинуть гипотезы: основную H 0 – случайные величины X
     5.10. Проверка гипотезы о независимости                                   и Y независимы и альтернативную H1 – случайные величины X и
          двух генеральных совокупностей с применением
          критерия χ2                                                          Y зависимы. Используем критерий χ2 для проверки этих гипотез.
                                                                               Если гипотеза H 0 верна, то
      Пусть ( X , Y ) – двухмерная генеральная совокупность, причем                                      P ( X = ai , Y = b j ) = P( X = ai ) ⋅ P(Y = b j ) .
все значения случайной величины X исчерпываются числами
a1 ,..., al , а все значения случайной величины Y – числами                                                             Корреляционная таблица
b1 ,..., bs . Выборка объема п в этом случае состоит из пар                                              Y
                                                                                                                        b1                 b2              ...      bs
( x1 , y1 ),..., ( x n , y n ) , где xi и yi – соответствующие значения слу-               X
чайных величин X и Y . Заполним таблицу, называемую кор-                                        a1                  n11                    n12            ...       n1s
реляционной, в первой строке которой перечислим все различные                                   a2                  n21                    n22            ...       n2 s
значения случайной величины Y , в первом столбце – все различ-                                  K                   K                      K              K         K
ные значения случайной величины X , а на пересечении i-й строки                                 al                                         nl 2                     nls
                                                                                                                    nl 2                                  ...
и j-го столбца поместим число nij – количество пар (ai , bi ) , встре-
                                                 s
                                                                                    Пусть значение X = ai встречается среди чисел x1 ,..., xn ni•
чающихся в выборке. Сумму элементов            ∑ nij   i-й строки обозна-
                                                j =1
                                                                               раз. Тогда относительная частота события { X = ai } равна ni• n .
                                                                               Она является состоятельной и несмещенной оценкой параметра
                                    133                                                                                                    134