Математическая статистика. Воскобойников Ю.Е - 54 стр.

UptoLike

107 108
Если числа
ij
n концентрируются вдоль диагонали, идущей с левого
верхнего угла к правому нижнему, то между величинами
Х и Y можно
предположить тесную прямую связь.
Если числа
ij
n сосредоточены вдоль другой диагонали, то между
случайными величинами
X
и
Y
вероятна обратная связь, т.е. с ростом
X
значения
Y
убывают. Если числа
ij
n разбросаны по таблице, то ме-
жду
X
и
Y
скорее всего нет связи.
Предположим, что анализ корреляционной таблицы позволил нам
выдвинуть гипотезу , что случайные величины
X
и
Y
независимы. Ис-
пользуем критерий
2
χ
для проверки этой гипотезы. Если гипотеза вер-
на, то
)()(),(
jiji
bYPaXPbYaXP
=
===
=
.
Корреляционная таблица
Y
X
1
b
2
b
...
3
b
l
a
a
a
M
2
1
2
21
11
l
n
n
n
2
22
12
l
n
n
n
...
...
...
ls
s
s
n
n
n
2
1
Значение
i
a встречается среди чисел
n
xx ,...,
1
i
n раз. Поэтому от-
носительная частота события
}{
i
aX = равна nn
i
. Она является со-
стоятельной и несмещенной оценкой параметра
)(
ii
aXPp
=
=
. Ана-
логично,
nn
j
состоятельная и несмещенная оценка вероятности
)(
jj
bYPp ==
. Поэтому ожидаемое количество попаданий в клетку
),( ji
можно найти по формуле
n
nn
n
nn
nn
jiji
ij
==
2
, как матема-
тическое ожидание случайной величины, распределенной по биноми-
альному закону с параметрами
n и
2
n
nn
p
ji
= . Если гипотеза
0
H
верна, то числа
ij
n
и
n
nn
ji
близки друг к другу в совокупности. В ка-
честве критерия примем случайную величину
∑∑
==
=
l
i
s
j
ji
n
nn
ij
nnn
n
K
ji
11
2
)(
. (5.73)
Если гипотеза
0
H справедлива, то эта случайная величина имеет
2
χ
-
распределение с
)1)(1(
=
llk степенями свободы, т.е
2
)1)(1(
=
sl
K
χ
. (5.74)
Критическая область определяется отрезком
),(
+
пр
x
, где точка
α
,пр
x
определяется соотношением ))1)(1(,1(
2
,
= slx
пр
αχ
α
.
Если числовое значение критерия
наб
K , найденное по формуле
(5.73), попадает в критическую область, т.е.
α
,прнаб
xK >
, то нулевая
гипотеза о независимости
X
и
Y
отвергается.
Заметим, что вместо ограничения
10
i
np , указанного в пункте
5.9, здесь желательно выполнение условия
4
n
nn
ji
. Если это усло-
вие не выполняется, то соответствующие строки и столбцы должны
быть объединены с соседними.
Пример 5.13. Комплектующие усилия одного наименования посту-
пают с трех предприятий: 1, 2, 3. Результаты проверки изделий при-
ведены в табл. 5.3.
   Если числа nij концентрируются вдоль диагонали, идущей с левого                                                                           ni• n• j
                                                                                       альному закону с параметрами n и p =                              . Если гипотеза H 0
верхнего угла к правому нижнему, то между величинами Х и Y можно                                                                               n2
предположить тесную прямую связь.                                                                              ni• n• j
   Если числа nij сосредоточены вдоль другой диагонали, то между                       верна, то числа nij и                близки друг к другу в совокупности. В ка-
                                                                                                                    n
случайными величинами X и Y вероятна обратная связь, т.е. с ростом                     честве критерия примем случайную величину
 X значения Y убывают. Если числа nij разбросаны по таблице, то ме-                                                                           2
жду X и Y скорее всего нет связи.
                                                                                                                      ⎛⎜ n − ( ni•n• j ) ⎞⎟
                                                                                                                l       s ij
                                                                                                        K = ∑∑ ⎝                          ⎠ .
                                                                                                                                   n
   Предположим, что анализ корреляционной таблицы позволил нам                                                                                                         (5.73)
выдвинуть гипотезу , что случайные величины X и Y независимы. Ис-                                           i =1 j =1      ni• n• j n
пользуем критерий    χ2   для проверки этой гипотезы. Если гипотеза вер-
на, то                                                                                 Если гипотеза H 0 справедлива, то эта случайная величина имеет                   χ2-
                                                                                       распределение с k = (l − 1)(l − 1) степенями свободы, т.е
               P ( X = ai , Y = b j ) = P( X = ai ) ⋅ P(Y = b j ) .
                                                                                                                               K = χ (2l −1)( s −1) .                  (5.74)
                          Корреляционная таблица
                                                                                          Критическая область определяется отрезком ( x пр ,+∞) , где точка
               Y                                    ...
                       b1            b2                                 b3             xпр ,α определяется соотношением xпр ,α = χ 2 (1 − α , (l − 1)( s − 1)) .
      X                                             ...
          a1           n11           n12                               n1s                Если числовое значение критерия K наб , найденное по формуле
                                                    ...
          a2           n21           n22                               n2 s            (5.73), попадает в критическую область, т.е. K наб > x пр ,α , то нулевая
          M                                                                            гипотеза о независимости X и Y отвергается.
          al                         nl 2           ...                 nls
                       nl 2                                                               Заметим, что вместо ограничения npi ≥ 10 , указанного в пункте
                                                                                                                                              ni• n• j
   Значение ai встречается среди чисел x1 ,..., x n ni• раз. Поэтому от-               5.9, здесь желательно выполнение условия                          ≥ 4 . Если это усло-
                                                                                                                                                  n
носительная частота события { X = ai } равна ni• n . Она является со-
                                                                                       вие не выполняется, то соответствующие строки и столбцы должны
стоятельной и несмещенной оценкой параметра pi = P ( X = ai ) . Ана-                   быть объединены с соседними.
логично, n• j n состоятельная и несмещенная оценка вероятности
                                                                                          Пример 5.13. Комплектующие усилия одного наименования посту-
p ′j = P(Y = b j ) . Поэтому ожидаемое количество попаданий в клетку                   пают с трех предприятий: № 1, 2, 3. Результаты проверки изделий при-
                                             ni• n• j       ni• n• j                   ведены в табл. 5.3.
(i, j ) можно найти по формуле nij′ = n ⋅               =              , как матема-
                                               n2              n
тическое ожидание случайной величины, распределенной по биноми-


                                      107                                                                                          108