Составители:
Рубрика:
107 108
Если числа
ij
n концентрируются вдоль диагонали, идущей с левого
верхнего угла к правому нижнему, то между величинами
Х и Y можно
предположить тесную прямую связь.
Если числа
ij
n сосредоточены вдоль другой диагонали, то между
случайными величинами
X
и
Y
вероятна обратная связь, т.е. с ростом
X
значения
Y
убывают. Если числа
ij
n разбросаны по таблице, то ме-
жду
X
и
Y
скорее всего нет связи.
Предположим, что анализ корреляционной таблицы позволил нам
выдвинуть гипотезу , что случайные величины
X
и
Y
независимы. Ис-
пользуем критерий
2
χ
для проверки этой гипотезы. Если гипотеза вер-
на, то
)()(),(
jiji
bYPaXPbYaXP
=
⋅
===
=
.
Корреляционная таблица
Y
X
1
b
2
b
...
3
b
l
a
a
a
M
2
1
2
21
11
l
n
n
n
2
22
12
l
n
n
n
...
...
...
ls
s
s
n
n
n
2
1
Значение
i
a встречается среди чисел
n
xx ,...,
1
•i
n раз. Поэтому от-
носительная частота события
}{
i
aX = равна nn
i•
. Она является со-
стоятельной и несмещенной оценкой параметра
)(
ii
aXPp
=
=
. Ана-
логично,
nn
j•
состоятельная и несмещенная оценка вероятности
)(
jj
bYPp ==
′
. Поэтому ожидаемое количество попаданий в клетку
),( ji
можно найти по формуле
n
nn
n
nn
nn
jiji
ij
••••
=⋅=
′
2
, как матема-
тическое ожидание случайной величины, распределенной по биноми-
альному закону с параметрами
n и
2
n
nn
p
ji ••
= . Если гипотеза
0
H
верна, то числа
ij
n
и
n
nn
ji ••
близки друг к другу в совокупности. В ка-
честве критерия примем случайную величину
∑∑
==
••
⎟
⎠
⎞
⎜
⎝
⎛
−
=
••
l
i
s
j
ji
n
nn
ij
nnn
n
K
ji
11
2
)(
. (5.73)
Если гипотеза
0
H справедлива, то эта случайная величина имеет
2
χ
-
распределение с
)1)(1(
−
−
=
llk степенями свободы, т.е
2
)1)(1(
−−
=
sl
K
χ
. (5.74)
Критическая область определяется отрезком
),(
+
∞
пр
x
, где точка
α
,пр
x
определяется соотношением ))1)(1(,1(
2
,
−−−= slx
пр
αχ
α
.
Если числовое значение критерия
наб
K , найденное по формуле
(5.73), попадает в критическую область, т.е.
α
,прнаб
xK >
, то нулевая
гипотеза о независимости
X
и
Y
отвергается.
Заметим, что вместо ограничения
10≥
i
np , указанного в пункте
5.9, здесь желательно выполнение условия
4≥
••
n
nn
ji
. Если это усло-
вие не выполняется, то соответствующие строки и столбцы должны
быть объединены с соседними.
Пример 5.13. Комплектующие усилия одного наименования посту-
пают с трех предприятий: № 1, 2, 3. Результаты проверки изделий при-
ведены в табл. 5.3.
Если числа nij концентрируются вдоль диагонали, идущей с левого ni• n• j альному закону с параметрами n и p = . Если гипотеза H 0 верхнего угла к правому нижнему, то между величинами Х и Y можно n2 предположить тесную прямую связь. ni• n• j Если числа nij сосредоточены вдоль другой диагонали, то между верна, то числа nij и близки друг к другу в совокупности. В ка- n случайными величинами X и Y вероятна обратная связь, т.е. с ростом честве критерия примем случайную величину X значения Y убывают. Если числа nij разбросаны по таблице, то ме- 2 жду X и Y скорее всего нет связи. ⎛⎜ n − ( ni•n• j ) ⎞⎟ l s ij K = ∑∑ ⎝ ⎠ . n Предположим, что анализ корреляционной таблицы позволил нам (5.73) выдвинуть гипотезу , что случайные величины X и Y независимы. Ис- i =1 j =1 ni• n• j n пользуем критерий χ2 для проверки этой гипотезы. Если гипотеза вер- на, то Если гипотеза H 0 справедлива, то эта случайная величина имеет χ2- распределение с k = (l − 1)(l − 1) степенями свободы, т.е P ( X = ai , Y = b j ) = P( X = ai ) ⋅ P(Y = b j ) . K = χ (2l −1)( s −1) . (5.74) Корреляционная таблица Критическая область определяется отрезком ( x пр ,+∞) , где точка Y ... b1 b2 b3 xпр ,α определяется соотношением xпр ,α = χ 2 (1 − α , (l − 1)( s − 1)) . X ... a1 n11 n12 n1s Если числовое значение критерия K наб , найденное по формуле ... a2 n21 n22 n2 s (5.73), попадает в критическую область, т.е. K наб > x пр ,α , то нулевая M гипотеза о независимости X и Y отвергается. al nl 2 ... nls nl 2 Заметим, что вместо ограничения npi ≥ 10 , указанного в пункте ni• n• j Значение ai встречается среди чисел x1 ,..., x n ni• раз. Поэтому от- 5.9, здесь желательно выполнение условия ≥ 4 . Если это усло- n носительная частота события { X = ai } равна ni• n . Она является со- вие не выполняется, то соответствующие строки и столбцы должны стоятельной и несмещенной оценкой параметра pi = P ( X = ai ) . Ана- быть объединены с соседними. логично, n• j n состоятельная и несмещенная оценка вероятности Пример 5.13. Комплектующие усилия одного наименования посту- p ′j = P(Y = b j ) . Поэтому ожидаемое количество попаданий в клетку пают с трех предприятий: № 1, 2, 3. Результаты проверки изделий при- ni• n• j ni• n• j ведены в табл. 5.3. (i, j ) можно найти по формуле nij′ = n ⋅ = , как матема- n2 n тическое ожидание случайной величины, распределенной по биноми- 107 108
Страницы
- « первая
- ‹ предыдущая
- …
- 52
- 53
- 54
- 55
- 56
- …
- следующая ›
- последняя »