ВУЗ:
Составители:
Рубрика:
72 ПРОВЕРКА НЕПАРАМЕТРИЧЕСКИХ ГИПОТЕЗ § 11.
По условию n = 4000, n
1
= 2028, n
2
= n − n
1
= 1972. Вычислим
реализацию g
n
статистики G
n
по формуле (11.2):
g
n
=
n
2
1
np
1
+
n
2
2
np
2
− n =
2028
2
2000
+
1972
2
2000
− 4000 = 0,784.
Критическая область имеет вид ∆
p
= (k
α
(r), +∞), где k
α
(r) = k
0,95
(1) =
= 3,84 (здесь α = 1 −p = 0,95, r = K −1 = 1, так как K = 2 по условию).
Итак, ∆
p
= (3,84, +∞). Так как g
n
= 0,784 /∈ ∆
p
, то H
0
принимается на
уровне з начимости p = 0,05.
П р и м е р 11.2. В таблице 11.1 приведена реализация выборки объема
n = 50, соответствующей некоторому распределению F (x). На уровне
значимости p = 0,05 проверить гипотезу H
0
: F (x) = R[0; 100].
Таблица 11.1
65 48 11 76 74 17 46 85 9 50
37 77 69 74 45 80 12 43 56 35
72 70 80 15 45 31 82 23 74 45
35 9 98 17 77 39 27 72 14 43
55 2 10 19 69 91 58 17 73 23
Р е ш е н и е. Если H
0
верна, то выборка порождена СВ X ∼ R[0; 100],
множество V
X
допустимых значений которой есть [0; 100]. Разобьем V
X
на K = 5 подынтервалов {δ
m
, m = 1, . . . , K} одинаковой длины и про-
ведем группировку выборки, результаты которой приведены в таблице
11.2.
Таблица 11.2
m 1 2 3 4 5
δ
m
[0, 20) [20, 40) [40, 60) [60, 80) [80, 100]
n
m
12 8 11 13 6
Так как все подынтервалы δ
m
одинаковой длины L = 20, а K = 5, то
p
m
= P(X ∈ δ
m
) =
20
100
= 0,2 (при условии, что X ∼ R[0; 100]). Используя
результаты, приведенные в таблице 11.2, вычислим g
n
по формуле (11.2)
с учетом того, что np
m
= 50 · 0,2 = 10, m = 1, . . . , K:
g
n
=
K
X
m=1
(n
m
)
2
np
m
− n =
h
144 + 64 + 121 + 169 + 36
10
i
− 50 = 3,4.
Критическая область ∆
p
= (k
α
(r), +∞) = (k
0,95
(4), +∞), так как α = 1 −
− p = 0,95, r = K − 1 = 4 (тестируемое распределение не содержит
§ 11. ПРОВЕРКА НЕПАРАМЕТРИЧЕСКИХ ГИПОТЕЗ 73
неизвестных параметров). Квантиль k
0,95
(4) = 9,49, поэтому ∆
p
=
= (9,49, +∞) — критическая область, а ∆
p
= [0, 9,49] — доверительная
область.
Так как g
n
= 3,4 ∈
∆
p
, то H
0
: X ∼ R[0; 100] принимается на 5%-ном
уровне з начимости.
П р и м е р 11.3. В условиях примера 11.2 проверить гипотезу H
0
:
выборка соответствует гауссовскому распределению.
Р е ш е н и е. Если H
0
верна, то X ∼ N(m
X
; D
X
). Заметим, что
гипотетическое распределение содержит l = 2 неизвестных параметра,
так как точные значения m
X
и D
X
не заданы. По выборке (таблица 11.1)
вычислим соответствующие реализации оценок максимального правдо-
подобия для m
X
и D
X
(см. пример 7.4):
bm
X
=
x
n
=
1
n
n
X
k=1
x
k
= 47,9 (выборочное среднее);
b
D
X
=
s
n
2
=
1
n
n
X
k=1
(x
k
− bm
X
)
2
= 698,02 (выборочная д исперс ия);
bσ
X
=
q
b
D
X
= s
n
= 26,42.
В силу гауссовости СВ X множество ее значений V
X
= (−∞, +∞),
поэтому подынтервал δ
1
необходимо расширить до (−∞, 20), а δ
5
— до
[80, +∞). Пусть δ
m
= [a
m
, a
m+1
), тогда оценку bp
m
вероятности попадания
СВ X в δ
m
можно вычислить по следующей формуле:
bp
m
= Φ
a
m+1
−
x
n
s
n
− Φ
a
m
−
x
n
s
n
= Φ
a
m+1
− 47,9
26,42
− Φ
a
m
− 47,9
26,42
,
где Φ(x) — функция Лапласа, m = 1, . . . , K. Результаты соответствую-
щих вычислений приведены в таблице 11.3.
Таблица 11.3
δ
m
(−∞, 20) [20, 40) [40, 60) [60, 80) [80, +∞)
nbp
m
20,25 14,5 10,15 4,04 1,06
n
m
12 8 11 13 6
Вычислим реализацию статистики критерия g
n
по формуле (11.2),
заменяя p
m
на bp
m
:
g
n
=
K
X
m=1
(n
m
)
2
nbp
m
− n =
144
20,25
+
64
14,5
+
121
10,15
+
169
4,04
+
36
1,06
− 50 = 49,24.
72 ПРОВЕРКА НЕПАРАМЕТРИЧЕСКИХ ГИПОТЕЗ § 11. § 11. ПРОВЕРКА НЕПАРАМЕТРИЧЕСКИХ ГИПОТЕЗ 73 По условию n = 4000, n 1 = 2028, n 2 = n − n 1 = 1972. Вычислим неизвестных параметров). Квантиль k 0,95(4) = 9,49, поэтому ∆ p = реализацию g n статистики G n по формуле (11.2): = (9,49, +∞) — критическая область, а ∆ p = [0, 9,49] — доверительная n21 n2 20282 19722 область. gn = + 2 −n= + − 4000 = 0,784. Так как g n = 3,4 ∈ ∆ p, то H 0: X ∼ R[0; 100] принимается на 5%-ном np 1 np2 2000 2000 уровне значимости. Критическая область имеет вид ∆ p = (k α(r), +∞), где k α(r) = k 0,95(1) = П р и м е р 11.3. В условиях примера 11.2 проверить гипотезу H 0: = 3,84 (здесь α = 1 − p = 0,95, r = K − 1 = 1, так как K = 2 по условию). выборка соответствует гауссовскому распределению. Итак, ∆ p = (3,84, +∞). Так как g n = 0,784 ∈/ ∆ p, то H 0 принимается на Р е ш е н и е. Если H 0 верна, то X ∼ N (m X ; D X ). Заметим, что уровне значимости p = 0,05. гипотетическое распределение содержит l = 2 неизвестных параметра, П р и м е р 11.2. В таблице 11.1 приведена реализация выборки объема так как точные значения m X и D X не заданы. По выборке (таблица 11.1) n = 50, соответствующей некоторому распределению F (x). На уровне вычислим соответствующие реализации оценок максимального правдо- значимости p = 0,05 проверить гипотезу H 0: F (x) = R[0; 100]. подобия для m X и D X (см. пример 7.4): n Таблица 11.1 1 X b X = xn = m x k = 47,9 (выборочное среднее); 65 48 11 76 74 17 46 85 9 50 n k=1 37 77 69 74 45 80 12 43 56 35 n X 72 70 80 15 45 31 82 23 74 45 b = s2 = 1 D b X )2 = 698,02 (x k − m (выборочная дисперсия); X n n 35 9 98 17 77 39 27 72 14 43 k=1 55 2 10 19 69 91 58 17 73 23 q σ bX = b = s = 26,42. D X n Р е ш е н и е. Если H 0 верна, то выборка порождена СВ X ∼ R[0; 100], множество V X допустимых значений которой есть [0; 100]. Разобьем V X В силу гауссовости СВ X множество ее значений V X = (−∞, +∞), на K = 5 подынтервалов {δ m, m = 1, . . . , K} одинаковой длины и про- поэтому подынтервал δ 1 необходимо расширить до (−∞, 20), а δ 5 — до ведем группировку выборки, результаты которой приведены в таблице [80, +∞). Пусть δ m = [a m, a m+1), тогда оценку pbm вероятности попадания 11.2. СВ X в δ m можно вычислить по следующей формуле: Таблица 11.2 am+1 − xn am − xn am+1 − 47,9 am − 47,9 m 1 2 3 4 5 pbm = Φ −Φ =Φ −Φ , sn sn 26,42 26,42 δm [0, 20) [20, 40) [40, 60) [60, 80) [80, 100] nm 12 8 11 13 6 где Φ(x) — функция Лапласа, m = 1, . . . , K. Результаты соответствую- щих вычислений приведены в таблице 11.3. Так как все подынтервалы δ m одинаковой длины L = 20, а K = 5, то 20 Таблица 11.3 p m = P(X ∈ δ m) = = 0,2 (при условии, что X ∼ R[0; 100]). Используя 100 δm (−∞, 20) [20, 40) [40, 60) [60, 80) [80, +∞) результаты, приведенные в таблице 11.2, вычислим g n по формуле (11.2) nb pm 20,25 14,5 10,15 4,04 1,06 с учетом того, что np m = 50 · 0,2 = 10, m = 1, . . . , K: nm 12 8 11 13 6 K h i X (nm )2 144 + 64 + 121 + 169 + 36 Вычислим реализацию статистики критерия g n по формуле (11.2), gn = −n= − 50 = 3,4. m=1 np m 10 заменяя p m на pbm: K Критическая область ∆ p = (k α(r), +∞) = (k 0,95(4), +∞), так как α = 1 − X (nm )2 144 64 121 169 36 gn = −n= + + + + − 50 = 49,24. − p = 0,95, r = K − 1 = 4 (тестируемое распределение не содержит m=1 nb pm 20,25 14,5 10,15 4,04 1,06
Страницы
- « первая
- ‹ предыдущая
- …
- 35
- 36
- 37
- 38
- 39
- …
- следующая ›
- последняя »