Практикум по математической статистике. Панков А.Р - 37 стр.

UptoLike

Составители: 

72 ПРОВЕРКА НЕПАРАМЕТРИЧЕСКИХ ГИПОТЕЗ § 11.
По условию n = 4000, n
1
= 2028, n
2
= n n
1
= 1972. Вычислим
реализацию g
n
статистики G
n
по формуле (11.2):
g
n
=
n
2
1
np
1
+
n
2
2
np
2
n =
2028
2
2000
+
1972
2
2000
4000 = 0,784.
Критическая область имеет вид
p
= (k
α
(r), +), где k
α
(r) = k
0,95
(1) =
= 3,84 (здесь α = 1 p = 0,95, r = K 1 = 1, так как K = 2 по условию).
Итак,
p
= (3,84, +). Так как g
n
= 0,784 /
p
, то H
0
принимается на
уровне з начимости p = 0,05.
П р и м е р 11.2. В таблице 11.1 приведена реализация выборки объема
n = 50, соответствующей некоторому распределению F (x). На уровне
значимости p = 0,05 проверить гипотезу H
0
: F (x) = R[0; 100].
Таблица 11.1
65 48 11 76 74 17 46 85 9 50
37 77 69 74 45 80 12 43 56 35
72 70 80 15 45 31 82 23 74 45
35 9 98 17 77 39 27 72 14 43
55 2 10 19 69 91 58 17 73 23
Р е ш е н и е. Если H
0
верна, то выборка порождена СВ X R[0; 100],
множество V
X
допустимых значений которой есть [0; 100]. Разобьем V
X
на K = 5 подынтервалов {δ
m
, m = 1, . . . , K} одинаковой длины и про-
ведем группировку выборки, результаты которой приведены в таблице
11.2.
Таблица 11.2
m 1 2 3 4 5
δ
m
[0, 20) [20, 40) [40, 60) [60, 80) [80, 100]
n
m
12 8 11 13 6
Так как все подынтервалы δ
m
одинаковой длины L = 20, а K = 5, то
p
m
= P(X δ
m
) =
20
100
= 0,2 (при условии, что X R[0; 100]). Используя
результаты, приведенные в таблице 11.2, вычислим g
n
по формуле (11.2)
с учетом того, что np
m
= 50 · 0,2 = 10, m = 1, . . . , K:
g
n
=
K
X
m=1
(n
m
)
2
np
m
n =
h
144 + 64 + 121 + 169 + 36
10
i
50 = 3,4.
Критическая область
p
= (k
α
(r), +) = (k
0,95
(4), +), так как α = 1
p = 0,95, r = K 1 = 4 (тестируемое распределение не содержит
§ 11. ПРОВЕРКА НЕПАРАМЕТРИЧЕСКИХ ГИПОТЕЗ 73
неизвестных параметров). Квантиль k
0,95
(4) = 9,49, поэтому
p
=
= (9,49, +) критическая область, а
p
= [0, 9,49] доверительная
область.
Так как g
n
= 3,4
p
, то H
0
: X R[0; 100] принимается на 5%-ном
уровне з начимости.
П р и м е р 11.3. В условиях примера 11.2 проверить гипотезу H
0
:
выборка соответствует гауссовскому распределению.
Р е ш е н и е. Если H
0
верна, то X N(m
X
; D
X
). Заметим, что
гипотетическое распределение содержит l = 2 неизвестных параметра,
так как точные значения m
X
и D
X
не заданы. По выборке аблица 11.1)
вычислим соответствующие реализации оценок максимального правдо-
подобия для m
X
и D
X
(см. пример 7.4):
bm
X
=
x
n
=
1
n
n
X
k=1
x
k
= 47,9 (выборочное среднее);
b
D
X
=
s
n
2
=
1
n
n
X
k=1
(x
k
bm
X
)
2
= 698,02 (выборочная д исперс ия);
bσ
X
=
q
b
D
X
= s
n
= 26,42.
В силу гауссовости СВ X множество ее значений V
X
= (−∞, +),
поэтому подынтервал δ
1
необходимо расширить до (−∞, 20), а δ
5
до
[80, +). Пусть δ
m
= [a
m
, a
m+1
), тогда оценку bp
m
вероятности попадания
СВ X в δ
m
можно вычислить по следующей формуле:
bp
m
= Φ
a
m+1
x
n
s
n
Φ
a
m
x
n
s
n
= Φ
a
m+1
47,9
26,42
Φ
a
m
47,9
26,42
,
где Φ(x) функция Лапласа, m = 1, . . . , K. Результаты соответствую-
щих вычислений приведены в таблице 11.3.
Таблица 11.3
δ
m
(−∞, 20) [20, 40) [40, 60) [60, 80) [80, +)
nbp
m
20,25 14,5 10,15 4,04 1,06
n
m
12 8 11 13 6
Вычислим реализацию статистики критерия g
n
по формуле (11.2),
заменяя p
m
на bp
m
:
g
n
=
K
X
m=1
(n
m
)
2
nbp
m
n =
144
20,25
+
64
14,5
+
121
10,15
+
169
4,04
+
36
1,06
50 = 49,24.
72                    ПРОВЕРКА НЕПАРАМЕТРИЧЕСКИХ ГИПОТЕЗ                            § 11.   § 11.                       ПРОВЕРКА НЕПАРАМЕТРИЧЕСКИХ ГИПОТЕЗ                            73

   По условию n = 4000, n 1 = 2028, n 2 = n − n 1 = 1972. Вычислим                          неизвестных параметров). Квантиль k 0,95(4) = 9,49, поэтому ∆ p =
реализацию g n статистики G n по формуле (11.2):                                            = (9,49, +∞) — критическая область, а ∆ p = [0, 9,49] — доверительная
                     n21    n2    20282   19722                                             область.
           gn =           + 2 −n=       +       − 4000 = 0,784.                                Так как g n = 3,4 ∈ ∆ p, то H 0: X ∼ R[0; 100] принимается на 5%-ном
                     np 1  np2    2000    2000
                                                                                            уровне значимости.
Критическая область имеет вид ∆ p = (k α(r), +∞), где k α(r) = k 0,95(1) =                     П р и м е р 11.3. В условиях примера 11.2 проверить гипотезу H 0:
= 3,84 (здесь α = 1 − p = 0,95, r = K − 1 = 1, так как K = 2 по условию).                   выборка соответствует гауссовскому распределению.
Итак, ∆ p = (3,84, +∞). Так как g n = 0,784 ∈/ ∆ p, то H 0 принимается на                      Р е ш е н и е. Если H 0 верна, то X ∼ N (m X ; D X ). Заметим, что
уровне значимости p = 0,05.                                                                 гипотетическое распределение содержит l = 2 неизвестных параметра,
   П р и м е р 11.2. В таблице 11.1 приведена реализация выборки объема                     так как точные значения m X и D X не заданы. По выборке (таблица 11.1)
n = 50, соответствующей некоторому распределению F (x). На уровне                           вычислим соответствующие реализации оценок максимального правдо-
значимости p = 0,05 проверить гипотезу H 0: F (x) = R[0; 100].                              подобия для m X и D X (см. пример 7.4):
                                                                                                                              n
                                                                Таблица 11.1                                                1 X
                                                                                                           b X = xn =
                                                                                                           m                    x k = 47,9          (выборочное среднее);
               65     48       11      76      74   17     46    85 9 50                                                    n
                                                                                                                              k=1
               37     77       69      74      45   80     12    43 56 35                                             n
                                                                                                                      X
               72     70       80      15      45   31     82    23 74 45                           b = s2 = 1
                                                                                                    D                            b X )2 = 698,02
                                                                                                                          (x k − m                          (выборочная дисперсия);
                                                                                                      X  n        n
               35     9        98      17      77   39     27    72 14 43                                             k=1
               55     2        10      19      69   91     58    17 73 23                                                            q
                                                                                                                            σ
                                                                                                                            bX =          b = s = 26,42.
                                                                                                                                          D X  n
   Р е ш е н и е. Если H 0 верна, то выборка порождена СВ X ∼ R[0; 100],
множество V X допустимых значений которой есть [0; 100]. Разобьем V X                           В силу гауссовости СВ X множество ее значений V X = (−∞, +∞),
на K = 5 подынтервалов {δ m, m = 1, . . . , K} одинаковой длины и про-                      поэтому подынтервал δ 1 необходимо расширить до (−∞, 20), а δ 5 — до
ведем группировку выборки, результаты которой приведены в таблице                           [80, +∞). Пусть δ m = [a m, a m+1), тогда оценку pbm вероятности попадания
11.2.                                                                                       СВ X в δ m можно вычислить по следующей формуле:
                                                                                                                                                               
                                                                  Таблица 11.2                         am+1 − xn        am − xn          am+1 − 47,9        am − 47,9
            m           1              2            3           4        5                   pbm = Φ               −Φ              =Φ                  −Φ               ,
                                                                                                             sn                      sn                      26,42            26,42
            δm       [0, 20)        [20, 40)    [40, 60)    [60, 80) [80, 100]
            nm         12              8           11          13        6                  где Φ(x) — функция Лапласа, m = 1, . . . , K. Результаты соответствую-
                                                                                            щих вычислений приведены в таблице 11.3.
     Так как все подынтервалы δ m одинаковой длины L = 20, а K = 5, то
                        20                                                                                                                                          Таблица 11.3
p m = P(X ∈ δ m) =      = 0,2 (при условии, что X ∼ R[0; 100]). Используя
                   100                                                                                 δm         (−∞, 20)      [20, 40)         [40, 60)     [60, 80) [80, +∞)
результаты, приведенные в таблице 11.2, вычислим g n по формуле (11.2)                                 nb
                                                                                                        pm          20,25         14,5            10,15         4,04      1,06
с учетом того, что np m = 50 · 0,2 = 10, m = 1, . . . , K:                                             nm            12            8                11           13         6
               K                        h                             i
               X (nm )2                     144 + 64 + 121 + 169 + 36                          Вычислим реализацию статистики критерия g n по формуле (11.2),
        gn =                 −n=                                      − 50 = 3,4.
               m=1
                      np m                              10                                  заменяя p m на pbm:
                                                                                                  K
                                                                                                                                              
Критическая область ∆ p = (k α(r), +∞) = (k 0,95(4), +∞), так как α = 1 −                         X   (nm )2       144   64   121   169     36
                                                                                             gn =            −n=       +    +     +     +        − 50 = 49,24.
− p = 0,95, r = K − 1 = 4 (тестируемое распределение не содержит                                     m=1
                                                                                                           nb
                                                                                                            pm               20,25        14,5     10,15       4,04   1,06