Практикум по математической статистике. Панков А.Р - 38 стр.

UptoLike

Составители: 

74 ПРОВЕРКА НЕПАРАМЕТРИЧЕСКИХ ГИПОТЕЗ § 11.
Найдем критическую область
p
для p = 0,05. Так как K = 5, а l = 2,
то число степеней свободы r = K l 1 = 2. Отсюда
p
= (k
α
(r), +) =
= (k
0,95
(2), +) = (5,99, +). Видим, что g
n
= 49,24
p
, поэтому H
0
отвергается на уровне значимости p = 0,05.
П р и м е р 11.4. Имеются две группы данных о приеме в ВУЗы: A
абитуриент принят (
A не принят), B абитуриент мужчина (B
женщина). Всего абитуриентов n = 442, а суммарные данные о сочетании
признаков в обследуемой группе приведены в таблице 11.4:
Таблица 11.4
B B
A 97 40
A 263 42
Проверить на уровне значимости p = 0,05 гипотезу H
0
: признаки A и
B независимы.
Р е ш е н и е. С признаком A свяжем СВ X следующим образом: {X =
= 1} абитуриент принят, {X = 0} не принят. Аналогично, {Y = 1}
абитуриент мужчина, {Y = 0} женщина. Таким образом, проверка
независимости признаков A и B эквивалентна проверки независимости
СВ X и Y .
Из таблицы 11.4 следует, что n
11
= 97, n
12
= 40, n
21
= 263 и n
22
= 42.
Отсюда N
1
= n
11
+n
12
= 137, N
2
= n
21
+n
22
= 305, M
1
= 97 +263 = 360,
M
2
= 40 + 42 = 82. В данном примере X и Y принимают только два
значения, т.е. s = t = 2, поэтому реализацию bg
n
статистики хи-квадрат
b
G
n
можно вычислить по формуле (11.5):
bg
n
=
n(n
11
n
22
n
12
n
21
)
2
N
1
N
2
M
1
M
2
=
442(97 · 42 40 · 263)
2
137 · 305 · 360 · 82
= 14,89.
Если H
0
верна, то можно считать, что bg
n
реализация СВ χ
2
(r), где
r = (s 1)(t 1) = 1. Поэтому для α = 0,95 критическая область
p
=
= (k
α
(r), +) = (3,84, +). Так как bg
n
p
, то H
0
следует отвергнуть.
Таким образом, имеющиеся статистические данные свидетельствует в
пользу того, что признаки A и B зависимы.
11.3. Задачи для самостоятельного решения.
1. Среди n = 10000 новорожденных детей мальчиков оказалось 5140. С
помощью хи-квадрат критерия на уровне значимости p = 0,05 проверить
гипотезу H
0
: вероятности рождения мальчика и девочки одинаковы.
О т в е т. H
0
отвергается.
§ 12. МЕТОД НАИМЕНЬШИХ КВАДРАТОВ 75
2. Результаты группир овки реализаций выборки, порожденной некоторой
СВ X, приведены в таблице:
δ
m
(−∞; 2) [2; 1) [1; 0) [0; 1) [1; 2) [2; +)
n
m
24 132 351 335 140 18
На уровне значимости p = 0,05 проверить гипотезу H
0
: X N(0; 1).
О т в е т. H
0
принимается.
3. В табл ице случайных чисел на 1000 знаков цифры 0, 1, . . . , 9 появлялись
следующее число раз:
0 1 2 3 4 5 6 7 8 9
90 105 112 97 108 101 93 87 103 104
С помощью критерия Пирсона проверить на 5%-ом уровне значимости
гипотезу H
0
: цифры появляются равновероятно.
О т в е т. H
0
принимается.
4. Среди 2020 семей, имеющих двух детей, 527 имеют двух мальчиков, а
476 двух девочек. Пусть СВ X количество мальчиков в двухдетной семье.
На уровне значимости p = 0,05 проверить гипотезу H
0
: X Bi(2; θ).
О т в е т.
b
θ
n
= 0,513; H
0
принимается.
5. В табли це приведены 818 случаев, классифицированных по двум призна-
кам: A наличию прививки против холеры и B отсутствию заболевания:
B B
A 276 3
A 473 66
С помощью хи-квадрат критерия на уровне значимости p = 0,05 проверить
гипотезу H
0
: признаки A и B независимы.
О т в е т. H
0
отклоняется.
§ 12. Метод наименьших квадратов
12.1. Теоретические положения. Пусть Z
n
= {X
k
, k =
= 1, . . . , n} неоднородная гауссовская выборка, элементы которой за-
даны с оотношениями
X
k
= h
(t
k
)θ + ε
k
, k = 1, . . . , n, (12.1)
где θ R
p
вектор неслучайных неизвестных параметров; h(t) =
= {h
1
(t), . . . , h
p
(t)}
вектор известных функций; ε
k
гаусcовская СВ
с параметрами (0; σ
2
), σ > 0; t
k
момент времени, соответствующей
наблюдению X
k
; n общее число наблюдений. Будем предполагать
также, что СВ {ε
k
, k = 1, . . . , n} независимы в совокупности.
74                   ПРОВЕРКА НЕПАРАМЕТРИЧЕСКИХ ГИПОТЕЗ                       § 11.   § 12.                     МЕТОД НАИМЕНЬШИХ КВАДРАТОВ                        75

   Найдем критическую область ∆ p для p = 0,05. Так как K = 5, а l = 2,                  2. Результаты группировки реализаций выборки, порожденной некоторой
то число степеней свободы r = K − l − 1 = 2. Отсюда ∆ p = (k α(r), +∞) =              СВ X, приведены в таблице:
                                                                                                δ m (−∞; −2) [−2; −1) [−1; 0) [0; 1) [1; 2) [2; +∞)
= (k 0,95(2), +∞) = (5,99, +∞). Видим, что g n = 49,24 ∈ ∆ p, поэтому H 0                      nm          24          132       351   335   140        18
отвергается на уровне значимости p = 0,05.                                               На уровне значимости p = 0,05 проверить гипотезу H 0: X ∼ N (0; 1).
   П р и м е р 11.4. Имеются две группы данных о приеме в ВУЗы: A —                      О т в е т. H 0 принимается.
абитуриент принят (A — не принят), B — абитуриент мужчина (B —
                                                                                         3. В таблице случайных чисел на 1000 знаков цифры 0, 1, . . . , 9 появлялись
женщина). Всего абитуриентов n = 442, а суммарные данные о сочетании                  следующее число раз:
признаков в обследуемой группе приведены в таблице 11.4:                                             0     1     2      3    4     5   6   7    8      9
                                                                                                    90 105 112 97 108 101 93 87 103 104
                                   Таблица 11.4
                                                                                         С помощью критерия Пирсона проверить на 5%-ом уровне значимости
                                       B     B                                        гипотезу H 0: цифры появляются равновероятно.
                                   A   97   40                                           О т в е т. H 0 принимается.
                                   A 263 42                                              4. Среди 2020 семей, имеющих двух детей, 527 имеют двух мальчиков, а
                                                                                      476 — двух девочек. Пусть СВ X — количество мальчиков в двухдетной семье.
    Проверить на уровне значимости p = 0,05 гипотезу H 0: признаки A и                На уровне значимости p = 0,05 проверить гипотезу H 0: X ∼ Bi(2; θ).
B независимы.                                                                            О т в е т. θbn = 0,513; H 0 принимается.
    Р е ш е н и е. С признаком A свяжем СВ X следующим образом: {X =                     5. В таблице приведены 818 случаев, классифицированных по двум призна-
= 1} — абитуриент принят, {X = 0} — не принят. Аналогично, {Y = 1} —                  кам: A — наличию прививки против холеры и B — отсутствию заболевания:
абитуриент мужчина, {Y = 0} — женщина. Таким образом, проверка                                                                  B    B
независимости признаков A и B эквивалентна проверки независимости                                                          A   276   3
СВ X и Y .                                                                                                                 A 473 66
    Из таблицы 11.4 следует, что n 11 = 97, n 12 = 40, n 21 = 263 и n 22 = 42.           С помощью хи-квадрат критерия на уровне значимости p = 0,05 проверить
Отсюда N 1 = n 11 + n 12 = 137, N 2 = n 21 + n 22 = 305, M 1 = 97 + 263 = 360,        гипотезу H 0: признаки A и B независимы.
M 2 = 40 + 42 = 82. В данном примере X и Y принимают только два                          О т в е т. H 0 отклоняется.
значения, т.е. s = t = 2, поэтому реализацию gbn статистики хи-квадрат
b можно вычислить по формуле (11.5):
G n

                 n(n11 n22 − n12 n21 )2   442(97 · 42 − 40 · 263)2                                § 12. Метод наименьших квадратов
         gbn =                          =                          = 14,89.
                    N1 N2 M1 M2             137 · 305 · 360 · 82

   Если H 0 верна, то можно считать, что gbn — реализация СВ χ2 (r), где
r = (s − 1)(t − 1) = 1. Поэтому для α = 0,95 критическая область ∆ p =                   12.1. Теоретические положения. Пусть Z n = {X k, k =
                                                                                      = 1, . . . , n} — неоднородная гауссовская выборка, элементы которой за-
= (k α(r), +∞) = (3,84, +∞). Так как gbn ∈ ∆ p, то H 0 следует отвергнуть.            даны соотношениями
Таким образом, имеющиеся статистические данные свидетельствует в
пользу того, что признаки A и B зависимы.                                                                  X k = h⊤ (t k)θ + ε k,   k = 1, . . . , n,         (12.1)

                                                                                      где θ ∈ Rp — вектор неслучайных неизвестных параметров; h(t) =
     11.3. Задачи для самостоятельного решения.                                       = {h 1(t), . . . , h p(t)}⊤ — вектор известных функций; ε k — гаусcовская СВ
   1. Среди n = 10000 новорожденных детей мальчиков оказалось 5140. С
помощью хи-квадрат критерия на уровне значимости p = 0,05 проверить                   с параметрами (0; σ 2 ), σ > 0; t k — момент времени, соответствующей
гипотезу H 0: вероятности рождения мальчика и девочки одинаковы.                      наблюдению X k; n — общее число наблюдений. Будем предполагать
   О т в е т. H 0 отвергается.                                                        также, что СВ {ε k, k = 1, . . . , n} независимы в совокупности.