Теория статистического вывода. Харченко М.А. - 37 стр.

UptoLike

Составители: 

Рубрика: 

37
Нулевая гипотеза h
0
состоит в том, что обе выборки принадлежат
одной генеральной совокупности , т.е. имеют тождественные функции рас-
пределения: F
1
(x) = F
2
(x).
Альтернативная гипотеза h
1
состоит в том, что указанные выборки
принадлежат различным генеральным совокупностям: F
1
(x)
F
2
(x).
Схема вычислений. Значения характеристики двух выборок объеди -
няются в общий вариационный ряд с отметкой принадлежности каждого
члена ряда к соответствующей выборке и производится обыкновенное
ранжирование членов ряда (меньшие значения получают меньшие ранги ).
Одинаковым значениям общего вариационного ряда присваиваются оди -
наковые ранги , равные среднему арифметическому.
Затем подсчитываются суммы рангов R
1
и R
2
каждой выборки . В ка-
честве проверки правильности вычислений используют соотношение:
R
1
+ R
2
= ½ (n
1
+ n
2
) (n
1
+ n
2
+ 1).
Далее подсчитываются инверсии:
U
1
= n
1
n
2
+ ½ n
2
(n
2
+ 1) R
2
;
U
2
= n
1
n
2
+ ½ n
1
(n
1
+ 1) R
1
с контролем по формуле : U
1
+ U
2
= n
1
n
2
.
Статистикой критерия МаннаУитни является случайная величина U
наименьшая из двух инверсий : U = min(U
1
, U
2
).
Эта величина при относительно большом объеме выборок
(n
1
+ n
2
> 19, n
i
> 3) распределена нормально с параметрами M(U) =
2
1
n
1
n
2
и σ
2
(U) =
12
1
n
1
n
2
(n
1
+ n
2
+ 1). При малом же объеме выборок (n
1
+ n
2
< 20)
распределение величины U отличается от нормального , в связи с чем про-
верка нулевой гипотезы осуществляется по- разному, в зависимости от объ -
емов исследуемых выборок.
1. В случае, когда n
1
+ n
2
> 19 проверка нулевой гипотезы сводится
к вычислению нормированной случайной величины z :
()
1
2121
12
1
2
1
212
1
++
−−
=
nnnn
nnU
z
.
Если в выборках наблюдаются повторяющиеся значения, то z вычис-
ляется по следующей формуле :
++⋅
+++
−−
=
=
m
k
kk
ttnnnn
nnnn
nn
nnU
z
1
3
21
3
21
2121
21
2
1
21
2
1
)()()(
)1)((12
.
В корректирующем члене через t
k
обозначено число одинаковых зна-
чений в каждой из m групп.
Эмпирическое значение z сравнивается с квантилями нормального
распределения z
1α/2
(для α = 0,05: z
1-α/2
= 1,960; для α = 0,01: z
1-α/2
= 2,576).
                                            37

       Н улевая ги потез а h0 состои т в том, что обе выборки при надлеж ат
одной генераль ной совокупности , т.е. и мею т тож дественные ф ункци и рас-
пределени я: F1 (x) = F2(x).
       А ль тернати вная ги потез а h1 состои т в том, что указ анные выборки
при надлеж атраз ли чным генераль ным совокупностям: F1 (x) ≠ F2 (x).
       Схема вы чи слени й. Значени я характери сти ки двух выборок объеди -
няю тся в общ и й вари аци онный ряд с отметкой при надлеж ности каж дого
члена ряда к соответствую щ ей выборке и прои з води тся обыкновенное
ранж и ровани е членов ряда (мень ши е з начени я получаю т мень ши е ранги ).
О ди наковым з начени ям общ его вари аци онного ряда при сваи ваю тся оди -
наковыеранги , равныесреднему ари ф мети ческому.
       Затем подсчи тываю тся суммы рангов R1 и R2 каж дой выборки . В ка-
чествепроверки прави ль ности вычи слени й и споль з ую тсоотношени е:
                           R1 + R2 = ½ (n1 + n2) (n1 + n2 + 1).
       Д алееподсчи тываю тся и нверси и :
                             U1 = n 1 n 2 + ½ n2 (n2 + 1) – R2;
                             U2 = n1 n2 + ½ n1 (n1 + 1) – R1
сконтролем по ф ормуле: U1 + U2 = n1 n2.
       Стати сти кой кри тери я М анна– У и тни является случай ная вели чи наU
— наи мень шая и з двух и нверси й : U = min(U1, U2 ).
       Э та вели чи на при относи тель но боль шом объеме выборок
                                                                                           1
(n1 + n2 > 19, ni > 3) распределена нормаль но с параметрами M(U) = n1n2
                                                                                           2
             1
и σ2(U) =       n 1 n2 (n1 + n2 + 1). При малом ж еобъеме выборок (n1 + n2 < 20)
            12
распределени е вели чи ны U отли чается отнормаль ного, всвяз и счем про-
верканулевой ги потез ы осущ ествляется по-раз ному, вз ави си мости отобъ-
емови сследуемых выборок.
       1. В случае, когд а n1 + n2 > 19 проверка нулевой ги потез ы своди тся
к вычи слени ю норми рованной случай ной вели чи ны z:
                                          U − 12 n1 n2 − 12
                                 z=                             .
                                        1
                                          n n
                                       12 1 2
                                                ( n1 + n 2 + 1)
       Е сли ввыборках наблю даю тся повторяю щ и еся з начени я, то z вычи с-
ляется по следую щ ей ф ормуле:
                                         U − 12 n1 n2 − 12
        z=                                                                               .
                         n1n 2                                          m
                                                                                       
                                          ⋅ ( n1 + n2 ) − ( n1 + n2 ) − ∑ (t k − t k ) 
                                                        3                    3

               12( n1 + n2 )(n1 + n2 + 1)                             k =1           
       В корректи рую щ ем членечерез tk обоз начено чи сло оди наковых з на-
чени й вкаж дой и з m групп.
       Э мпи ри ческое з начени е z сравни вается с кванти лями нормаль ного
распределени я z1– α/2 (для α = 0,05: z1-α/2 = 1,960; для α = 0,01: z1-α/2 = 2,576).