Математическая статистика. Компьютерный практикум. Баркова Л.Н - 29 стр.

UptoLike

Составители: 

29
Analysis – Startup Panel –
в поле
Input File: Frequencies w/out coding
variables(
частоты без кодирующих переменных)-
Variables: Select All – OK
– Specify Tables
(спецификация таблицы):
Factor Name: S, No. of levels:
4
(число уровней: 4);
Factor Name: Z, No. of levels: 2 – OK – OK -
в окне
Log -Linear Model
Specification
выполним
Test all Marginal & Partial Association .
В таблице
Results of Fitting…
в последней строке столбца
Pearson Chi-
Square
в последней строке столбца получаем X
2
=3.59, число степеней
свободы
Degres of Freedom
f=3 и уровень значимости
Probability
p=0.31.
Поскольку эта вероятность не мала, гипотезу об одинаковом распределении
содержания серы в металле на двух заводах можно принять (точнее,
наблюдения этому не противоречат).
Проверка гипотезы о независимости признаков
Пусть с.в.
1
ξ
принимает конечное число m некоторых значений
m
aaa ,...,,
,21
, а вторая компонента
2
ξ
- kзначений:
k
bbb ,...,,
21
. Множество
значений
1
ξ
разбивается на m интервалов:
)()(
)(
,...,,
11
1
(((
, а для
2
ξ
на k –
интервалов:
)()(
)(
,...,,
22
2
R
(((
; само множество
ξ
=(
1
ξ
,
2
ξ
) на N=mk
прямоугольников
)(1
P
(
)( 2
Q
(
;
ij
ν
- число наблюдений пары (a
i
,b
j
) - число
элементов, принадлежащих
)(
1
P
(
)(
2
Q
(
,
n
k
j
ij
m
i
=
== 11
ν
- общее число наблюдений
В этом случае статистика принимает вид
=
∑∑
=
=
1
1
2
1
2
s
i
ji
ij
k
j
n
nX
νν
ν
.
, (4)
здесь точка означает суммирование по соответствующему индексу.
Правило проверки основной гипотезы аналогично рассмотренному
выше случаю проверки гипотезы об однородности выборок.
Пример 3.
Данные относительно
физических недостатков
школьников (P
1
, P
2
, P
3
- признак A
,
) и дефектов речи (S
1
,S
2
,S
3
признак В)
приведены в таблице приложения. В таблице 2 даны частоты комбинаций
P
i
S
j
(i,j=1,2,3). Проверить гипотезу о независимости этих двух признаков.
Таблица 2. Частоты комбинаций признаков
S
1
S
2
S
3
Сумма
P
1
45 26 12 83
P
2
32 50 21 103
P
3
4 10 17 31
Сумма 81 86 50 217
В модуле
Basic Statistics and Tables
образуйте таблицу с двумя
столбцами (P и S) и 217 строками, назовите
Def.sta.
                                            29
      Analysis – Startup Panel – в поле Input File: Frequencies w/out coding
variables(частоты без кодирующих переменных)- Variables: Select All – OK
– Specify Tables(спецификация таблицы): Factor Name: S, No. of levels:
4(число уровней: 4);
Factor Name: Z, No. of levels: 2 – OK – OK - в окне Log -Linear Model
Specification выполним Test all Marginal & Partial Association .
В таблице Results of Fitting в последней строке столбца Pearson Chi-
Square в последней строке столбца получаем X2 =3.59, число степеней
свободы Degres of Freedom f=3 и уровень значимости Probability p=0.31.
Поскольку эта вероятность не мала, гипотезу об одинаковом распределении
содержания серы в металле на двух заводах можно принять (точнее,
наблюдения этому не противоречат).

                      Проверка гипотезы о независимости признаков
            Пусть с.в. ξ1 принимает конечное число m некоторых значений
a1 , a 2 , ,..., am , а вторая компонента ξ 2 - k –значений: b1 , b2 ,..., bk . Множество
значений ξ1 разбивается на m интервалов: �� , �(�1) ,..., �(�1) , а для ξ 2 на k –
                                                     (1 )



интервалов: �� , �(�2 ) ,..., �(�2 ) ; само множество ξ =( ξ1 , ξ 2 ) на N=mk
                          ( 2)


прямоугольников �(�1) ⊗ �(�2 ) ; ν ij - число наблюдений пары (ai,bj) - число
элементов, принадлежащих �(�1) ⊗ �(�2 ) ,
m      k

∑ ∑ν
i =1   j =1
              ij   = n - общее число наблюдений
              В этом случае статистика принимает вид

                 ⎛ s k ν 2 ij                ⎞
         X n = n⎜⎜ ∑∑                    − 1⎟⎟ ,
                   2
                                                                       (4)
                   i =1 j =1 ν i .•ν • j
                 ⎝                           ⎠
здесь точка означает суммирование по соответствующему индексу.
        Правило проверки основной гипотезы аналогично рассмотренному
выше случаю проверки гипотезы об однородности выборок.
        Пример 3. Данные относительно физических недостатков
школьников (P1, P2, P3- признак A,) и дефектов речи (S1,S2,S3 – признак В)
приведены в таблице приложения. В таблице 2 даны частоты комбинаций
PiSj (i,j=1,2,3). Проверить гипотезу о независимости этих двух признаков.
                       Таблица 2. Частоты комбинаций признаков
                             S1                  S2 S3      Сумма
         P1                  45                  26 12         83
         P2                  32                  50 21        103
         P3                   4                  10 17         31
      Сумма                  81                  86 50        217
        В модуле Basic Statistics and Tables образуйте таблицу с двумя
столбцами (P и S) и 217 строками, назовите Def.sta.