Компьютерный практикум в пакете Statistica. Баркова Л.Н - 28 стр.

UptoLike

Составители: 

Рубрика: 

28
−=
=
∑∑
====
1
11
2
11
2
2
m
i
k
j
ij
ij
m
i
k
j
ij
ijij
n
n
n
n
nn
npX
ν
ν
ν
νν )/(
)
ˆ
(
(3)
ij
ji
k
nnnn
ν
=
=
+
+
+
=
1
21
,
... - общее число наблюдений
Если наблюдавшееся значение g
экс
))((, 111
2
−−
km α
χ
, то гипотезу
0
H
отвергают, в противном случае
0
H
не противоречит результатам испытаний.
Пример 2. Имеются данные о наличии примесей серы в углеродистой
стали , выплавляемой двумя заводами (см . таблицу 1). Проверить гипотезу о
том, что распределения содержания серы (нежелательный фактор)
одинаковы на этих заводах.
Таблица 1. Число плавок
Содержание серы , 10
-2
%
0 - 2 2 - 4 4 - 6 6 - 8 Сумма
Завод 1 82 535 1173 1714 3504
Завод 2 63 429 995 1307 2794
Сумма 145 964 2168 3021
В модуле Log Linear Analysis создайте файл 2*4; столбцы назовите,
например, S1, S4 (сера ), а строки Z1,Z2 (заводы).
Analysis Startup Panel в поле Input File: Frequencies w/out coding
variables(частоты без кодирующих переменных)- Variables: Select All OK
Specify Tables(спецификация таблицы ): Factor Name: S, No. of levels: 4(число
уровней: 4);
Factor Name: Z, No. of levels: 2 OK OK - в окне Log -Linear Model
Specification выполним Test all Marginal & Partial Association .
В таблице Results of Fitting в последней строке столбца Pearson Chi-
Square в последней строке столбца получаем X
2
=3.59, число степеней
свободы Degres of Freedom f=3 и уровень значимости Probability p=0.31.
Поскольку эта вероятность не мала , гипотезу об одинаковом распределении
содержания серы в металле на двух заводах можно принять (точнее,
наблюдения этому не противоречат).
Проверка гипотезы о независимости признаков
Пусть с.в.
1
ξ
принимает конечное число m некоторых значений
m
aaa ,...,,
, 21
, а вторая компонента
2
ξ
- k значений:
k
bbb ,...,,
21
. Множество
значений
1
ξ
разбивается на m интервалов:
)()(
)(
,...,,
11
1
m21
EEE
, а для
2
ξ
на k
интервалов:
)()(
)(
,...,,
22
2
k21
EEE ; само множество
ξ
=(
1
ξ
,
2
ξ
) на N=mk
прямоугольников
)( 1
i
E
)( 2
j
E ;
ij
ν
- число наблюдений пары (a
i
,b
j
) - число
элементов, принадлежащих
)( 1
i
E
)( 2
j
E
,
                                                                  28

                      �     m    k      (ν ij −n jν i / n) 2 �     �        m    k
                                                                                     ν 2 ij     �
       X n ( pˆ ) =n��    ∑∑                                  � =n�        ∑    ∑           −1��
          2

                                                               �     �                                            (3)
                      �    i =1 j =1            n jν i           �     �   i =1 j =1 n jν i
                                                                                                  �

n =n1 +n 2 +... +n k = ∑ ν ij - общее число наблюдений
                                     i , j =1

      Если наблюдавшееся значение                                               gэкс ≥χ 2 1−α ,( m−1)( k −1) ,то гипотезу H 0
отвергают, в противном случае H 0 не противоречит результатам испытаний.
     Пример 2. Имеются данные о наличии примесей серы в углеродистой
стали, выплавляемой двумя заводами (см. таблицу 1). Проверить гипотезу о
том, что распределения содержания серы (нежелательный фактор)
одинаковы на этих заводах.
                         Таблица 1. Число плавок
                            Содержание серы, 10-2 %
                  0-2       2-4          4-6       6-8       Сумма
    Завод 1       82        535        1173       1714       3504
    Завод 2       63        429         995       1307       2794
    Сумма        145        964        2168       3021

      В модуле Log – Linear Analysis создайте файл 2*4; столбцы назовите,
например, S1,…S4 (сера), а строки – Z1,Z2 (заводы).
      Analysis – Startup Panel – в поле Input File: Frequencies w/out coding
variables(частоты без кодирующих переменных)- Variables: Select All – OK –
Specify Tables(спецификация таблицы): Factor Name: S, No. of levels: 4(число
уровней: 4);
Factor Name: Z, No. of levels: 2 – OK – OK - в окне Log -Linear Model
Specification выполним Test all Marginal & Partial Association .
В таблице Results of Fitting… в последней строке столбца Pearson Chi-
Square в последней строке столбца получаем X 2 =3.59, число степеней
свободы Degres of Freedom f=3 и уровень значимости Probability p=0.31.
Поскольку эта вероятность не мала, гипотезу об одинаковом распределении
содержания серы в металле на двух заводах можно принять (точнее,
наблюдения этому не противоречат).


                    Проверка гипотезы о независимости признаков
          Пусть с.в. ξ1 принимает конечное число m некоторых значений
a1 , a2, ,..., am , а вторая компонента ξ2 - k –значений: b1 , b2 ,..., bk . Множество
значений ξ1 разбивается на m интервалов: E 1 , E (21) ,..., E (m1) , а для ξ2 на k –
                                                                                     (1)



интервалов: E 1 , E (22 ) ,..., E (k2 ) ; само множество ξ =( ξ1 , ξ2 ) на N=mk
                          ( 2)



прямоугольников E (1i ) ⊗ E (j2 ) ; ν ij - число наблюдений пары (ai,bj) - число
элементов, принадлежащих E (1i ) ⊗ E (2j ) ,