Математическая статистика. Компьютерный практикум. Баркова Л.Н - 28 стр.

UptoLike

Составители: 

28
проверим гипотезу. Удаление одного наблюдения, если оно типично, не
может изменить характеристики совокупности из 100 элементов; если же
изменение происходит, следовательно, это наблюдение типичным не
является и должно быть удалено.
Повторим проверку гипотезы для «цензурированной» выборки и
убедимся в том, что наблюдения не противоречат гипотезе о нормальности.
Проверка гипотезы об однородности выборок
Критерий используют для проверки однородности данных, имеющих
дискретную структуру, т.е., когда в опытах наблюдается некоторый
переменный признак, принимающий конечное число, например, m
различных значений.
Имеется k – серий опытов, состоящих из
k
nnn
+
+
+
...
21
- наблюдений
над случайной величиной
ξ
. В каждом опыте некоторый признак
принимает одно из m различных значений.
ij
ν
- число реализаций i – исхода в j – серии:
=
=
m
i
jij
n
1
ν
, j=1,…,k
Требуется проверить гипотезу о том, что все наблюдения проводились над
одной и той же случайной величиной.
В этом случае статистика принимает вид
=
=
∑∑∑∑
====
1
11
2
11
2
2
m
i
k
j
ij
ij
m
i
k
j
ij
ijij
n
n
n
n
nn
npX
ν
ν
ν
νν
)/(
)
(
(3)
ij
ji
k
nnnn
ν
=
=+++=
1
21
,
... - общее число наблюдений
Если наблюдавшееся значение g
экс
))((, 111
2
km
α
χ
,то гипотезу
0
H
отвергают, в противном случае
0
H
не противоречит результатам
испытаний.
Пример 2.
Имеются данные о наличии примесей серы в углеродистой
стали, выплавляемой двумя заводами (см. таблицу 1). Проверить гипотезу
о том, что распределения содержания серы (нежелательный фактор)
одинаковы на этих заводах.
Таблица 1. Число плавок
Содержание серы, 10
-2
%
0 - 2 2 - 4 4 - 6 6 - 8 Сумма
Завод 1 82 535 1173 1714 3504
Завод 2 63 429 995 1307 2794
Сумма 145 964 2168 3021
В модуле
Log – Linear Analysis
создайте файл 2*4; столбцы назовите,
например, S1,…S4 (сера), а строки – Z1,Z2 (заводы).
                                                     28
проверим гипотезу. Удаление одного наблюдения, если оно типично, не
может изменить характеристики совокупности из 100 элементов; если же
изменение происходит, следовательно, это наблюдение типичным не
является и должно быть удалено.
     Повторим проверку гипотезы для «цензурированной» выборки и
убедимся в том, что наблюдения не противоречат гипотезе о нормальности.

                Проверка гипотезы об однородности выборок
         Критерий используют для проверки однородности данных, имеющих
дискретную структуру, т.е., когда в опытах наблюдается некоторый
переменный признак, принимающий конечное число, например,                     m
различных значений.
         Имеется k – серий опытов, состоящих из n1 + n2 + ... + nk - наблюдений
над случайной величиной ξ . В каждом опыте некоторый признак
принимает одно из m различных значений.
ν ij - число реализаций i – исхода в j – серии:
        m

       ∑ν
       i =1
              ij   = nj ,   j=1, ,k
Требуется проверить гипотезу о том, что все наблюдения проводились над
одной и той же случайной величиной.
     В этом случае статистика принимает вид
                    ⎛ m k (ν ij − n jν i / n ) 2 ⎞ ⎛ m k ν 2 ij         ⎞
      X n ( p€) = n⎜⎜ ∑∑                         ⎟ = n⎜ ∑∑           −  ⎟
         2

                                                 ⎟ ⎜ i =1 j =1 n ν     1⎟ (3)
                    ⎝ i =1 j =1  n  ν
                                   j i           ⎠ ⎝             j i    ⎠

n = n1 + n 2 + ... + n k =   ∑ν
                             i , j =1
                                        ij
                                             - общее число наблюдений

       Если наблюдавшееся значение                        gэкс ≥ χ 2 1−α ,( m−1)( k −1) ,то гипотезу H 0
отвергают, в противном случае H 0 не противоречит результатам
испытаний.
     Пример 2. Имеются данные о наличии примесей серы в углеродистой
стали, выплавляемой двумя заводами (см. таблицу 1). Проверить гипотезу
о том, что распределения содержания серы (нежелательный фактор)
одинаковы на этих заводах.
                        Таблица 1. Число плавок
                             Содержание серы, 10-2 %
                 0-2         2-4         4-6         6-8    Сумма
    Завод 1      82          535        1173        1714     3504
    Завод 2      63          429        995         1307     2794
    Сумма       145          964        2168        3021
     В модуле Log – Linear Analysis создайте файл 2*4; столбцы назовите,
например, S1, S4 (сера), а строки – Z1,Z2 (заводы).