Математическая статистика. Компьютерный практикум. Баркова Л.Н - 27 стр.

UptoLike

Составители: 

27
Статистика имеет вид
2
1
2
)
(
))
((
)
(
=
=
N
n
j
jj
n
np
np
X
θ
θν
θ
, (1)
где
j
ν
- число наблюдений в j-м интервале
),(
jj
zz
1
(
j
ν
5
);
)(
θ
j
p
=
P
(
ξ
)|),(
01
Hzz
jj
- вероятности исходов представляют собой
некоторые функции от неизвестного параметра
θ
;
n
θθ
=
-оценка
максимального правдоподобия для
θ
.
Если наблюдавшееся значение g
экс
11
2
N
,
α
χ
,то гипотезу
0
H
отвергают, в противном случае
0
H
не противоречит результатам
испытаний.
Процедуру решения можно записать иначе:
если
P{
11
2
N
,
α
χ
)
(
θ
n
X
2
}
α
,
(2)
то гипотеза
0
H отклоняется.
Проверка гипотез о законе распределения
Пример 1.
Проверка гипотезы о нормальном законе распределения
размеров головок заклепок, сделанных на одном станке, по выборке объема
n=200; измерения приведены в таблице Приложение 2.
В модуле
Nonparametric Statistics
откройте файл Diamz.sta:
2v*100c(или создайте новый с одноименным названием, если файл
Diamz.sta отсутствует). В стартовой панели модуля выберите
Distribution
Fitting
(подбор распределений).
В поле
Continuous Distributions: Normal – Variable: d2
в поле
Plot
Distribution: Frequency Distribution(частоты распределения) –OK
запишите оценки параметров:
Mean:
14,42, Variance:
102,31.
Число групп
Number of Categories: 13 – OK.
В таблице частот нужны столбцы:
observed frequency(наблюдаемые
частоты)
и
expected
frequency(ожидаемые частоты),
а также столбец
разности
observed expected
. Закройте таблицу. Сравните графически
наблюдаемые и ожидаемые частоты: выделите соответствующие столбцы
Graphs – Custom Graphs – 2D Graphs…- OK.
В таблице приведено значение статистики
2
χ
(Chi-Square): 159.21,
количество степеней свободы
df=1
. Приведено значение вероятности
p=P{
2
χ
12}=0.000007.
Последнее равенство означает, что если гипотеза верна, вероятность
получить значение
2
X
00012
.
равна 0.000007. Это слишком малая
вероятность, поэтому отклоняем гипотезу о нормальности.
Посмотрим гистограмму наблюдений (или гистограмму рассеяния):
Graphs – Stats2D Graphs – Histograms - … -OK.
Видим, что в выборке
d2
имеется одно аномальное значение:
114.56
(88). Удалим его и снова
                                                       27
        Статистика имеет вид
                        N  (ν   − np   (θ€)) 2
         X 2 n (θ€) = ∑
                              j      j
                                               ,                                                        (1)
                      n =1      np (θ€ )
                                     j
где     νj-       число        наблюдений          в        j-м   интервале    ( z j −1 , z j )   (ν j ≥ 5 );
p j (θ ) =P( ξ ∈ ( z j−1 , z j ) | H 0 ) -   вероятности          исходов  представляют собой
некоторые функции от неизвестного                                 параметра θ ;
                                                                          n        θ€ = θ€ -оценка
максимального правдоподобия для θ .
      Если наблюдавшееся значение            gэкс ≥ χ 2 1−α , N −1 ,то гипотезу H 0
отвергают, в противном случае H 0 не противоречит результатам
испытаний.
      Процедуру решения можно записать иначе:
 если
      P{ χ 2 1−α , N −1 ≥ X 2 n (θ€) } ≤ α ,                                    (2)
то гипотеза H 0 отклоняется.

                Проверка гипотез о законе распределения
      Пример 1. Проверка гипотезы о нормальном законе распределения
размеров головок заклепок, сделанных на одном станке, по выборке объема
n=200; измерения приведены в таблице Приложение 2.
      В модуле Nonparametric Statistics       откройте файл Diamz.sta:
2v*100c(или создайте новый с одноименным названием, если файл
Diamz.sta отсутствует). В стартовой панели модуля выберите Distribution
Fitting(подбор распределений).
      В поле Continuous Distributions: Normal – Variable: d2 – в поле Plot
Distribution: Frequency Distribution(частоты распределения) –OK –
запишите оценки параметров:
Mean: 14,42, Variance: 102,31. Число групп Number of Categories: 13 – OK.
       В таблице частот нужны столбцы: observed frequency(наблюдаемые
частоты) и expected frequency(ожидаемые частоты), а также столбец
разности – observed expected. Закройте таблицу. Сравните графически
наблюдаемые и ожидаемые частоты: выделите соответствующие столбцы –
Graphs – Custom Graphs – 2D Graphs - OK.
       В таблице приведено значение статистики χ 2 (Chi-Square): 159.21,
количество степеней свободы df=1. Приведено значение вероятности
p=P{ χ 2 ≥ 12}=0.000007.
      Последнее равенство означает, что если гипотеза верна, вероятность
получить значение      X 2 ≥ 12.000 равна 0.000007. Это слишком малая
вероятность, поэтому отклоняем гипотезу о нормальности.
      Посмотрим гистограмму наблюдений (или гистограмму рассеяния):
Graphs – Stats2D Graphs – Histograms -     -OK. Видим, что в выборке d2
имеется одно аномальное значение: 114.56 (№88). Удалим его и снова