Теория вероятностей и математическая статистика. Соппа М.С - 24 стр.

UptoLike

Составители: 

49
приближенное представление корреляционного момента. Для его
вычисления составляется корреляционная таблица, которая за-
полняется следующим образом. В исходной
неупорядоченной
парной выборке берется очередная пара (x
i
, y
i
). Определяется, в
какой из пяти интервалов диапазона
х-выборки попадает x
i
, а за-
тем в какой из пяти интервалов диапазона
у-выборки попадает у
i
.
На пересечении соответствующих столбца и строки ставится от-
метка I. Когда все пары выборки пройдены, вычисляется относи-
тельная частота двумерного выборочного распределения
w
pq
как
результат деления количества отметок на объем выборки.
В клетках, оставшихся пустыми,
w
pq
= 0. Очевидно, что
==
=
5
1
5
1
1
q
pq
p
w .
*
1x
z
*
2x
z
*
3x
z
*
4x
z
*
5x
z
X
Y
[z
0x
, z
1x
] [z
1x
, z
2x
] [z
2x
, z
3x
][z
3x
, z
4x
][z
4x
, z
5x
]
*
1у
z
[z
0у
, z
1у
]
*
2 у
z
[z
1у
, z
2у
]
*
3 у
z
[z
2у
, z
3у
]
*
4 у
z
[z
3у
, z
4у
]
*
5 у
z
[z
4у
, z
5у
]
С использованием корреляционной таблицы вычисляем
в
ху
____
=
**
5
1
5
1
pуqх
q
pq
p
zzw
==
=
*
5
*
555
*
1
*
212
*
1
*
111
...
ухухух
zzwzzwzzw +++ .
Подставив найденное значение в формулу (8) и определив вели-
чину выборочного коэффициента корреляции, необходимо сде-
лать вывод о наличии и величине возможной взаимосвязи гене-
ральных совокупностей Х и Y.
50
Интервальные оценки параметров генеральной
совокупности
Недостаток точечных оценок (
в
х ,
в
D ), полученных ранее,
состоит в том, что нами не указывалась величина возможной по-
грешности при их применении. Не указывается, например, какова
вероятность ошибки на 5 %, 10 % и т.д. В особенности это стано-
вится актуальным при небольших объемах выборок: n = 5÷15.
Построение интервальных оценок позволяет в какой-то мере
устранить этот недостаток.
Надежностью
γ
назовем вероятность того, что оценивае-
мая величина
г
v
попала в некоторый интервал I с центром в
точке
в
v
:
γ
= Р({
г
v
I
}) = Р({|
г
v
в
v |
δ
<
}). (9)
Параметр
γ
задается заранее, и в наших интересах, чтобы он
был как можно ближе к 1 (обычно 0.9, 0.95, 0.99). Из соотноше-
ния (9) определяется параметр
δ
полуширина интервала I, в
котором, как мы предполагаем, должна содержаться оценивае-
мая величина:
г
v ),(
δ
δ
+
=
вв
vvI .
Интервальной оценкой называется интервал
),(
δ
δ
+
=
вв
vvI , для которого вероятность того, что оцени-
ваемый параметр
г
v окажется внутри него, равна заранее за-
данной величине надежности
γ
, т.е. выполняется соотношение
(9). Такой интервал
I
, обеспечивающий построение интерваль-
ной оценки, называется
доверительным интервалом.
Построим интервальную оценку для математического ожи-
дания
г
х , учитывая, что ранее для нее была получена точечная
оценка
в
х ~
г
х .
В предположении, что исследуемая генеральная совокуп-
ность
нормально распределена, то есть, Х = N(a,
σ
), мы ре-
шим две задачи о построении интервальной оценки (считая, что
объем выборки невелик).
Задача 1. Пусть объем выборки мал, а
D=
σ
известна из
каких-либо соображений. Требуется построить доверительный
интервал с надежностью
γ
.
приближенное представление корреляционного момента. Для его                                               Интервальные оценки параметров генеральной
вычисления составляется корреляционная таблица, которая за-                                                                    совокупности
полняется следующим образом. В исходной неупорядоченной                                              Недостаток точечных оценок ( х в , Dв ), полученных ранее,
парной выборке берется очередная пара (xi, yi). Определяется, в                                состоит в том, что нами не указывалась величина возможной по-
какой из пяти интервалов диапазона х-выборки попадает xi, а за-                                грешности при их применении. Не указывается, например, какова
тем в какой из пяти интервалов диапазона у-выборки попадает уi.                                вероятность ошибки на 5 %, 10 % и т.д. В особенности это стано-
На пересечении соответствующих столбца и строки ставится от-                                   вится актуальным при небольших объемах выборок: n = 5÷15.
метка I. Когда все пары выборки пройдены, вычисляется относи-                                  Построение интервальных оценок позволяет в какой-то мере
тельная частота двумерного выборочного распределения wpq как                                   устранить этот недостаток.
результат деления количества отметок на объем выборки.                                               Надежностью γ назовем вероятность того, что оценивае-
В клетках, оставшихся пустыми, wpq = 0. Очевидно, что
 5       5
                                                                                               мая величина v г попала в некоторый интервал I с центром в
∑ ∑ w pq = 1 .                                                                                 точке vв :
p =1 q =1
                                                                                                                γ = Р({ v г ∈ I }) = Р({| v г – vв | < δ }).       (9)
                                    *
                                                                                               Параметр γ задается заранее, и в наших интересах, чтобы он
                                  z1x        z2* x        *
                                                        z3x        z4* x        *
                                                                              z5x              был как можно ближе к 1 (обычно 0.9, 0.95, 0.99). Из соотноше-
                          X
                               [z0x, z1x] [z1x, z2x] [z2x, z3x] [z3x, z4x] [z4x, z5x]          ния (9) определяется параметр δ – полуширина интервала I, в
     Y
                                                                                               котором, как мы предполагаем, должна содержаться оценивае-
      *
     z1у          [z0у, z1у]
                                                                                               мая величина: v г ∈ I = ( v в − δ , v в + δ ) .
     z2* у        [z1у, z2у]                                                                         Интервальной             оценкой         называется     интервал
                                                                                                I = ( v в − δ , v в + δ ) , для которого вероятность того, что оцени-
     z3* у        [z2у, z3у]
                                                                                               ваемый параметр v г окажется внутри него, равна заранее за-
     z4* у        [z3у, z4у]                                                                   данной величине надежности γ , т.е. выполняется соотношение
                  [z4у, z5у]                                                                   (9). Такой интервал I , обеспечивающий построение интерваль-
     z5* у
                                                                                               ной оценки, называется доверительным интервалом.
                                                                                                     Построим интервальную оценку для математического ожи-
       С использованием корреляционной таблицы вычисляем                                       дания х г , учитывая, что ранее для нее была получена точечная
____          5      5
                                                                                               оценка х в ~ х г .
ху в =       ∑ ∑ wpq zqх* z*pу     = w11 z1*х z1*у + w12 z2* х z1*у + ... + w55 z5*х z5* у .
                                                                                                     В предположении, что исследуемая генеральная совокуп-
             p =1 q =1

Подставив найденное значение в формулу (8) и определив вели-                                   ность нормально распределена, то есть, Х = N(a, σ ), мы ре-
чину выборочного коэффициента корреляции, необходимо сде-                                      шим две задачи о построении интервальной оценки (считая, что
лать вывод о наличии и величине возможной взаимосвязи гене-                                    объем выборки невелик).
ральных совокупностей Х и Y.                                                                         Задача 1. Пусть объем выборки мал, а σ = D известна из
                                                                                               каких-либо соображений. Требуется построить доверительный
                                                                                               интервал с надежностью γ .
                                              49                                                                                 50