Математическая статистика. Воскобойников Ю.Е - 30 стр.

UptoLike

59 60
2,;1,
pppp
прлев
=
=
γγ
. (4.27)
Если п >> 100, то для вычисления
21
p,p можно использовать прибли-
женные формулы:
.n)p(pxpp;n)p(pxpp
******
+ 11
21
γγ
(4.28)
Видно, что границы интервала (4.23) являются случайными величинами
и конкретные значения границ получаются в результате подстановки
наблюдаемого значения случайной величины
р*.
Пример 4.4. Событие А в серии из п = 100 испытаний произошло т
= 78 раз. Построить интервальную оценку для вероятности
р события с
надежностью
9.0
=
γ
.
Решение. В условиях примера значение точечной оценки вероятнос-
ти
р равно, 78.0100/78
*
==p . По табл. П1 определяем 64.1
=
γ
x
и вычисляем по формулам (4.25, 4.26) значения
21
p,p при
848.0,705.0:78.0
21
*
=== ppp . Таким образом, получили
реализацию доверительного интервала
(0.705, 0.848) для вероятности
р события А.
Интервальная оценка вероятности при малом числе испытаний
При малом числе испытаний п предположение о приближенном рас-
пределении случайной величины
m по нормальному закону
)npq,np(Nm =
,
становится несправедливым и для описания распределения величины
m необходимо использовать формулу Бернулли:
nxppCxmP
xnxx
n
,...,1,0,)1()( ===
.
Можно показать, что граничные точки интервальной оценки (4.22)
являются решениями следующих нелинейных уравнений:
+
=
=
1
0
,,
2
1
)1(
m
x
xn
лев
x
лев
x
n
ppc
γ
γγ
; (4.29)
=
=
m
x
xn
пр
x
пр
x
n
ppc
0
,,
2
1
)1(
γ
γγ
, (4.30)
где
γ
надежность интервальной оценки. Вновь заметим, что решения
γγ
,,
,
прлев
pp этих уравнений являются случайными величинами (по-
чему?) и только при подстановке конкретного значения
т (количество
испытаний, в которых появилось событие
А) будут получены конкрет-
ные значения граничных точек интервальной оценки (4.23).
Корни уравнений (4.29), (4.30) могут быть найдены одним из извест-
ных численных методов решения нелинейных уравнений. Кроме этого,
существуют специальные таблицы для нахождения чисел
γγ
,,
,
прлев
pp , удовлетворяющих уравнениям (4.29), (4.30) по задан-
ным
γ
,, nmn
. Фрагмент этих таблиц представлен в табл. П4.
Пример 4.5. В пяти испытаниях событие
А произошло три раза. По-
строить интервальную оценку для вероятности
р события А с надежно-
стью
95.0
=
γ
.
Решение. Из условий примера имеем
п = 5, m = 3,
γ
= 0.95. По
табл. П4 находим
947.0,147.0
,,
=
=
γγ
прлев
pp , а интервальная
оценка определяется как
(0.147,0.947).
Сравнивая интервальные оценки примеров
4.4, 4.5, видим, что дли-
на доверительного интервала для примера 4.5 (равная 0.8) существенно
больше длины доверительного интервала примера 4.4 (равной 0.143).
Это является следствием разного объема выборок
)5(
=
n и )100( =n
и различных дисперсий случайной величины
nmp =
*
.
5. Проверка статистических гипотез
5.1. Понятие статистической гипотезы. Основные
этапы проверки гипотезы
Прежде чем перейти к математическим формулировкам, рассмотрим
один пример.
Результаты многолетних статистических исследований показали, что
для населения некоторого региона вероятность предрасположения к
данному заболеванию R равна
1.0
0
=
p . После строительства в этом
регионе химического предприятия была проведена выборочная провер-
ка населения. Из 1000 обследованных у 120 человек были обнаружены
                    p лев ,γ = p1;        pпр ,γ = p2 .                           (4.27)                m
                                                                                                          x x                  n− x     1−γ
                                                                                                       ∑ cn pпр,γ (1 − pпр,γ )      =       ,               (4.30)
                                                                                                       x =0                              2
Если п >> 100, то для вычисления p1 , p 2 можно использовать прибли-
женные формулы:                                                                            где   γ   – надежность интервальной оценки. Вновь заметим, что решения
                                                                                           p лев ,γ , pпр,γ этих уравнений являются случайными величинами (по-
 p1 ≈ p* − xγ       p* ( 1 − p* ) n ;   p 2 ≈ p* + xγ      p* ( 1 − p* ) n . (4.28)
                                                                                           чему?) и только при подстановке конкретного значения т (количество
Видно, что границы интервала (4.23) являются случайными величинами                         испытаний, в которых появилось событие А) будут получены конкрет-
и конкретные значения границ получаются в результате подстановки                           ные значения граничных точек интервальной оценки (4.23).
наблюдаемого значения случайной величины р*.                                                   Корни уравнений (4.29), (4.30) могут быть найдены одним из извест-
                                                                                           ных численных методов решения нелинейных уравнений. Кроме этого,
   Пример 4.4. Событие А в серии из п = 100 испытаний произошло т                          существуют         специальные   таблицы    для   нахождения      чисел
= 78 раз. Построить интервальную оценку для вероятности р события с                         p лев ,γ , pпр,γ , удовлетворяющих уравнениям (4.29), (4.30) по задан-
надежностью γ = 0.9 .                                                                      ным  n, m − n, γ . Фрагмент этих таблиц представлен в табл. П4.
   Решение. В условиях примера значение точечной оценки вероятнос-                            Пример 4.5. В пяти испытаниях событие А произошло три раза. По-
                *
ти р равно, p = 78 / 100 = 0.78 . По табл. П1 определяем xγ = 1.64                         строить интервальную оценку для вероятности р события А с надежно-
и вычисляем по формулам (4.25, 4.26) значения                          p1 , p 2     при    стью γ = 0.95 .
  *                                                                                           Решение. Из условий примера имеем п = 5, m = 3, γ = 0.95. По
p = 0.78 : p1 = 0.705,    p2 = 0.848 . Таким образом, получили
                                                                                           табл. П4 находим p лев ,γ = 0.147, pпр ,γ = 0.947 , а интервальная
реализацию доверительного интервала (0.705, 0.848) для вероятности
р события А.                                                                               оценка определяется как (0.147,0.947).
   Интервальная оценка вероятности при малом числе испытаний                                  Сравнивая интервальные оценки примеров 4.4, 4.5, видим, что дли-
                                                                                           на доверительного интервала для примера 4.5 (равная 0.8) существенно
   При малом числе испытаний п предположение о приближенном рас-
                                                                                           больше длины доверительного интервала примера 4.4 (равной 0.143).
пределении случайной величины m по нормальному закону
                                                                                           Это является следствием разного объема выборок ( n = 5) и ( n = 100)
                              m = N ( np , npq ) ,                                         и различных дисперсий случайной величины p = m n .
                                                                                                                                                *

становится несправедливым и для описания распределения величины
                                                                                                              5. Проверка статистических гипотез
m необходимо использовать формулу Бернулли:
                                                                                                 5.1. Понятие статистической гипотезы. Основные
               P( m = x ) = Cnx p x (1 − p ) n − x ,      x = 0,1,..., n .                            этапы проверки гипотезы
                                                                                              Прежде чем перейти к математическим формулировкам, рассмотрим
   Можно показать, что граничные точки интервальной оценки (4.22)                          один пример.
являются решениями следующих нелинейных уравнений:                                            Результаты многолетних статистических исследований показали, что
        m −1                                    1+γ                                        для населения некоторого региона вероятность предрасположения к
            x x                        n−x
         ∑ cn p лев ,γ (1 − p лев ,γ )     =        ;                             (4.29)   данному заболеванию R равна p0 = 0.1 . После строительства в этом
        x =0                                     2
                                                                                           регионе химического предприятия была проведена выборочная провер-
                                                                                           ка населения. Из 1000 обследованных у 120 человек были обнаружены
                                          59                                                                                      60