Практикум по математической статистике. Панков А.Р - 28 стр.

UptoLike

Составители: 

54 ИНТЕРВАЛЬНЫЕ ОЦЕНКИ ПАРАМЕТРОВ § 9.
§ 9. Интервальные оценки параметров
9.1. Теоретические положения. Пусть Z
n
= {X
k
, k = 1, . . . , n}
выборка, соответствующая распределению F (x; θ), где θ Θ R
1
неизвестный параметр. Выберем некоторое малое положительное число
p и предположим, что найдутся статистики T
1
= T
1
(Z
n
) и T
2
= T
2
(Z
n
),
T
1
< T
2
, такие, что для любого θ Θ
P(T
1
6 θ 6 T
2
) = 1 p. (9.1)
О п р е д е л е н и е 9.1. Промежуток [T
1
, T
2
] называется доверитель-
ным интервалом для θ надежности q = 1 p. Доверительный интервал
также называют интервальной оценкой параметра θ.
Число p = 1q называют уровнем значимости и обычно на практике
полагают p = 0,05 или p = 0,01.
Пусть ξ СВ, имеющая непрерывную функцию распределения F
ξ
(x).
О п р е д е л е н и е 9.2. Для любого α (0; 1) число
x
α
= min{x : F
ξ
(x) > α} (9.2)
называется квантилью уровня α распределения F
ξ
(x).
Из (9.2) следует, что
P(ξ 6 x
α
) = α, P(ξ > x
α
) = 1 α. (9.3)
Понятие квантили имеет существенное значение для построения до-
верительных и нтервалов и проверки статистических гипотез.
Центральный доверительный интервал.
Пусть G(Z
n
; θ) такая СВ,
что ее функция распределения F
G
(x) = P (G(Z
n
; θ) 6 x) не зависит от θ.
Пусть также для каждой реализации z
n
выборки Z
n
числовая функция
G
n
(θ) = G(z
n
; θ) непрерывна и строго монотонна по θ на Θ.
О п р е д е л е н и е 9.3. СВ G(Z
n
; θ) называется центральной стати-
стикой дл я θ.
Пусть задан уровень значимости p и выбраны произвольно p
1
> 0 и
p
2
> 0 такие, что p = p
1
+ p
2
(например, p
1
= p
2
=
p
2
). Если g
1
и g
2
квантили распределения F
G
(x) уровней, соответственно, p
1
и 1 p
2
, то
для любого θ Θ
P (g
1
6 G(Z
n
; θ) 6 g
2
) = 1 p.
Найдем решения t
1
и t
2
уравнений G(Z
n
; θ) = g
i
, i = 1, 2 и положим
T
1
= min{t
1
, t
2
}, T
2
= max{t
1
, t
2
}. Тогда
P (T
1
6 θ 6 T
2
) = 1 p = q,
§ 9. ИНТЕРВАЛЬНЫЕ ОЦЕНКИ ПАРАМЕТРОВ 55
т.е. [T
1
, T
2
] доверительный интервал для θ надежности q.
В силу произвола в выборе p
1
и p
2
интервал [T
1
, T
2
] определен неодно-
значно. Если при построении T
1
и T
2
с помощью G(Z
n
; θ) дополнительно
предположить, что p
1
= p
2
=
p
2
, то [T
1
, T
2
] называют центральным
доверительным интервалом.
В общем случае выбор p
1
и p
2
осуществляется так, чтобы длина
интервала T
2
T
1
была минимальной при неизменной надежности q
этом случае интервальная оценка будет самой точной среди всех оценок
надежности q).
Следующее утверждение дает общий способ построения центральной
статистики.
Т е о р е м а 9.1. Пусть выборка Z
n
= {X
k
, k = 1, . . . , n} соответ-
ствует функции распределения F (x; θ), удовлетворяющей следующим
требованиям:
1) F (x; θ) непрерывна по x для любого θ Θ;
2) F (x; θ) непрерывна и монотонна по θ для любого x.
Тогда G(Z
n
; θ) =
n
X
k=1
ln F (X
k
; θ) является центральной статистикой
для θ Θ.
Асимптотический доверительный интервал.
При больших объемах
выборки (n 1) для построения доверительного интервала можно вос-
пользоваться любой асимптотически нормальной оценкой
b
θ
n
параметра
θ. Пусть
n(
b
θ
n
θ)
d
ξ N(0; d(θ)), n , (9.4)
где d(θ) асимптотическая дисперсия оценки
b
θ
n
.
Зададим надежность q, уровень значимости p = 1 q и определим
(по таблице 13.2) квантиль u
α
уровня α = 1
p
2
распределения N(0; 1).
Так как функция Лапласа строго монотонна, Φ(u
α
) = 1
p
2
. Кроме того,
есл и β =
p
2
, то u
β
= u
α
.
Если d(θ) непрерывна по θ Θ, то из (9.4) следует:
P
b
θ
n
u
α
r
d(
b
θ
n
)
n
6 θ 6
b
θ
n
+ u
α
r
d(
b
θ
n
)
n
!
Φ(u
α
) Φ(u
α
) = q.
После днее означает, что интервал
b
I =
"
b
θ
n
u
α
r
d(
b
θ
n
)
n
;
b
θ
n
+ u
α
r
d(
b
θ
n
)
n
#
, α = 1
p
2
=
1 + q
2
54                   ИНТЕРВАЛЬНЫЕ ОЦЕНКИ ПАРАМЕТРОВ                       § 9.   § 9.                     ИНТЕРВАЛЬНЫЕ ОЦЕНКИ ПАРАМЕТРОВ                        55

           § 9. Интервальные оценки параметров                                   т.е. [T 1, T 2] — доверительный интервал для θ надежности q.
                                                                                     В силу произвола в выборе p 1 и p 2 интервал [T 1, T 2] определен неодно-
                                                                                 значно. Если при построении T 1 и T 2 с помощью G(Z n; θ) дополнительно
    9.1. Теоретические положения. Пусть Z n = {X k, k = 1, . . . , n} —          предположить, что p 1 = p 2 = p2 , то [T 1, T 2] называют центральным
выборка, соответствующая распределению F (x; θ), где θ ∈ Θ ⊆ R1 —                доверительным интервалом.
неизвестный параметр. Выберем некоторое малое положительное число                    В общем случае выбор p 1 и p 2 осуществляется так, чтобы длина
p и предположим, что найдутся статистики T 1 = T 1(Z n) и T 2 = T 2(Z n),        интервала T 2 − T 1 была минимальной при неизменной надежности q (в
T 1 < T 2, такие, что для любого θ ∈ Θ                                           этом случае интервальная оценка будет самой точной среди всех оценок
                                                                                 надежности q).
                          P(T 1 6 θ 6 T 2) = 1 − p.                      (9.1)       Следующее утверждение дает общий способ построения центральной
   О п р е д е л е н и е 9.1. Промежуток [T 1, T 2] называется доверитель-       статистики.
ным интервалом для θ надежности q = 1 − p. Доверительный интервал                    Т е о р е м а 9.1. Пусть выборка Z n = {X k, k = 1, . . . , n} соответ-
также называют интервальной оценкой параметра θ.                                 ствует функции распределения F (x; θ), удовлетворяющей следующим
   Число p = 1−q называют уровнем значимости и обычно на практике                требованиям:
полагают p = 0,05 или p = 0,01.                                                      1) F (x; θ) непрерывна по x для любого θ ∈ Θ;
   Пусть ξ — СВ, имеющая непрерывную функцию распределения Fξ (x).                   2) F (x; θ) непрерывна и монотонна по θ для любого x.
                                                                                                         n
                                                                                                         X
   О п р е д е л е н и е 9.2. Для любого α ∈ (0; 1) число                        Тогда G(Z n; θ) = −         ln F (X k; θ) является центральной статистикой
                                                                                                       k=1
                          x α = min{x : Fξ (x) > α}                      (9.2)
                                                                                 для θ ∈ Θ.
называется квантилью уровня α распределения Fξ (x).                                  Асимптотический доверительный интервал. При больших объемах
   Из (9.2) следует, что                                                         выборки (n ≫ 1) для построения доверительного интервала можно вос-
                                                                                 пользоваться любой асимптотически нормальной оценкой θbn параметра
                   P(ξ 6 x α) = α,    P(ξ > x α) = 1 − α.                (9.3)
                                                                                 θ. Пусть
    Понятие квантили имеет существенное значение для построения до-                             √             d
верительных интервалов и проверки статистических гипотез.                                         n(θbn − θ) −→ ξ ∼ N (0; d(θ)), n → ∞,        (9.4)
    Центральный доверительный интервал. Пусть G(Z n; θ) — такая СВ,
                                                                                 где d(θ) — асимптотическая дисперсия оценки θbn.
что ее функция распределения F G(x) = P (G(Z n; θ) 6 x) не зависит от θ.
                                                                                    Зададим надежность q, уровень значимости p = 1 − q и определим
Пусть также для каждой реализации z n выборки Z n числовая функция                                                            p
G n(θ) = G(z n; θ) непрерывна и строго монотонна по θ на Θ.                      (по таблице 13.2) квантиль u α уровня α = 1 − распределения N (0; 1).
                                                                                                                                       2
    О п р е д е л е н и е 9.3. СВ G(Z n; θ) называется центральной стати-                                                                       p
                                                                                 Так как функция Лапласа строго монотонна, Φ(u α) = 1 − . Кроме того,
стикой для θ.                                                                                                                                   2
                                                                                           p
    Пусть задан уровень значимости p и выбраны произвольно p 1 > 0 и             если β = , то u β = −u α.
                                                                                          2
p 2 > 0 такие, что p = p 1 + p 2 (например, p 1 = p 2 = p2 ). Если g 1 и g 2 —      Если d(θ) непрерывна по θ ∈ Θ, то из (9.4) следует:
квантили распределения F G(x) уровней, соответственно, p 1 и 1 − p 2, то                        r                         r         !
для любого θ ∈ Θ                                                                                  d(θbn )                   d(θbn )
                                                                                    P θbn − u α           6 θ 6 θbn + u α             → Φ(u α) − Φ(−u α) = q.
                                                                                                      n                       n
                      P (g 1 6 G(Z n; θ) 6 g 2) = 1 − p.
    Найдем решения t 1 и t 2 уравнений G(Z n; θ) = g i, i = 1, 2 и положим       Последнее означает, что интервал
                                                                                           "       r                   r         #
T 1 = min{t 1, t 2}, T 2 = max{t 1, t 2}. Тогда                                                       d(θbn )            d(θbn )               p   1+q
                                                                                       Ib = θb − u
                                                                                               n     α        ; θb + u
                                                                                                                   n    α          ,   α=1−      =
                       P (T 1 6 θ 6 T 2) = 1 − p = q,                                                        n               n                 2    2