Математическая статистика. Воскобойников Ю.Е - 17 стр.

UptoLike

33 34
виду, что в условиях испытаний Бернулли величина
т имеет биноми-
альный закон распределения с характеристиками
М(т) = пр, D(m) =
пр(1 – р
). Имеем
)(
1
)(
1
Apnp
n
mM
nn
m
M ===
.
Следовательно,
nmp /
*
= является несмещенной оценкой вероят-
ности
р(А).
Для доказательства эффективности укажем, что минимум среди дис-
персий различных несмещенных оценок вероятности
р(А) равен
n
pp
D
)1(
min
=
. (3.19)
Определим дисперсию оценки
*
p
n
pp
n
pnp
mD
n
n
m
DpD
)1()1(
)(
1
)(
22
*
=
==
=
.
Так как D(P*) СОВпадает с минимальной дисперсией
min
D , то част-
ность
р*, будучи несмещенной оценкой, является также и эффективной.
3.5. Метод максимального правдоподобия
В предыдущих пунктах были рассмотрены различные точечные
оценки, являющиеся некоторыми функциями от результатов наблюде-
ния. Однако осталось неясным, почему были взяты именно эти функ-
ции. Рассмотрим один из методов, позволяющих получить эти функции.
Для понимания его сущности обратимся к следующему примеру.
Предположим, что график плотности распределения генеральной со-
вокупности Х имеет
вид равнобедренного треугольника АВС, длина ос-
нования и высота которого зафиксированы, а неизвестным параметром
θ
является абсцисса точки Dсередины отрезка АВ. Пусть
n
xxx ...,,,
21
выборка из генеральной совокупности X. Зададимся во-
просом: в какую точку оси абсцисс необходимо поместить точку D, ес-
ли в результате опыта получена именно выборка
n
xxx ...,,,
21
. Конеч-
но, никаких ограничений для ее расположения на оси х нет. Но если мы
сдвинем треугольник далеко влево или вправо от элементов выборки, то
вероятность получения выборки, попавшей на промежуток
],[ ML
, ко-
торому принадлежит точка D, будет равна нулю, так как
00
=
=
=
∫∫
]M,L[]M,L[
dxdx)x(p])M,L[X(P
.
Поэтому точка
D должна лежать в "гуще" выборки, т.е. таким обра-
зом, чтобы значения ординат
),(
θ
i
xp были в совокупности как можно
больше. Тогда становится правдоподобным получение именно выборки
n
xxx ...,,,
21
. Данный метод называется методом максимального
правдоподобия. Итак, параметр
θ
, согласно этому методу, нужно вы-
бирать так, чтобы вероятность получения набора значений
n
xxx ...,,,
21
случайной величины Х при этом значении
θ
была наи-
большей. Конечно, о вероятности получения данного набора значений
мы строго можем говорить лишь в том случае, когда рассматриваемая
генеральная совокупность распределена дискретно. Напомним, что для
непрерывных случайных величин любые конкретные значения появля-
ются с нулевой вероятностью. Поэтому метод максимального правдо-
подобия имеет некоторые различия в случае дискретных и
непрерывных
генеральных совокупностей.
Дискретная генеральная совокупность. Пусть
Х дискретная ге-
неральная совокупность, распределение которой зависит от некоторого
параметра
θ
, т.е.
)()(
θ
ji
pyXP
=
=
,
где
j = 1,..., m; y
1
,...,y
m
все различные значения, которые может
принимать случайная величина
X, а вероятности, с которыми эти зна-
чения появляются, зависят от параметра
θ
. Предположим, что
n
xxx ...,,,
21
выборка из генеральной совокупности X, причем значе-
ние
y
j
встречается в выборке n
j
раз, т.е. n
j
частота значения y
j
, и по-
этому имеет место равенство
=
=
m
j
j
nn
1
.
Учитывая независимость случайных величин
n
XX ...,,
1
, вероятность
получения выборки
n
xxx ...,,,
21
можно представить как
)xX(P)xX(P)xX...;;xX(P
nnnn
=
=
=
=
=
L
1111
.
виду, что в условиях испытаний Бернулли величина т имеет биноми-                       P( X ∈ [ L , M ]) =      ∫       p( x )dx =      ∫ 0 ⋅ dx = 0 .
альный закон распределения с характеристиками М(т) = пр, D(m) =                                              [ L ,M ]                [ L ,M ]
пр(1 – р). Имеем
                                                                                 Поэтому точка D должна лежать в "гуще" выборки, т.е. таким обра-
                    ⎛m⎞ 1        1
                  M ⎜ ⎟ = M (m) = np = p ( A) .                               зом, чтобы значения ординат p ( xi ,θ ) были в совокупности как можно
                    ⎝n⎠ n        n                                            больше. Тогда становится правдоподобным получение именно выборки
                      *
   Следовательно, p = m / n является несмещенной оценкой вероят-              x1 , x 2 , ..., x n . Данный метод называется методом максимального
ности р(А).                                                                   правдоподобия. Итак, параметр θ , согласно этому методу, нужно вы-
   Для доказательства эффективности укажем, что минимум среди дис-            бирать так, чтобы вероятность получения набора значений
персий различных несмещенных оценок вероятности р(А) равен                    x1 , x 2 , ..., x n случайной величины Х при этом значении θ была наи-
                        p(1 − p)                                              большей. Конечно, о вероятности получения данного набора значений
                 Dmin =          .                            (3.19)
                            n                                                 мы строго можем говорить лишь в том случае, когда рассматриваемая
                                  *                                           генеральная совокупность распределена дискретно. Напомним, что для
   Определим дисперсию оценки p                                               непрерывных случайных величин любые конкретные значения появля-
                   ⎛m⎞ 1             np(1 − p) p(1 − p)                       ются с нулевой вероятностью. Поэтому метод максимального правдо-
      D ( p * ) = D⎜ ⎟ = 2 D ( m ) =           =          .                   подобия имеет некоторые различия в случае дискретных и непрерывных
                   ⎝n⎠ n                n2           n                        генеральных совокупностей.
   Так как D(P*) СОВпадает с минимальной дисперсией Dmin , то част-
                                                                                 Дискретная генеральная совокупность. Пусть Х – дискретная ге-
ность р*, будучи несмещенной оценкой, является также и эффективной.           неральная совокупность, распределение которой зависит от некоторого
     3.5. Метод максимального правдоподобия                                   параметра θ , т.е.

     В предыдущих пунктах были рассмотрены различные точечные
                                                                                                     P ( X = yi ) = p j (θ ) ,
оценки, являющиеся некоторыми функциями от результатов наблюде-               где j = 1,..., m; y1,...,ym – все различные значения, которые может
ния. Однако осталось неясным, почему были взяты именно эти функ-              принимать случайная величина X, а вероятности, с которыми эти зна-
ции. Рассмотрим один из методов, позволяющих получить эти функции.
                                                                              чения появляются, зависят от параметра θ . Предположим, что
Для понимания его сущности обратимся к следующему примеру.
     Предположим, что график плотности распределения генеральной со-           x1 , x 2 , ..., x n – выборка из генеральной совокупности X, причем значе-
вокупности Х имеет вид равнобедренного треугольника АВС, длина ос-            ние yj встречается в выборке nj раз, т.е. nj – частота значения yj, и по-
нования и высота которого зафиксированы, а неизвестным параметром             этому имеет место равенство
θ является абсцисса точки D – середины отрезка АВ. Пусть                                                         m
 x1 , x 2 , ..., x n – выборка из генеральной совокупности X. Зададимся во-                                      ∑nj = n .
                                                                                                                j =1
просом: в какую точку оси абсцисс необходимо поместить точку D, ес-
                                                                              Учитывая независимость случайных величин X 1 , ..., X n , вероятность
ли в результате опыта получена именно выборка x1 , x 2 , ..., x n . Конеч-
но, никаких ограничений для ее расположения на оси х нет. Но если мы          получения выборки x1 , x 2 , ..., x n можно представить как
сдвинем треугольник далеко влево или вправо от элементов выборки, то
вероятность получения выборки, попавшей на промежуток [ L, M ] , ко-               P( X 1 = x1 ; ...; X n = xn ) = P( X 1 = x1 ) L P( X n = xn ) .
торому принадлежит точка D, будет равна нулю, так как

                                      33                                                                                34