Математическая статистика. Воскобойников Ю.Е - 8 стр.

UptoLike

15 16
Напомним, что
)(
*
xF
n
равна относительной частоте появления со-
бытия
}{ xXA
<
= и, следовательно, при любом значении
x
величи-
на
)(
*
xF
n
является случайной. Тогда конкретной выборке
)...,,,(
21 n
xxx объема n соответствует функция распределения
)(
*
xF
n
, которая в силу своей случайности будет отличаться от )(
*
xF
n
,
построенной по другой выборке из той же генеральной совокупности.
Возникает вопрос: зачем нужна такая характеристика, меняющаяся
от выборки к выборке. Ответ получаем на основе следующих рассужде-
ний.
По теореме Бернулли относительная частота появления события
A
в
n
независимых опытах сходится по вероятности к вероятности
)( xXP <
этого события при увеличении n . Следовательно, при
больших объемах выборки выборочная функция распределения
)(
*
xF
n
близка к теоретической функции
)(xF . Точнее имеет место следую-
щая теорема.
Теорема В.И. Гливенко. Для любого действительного числа
x
и
любого
0>
ε
0))()((lim
*
=>
ε
xFxFP
n
n
.
Таким образом, по функции
)(
*
xF
n
мы можем получить прибли-
женно функцию
)(xF , т.е. функция )(
*
xF
n
является оценкой )(xF .
В качестве оценки плотности распределения вероятности непрерыв-
ной случайной величины используют гистограмму относительных
частот.
Гистограммой относительных частот называется система прямо-
угольников, каждый из которых основанием имеет i-й интервал интер-
вального вариационного ряда; площадь, равную относительной частоте
i
ω
, а высота
i
y определяется по формуле
mi
h
y
i
i
i
...,,2,1, ==
ω
,
где
iii
zzh =
+1
длина i-го частичного интервала. Если длина час-
тичных интервалов одинакова, то
hh
i
= (см. (2.2), (2.3)).
Очевидно, что сумма площадей всех прямоугольников равна 1 (дока-
жите это свойство).
Площадь прямоугольника
i
ω
равна относительной частоте попада-
ния элементов выборочной совокупности объема
n
на i-й интервал т.е.
)(
1
*
+
<=
iini
zXz
ωω
.
С другой стороны, если
)(xpy
=
плотность вероятности случай-
ной величины
X
, то вероятность
)(
1+
<
=
iii
zXzPp
по теореме Бернулли близка при большом значении
n
к относительной
частоте.
Поэтому значение
i
ω
близко к
+
=<=
+
1
)()(
1
i
i
z
z
iii
dxxpzXzPp . (2.7)
Пусть
i
y высота i-го прямоугольника. По теореме о среднем инте-
грал, выражающий вероятность в формуле (2.7), можно записать в виде
)u(p)zz(dx)x(pp
iii
z
z
i
i
i
=
=
+
+
1
1
, (2.8)
где
i
u некоторое число из промежутка ),[
1ii
zz . Так как
iiii
yzz )(
1
=
+
ω
, то значения
i
y и )(
i
up близки друг к другу.
Практически это означает, что график плотности распределения гене-
ральной совокупности
X
проходит вблизи верхних границ прямо-
угольников, образующих гистограмму. Поэтому при больших объемах
выборок и удачном выборе длины частичных интервалов гистограмма
напоминает график плотности распределения
)(xp
.
Пример 2.5. Построим гистограмму относительных частот выбо-
рочной совокупности из примера 2.3.
Решение. Используя интервальный вариационный ряд (см. табл. 2.2),
находим высоты
i
y по формуле 2/
ii
y
ω
=
. График построенной гис-
тограммы приведен на рис 2.2. Здесь же штриховой линией отмечен
предполагаемый график неизвестной плотности
)(xp .
                       *                                                         Очевидно, что сумма площадей всех прямоугольников равна 1 (дока-
      Напомним, что Fn ( x ) равна относительной частоте появления со-
                                                                               жите это свойство).
бытия A = { X < x} и, следовательно, при любом значении x величи-                Площадь прямоугольника ω i равна относительной частоте попада-
на     Fn* ( x ) является случайной. Тогда конкретной выборке                  ния элементов выборочной совокупности объема n на i-й интервал т.е.
( x1 , x2 , ..., xn ) объема n соответствует функция распределения                                        ω i = ω n* ( zi ≤ X < zi +1 ) .
                                                                                  С другой стороны, если y = p (x ) – плотность вероятности случай-
Fn* ( x ) , которая в силу своей случайности будет отличаться от Fn* ( x ) ,
                                                                               ной величины X , то вероятность
построенной по другой выборке из той же генеральной совокупности.
   Возникает вопрос: зачем нужна такая характеристика, меняющаяся                                            pi = P( zi ≤ X < zi +1 )
от выборки к выборке. Ответ получаем на основе следующих рассужде-
ний.                                                                           по теореме Бернулли близка при большом значении n к относительной
                                                                               частоте.
   По теореме Бернулли относительная частота появления события A
в n независимых опытах сходится по вероятности к вероятности                         Поэтому значение   ωi   близко к
P( X < x ) этого события при увеличении n . Следовательно, при                                                                   z i +1
                                                          *
больших объемах выборки выборочная функция распределения Fn ( x )                                   pi = P( zi ≤ X < zi +1 ) = ∫ p( x )dx .        (2.7)
                                                                                                                                  zi
близка к теоретической функции F ( x ) . Точнее имеет место следую-
щая теорема.
                                                                                     Пусть   yi – высота i-го прямоугольника. По теореме о среднем инте-
   Теорема В.И. Гливенко. Для любого действительного числа x и                 грал, выражающий вероятность в формуле (2.7), можно записать в виде
любого ε > 0                                                                                             zi +1
                                                                                                    pi = ∫ p( x )dx = ( zi +1 − zi ) ⋅ p( ui ) ,   (2.8)
                      lim P( Fn* ( x ) − F ( x ) > ε ) = 0 .                                              zi
                     n→∞
                                         *                                     где  ui – некоторое число из промежутка [ zi , zi −1 ) . Так как
      Таким образом, по функции Fn ( x ) мы можем получить прибли-
                                                                               ω i = ( zi +1 − zi ) yi , то значения yi и p(u i ) близки друг к другу.
                                               *
женно функцию F (x ) , т.е. функция Fn ( x ) является оценкой F (x ) .         Практически это означает, что график плотности распределения гене-
    В качестве оценки плотности распределения вероятности непрерыв-            ральной совокупности X проходит вблизи верхних границ прямо-
ной случайной величины используют гистограмму относительных                    угольников, образующих гистограмму. Поэтому при больших объемах
частот.                                                                        выборок и удачном выборе длины частичных интервалов гистограмма
    Гистограммой относительных частот называется система прямо-                напоминает график плотности распределения p (x ) .
угольников, каждый из которых основанием имеет i-й интервал интер-                ♦Пример 2.5. Построим гистограмму относительных частот выбо-
вального вариационного ряда; площадь, равную относительной частоте             рочной совокупности из примера 2.3.
ω i , а высота yi определяется по формуле
                                  ωi                                           Решение. Используя интервальный вариационный ряд (см. табл. 2.2),
                           yi =        , i = 1,2, ..., m ,                     находим высоты yi по формуле yi = ω i / 2 . График построенной гис-
                                  hi
                                                                               тограммы приведен на рис 2.2. Здесь же штриховой линией отмечен
где hi = zi +1 − zi – длина i-го частичного интервала. Если длина час-         предполагаемый график неизвестной плотности p (x ) .
тичных интервалов одинакова, то hi = h (см. (2.2), (2.3)).

                                          15                                                                            16