Составители:
Рубрика:
15 16
Напомним, что
)(
*
xF
n
равна относительной частоте появления со-
бытия
}{ xXA
<
= и, следовательно, при любом значении
x
величи-
на
)(
*
xF
n
является случайной. Тогда конкретной выборке
)...,,,(
21 n
xxx объема n соответствует функция распределения
)(
*
xF
n
, которая в силу своей случайности будет отличаться от )(
*
xF
n
,
построенной по другой выборке из той же генеральной совокупности.
Возникает вопрос: зачем нужна такая характеристика, меняющаяся
от выборки к выборке. Ответ получаем на основе следующих рассужде-
ний.
По теореме Бернулли относительная частота появления события
A
в
n
независимых опытах сходится по вероятности к вероятности
)( xXP <
этого события при увеличении n . Следовательно, при
больших объемах выборки выборочная функция распределения
)(
*
xF
n
близка к теоретической функции
)(xF . Точнее имеет место следую-
щая теорема.
Теорема В.И. Гливенко. Для любого действительного числа
x
и
любого
0>
ε
0))()((lim
*
=>−
∞→
ε
xFxFP
n
n
.
Таким образом, по функции
)(
*
xF
n
мы можем получить прибли-
женно функцию
)(xF , т.е. функция )(
*
xF
n
является оценкой )(xF .
В качестве оценки плотности распределения вероятности непрерыв-
ной случайной величины используют гистограмму относительных
частот.
Гистограммой относительных частот называется система прямо-
угольников, каждый из которых основанием имеет i-й интервал интер-
вального вариационного ряда; площадь, равную относительной частоте
i
ω
, а высота
i
y определяется по формуле
mi
h
y
i
i
i
...,,2,1, ==
ω
,
где
iii
zzh −=
+1
– длина i-го частичного интервала. Если длина час-
тичных интервалов одинакова, то
hh
i
= (см. (2.2), (2.3)).
Очевидно, что сумма площадей всех прямоугольников равна 1 (дока-
жите это свойство).
Площадь прямоугольника
i
ω
равна относительной частоте попада-
ния элементов выборочной совокупности объема
n
на i-й интервал т.е.
)(
1
*
+
<≤=
iini
zXz
ωω
.
С другой стороны, если
)(xpy
=
– плотность вероятности случай-
ной величины
X
, то вероятность
)(
1+
<
≤
=
iii
zXzPp
по теореме Бернулли близка при большом значении
n
к относительной
частоте.
Поэтому значение
i
ω
близко к
∫
+
=<≤=
+
1
)()(
1
i
i
z
z
iii
dxxpzXzPp . (2.7)
Пусть
i
y – высота i-го прямоугольника. По теореме о среднем инте-
грал, выражающий вероятность в формуле (2.7), можно записать в виде
)u(p)zz(dx)x(pp
iii
z
z
i
i
i
⋅−=
∫
=
+
+
1
1
, (2.8)
где
i
u – некоторое число из промежутка ),[
1−ii
zz . Так как
iiii
yzz )(
1
−
=
+
ω
, то значения
i
y и )(
i
up близки друг к другу.
Практически это означает, что график плотности распределения гене-
ральной совокупности
X
проходит вблизи верхних границ прямо-
угольников, образующих гистограмму. Поэтому при больших объемах
выборок и удачном выборе длины частичных интервалов гистограмма
напоминает график плотности распределения
)(xp
.
♦Пример 2.5. Построим гистограмму относительных частот выбо-
рочной совокупности из примера 2.3.
Решение. Используя интервальный вариационный ряд (см. табл. 2.2),
находим высоты
i
y по формуле 2/
ii
y
ω
=
. График построенной гис-
тограммы приведен на рис 2.2. Здесь же штриховой линией отмечен
предполагаемый график неизвестной плотности
)(xp .
* Очевидно, что сумма площадей всех прямоугольников равна 1 (дока- Напомним, что Fn ( x ) равна относительной частоте появления со- жите это свойство). бытия A = { X < x} и, следовательно, при любом значении x величи- Площадь прямоугольника ω i равна относительной частоте попада- на Fn* ( x ) является случайной. Тогда конкретной выборке ния элементов выборочной совокупности объема n на i-й интервал т.е. ( x1 , x2 , ..., xn ) объема n соответствует функция распределения ω i = ω n* ( zi ≤ X < zi +1 ) . С другой стороны, если y = p (x ) – плотность вероятности случай- Fn* ( x ) , которая в силу своей случайности будет отличаться от Fn* ( x ) , ной величины X , то вероятность построенной по другой выборке из той же генеральной совокупности. Возникает вопрос: зачем нужна такая характеристика, меняющаяся pi = P( zi ≤ X < zi +1 ) от выборки к выборке. Ответ получаем на основе следующих рассужде- ний. по теореме Бернулли близка при большом значении n к относительной частоте. По теореме Бернулли относительная частота появления события A в n независимых опытах сходится по вероятности к вероятности Поэтому значение ωi близко к P( X < x ) этого события при увеличении n . Следовательно, при z i +1 * больших объемах выборки выборочная функция распределения Fn ( x ) pi = P( zi ≤ X < zi +1 ) = ∫ p( x )dx . (2.7) zi близка к теоретической функции F ( x ) . Точнее имеет место следую- щая теорема. Пусть yi – высота i-го прямоугольника. По теореме о среднем инте- Теорема В.И. Гливенко. Для любого действительного числа x и грал, выражающий вероятность в формуле (2.7), можно записать в виде любого ε > 0 zi +1 pi = ∫ p( x )dx = ( zi +1 − zi ) ⋅ p( ui ) , (2.8) lim P( Fn* ( x ) − F ( x ) > ε ) = 0 . zi n→∞ * где ui – некоторое число из промежутка [ zi , zi −1 ) . Так как Таким образом, по функции Fn ( x ) мы можем получить прибли- ω i = ( zi +1 − zi ) yi , то значения yi и p(u i ) близки друг к другу. * женно функцию F (x ) , т.е. функция Fn ( x ) является оценкой F (x ) . Практически это означает, что график плотности распределения гене- В качестве оценки плотности распределения вероятности непрерыв- ральной совокупности X проходит вблизи верхних границ прямо- ной случайной величины используют гистограмму относительных угольников, образующих гистограмму. Поэтому при больших объемах частот. выборок и удачном выборе длины частичных интервалов гистограмма Гистограммой относительных частот называется система прямо- напоминает график плотности распределения p (x ) . угольников, каждый из которых основанием имеет i-й интервал интер- ♦Пример 2.5. Построим гистограмму относительных частот выбо- вального вариационного ряда; площадь, равную относительной частоте рочной совокупности из примера 2.3. ω i , а высота yi определяется по формуле ωi Решение. Используя интервальный вариационный ряд (см. табл. 2.2), yi = , i = 1,2, ..., m , находим высоты yi по формуле yi = ω i / 2 . График построенной гис- hi тограммы приведен на рис 2.2. Здесь же штриховой линией отмечен где hi = zi +1 − zi – длина i-го частичного интервала. Если длина час- предполагаемый график неизвестной плотности p (x ) . тичных интервалов одинакова, то hi = h (см. (2.2), (2.3)). 15 16
Страницы
- « первая
- ‹ предыдущая
- …
- 6
- 7
- 8
- 9
- 10
- …
- следующая ›
- последняя »