Составители:
Рубрика:
41
Глава 2. МАТЕМАТИЧЕСКАЯ СТАТИСТИКА
2.1. Основные понятия математической статистики
В теории вероятностей основная задача заключалась в том,
что по известной функции распределения
F(x) и функции плот-
ности вероятности
p(x) требовалось вычислить вероятность по-
падания значений случайной величины на заданный интервал
],[
β
α
: Р(Х ],[
β
α
∈ ). Однако на практике для реальных случай-
ных величин эти функции не всегда известны. Основными зада-
чами математической статистики, в частности, являются:
1. Собрать и сгруппировать данные наблюдений (измере-
ний), проведенных над случайной величиной
Х.
2. По этим данным приближенно определить функцию рас-
пределения
F(x), функцию плотности вероятности p(x) и другие
важнейшие характеристики исследуемой случайной величины
Х.
При этом необходимо дать оценку достоверности и возможной
погрешности полученных результатов.
Соответствие терминологии в теории вероятностей и мате-
матической статистике.
Теория
вероятностей
Математическая
статистика
Приближенные аналоги
в математической
статистике
Х – случайная
величина
Х – генеральная
совокупность
–
М(Х) – математи-
ческое ожидание
г
х – генераль-
ное с
р
еднее
в
х – выборочное
с
р
еднее
D(Х) – дисперсия D
г
– генераль-
ная дисперсия
D
в
– выборочная
дисперсия
Р – вероятность то же W – относительная
частота
F(x) – функция
распределения
то же F
*
(x) – эмпирическая
функция распределения
p(x) – плотность
вероятности
то же
)(
~
хр – гистограмма
относительных частот
xy
r – коэффициент
коррел
я
ции
то же
вxy
r – выборочный ко-
эффициент коррел
я
ции
42
Выборкой (х
1
, х
2
, …, х
n
) объема n называется результат n на-
блюдений (измерений), проведенных над исследуемой случай-
ной величиной (генеральной совокупностью)
Х.
К выборкам в математической статистике предъявляется
требование
репрезентативности (представительности). Это оз-
начает, что
– должен быть обеспечен полностью
случайный выбор n
значений;
– выборка должна иметь достаточно большой объем (жела-
тельно,
n > 40–50).
Приемы обработки выборок
1. Ранжирование – упорядочение элементов выборки в по-
рядке возрастания. Одинаковые значения повторно включаются
в ранжированный ряд.
2. Чтобы избежать дальнейших громоздких действий с вы-
боркой, строится
группированный статистический ряд:
– определяется диапазон выборки
[
x
min
, x
max
];
– находится шаг разбиения
5
minmax
xx
h
−
=
;
– вычисляются границы интервалов (с точностью не менее
трех знаков после запятой):
z
0
= x
min
, z
1
= z
0
+ h, z
2
= z
1
+ h, z
3
= z
2
+ h;
z
4
= z
3
+ h, z
5
= z
4
+ h ~
max
x
;
– находятся значения середин интервалов
2
1
*
ii
i
zz
z
+
=
−
,
i = 1, ..., 5, :
2/)(
10
*
1
zzz += , 2/)(
21
*
2
zzz += , 2/)(
32
*
3
zzz += ,
2/)(
43
*
4
zzz += , 2/)(
54
*
5
zzz += .
Графическое представление проведенного разбиения диапа-
зона выборки на интервалы:
Глава 2. МАТЕМАТИЧЕСКАЯ СТАТИСТИКА Выборкой (х1, х2, …, хn) объема n называется результат n на- блюдений (измерений), проведенных над исследуемой случай- 2.1. Основные понятия математической статистики ной величиной (генеральной совокупностью) Х. К выборкам в математической статистике предъявляется В теории вероятностей основная задача заключалась в том, что по известной функции распределения F(x) и функции плот- требование репрезентативности (представительности). Это оз- ности вероятности p(x) требовалось вычислить вероятность по- начает, что падания значений случайной величины на заданный интервал – должен быть обеспечен полностью случайный выбор n [α , β ] : Р(Х ∈ [α , β ] ). Однако на практике для реальных случай- значений; ных величин эти функции не всегда известны. Основными зада- – выборка должна иметь достаточно большой объем (жела- чами математической статистики, в частности, являются: тельно, n > 40–50). 1. Собрать и сгруппировать данные наблюдений (измере- ний), проведенных над случайной величиной Х. Приемы обработки выборок 2. По этим данным приближенно определить функцию рас- 1. Ранжирование – упорядочение элементов выборки в по- пределения F(x), функцию плотности вероятности p(x) и другие рядке возрастания. Одинаковые значения повторно включаются важнейшие характеристики исследуемой случайной величины Х. в ранжированный ряд. При этом необходимо дать оценку достоверности и возможной 2. Чтобы избежать дальнейших громоздких действий с вы- погрешности полученных результатов. боркой, строится группированный статистический ряд: Соответствие терминологии в теории вероятностей и мате- – определяется диапазон выборки матической статистике. [xmin, xmax]; Теория Математическая Приближенные аналоги – находится шаг разбиения вероятностей статистика в математической x − xmin статистике h = max ; 5 Х – случайная Х – генеральная – – вычисляются границы интервалов (с точностью не менее величина совокупность трех знаков после запятой): М(Х) – математи- х г – генераль- х в – выборочное ческое ожидание z0 = xmin, z1 = z0 + h, z2 = z1 + h, z3 = z2 + h; ное среднее среднее z4 = z3 + h, z5 = z4 + h ~ xmax ; D(Х) – дисперсия Dг – генераль- Dв – выборочная ная дисперсия дисперсия z +z – находятся значения середин интервалов zi* = i −1 i , Р – вероятность то же W – относительная 2 частота i = 1, ..., 5, : F(x) – функция то же F*(x) – эмпирическая z1* = ( z0 + z1 ) / 2 , z2* = ( z1 + z2 ) / 2 , z3* = ( z2 + z3 ) / 2 , распределения функция распределения p(x) – плотность то же ~ р ( х) – гистограмма z4* = ( z3 + z4 ) / 2 , z5* = ( z4 + z5 ) / 2 . вероятности относительных частот Графическое представление проведенного разбиения диапа- rxy – коэффициент то же rвxy – выборочный ко- зона выборки на интервалы: корреляции эффициент корреляции 41 42
Страницы
- « первая
- ‹ предыдущая
- …
- 18
- 19
- 20
- 21
- 22
- …
- следующая ›
- последняя »