Теория вероятностей и математическая статистика. Соппа М.С - 20 стр.

UptoLike

Составители: 

41
Глава 2. МАТЕМАТИЧЕСКАЯ СТАТИСТИКА
2.1. Основные понятия математической статистики
В теории вероятностей основная задача заключалась в том,
что по известной функции распределения
F(x) и функции плот-
ности вероятности
p(x) требовалось вычислить вероятность по-
падания значений случайной величины на заданный интервал
],[
β
α
: Р(Х ],[
β
α
). Однако на практике для реальных случай-
ных величин эти функции не всегда известны. Основными зада-
чами математической статистики, в частности, являются:
1. Собрать и сгруппировать данные наблюдений (измере-
ний), проведенных над случайной величиной
Х.
2. По этим данным приближенно определить функцию рас-
пределения
F(x), функцию плотности вероятности p(x) и другие
важнейшие характеристики исследуемой случайной величины
Х.
При этом необходимо дать оценку достоверности и возможной
погрешности полученных результатов.
Соответствие терминологии в теории вероятностей и мате-
матической статистике.
Теория
вероятностей
Математическая
статистика
Приближенные аналоги
в математической
статистике
Хслучайная
величина
Хгенеральная
совокупность
М(Х) – математи-
ческое ожидание
г
х генераль-
ное с
р
еднее
в
х выборочное
с
р
еднее
D(Х) – дисперсия D
г
генераль-
ная дисперсия
D
в
выборочная
дисперсия
Рвероятность то же Wотносительная
частота
F(x) – функция
распределения
то же F
*
(x)эмпирическая
функция распределения
p(x) – плотность
вероятности
то же
)(
~
хр гистограмма
относительных частот
xy
r коэффициент
коррел
я
ции
то же
вxy
r выборочный ко-
эффициент коррел
я
ции
42
Выборкой (х
1
, х
2
,, х
n
) объема n называется результат n на-
блюдений (измерений), проведенных над исследуемой случай-
ной величиной (генеральной совокупностью)
Х.
К выборкам в математической статистике предъявляется
требование
репрезентативности (представительности). Это оз-
начает, что
должен быть обеспечен полностью
случайный выбор n
значений;
выборка должна иметь достаточно большой объем (жела-
тельно,
n > 40–50).
Приемы обработки выборок
1. Ранжирование упорядочение элементов выборки в по-
рядке возрастания. Одинаковые значения повторно включаются
в ранжированный ряд.
2. Чтобы избежать дальнейших громоздких действий с вы-
боркой, строится
группированный статистический ряд:
определяется диапазон выборки
[
x
min
, x
max
];
находится шаг разбиения
5
minmax
xx
h
=
;
вычисляются границы интервалов (с точностью не менее
трех знаков после запятой):
z
0
= x
min
, z
1
= z
0
+ h, z
2
= z
1
+ h, z
3
= z
2
+ h;
z
4
= z
3
+ h, z
5
= z
4
+ h ~
max
x
;
находятся значения середин интервалов
2
1
*
ii
i
zz
z
+
=
,
i = 1, ..., 5, :
2/)(
10
*
1
zzz += , 2/)(
21
*
2
zzz += , 2/)(
32
*
3
zzz += ,
2/)(
43
*
4
zzz += , 2/)(
54
*
5
zzz += .
Графическое представление проведенного разбиения диапа-
зона выборки на интервалы:
       Глава 2. МАТЕМАТИЧЕСКАЯ СТАТИСТИКА                                  Выборкой (х1, х2, …, хn) объема n называется результат n на-
                                                                       блюдений (измерений), проведенных над исследуемой случай-
     2.1. Основные понятия математической статистики                   ной величиной (генеральной совокупностью) Х.
                                                                           К выборкам в математической статистике предъявляется
      В теории вероятностей основная задача заключалась в том,
что по известной функции распределения F(x) и функции плот-            требование репрезентативности (представительности). Это оз-
ности вероятности p(x) требовалось вычислить вероятность по-           начает, что
падания значений случайной величины на заданный интервал                   – должен быть обеспечен полностью случайный выбор n
[α , β ] : Р(Х ∈ [α , β ] ). Однако на практике для реальных случай-   значений;
ных величин эти функции не всегда известны. Основными зада-                – выборка должна иметь достаточно большой объем (жела-
чами математической статистики, в частности, являются:                 тельно, n > 40–50).
      1. Собрать и сгруппировать данные наблюдений (измере-
ний), проведенных над случайной величиной Х.                                                     Приемы обработки выборок
      2. По этим данным приближенно определить функцию рас-                 1. Ранжирование – упорядочение элементов выборки в по-
пределения F(x), функцию плотности вероятности p(x) и другие           рядке возрастания. Одинаковые значения повторно включаются
важнейшие характеристики исследуемой случайной величины Х.             в ранжированный ряд.
При этом необходимо дать оценку достоверности и возможной                   2. Чтобы избежать дальнейших громоздких действий с вы-
погрешности полученных результатов.                                    боркой, строится группированный статистический ряд:
      Соответствие терминологии в теории вероятностей и мате-               – определяется диапазон выборки
матической статистике.                                                                                           [xmin, xmax];
           Теория             Математическая Приближенные аналоги           – находится шаг разбиения
        вероятностей             статистика        в математической                                                x − xmin
                                                        статистике                                             h = max             ;
                                                                                                                          5
    Х – случайная             Х – генеральная                –
                                                                            – вычисляются границы интервалов (с точностью не менее
    величина                  совокупность
                                                                       трех знаков после запятой):
    М(Х) – математи-          х г – генераль-   х в – выборочное
    ческое ожидание                                                                 z0 = xmin, z1 = z0 + h, z2 = z1 + h, z3 = z2 + h;
                              ное среднее      среднее                             z4 = z3 + h, z5 = z4 + h ~ xmax ;
    D(Х) – дисперсия Dг – генераль-            Dв – выборочная
                              ная дисперсия    дисперсия                                                                                             z +z
                                                                            – находятся значения середин интервалов zi* = i −1 i ,
    Р – вероятность           то же            W – относительная                                                                                       2
                                               частота                 i = 1, ..., 5, :
    F(x) – функция            то же            F*(x) – эмпирическая          z1* = ( z0 + z1 ) / 2 , z2* = ( z1 + z2 ) / 2 , z3* = ( z2 + z3 ) / 2 ,
    распределения                              функция распределения
    p(x) – плотность          то же             ~
                                                р ( х) – гистограмма        z4* = ( z3 + z4 ) / 2 , z5* = ( z4 + z5 ) / 2 .
    вероятности                                относительных частот        Графическое представление проведенного разбиения диапа-
     rxy – коэффициент то же                   rвxy – выборочный ко-   зона выборки на интервалы:
    корреляции                                 эффициент корреляции
                                41                                                                            42