Теория статистического вывода - 8 стр.

UptoLike

Составители: 

8
где nобъем выборки, x
j
значение характеристики в середине j-го интер-
вала, n
j
частота: число наблюдений, заключенное в j-м интервале, m
число интервалов. Группировка данных приводит к некоторой неточности
расчета выборочного среднего, однако получаемой при этом погрешно-
стью при большом объеме выборки можно пренебречь.
Выборочная медиана х
0,5
является статистической оценкой медианы.
Она делит выборку на две равные части по количеству полученных значе-
ний. Для ее вычисления эмпирические данные необходимо представить в
виде вариационного ряда. При нечетном
объеме выборки выборочная ме-
диана равна среднему члену вариационного ряда, при четном
объеме вы-
боркисреднему арифметическому двух членов вариационного ряда, на-
ходящихся в его середине. Середина вариационного ряда находится по
формуле
2
1+n
, где nобъем выборки.
Статистическая оценка
модывыборочная мода х
0
. Она определяет-
ся как значение показателя, имеющего наибольшую частоту. Распределе-
ния с двумя модами называются бимодальными, с несколькими модами
полимодальными. Имеются соглашения об использовании моды:
1. Если все значения в выборке встречаются одинаково часто, то в
этом случае считается, что моды нет. Например, нет моды в распределении
5, 5, 16, 16, 29, 29.
2. Когда два соседних значен
ия имеют одинаковую частоту, которая
больше частоты любого другого значения, мода есть среднее этих двух
значений: в распределении 1, 1, 2, 2, 2, 3, 3, 3, 4 мода равна 2,5.
3. Если два несмежных значения имеют равные частоты, которые
больше частоты любого другого значения, то распределение является би-
модальным: распределение 10, 11, 11, 11, 12, 13, 14, 14, 14, 15 является би-
модальным с модами, равными 11 и 14.
Статистической оценкой
дисперсии является выборочная дисперсия
s
2
, которая вычисляется по формулам
()
=
==
n
i
ii
nxx
ndf
SS
s
1
2
2
1
1
или
()
=
==
2
11
2
2
1
1
1
n
i
ii
n
i
ii
nx
n
nx
n
s ,
где SSсумма квадратов, df = n – 1– число степеней свободы, nобъем
выборки, x
i
значения изучаемой характеристики,
x
выборочное сред-
нее, n
i
частоты.
В случае большого объема выборки (n > 50) эмпирические данные
предварительно систематизируются в виде вариационного ряда и группи-
руются. Выборочная дисперсия вычисляется по формулам
где n – объем выборки, xj – значение характеристики в середине j-го интер-
вала, nj – частота: число наблюдений, заключенное в j-м интервале, m –
число интервалов. Группировка данных приводит к некоторой неточности
расчета выборочного среднего, однако получаемой при этом погрешно-
стью при большом объеме выборки можно пренебречь.
       Выборочная медиана х0,5 является статистической оценкой медианы.
Она делит выборку на две равные части по количеству полученных значе-
ний. Для ее вычисления эмпирические данные необходимо представить в
виде вариационного ряда. При нечетном объеме выборки выборочная ме-
диана равна среднему члену вариационного ряда, при четном объеме вы-
борки – среднему арифметическому двух членов вариационного ряда, на-
ходящихся в его середине. Середина вариационного ряда находится по
           n +1
формуле          , где n – объем выборки.
             2
       Статистическая оценка моды – выборочная мода х0. Она определяет-
ся как значение показателя, имеющего наибольшую частоту. Распределе-
ния с двумя модами называются бимодальными, с несколькими модами –
полимодальными. Имеются соглашения об использовании моды:
       1. Если все значения в выборке встречаются одинаково часто, то в
этом случае считается, что моды нет. Например, нет моды в распределении
5, 5, 16, 16, 29, 29.
       2. Когда два соседних значения имеют одинаковую частоту, которая
больше частоты любого другого значения, мода есть среднее этих двух
значений: в распределении 1, 1, 2, 2, 2, 3, 3, 3, 4 мода равна 2,5.
       3. Если два несмежных значения имеют равные частоты, которые
больше частоты любого другого значения, то распределение является би-
модальным: распределение 10, 11, 11, 11, 12, 13, 14, 14, 14, 15 является би-
модальным с модами, равными 11 и 14.
       Статистической оценкой дисперсии является выборочная дисперсия
 2
s , которая вычисляется по формулам
                                  SS        1 n
                            s2 =        =      ∑ (xi − x )2 ⋅ ni
                                  df n − 1 i=1
или
                                1 ⎡ n                           ⎞ ⎤
                                                                 2

                        s =
                         2
                                 (     )
                              n − 1 ⎢⎣ i =1
                                             2    1⎛ n
                                     ⎢ ∑ x i ni − ⎜ ∑ x i ni ⎟ ⎥ ,
                                                  n ⎝ i =1      ⎠ ⎥⎦
где SS – сумма квадратов, df = n – 1– число степеней свободы, n – объем
выборки, xi – значения изучаемой характеристики, x – выборочное сред-
нее, ni – частоты.
       В случае большого объема выборки (n > 50) эмпирические данные
предварительно систематизируются в виде вариационного ряда и группи-
руются. Выборочная дисперсия вычисляется по формулам
                                           8