Математическая статистика. Крашенинников В.Р - 5 стр.

UptoLike

- 5 -
1.2. Выборка. Вариационный ряд. Группированная выборка.
Предположим, что исследуется некоторое явление, описываемое двумя
количественными признаками
X и Y, которые буем считать случайными
величинами. Требуется на основании ряда наблюдений охарактеризовать
X и Y,
а также оценить связь между ними.
Статистическое исследование начинается со сбора данных. Для этого
производится
n опытов (наблюдений), результаты которых регистрируются.
Если
(x
i
, y
i
) значения X и Y, полученные в iм опыте, то получаем
последовательность:
(x
1
, y
1
) , (x
2
, y
2
) , …... , (x
n
, y
n
), (1.1)
называемую выборкой. Число опытов
n называется объёмом выборки.
Выборка является исходным материалом для всех дальнейших статистических
выводов о случайных величинах
X и Y.
Для начала будем исследовать
X и Y по отдельности, поэтому
сформируем из совместной выборки (1.1) две выборки для
X и Y раздельно:
x
1
, x
2
, … , x
n
, (1.2)
y
1
, y
2
, … , y
n
, (1.3)
На этом этапе обе выборки будут обрабатываться совершенно одинаково,
поэтому рассмотрим только случайную величину
X и её выборку (1.2).
Если элементы выборки (1.2) записать в порядке их возрастания, то
полученная последовательность будет называться
вариационным рядом.
Вариационный ряд значительно удобнее для дальнейшей обработки, чем
неупорядоченная (простая) выборка (1.2).
При большом объёме
n простая выборка и вариационный ряд становятся
очень громоздкими и мало наглядными. Для придания им большей наглядности
и компактности производится группировка данных. Для этого весь интервал
значений выборки разбивают на
k частичных интервалов или разрядов и
подсчитывают число
m
i
значений выборки, попавших в каждый iй разряд
ii+1
[a , a ) . Значение x
g
относится к i му интервалу, если
i
g
i+1
ax<a . Числа m
i
называются частотами. Результат этой группировки сводится в таблицу 1,
называемую
группированной выборкой. Первые три колонки этой таблицы и
представляют нашу группированную выборку. В дальнейшем нам также
понадобятся
представители интервалов
(
)
2
iii+1
zaa
=
+ , то есть средние
точки интервалов, относительные частоты
ii
pmn
= и плотности
относительных частот
(
)
ii i+1i
fmna a
=−
. Для контроля правильности
вычислений следует проверить равенства:
1
K
i
i
mn
=
=
;
1
1
K
i
i
p
=
=
.