Статистическое введение в распределенные вычислительные системы: статистика. Пархоменко А.В. - 9 стр.

UptoLike

Составители: 

Рубрика: 

Характеристики вариационного ряда
Мода (Мо) – значение признака, наиболее часто встречающееся в исследуемой совокупности.
Медианой (Me) называется значение признака, приходящееся на середину ранжированной (упорядоченной) совокупно-
сти.
Свойство медианы заключается в том, что сумма абсолютных отклонений значений признака от медианы меньше, чем
от любой другой величины:
Y |хiМе| = min.
Для определения медианы необходимо провести ранжирование. Если ранжированный ряд включает четное число еди-
ниц, то медиана определяется как средняя из двух центральных значений.
Для определения медианного значения признака по следующей формуле находят номер медианной единицы ряда
(NМе):
2
1
е
+
=
Μ
n
Ν
,
где nобъем совокупности.
В отличие от дискретных вариационных рядов определение моды и медианы по интервальным радам требует проведе-
ния определенных расчетов по следующим формулам:
)()(
)(
Мо
1МоМо1МоМо
1МоМо
0
+
+
+=
ffff
ff
ix
,
где x0 – нижняя граница модального интервала (модальным называется интервал, имеющий наибольшую частоту); iвеличина модально-
го интервала; fMочастота модального интервала; fМо – 1 частота интервала, предшествующего модальному; fМо + 1 частота интер-
вала, следующего за модальным.
Me
1Me
0
2
1
Me
f
Sf
ix
i
+=
,
где х0 – нижняя граница медианного интервала (медианным называется первый интервал, накопленная частота которого превышает поло-
вину общей суммы частот); iвеличина медианного интервала; SМе – 1 – накопленная частота интервала, предшествующего медианному;
fМечастота медианного интервала.
Моду и медиану в интервальном ряду можно определить графически. Мода определяется по гистограмме распределения. Для этого
выбирается самый высокий прямоугольник, который является в данном случае модальным. Затем правую вершину модального прямо-
угольника соединяем с правым верхним углом предыдущего прямоугольника, а левую вершину модального прямоугольникас левым
верхним углом последующего прямоугольника. Далее из точки их пересечения опускают перпендикуляр на ось абсцисс.
Абсцисса точки пересечения этих прямых и будет модой распределения. Медиана рассчитывается по кумуляте. Для ее определения
из точки на шкале накопленных частот (частостей), соответствующей 50 %, проводится прямая, параллельная оси абсцисс, до пересечения
с кумулятой. Затем из точки пересечения указанной прямой с кумулятой опускается перпендикуляр на ось абсцисс. Абсцисса точки пере-
сечения является медианой.
Аналогично с нахождением медианы в вариационных рядах распределения можно отыскать квартили.
Квартили представляют собой значения признака, делящие ранжированную совокупность на четыре равновеликие части. Различают
квартиль нижний (Q1), отделяющий ј часть совокупности с наименьшими значениями признака, и квартиль верхний (Q3), отсекающий ј
часть с наибольшими значениями признака. Это означает, что 25 % единиц совокупности будут меньше по величине Q1; 25 % единиц бу-
дут заключены между Q1 и Q2; 25 % – между Q2 и Q3 и остальные 25 % превосходят Q3. Средним квартилем Q2 является медиана.
Для расчета квартилей по интервальному вариационному ряду используются формулы:
1
1
1
1
1
4
1
Q
Q
Q
f
Sf
iXQ
+=
;
3
3
3
1
3
4
3
Q
Q
Q
f
Sf
iXQ
+=
,
где
1
Q
X
нижняя граница интервала, содержащего нижний квартиль (интервал определяется по накопленной частоте, первой превы-
шающей 25 %);
3
Q
X
нижняя граница интервала, содержащего верхний квартиль (интервал определяется по накопленной частоте, пер-
вой превышающей 75 %); iвеличина интервала;
1
1
Q
S
накопленная частота интервала, предшествующего интервалу, содержащему
нижний квартиль;
1
3
Q
S
то же для верхнего квартиля;
1
Q
f
частота интервала, содержащего нижний квартиль;
3
Q
f
то же для верх-
него квартиля.
Понятие о закономерности распределения
В статистике существует определенная зависимость между изменением значений варьирующего признака и частот.
Частоты в этих рядах с увеличением значения варьирующего признака первоначально увеличиваются, а затем после дости-
жения какой-то максимальной величины в середине ряда уменьшаются. Это свидетельствует о том, что частоты в вариаци-
онных рядах изменяются закономерно в связи с изменением варьирующего признака. Такие закономерности изменения час-
тот в вариационных рядах называются закономерностями распределения.
Имея дело с эмпирическим распределением, можно предположить, что данному распределению соответствует опреде-
ленная, характерная для него теоретическая кривая. Выдвинув гипотезу о той или иной форме распределения, стремятся
описать эмпирический ряд с помощью математической модели, выражающей некоторый теоретический закон распределе-
ния. Среди различных кривых распределения особое место занимает нормальное распределение.