Статистическое введение в распределенные вычислительные системы: статистика. Пархоменко А.В. - 8 стр.

UptoLike

Составители: 

Рубрика: 

где
i
x и niсоответственно групповые средние и численности по отдельным группам.
Внутригрупповая дисперсия (
2
i
y
) отражает случайную вариацию, т.е. часть вариации, происходящую под влиянием не-
учтенных факторов и не зависящую от признака-фактора, положенного в основание группировки.
=σ
i
ii
i
n
nxx
2
2
)(
.
Средняя из внутригрупповых дисперсий (
2
i
σ
):
σ
=σ
i
ii
i
n
n
2
2
.
Существует закон, связывающий три вида дисперсии. Общая дисперсия равна сумме средней из внутригрупповых и межгрупповой
дисперсий:
222
xi
δ+σ=σ
.
Данное соотношение называют правилом сложения дисперсий.
В статистическом анализе широко используется показатель, представляющий собой долю межгрупповой дисперсии в
общей дисперсии. Он носит название
эмпирического коэффициента детерминации (η2):
2
2
2
σ
δ
=η
x
.
Этот коэффициент показывает долю общей вариации изучаемого признака, обусловленную вариацией группировочного
признака.
Корень квадратный из эмпирического коэффициента детерминации носит название
эмпирического корреляционного
отношения
(η):
2
2
σ
δ
=η
x
.
Оно характеризует влияние признака, положенного в основание группировки, на вариацию результативного признака.
Эмпирическое корреляционное отношение изменяется в пределах от 0 до 1.
Наряду с вариацией индивидуальных значений признака вокруг средней может наблюдаться и вариация индивидуаль-
ных долей признака вокруг средней доли.
Внутригрупповая дисперсия доли определяется по формуле
)1(
2
iip
pp
i
=σ
.
Средняя из внутригрупповых дисперсий:
()
==σ
i
iii
iip
n
npp
pp
i
)1(
1
2
.
Формула межгрупповой дисперсии имеет следующий вид:
=δ
i
ii
p
n
npp
i
2
2
)(
,
где niчисленность единиц в отдельных группах; рдоля изучаемого признака во всей совокупности, которая определяется по формуле
=
i
ii
n
np
p
.
Общая дисперсия определяется по формуле
)1(
2
pp
p
=σ
.
Три вида дисперсии связаны между собой следующим образом:
222
ii
ppp
δ+σ=σ
.
Это соотношение дисперсий называется теоремой сложения дисперсии доли признака.