Статистическое введение в распределенные вычислительные системы: статистика. Пархоменко А.В. - 12 стр.

UptoLike

Составители: 

Рубрика: 

для параметра а0
ост
0
2
0
σ
=
n
at
a
;
для параметра a1
хa
n
at
σ
σ
=
ост
1
2
1
,
где nобъем выборки;
=σ nyy /)(
2
ост
среднее квадратическое отклонение результативного признака у от вырав-
ненных значений
y
;
=σ nxx
x
/)(
2
или
2
2
=σ
n
x
n
x
x
среднее квадратическое отклонение факторного
признака х от общей средней
х .
Вычисленные по формулам значения сравнивают с критическими t, которые определяют по таблице Стьюдента с уче-
том принятого уровня значимости α и числом степеней свободы вариации γ = n – 2.
Параметр признается значимым при условии, если tрасч > tтабл.
Проверка адекватности регрессионной модели может быть дополнена корреляционным анализом. Для этого необходи-
мо определить тесноту корреляционной связи между переменными х и у. Теснота корреляционной связи, как и любой дру-
гой, может быть измерена эмпирическим корреляционным отношением ηэ, когда δ2 (межгрупповая дисперсия) характеризу-
ет отклонения групповых средних результативного признака от общей средней:
2
2
э
σ
δ
=η
.
Теоретическое корреляционное отношение η представляет собой относительную величину, получающуюся в результате сравнения
среднего квадратического отклонения выровненных значений результативного признака
x
y , т.е. рассчитанных по уравнению регрессии,
со средним квадратическим отклонением эмпирических (фактических) значений результативного признака у:
2
2
ост
2
2
ост
2
2
2
1
σ
σ
=
σ
σσ
=
σ
δ
=η
или
()
()
=η
2
2
1
yy
yy
x
.
Теоретическое корреляционное отношение применяется для измерения тесноты связи при линейной и криволинейной зависимостях
между результативным и факторным признаком. При криволинейных связях теоретическое корреляционное отношение называют индек-
сом корреляции R. Корреляционное отношение может находиться в пределах от 0 до 1, т.е. (0 < η< 1).
Кроме того, при линейной форме уравнения применяется другой показатель тесноты связилинейный коэффициент корреляции:
yx
xy
xyyx
r
σσ
=
=
∑∑
=
σσ
22
)()(
))(())((
yyxx
yyxx
n
yyxx
yx
,
где nчисло наблюдений.
Для практических вычислений при малом числе наблюдений, п < (20 – 30), линейный коэффициент корреляции удобнее определить
по следующей формуле:
() ()
.
2
2
2
2
=
∑∑
n
y
y
n
x
x
n
y
xxy
r
Он принимает значения в интервале: –1 < r < +1.
Отрицательные значения указывают на обратную связь, положительныена прямую.
Для оценки значимости коэффициента корреляции r используют t-критерий Стьюдента, который применяется при t-распределении,
отличном от нормального.
2
1
2
r
n
rt
r
=
,
где (n – 2) – число степеней свободы при заданном уровне значимости α и объеме выборки n.
После проверки адекватности, установления точности и надежности построенной модели ее необходимо проанализиро-
вать. Прежде всего, нужно проверить, согласуются ли знаки параметров с теоретическими представлениями о направлении
влияния признака-фактора на результативный признак (показатель).
Для удобства интерпретации параметра а1 используют коэффициент эластичности. Он показывает средние изменения
результативного признака при изменении факторного признака на 1 % и вычисляется по формуле, %:
y
x
a
i
x
i
1
Э =
.
Проверка адекватности всей модели осуществляется с помощью расчета F-критерия и величины средней ошибки
аппроксимации (
ε ).
Значение средней ошибки аппроксимации (
ε ), определяемой по формуле
=ε 100
1
...,,2,1
...,,2,1
k
k
y
yy
n
,
не должно превышать 12 – 15 %.