Математическая статистика. Плотникова С.В. - 13 стр.

UptoLike

Составители: 

В естественных науках часто идет речь о функциональной зависимости, когда каждому значению
одной переменной соответствует вполне определенное значение другой переменной. Однако на практи-
ке между переменными величинами существуют зависимости, когда каждому значению одной пере-
менной может соответствовать множество значений другой переменной, имеющее определенное рас-
пределение. Такая зависимость называется статистической.
Статистические связи между переменными можно изучать методами корреляционного и регресси-
онного анализа. Основной задачей регрессионного анализа является установление формы и изучение
зависимости между переменными, корреляционного анализа выявление связи между случайными пе-
ременными и оценка ее тесноты.
В регрессионном анализе рассматривается зависимость случайного результативного признака y от
неслучайных факторных признаков x
1
, x
2
, ..., x
n
. В случае единственного факторного признака x уравнение
взаимосвязи двух переменных может быть представлено в виде
y = φ(x) + ε,
где ε – случайная величина, причем предполагается, что М(ε) = 0, а дисперсия постоянна и не зависит от
х. Переменную ε называют возмущающей переменной или просто возмущением.
В зависимости от вида функции φ(x) различают следующие виды регрессий: линейную, гиперболи-
ческую, показательную, степенную, логарифмическую, параболическую и т.д.
Предположим, что для оценки параметров регрессии взята выборка, содержащая n пар значений (x
i
,
y
i
), где i = 1, 2, , n. Оценкой предложенных выше уравнений регрессии являются выборочные уравне-
ния регрессии:
линейное ;
10
xaay +=
)
гиперболическое ;/
10
xaay
+
=
)
показательное ;
10
x
aay =
)
степенное ;
1
0
a
xay =
)
логарифмическое ;ln
10
xaay +=
)
параболическое
,
2
210
xaxaay ++=
)
где параметры a
0
, a
1
, a
2
являются точечными оценками соответствующих параметров исходного урав-
нения и могут быть найдены на основе метода наименьших квадратов.
Сущность метода наименьших квадратов заключается в нахождении параметров модели a
0
, a
1
, при
которых минимизируется сумма квадратов отклонений эмпирических (фактических) значений результа-
тивного признака от теоретических, полученных по выборочному уравнению регрессии
min)(
2
=
ii
yyS
)
.
Для линейной модели
min)(
2
10
=
ii
xaayS . (4.1)
Функция двух переменных S(a
0
, a
1
) может достигнуть экстремума в том случае, когда ее частные
производные равны нулю. Вычисляя эти частные производные, получим систему уравнений для нахо-
ждения параметров
10
, aa линейного уравнения регрессии xaay
10
+
=
)
=+
=+
∑∑
.
;
2
10
10
iiii
ii
yxxaxa
yxana
(4.2)
В случае, когда возмущающая переменная ε имеет нормальное распределение, коэффициенты a
0
, a
1
,
полученные методом наименьших квадратов для линейной регрессии, являются несмещенными эффек-
тивными оценками параметров α
0
, α
1
исходного уравнения.
Для параболического уравнения регрессии
2
21
0
xaxaay ++=
)
система уравнений для нахождения па-
раметров a
0
, a
1
, a
2
имеет вид