Статистический анализ данных. Денискина Е.А - 51 стр.

UptoLike

Рубрика: 

51
5611,0
3381,13725,1
0306,1
~~
~
~
=
=
=
Y
X
XY
XY
K
r
σσ
.
Анализ полученного выборочного коэффициента корреляции позволяет
выдвинуть следующую гипотезу: связь между случайными величинами не
очень тесная (значение выборочного коэффициента корреляции по модулю
значительно отличается от единицы). Так как выборочный коэффициент
корреляции отрицателен, то при возрастании одной случайной величины другая
имеет тенденцию в среднем убывать.
2.3. УРАВНЕНИЕ ЛИНЕЙНОЙ РЕГРЕССИИ
Пусть имеется n наблюдений случайного вектора
()
YX , . При этом
{}
n
xxxX ,,,
21
K= и
{}
n
yyyY ,,,
21
K= .
Будем считать одну из наблюдаемых величин
X неслучайной
(детерминированной). Действительно, при сопоставлении этих величин можно
отнести все случайные ошибки лишь к величине
Y . Тогда ошибка наблюдения
будет складываться из собственной случайной ошибки величины
Y и из
«ошибки сопоставления», возникающей из-за того, что с величиной
Y
сопоставляется не совсем то значение
X , которое имело место на самом деле.
Требуется по данным наблюдений подобрать функцию
)(
~
~
x
yy = ,
наилучшим образом описывающую истинную зависимость между случайными
величинами. Класс математических функций для описания связи двух
случайных величин достаточно широк (линейная, квадратичная, степенная,
показательная, логарифмическая). На практике предпочтение отдается простым
видам функций, так как они требуют меньшего объема наблюдений. Результаты
многих исследований подтверждают, что число наблюдений должно как
минимум в 7 раз
превышать число коэффициентов при переменной
x
в модели.
В модели линейной регрессии зависимость между величинами
X и Y
представляется в виде:
ii
yaxb=⋅ +, ni ,1= ,