Анализ данных. Салмин А.А. - 54 стр.

UptoLike

Составители: 

54
Рис. 5.1. Подогнанная линия регрессии
5.2.2. Подгонка линии регрессии
При подгонке линии к данным предполагается, что
данные удовлетворяют следующей линейной модели:
xy
где
«истинное» пересечение;
«истинный» наклон;
ошибка.
При подгонке линии предпринимается попытка
оценить
и
, значения которых на самом деле не
известны. Оценочные значения
и
обозначаются
соответственно a и b, а предсказываемые значения
переменной у символом
y
:
bxay
.
Для оценки
и
используются такие a и b, для
которых сумма квадратов остатков принимает наименьшее
значение. Т.е. если у
i
это наблюдаемое значение
переменной у, то a и b должны быть такими, чтобы
следующее выражение имело минимальное значение:
n
=i
ii
yy=остатковквадратовсумма
1
2
__ .
Эта процедура называется методом наименьших
квадратов. Для вычисления таких значений a и b, которые
     Рис. 5.1. Подогнанная линия регрессии


     5.2.2. Подгонка линии регрессии
    При подгонке линии к данным предполагается, что
данные удовлетворяют следующей линейной модели:
     y    x  
     где  — «истинное» пересечение;
         — «истинный» наклон;
         — ошибка.
     При подгонке линии предпринимается попытка
оценить  и , значения которых на самом деле не
известны. Оценочные значения  и  обозначаются
соответственно a и b, а предсказываемые значения
переменной у — символом y :
      y  a  bx .
     Для оценки  и  используются такие a и b, для
которых сумма квадратов остатков принимает наименьшее
значение. Т.е. если уi — это наблюдаемое значение
переменной у, то a и b должны быть такими, чтобы
следующее выражение имело минимальное значение:
                                        n
                                                  2
     сумма _ квадратов _ остатков =   y i  y i  .
                                        i=1
     Эта процедура называется методом наименьших
квадратов. Для вычисления таких значений a и b, которые

54