Теория вероятностей и математическая статистика. Блатов И.А - 224 стр.

UptoLike

224
ss
R
=
n
i
i
)yy(
1
2
означает величину разброса, которая
обусловлена регрессией (ненулевым значением наклона
b
).
ss
E
=
n
i
ii
)yy(
1
2
означает разброс за счет случайных
отклонений от функции регрессии.
Оказывается,
ssssss
ERT
,
- полный разброс равен сумме разбросов за счет регрессии и
за счет случайных отклонений.
Величина
ss
ss
T
R
это доля вариации значений
,
обусловленной регрессией (т.е. доля закономерной
изменчивости в общей изменчивости).
Определение Коэффициент детерминации статистика
ss
ss
ss
ss
T
E
T
R
R
1
2
показывающая, какая доля дисперсии результативного признака
объясняется влиянием объясняющих переменных.
Если
0
2
R
, это означает, что регрессия ничего не дает, т.е.
знание
x
не улучшает предсказания для y по сравнению с
тривиальным
yy
i
. Другой крайний случай
1
2
R
означает
точную подгонку: все точки наблюдений лежат на
регрессионной прямой. Чем ближе к 1 значение
2
R
, тем лучше
качество подгонки. Линейная регрессия имеет следующие
общие свойства:
1. Чем ближе значение коэффициента детерминации к 1,
тем ближе модель к эмпирическим наблюдениям.
2. С увеличением количества объясняющих переменных
увеличивается R
2
.
          n
                
    Rss =  ( yi  y )
                              2
                                  означает величину разброса, которая
         i 1
                                                               
обусловлена регрессией (ненулевым значением наклона            b ).
          n
                          
    Ess =  ( yi  yi )
                              2
                                  означает разброс за счет случайных
         i 1
отклонений от функции регрессии.
   Оказывается,
                                  Tss  Rss  E ss ,
    - полный разброс равен сумме разбросов за счет регрессии и
за счет случайных отклонений.
                    Rss
   Величина                   –   это   доля   вариации   значений    yi ,
                    Tss
обусловленной      регрессией      (т.е.     доля  закономерной
изменчивости в общей изменчивости).
    Определение Коэффициент детерминации – статистика
                               R      1  E ss
                         R 2  ss 
                               Tss       Tss
показывающая, какая доля дисперсии результативного признака
объясняется влиянием объясняющих переменных.
   Если R 2  0 , это означает, что регрессия ничего не дает, т.е.
знание x не улучшает предсказания для y по сравнению с
             
тривиальным yi  y . Другой крайний случай R 2  1 означает
точную подгонку: все точки наблюдений лежат на
регрессионной прямой. Чем ближе к 1 значение R 2 , тем лучше
качество подгонки. Линейная регрессия имеет следующие
общие свойства:
   1. Чем ближе значение коэффициента детерминации к 1,
тем ближе модель к эмпирическим наблюдениям.

   2. С увеличением количества объясняющих переменных
увеличивается R2.

   224