Регрессионный анализ данных на ПК в примерах и задачах (система Statistica). Богатова В.П. - 4 стр.

UptoLike

Составители: 

Рубрика: 

Значение коэффициента детерминации
2
R
, возрастает с ростом числа пе-
ременных в регрессии, что не означает улучшения качества предсказания. Потому
для оценки качества подгонки регрессионной модели к наблюдаемым значениям
i
y
, вводится скорректированный (adjusted) коэффициент детерминации
()
22
(1)
11
(1)
adj
n
RR
nk
=−−
−−
. (20 )
Различные регрессии (с различным набором переменных) можно сравнивать по
скорректированному коэффициенту детерминации (20) и принять тот вариант
регрессии, для которого
adj
R
максимален .
Доверительные интервалы и проверка гипотезы о нулевых значениях
коэффициентов регрессии.
Стандартной ошибкой оценки
)
j
β
является величина
z
σ
, оценка
для которой является
,0,1,...,
jjj
sszjk
== , ( 21 )
где
jj
z
диагональный элемент матрицы
(
)
1
T
ZXX
= . В предположениях мо-
дели , приведенных выше, статистика
!
(
)
!
jjjj
j
j
j
z
t
ss
ββσ
ββ
σ
== ( 22 )
распределена по закону Стьюдента с
(1)
nk
−−
степенями свободы . Поэтому не-
равенство
)
jpj
j
ts
ββ−≤ ( 23 )
задает доверительный интервал для
j
β
с уровнем доверия
γ
, если
p
t
кван -
тиль уровня
(
)
12
p γ=+
распределения Стьюдента.
Для проверки гипотезы
012
:...0
k
H
βββ
====
( об отсутствии какой бы
то ни было линейной связи между
y
и совокупностью факторов ) используется
статистика
     Значение коэффициента детерминации R 2 , возрастает с ростом числа пе-
ременных в регрессии, что не означает улучшения качества предсказания. Потому
для оценки качества подгонки регрессионной модели к наблюдаемым значениям
yi , вводится скорректированный (adjusted) коэффициент детерминации
                                                     (n −1)
                             2
                            Radj =1 −(1 −R 2 )               .                           (20 )
                                                  ( n −k −1)
Различные регрессии (с различным набором переменных) можно сравнивать по
скорректированному коэффициенту детерминации (20) и принять тот вариант
регрессии, для которого Radj
                         2
                             максимален.

        Доверительные интервалы и проверка гипотезы о нулевых значениях
                       коэффициентов регрессии.
                                
     Стандартной ошибкой оценки β j является величина σ z jj ,                         оценка

для которой является
                             s j =s z jj ,    j =0,1,..., k ,                            ( 21 )

                                                        (      )
                                                                   −1
где z jj – диагональный элемент матрицы Z = X T X                       . В предположениях мо-

дели, приведенных выше, статистика


                           t=
                             ( β  j)
                               � −β σ
                                         j       z jj
                                                        =
                                                            � −β
                                                            β j  j
                                                                                         ( 22 )
                                       sσ                     sj

распределена по закону Стьюдента с ( n −k −1) степенями свободы. Поэтому не-
равенство
                                      
                                      β j −β j ≤t p s j                                  ( 23 )

задает доверительный интервал для      β j с уровнем доверия γ , если t p – кван-

тиль уровня   p =(1 +γ ) 2 распределения Стьюдента.

     Для проверки гипотезы H 0 : β1 =β2 =... =βk =0                 ( об отсутствии какой бы
то ни было линейной связи между y и совокупностью факторов) используется
статистика