Регрессионный анализ данных на ПК в примерах и задачах (система Statistica). Богатова В.П. - 17 стр.

UptoLike

Составители: 

Рубрика: 

2-й шаг. Увеличим число переменных до двух
(2)
k
=
. Среди возможных
пар
(
)
4,,1,2,3,5
xxjj=
, будем выбирать дающую наибольшее значение
2
R
(или, что то же самое,
adj
R
). Возвратимся в окно Select dep. and indep. Var. и вы -
числим последовательно:
(
)
2
4,10.406
adj
Rxx= ,
(
)
2
4,20.399
adj
Rxx = ,
(
)
2
4,30.421
adj
Rxx= ,
(
)
2
4,50.255
adj
Rxx= .
Откуда заключаем , что наиболее информативной парой является (x4, x3).
Оценка уравнения регрессии урожайности по факторам x3 и x4 имеет
вид:
!
(
)
3434
(0.66)(0.13)(1.07)
,7.290.283.47
fxxxx
=++ . ( 27 )
Внизу в скобках указаны стандартные ошибки, взятые из столбца Std.Err. of B
таблицы Regression Results для варианта независимых переменных (x4, x3). Из
столбца p-level той же таблицы видно, что все три коэффициента статистически
значимо отличаются от нуля при уровне значимости
0.05
α
=
.
3-й шаг. Увеличим число переменных до трех
(3)
k
=
. Среди возможных
троек
(
)
4,3,,1,2,5
xxxjj=
выбираем аналогичным образом наиболее информа-
тивную :
(
)
4,3,5
xxx
. Для этой тройки
2
(3)0.404
adj
R = . Имеем
2
(3)
adj
R
<
2
(2)
adj
R
, следовательно, третью переменную в модель включать нецелесо-
образно, так как она не повышает значение
adj
R
. Итак , результатом анализа явля-
ется функция (27).
II способ. Поручим системе выполнить пошаговый отбор переменных. Для
этого после запуска процедуры регрессионного анализа:
Analysis Startup Panel кнопка Dependent var: y
- Independent var: x1, ,x5 (при нажатой клавише Ctrl) OK Input file :
Raw Data ОК.
В окне Model Definition устанавливаем (рис.38):
        2-й шаг. Увеличим число переменных до двух ( k =2) . Среди возможных

пар    ( x4, xj ) ,   j =1, 2, 3, 5 , будем выбирать дающую наибольшее значение R 2

(или, что то же самое, Radj
                        2
                            ). Возвратимся в окно Select dep. and indep. Var. и вы-

числим последовательно:

 2
Radj ( x 4, x1) =0.406 , Radj2 ( x 4, x2 ) =0.399 , Radj2 ( x4, x3) =0.421 , Radj2 ( x 4, x5 ) =0.255 .

Откуда заключаем, что наиболее информативной парой является (x4, x3).
        Оценка уравнения регрессии урожайности по факторам                                   x3 и x4   имеет
вид:
                                          �
                                          f ( x3 , x4 ) =7.29 +0.28 x3 +3.47 x4 .                       ( 27 )
                                                       (0.66)   (0.13)       (1.07)



Внизу в скобках указаны стандартные ошибки, взятые из столбца Std.Err. of B
таблицы Regression Results для варианта независимых переменных (x4, x3). Из
столбца p-level той же таблицы видно, что все три коэффициента статистически
значимо отличаются от нуля при уровне значимости α = 0.05 .
        3-й шаг. Увеличим число переменных до трех ( k =3) . Среди возможных

троек     ( x4, x3, xj ) ,   j =1, 2, 5   выбираем аналогичным образом наиболее информа-

тивную:         ( x4, x3, x5) .     Для этой тройки                       2
                                                                         Radj (3) =0.404 .             Имеем
 2
Radj (3) < Radj
            2
                (2) , следовательно, третью переменную в модель включать нецелесо-

образно, так как она не повышает значение Radj
                                           2
                                               . Итак, результатом анализа явля-

ется функция (27).


      II способ. Поручим системе выполнить пошаговый отбор переменных. Для
этого после запуска процедуры регрессионного анализа:
        Analysis – Startup Panel             – кнопка                             –     Dependent var: y
- Independent var: x1, … ,x5                  (при нажатой клавише Ctrl) – OK –                   Input file :
Raw Data – ОК.
        В окне Model Definition устанавливаем (рис.38):