Прикладной регрессионный анализ. Многофакторная регрессия. Шашков В.Б. - 51 стр.

UptoLike

Составители: 

51
Разность между текущим значением случайной величины
z и её сред-
ним (генеральным или выборочным) называют
ЦЕНТРИРОВАННОЙ слу-
чайной величиной, поскольку она интерпретирует текущее значение как от-
резок от центра (среднего значения), который лежит либо слева от центра
(отрицательные значения ) или справав области положительных значений.
Для обработки данных важны следующие свойства центрированных величин.
Первое (нулевое) свойство: сумма центрированных величин по их
совокупности (выборке) равна нулю. Это свойство очевидно, т.к. центри-
рование делит массив данных на две равные части с противоположными зна-
ками.
Второе (минимальное) свойство : сумма квадратов отклонений те-
кущих значений случайной величины от их среднего меньше, чем сумма
квадратов отклонений от любого другого числа, в том числе от моды и
медианы.
Докажем это свойство. Пусть сумма квадратов отклонений
S
otkl
от
некоторого числа
с
Sotkl z
i
c
i
n
=−=
=
()min
2
1
. (56)
Требуется определить значение
с, при котором функция
S
otkl
обращается в минимум. Решением является корень уравнения
S
otkl
c
= 0
,
при условии, что вторая производная имеет положительное значение. Диффе-
ренцируя уравнение (56), получаем:
-2
()zc
i
i
n
−=
=
0
1
, откуда zc
i
i
n
i
n
=
==
11
, или znc=⋅
, т.е. c
z
n
zsr==
, что озна-
чает
min исследуемой функции именно для условия c
z
sr
=
. В то же время
[]
2
2
22120
1
c
c
c
zc n
i
n
=−
=⋅ =⋅>
=
()
,
что доказывает второе свойство.
Условие (56) называют требованием наименьших квадратов, которое
мы обеспечили получением системы нормальных уравнений. Оно объясняет
также, почему величина (27) по своей природе является именно дисперсией: -
объяснение в том, что величина
y
gr
в уравнении (27) есть статистическая
оценка математического ожидания
{
}
My
g
-генерального СРЕДНЕГО.
Разделим центрированную величину
(
)
i
Mz
на среднеквадратичное
отклонение
σ
исходной величины z. Такая операция называется НОРМИ-
РОВАНИЕМ
, т.к. среднеквадратичное отклонение здесь выступает как мера
или норма измерения величины
(
)
i
Mz
.Полученная величина Zn называ-
ется нормированной:
      Разность между текущим значением случайной величины z и её сред-
ним (генеральным или выборочным) называют ЦЕНТРИРОВАННОЙ слу-
чайной величиной, поскольку она интерпретирует текущее значение как от-
резок от центра (среднего значения), который лежит либо слева от центра
(отрицательные значения ) или справа – в области положительных значений.
Для обработки данных важны следующие свойства центрированных величин.
      Первое (нулевое) свойство: сумма центрированных величин по их
совокупности (выборке) равна нулю. Это свойство очевидно, т.к. центри-
рование делит массив данных на две равные части с противоположными зна-
ками.
      Второе (минимальное) свойство : сумма квадратов отклонений те-
кущих значений случайной величины от их среднего меньше, чем сумма
квадратов отклонений от любого другого числа, в том числе от моды и
медианы.
      Докажем это свойство. Пусть сумма квадратов отклонений S          от
                                                                   otkl
некоторого числа с
                                n
                       Sotkl = ∑ ( z − c )2 = min .                  (56)
                                    i
                               i=1
      Требуется определить значение с, при котором функция S
                                                                      otkl
обращается в минимум. Решением является корень уравнения
                                 ∂Sotkl
                                        = 0,
                                   ∂c
при условии, что вторая производная имеет положительное значение. Диффе-
ренцируя уравнение (56), получаем:
   n                            n        n
                                                                            ∑ z = zsr , что озна-
-2 ∑ ( zi − c ) = 0 , откуда
   i=1
                               ∑ zi =
                               i= 1
                                        ∑ c , или ∑ z = n ⋅ c , т.е.
                                        i= 1
                                                                       c=
                                                                             n
чает min исследуемой функции именно для условия c = zsr . В то же время
                   ∂ 2c ∂                             n
                        =   [ − 2 ∑ ( z − c )] = 2 ⋅  ∑ 1 = 2⋅ n > 0 ,
                   ∂c 2 ∂ c                          i=1
 что доказывает второе свойство.
      Условие (56) называют требованием наименьших квадратов, которое
мы обеспечили получением системы нормальных уравнений. Оно объясняет
также, почему величина (27) по своей природе является именно дисперсией: -
объяснение в том, что величина ygr в уравнении (27) есть статистическая
                                                 { }
оценка математического ожидания M y g -генерального СРЕДНЕГО.
      Разделим центрированную величину ( z − Mz ) на среднеквадратичное
                                          i
отклонение σ исходной величины z. Такая операция называется НОРМИ-
РОВАНИЕМ, т.к. среднеквадратичное отклонение здесь выступает как мера
или норма измерения величины ( z − Mz ) .Полученная величина Zn называ-
                                i
ется нормированной:

                                                                                              51