Математика (Статистика, корреляция и регрессия). Кислов К.К. - 10 стр.

UptoLike

Составители: 

2 2
1
( , , ) ( ) min
n
i i i
i
F A B C y Ax Bx C
=
= =
е
.
Коэффициент
x
y
S
S
rA
=
в уравнении линейной регрессии называется
выборочным коэффициентом регрессии. Он характеризует угол наклона прямой
регрессии. Если A>0, то с увеличением x значение y также возрастает, в то время
как при A<0 y с возрастанием x убывает.
Статистическая обработка наблюдений (данных выборки) сводится к
вычислению параметров выборки
rSSyx
yx
,,,,
22
по формулам:
n
x
x
n
i
i
=
=
1
;
n
y
y
n
i
i
=
=
1
;
1
)(
1
2
2
=
=
n
xx
S
n
i
i
x
;
1
)(
1
2
2
=
=
n
yy
S
n
i
i
y
;
yx
n
i
ii
SSn
yyxx
r
=
=
)1(
))((
1
.
Для облегчения процесса вычисления параметров выборки, интервалы
изменения x и y выборки разбивают на
5lgk n
частичных интервалов,
составляют корреляционную таблицу и производят вычисления. Такой способ
вычисления параметров нецелесообразен, т.к. он вносит дополнительные ошибки
вычисления параметров. Например, вычисленное значение коэффициента
корреляции
r
в рассматриваемом далее примере при разбиении на 8 интервалов
(объем выборки 50) равно 0,466. Значения коэффициента корреляции,
вычисленные без разбиения на интервалы по вышеприведенным формулам,
равно – 0,548, т.е. ошибка вычисления составила 15%.
В работе Р.Шторм «Теория вероятностей. Математическая статистика.
Статистический контроль качества» статистически показано влияние длины
10
                                                                   10
                                               n
                         F ( A, B, C ) =   е
                                           i= 1
                                                   ( yi − Axi2 − Bxi − C ) 2 = min .

                            −   Sy
      Коэффициент      A= r           в уравнении линейной регрессии называется
                                Sx
выборочным коэффициентом регрессии. Он характеризует угол наклона прямой
регрессии. Если A>0, то с увеличением x значение y также возрастает, в то время
как при A<0 y с возрастанием x убывает.
      Статистическая обработка наблюдений (данных выборки) сводится к
                                               −    −                              −
вычислению параметров выборки x , y , S x2 , S y2 , r по формулам:
                                                                           n

                                                               −          ∑
                                                                          i= 1
                                                                                       xi
                                                                                                ;
                                                               x=
                                                                               n
                                                                           n

                                                               −          ∑
                                                                          i= 1
                                                                                       yi
                                                                                                ;
                                                               y=
                                                                               n
                                                                    n                       −
                                                                   ∑
                                                                   i= 1
                                                                          ( xi − x)2
                                                                                                        ;
                                                   S x2 =
                                                                           n− 1
                                                                    n                       −
                                                                   ∑
                                                                   i= 1
                                                                          ( yi − y)2
                                                                                                        ;
                                                   S y2 =
                                                                           n− 1
                                                         n                     −                    −

                                           −            ∑
                                                        i= 1
                                                               ( x i − x )( y i − y )
                                                                                                            .
                                           r=
                                                             ( n − 1) ⋅ S x ⋅ S y

      Для облегчения процесса вычисления параметров выборки, интервалы
изменения x и y выборки разбивают на k ≈ 5lg n частичных интервалов,
составляют корреляционную таблицу и производят вычисления. Такой способ
вычисления параметров нецелесообразен, т.к. он вносит дополнительные ошибки
вычисления параметров. Например, вычисленное значение коэффициента
             −
корреляции r в рассматриваемом далее примере при разбиении на 8 интервалов
(объем выборки – 50) равно – 0,466. Значения коэффициента корреляции,
вычисленные без разбиения на интервалы по вышеприведенным формулам,
равно – 0,548, т.е. ошибка вычисления составила ∼15%.
     В работе Р.Шторм «Теория вероятностей. Математическая статистика.
Статистический контроль качества» статистически показано влияние длины