Корреляционный анализ. Харченко М.А. - 11 стр.

UptoLike

Составители: 

Рубрика: 

§ 4. Коэффициенты ковариации и корреляции
Для оценки тесноты (силы) линейной связи служат коэффициенты
ковариации
1
и корреляции.
Коэффициент ковариации представляет собой математическое
ожидание произведения отклонений величин от их мат. ожиданий
2
:
cov(
X, Y) = M[(XM(X)) (YM(Y))].
Если рассматриваемые величины независимы, то коэффициент кова-
риации равен нулю:
3
cov(
X, Y) = M[(X·YM(X) ·YX·M(Y) + M(X) · M(Y)] =
=
M(X) · M(Y)M(X) · M(Y)M(X) · M(Y) + M(X) · M(Y) = 0.
В случае же линейной связи между величинами коэффициент кова-
риации отличен от нуля.
Вследствие того, что значение коэффициента ковариации зависит от
единиц измерения изучаемого признака, то его значение меняется при из-
менении масштаба измерительной шкалы. Например, в зависимости между
показателем интеллекта и уровнем месячного дохода человека коэффици-
ент ковариации изменится в 1000 раз, если величину дохода выразить не в
рублях, а в тысячах рублей.
Очевидно, удобный показатель тесноты связи должен иметь стан-
дартную систему единиц измерения, в которой данные по различным ха-
рактеристикам были бы сравнимы между собой (или быть безразмерной
величиной). Для получения такого показателя коэффициент ковариации
необходимо нормироватьразделить на максимально возможное значение
ковариации
σ
x
· σ
y
.
Нормированное значение коэффициента ковариации называется ко-
эффициентом корреляции
:
yx
YX
YX
σσ
ρ
=
),cov(
),(
(
)
(
)
[
]
yx
YMYXMXM
σσ
=
)()(
,
где
σ
x
, σ
y
средние квадратические отклонения переменных X и Y; М(X),
М(Y) – их математические ожидания.
Коэффициент корреляции представляет собой безразмерную ве-
личину, изменяющуюся в пределах от –1 до 1
. Значение коэффициента
корреляции выражает лишь долю от максимально возможной ковариации,
в чем и состоит его преимущество перед коэффициентом ковариации.
Величина коэффициента корреляции не меняется при увеличении
или уменьшении на одно и то же число или в одно и то же число раз всех
значений переменных.
1
Ковариацияот лат. con и variareсовместная изменчивость.
2
Ковариация по каждому аргументу удовлетворяет свойствам математического ожидания:
cov(С
1
X, С
2
Y) = С
1
С
2
· cov(X, Y),
а ковариация переменной самой с собой представляет собой дисперсию величины:
cov(X, X) = M[(XM(X)) (XM(X))] = M[XM(X)]
2
= D(X).
11
3
Математическое ожидание раскрыто с учетом того, что X и Yнезависимые случайные вели-
чины, а M(X) и M(Y) – константы.
       § 4. Коэффициенты ковариации и корреляции
      Для оценки тесноты (силы) линейной связи служат коэффициенты
ковариации 1 и корреляции.
      Коэффициент ковариации представляет собой математическое
ожидание произведения отклонений величин от их мат. ожиданий 2 :
                     cov(X, Y) = M[(X – M(X)) (Y – M(Y))].
      Если рассматриваемые величины независимы, то коэффициент кова-
риации равен нулю: 3
           cov(X, Y) = M[(X·Y – M(X) ·Y – X·M(Y) + M(X) · M(Y)] =
         = M(X) · M(Y) – M(X) · M(Y) – M(X) · M(Y) + M(X) · M(Y) = 0.
      В случае же линейной связи между величинами коэффициент кова-
риации отличен от нуля.
      Вследствие того, что значение коэффициента ковариации зависит от
единиц измерения изучаемого признака, то его значение меняется при из-
менении масштаба измерительной шкалы. Например, в зависимости между
показателем интеллекта и уровнем месячного дохода человека коэффици-
ент ковариации изменится в 1000 раз, если величину дохода выразить не в
рублях, а в тысячах рублей.
      Очевидно, удобный показатель тесноты связи должен иметь стан-
дартную систему единиц измерения, в которой данные по различным ха-
рактеристикам были бы сравнимы между собой (или быть безразмерной
величиной). Для получения такого показателя коэффициент ковариации
необходимо нормировать – разделить на максимально возможное значение
ковариации σx · σy.
      Нормированное значение коэффициента ковариации называется ко-
эффициентом корреляции:
                         cov( X , Y ) M [( X − M ( X ) ) ⋅ (Y − M (Y ) )]
              ρ(X ,Y ) =             =                                    ,
                          σ x ⋅σ y              σ x ⋅σ y
где σx, σy – средние квадратические отклонения переменных X и Y; М(X),
М(Y) – их математические ожидания.
      Коэффициент корреляции представляет собой безразмерную ве-
личину, изменяющуюся в пределах от –1 до 1. Значение коэффициента
корреляции выражает лишь долю от максимально возможной ковариации,
в чем и состоит его преимущество перед коэффициентом ковариации.
      Величина коэффициента корреляции не меняется при увеличении
или уменьшении на одно и то же число или в одно и то же число раз всех
значений переменных.

       1
          Ковариация – от лат. con и variare – совместная изменчивость.
       2
          Ковариация по каждому аргументу удовлетворяет свойствам математического ожидания:
                                     cov(С1X, С2Y) = С1С2 · cov(X, Y),
а ковариация переменной самой с собой представляет собой дисперсию величины:
                       cov(X, X) = M[(X – M(X)) (X – M(X))] = M[X – M(X)]2 = D(X).
        3
          Математическое ожидание раскрыто с учетом того, что X и Y – независимые случайные вели-
чины, а M(X) и M(Y) – константы.
                                               11