Определение тесноты и направления связи между двумя признаками в статистической обработке маркетинговой информации. Моисеева М.Л. - 3 стр.

UptoLike

Составители: 

определенного дня; проверка квалификации рабочих, когда фиксируются
производительность и стаж работы. Итак, исходными данными являются
пары чисел (точки)
(x
1,
y
1
), (x
2,
y
2
), …, (x
n,
y
n
),
где n число испытаний. Наряду с анализом величин X и Y по отдельности
представляет интерес исследование возможной зависимости между ними.
Являются ли величины X и Y независимыми? Если же между ними имеется
некоторая зависимость, то какова она?
Обратимся к рисункам. На них изображены различные виды графиков
(или диаграмм) рассеяния, т.
е. нанесены точки. Величины X и Y на рис. 1,
по-видимому, независимы: зная, какое значение приняла величина X, ничего
нельзя сказать о значении Y. На рис. 2-4 зависимость налицо: зная значение,
которое приняла величина X в результате испытания, можно довольно точно
сказать, каково значение Y.
Зависимость на рис. 3 и 4 близка к линейной, т. е. точки заметным
образом группируются вокруг некоторой прямой. В таких случаях говорят,
что величины X и Y коррелированны. Существует простой способ
определения степени коррелированности случайных величин. Он основан на
вычислении коэффициента корреляции r
ху
. Если понятно, о каких случайных
величинах идет речь, можно вместо r
ху
писать просто r.
Коэффициент корреляции обладает следующим свойством:
1 r 1.
При этом, чем ближе г к нулю, тем слабее корреляция. И наоборот, чем
ближе г к 1 или 1, тем сильнее корреляция, т. е. зависимость между X и Y
близка к линейной. Если г в точности равно 1 или 1, то точки лежат на
одной прямой.
Подчеркнем, что коэффициент корреляции отражает степень линейной
зависимости между величинами. При наличии ярко выраженной зависимости
другого вида (например, квадратичной) он может быть близок к нулю.
Приведем формулы для вычисления r
ху
:
()
1,
1
,
1
11
==
==
n
i
i
n
i
i
y
n
yх
n
х
()
2,
1
,
1
2
1
222
1
22
yy
n
sхх
n
s
n
i
iy
n
i
ix
=
=
==
()
3,
1
1
yхyх
n
s
n
i
iixy
=
=
определенного дня; проверка квалификации рабочих, когда фиксируются
производительность и стаж работы. Итак, исходными данными являются
пары чисел (точки)
      (x1, y1), (x2, y2), …, (xn, yn),
где n – число испытаний. Наряду с анализом величин X и Y по отдельности
представляет интерес исследование возможной зависимости между ними.
Являются ли величины X и Y независимыми? Если же между ними имеется
некоторая зависимость, то какова она?
      Обратимся к рисункам. На них изображены различные виды графиков
(или диаграмм) рассеяния, т. е. нанесены точки. Величины X и Y на рис. 1,
по-видимому, независимы: зная, какое значение приняла величина X, ничего
нельзя сказать о значении Y. На рис. 2-4 зависимость налицо: зная значение,
которое приняла величина X в результате испытания, можно довольно точно
сказать, каково значение Y.
      Зависимость на рис. 3 и 4 близка к линейной, т. е. точки заметным
образом группируются вокруг некоторой прямой. В таких случаях говорят,
что величины X и Y коррелированны. Существует простой способ
определения степени коррелированности случайных величин. Он основан на
вычислении коэффициента корреляции rху. Если понятно, о каких случайных
величинах идет речь, можно вместо rху писать просто r.
Коэффициент корреляции обладает следующим свойством:
                                       – 1≤ r ≤ 1.
      При этом, чем ближе г к нулю, тем слабее корреляция. И наоборот, чем
ближе г к 1 или –1, тем сильнее корреляция, т. е. зависимость между X и Y
близка к линейной. Если г в точности равно 1 или – 1, то точки лежат на
одной прямой.
      Подчеркнем, что коэффициент корреляции отражает степень линейной
зависимости между величинами. При наличии ярко выраженной зависимости
другого вида (например, квадратичной) он может быть близок к нулю.
Приведем формулы для вычисления rху:
                1 n                1 n
             х = ∑ хi ,         y = ∑ yi ,                 (1)
                n i=1              n i=1


      ⎛1 n 2⎞ 2                   ⎛1 n 2⎞ 2
  s = ⎜ ∑ хi ⎟ − х ,
   2
   x                          s = ⎜ ∑ yi ⎟ − y ,
                               2
                               y                                       (2)
      ⎝ n i=1 ⎠                   ⎝ n i=1 ⎠

               ⎛1 n      ⎞
         sxy = ⎜ ∑ хi yi ⎟ − хy,                                 (3)
               ⎝ n i=1   ⎠