Составители:
Рубрика:
определенного дня; проверка квалификации рабочих, когда фиксируются
производительность и стаж работы. Итак, исходными данными являются
пары чисел (точки)
(x
1,
y
1
), (x
2,
y
2
), …, (x
n,
y
n
),
где n – число испытаний. Наряду с анализом величин X и Y по отдельности
представляет интерес исследование возможной зависимости между ними.
Являются ли величины X и Y независимыми? Если же между ними имеется
некоторая зависимость, то какова она?
Обратимся к рисункам. На них изображены различные виды графиков
(или диаграмм) рассеяния, т.
е. нанесены точки. Величины X и Y на рис. 1,
по-видимому, независимы: зная, какое значение приняла величина X, ничего
нельзя сказать о значении Y. На рис. 2-4 зависимость налицо: зная значение,
которое приняла величина X в результате испытания, можно довольно точно
сказать, каково значение Y.
Зависимость на рис. 3 и 4 близка к линейной, т. е. точки заметным
образом группируются вокруг некоторой прямой. В таких случаях говорят,
что величины X и Y коррелированны. Существует простой способ
определения степени коррелированности случайных величин. Он основан на
вычислении коэффициента корреляции r
ху
. Если понятно, о каких случайных
величинах идет речь, можно вместо r
ху
писать просто r.
Коэффициент корреляции обладает следующим свойством:
– 1≤ r ≤ 1.
При этом, чем ближе г к нулю, тем слабее корреляция. И наоборот, чем
ближе г к 1 или –1, тем сильнее корреляция, т. е. зависимость между X и Y
близка к линейной. Если г в точности равно 1 или – 1, то точки лежат на
одной прямой.
Подчеркнем, что коэффициент корреляции отражает степень линейной
зависимости между величинами. При наличии ярко выраженной зависимости
другого вида (например, квадратичной) он может быть близок к нулю.
Приведем формулы для вычисления r
ху
:
()
1,
1
,
1
11
∑∑
==
==
n
i
i
n
i
i
y
n
yх
n
х
()
2,
1
,
1
2
1
222
1
22
yy
n
sхх
n
s
n
i
iy
n
i
ix
−
⎟
⎠
⎞
⎜
⎝
⎛
=−
⎟
⎠
⎞
⎜
⎝
⎛
=
∑∑
==
()
3,
1
1
yхyх
n
s
n
i
iixy
−
⎟
⎠
⎞
⎜
⎝
⎛
=
∑
=
определенного дня; проверка квалификации рабочих, когда фиксируются производительность и стаж работы. Итак, исходными данными являются пары чисел (точки) (x1, y1), (x2, y2), …, (xn, yn), где n – число испытаний. Наряду с анализом величин X и Y по отдельности представляет интерес исследование возможной зависимости между ними. Являются ли величины X и Y независимыми? Если же между ними имеется некоторая зависимость, то какова она? Обратимся к рисункам. На них изображены различные виды графиков (или диаграмм) рассеяния, т. е. нанесены точки. Величины X и Y на рис. 1, по-видимому, независимы: зная, какое значение приняла величина X, ничего нельзя сказать о значении Y. На рис. 2-4 зависимость налицо: зная значение, которое приняла величина X в результате испытания, можно довольно точно сказать, каково значение Y. Зависимость на рис. 3 и 4 близка к линейной, т. е. точки заметным образом группируются вокруг некоторой прямой. В таких случаях говорят, что величины X и Y коррелированны. Существует простой способ определения степени коррелированности случайных величин. Он основан на вычислении коэффициента корреляции rху. Если понятно, о каких случайных величинах идет речь, можно вместо rху писать просто r. Коэффициент корреляции обладает следующим свойством: – 1≤ r ≤ 1. При этом, чем ближе г к нулю, тем слабее корреляция. И наоборот, чем ближе г к 1 или –1, тем сильнее корреляция, т. е. зависимость между X и Y близка к линейной. Если г в точности равно 1 или – 1, то точки лежат на одной прямой. Подчеркнем, что коэффициент корреляции отражает степень линейной зависимости между величинами. При наличии ярко выраженной зависимости другого вида (например, квадратичной) он может быть близок к нулю. Приведем формулы для вычисления rху: 1 n 1 n х = ∑ хi , y = ∑ yi , (1) n i=1 n i=1 ⎛1 n 2⎞ 2 ⎛1 n 2⎞ 2 s = ⎜ ∑ хi ⎟ − х , 2 x s = ⎜ ∑ yi ⎟ − y , 2 y (2) ⎝ n i=1 ⎠ ⎝ n i=1 ⎠ ⎛1 n ⎞ sxy = ⎜ ∑ хi yi ⎟ − хy, (3) ⎝ n i=1 ⎠