ВУЗ:
Составители:
Статистические расчёты в Microsoft Excel
Практические задания и рекомендации по информатике
31
где
∑
=
⋅=
n
i
iixy
yx
n
C
1
1
– так называемый коэффициент ковариации. Для его расчёта в Excel име-
ется встроенная функция
КОВАР().
2
1
2
1
xx
n
n
i
ix
−⋅=
∑
=
σ
и
2
1
2
1
yy
n
n
i
iy
−⋅=
∑
=
σ
– средние квадратические отклонения значений рядов.
Вспомним, что средние квадратические рассчитываются в Excel с помощью функции
СТАНДОТКЛОНП().
Коэффициент корреляции обязательно находится в интервале
11 ≤
≤
−
r
и при правильном
расчёте не может выйти за эти пределы ни при каких исходных данных (если только количе-
ство данных в рядах одинаково).
По абсолютной величине коэффициента корреляции судят о тесноте связи между призна-
ками в рядах, а по его знаку – о направлении этой связи:
0≈r – корреляция отсутствует;
4,00 << r – корреляционная зависимость слабая;
7,04,0 << r – корреляционная зависимость средней тесноты;
17,0 << r
– корреляционная зависимость тесная;
1≈r – корреляционная зависимость полная, имеет место жёсткая функциональная связь
между значениями рядов;
0>r – зависимость прямая, то есть при возрастании значений одного ряда значения другого
ряда также возрастают (в среднем);
0<r – зависимость обратная, то есть при возрастании значений одного ряда значения друго-
го ряда, наоборот, уменьшаются (в среднем).
Кроме непосредственно нахождения коэффициента корреляции необходимо оценить сте-
пень его достоверности. Рассчитывают экспериментальное и критическое значения критерия
Стьюдента по формулам:
2
1
2
r
nr
t
э
−
−⋅
=
и
)2(
−
=
ntt
pкр
,
где
()
nt
p
– коэффициент Стьюдента для доверительной вероятности p и числа степеней сво-
боды n.
В случае, когда
крэ
tt > – коэффициент корреляции считается достоверным (значимым), в
противном случае коэффициент корреляции не достоверен (не значим). Последняя ситуация
вовсе не означает, что корреляции нет, и, тем более, что значение r ошибочно, – это означает
только, что данных слишком мало и связь слишком слабая, чтобы её наличие можно было
утверждать с определённой вероятностью.
И, наконец, зная коэффициент корреляции, можно найти уравнения линейной регрессии –
уравнения, наилучшим образом описывающие линейную зависимость средних значений од-
ного ряда от значений элементов другого. Различают два уравнения линейной регрессии:
B
X
A
Y
+⋅= – уравнение линейной регрессии ряда Y на ряд X и
DYCX +⋅= – уравнение линейной регрессии ряда X на ряд Y.
Коэффициенты уравнений вычисляются по следующим формулам:
x
y
rA
σ
σ
⋅= , xAyB
⋅
−
= ,
y
x
rC
σ
σ
⋅= , yCxD
⋅
−
=
.
В свете изложенного выше будет понятно, как производятся вычисления по формулам,
показанным в ячейках таблицы на следующем рисунке:
Статистические расчёты в Microsoft Excel 31 1 n где C xy = ⋅ ∑ xi yi – так называемый коэффициент ковариации. Для его расчёта в Excel име- n i =1 ется встроенная функция КОВАР(). 1 n 1 n σ x = ⋅ ∑ xi2 − x 2 и σ y = ⋅ ∑ yi2 − y 2 – средние квадратические отклонения значений рядов. n i =1 n i =1 Вспомним, что средние квадратические рассчитываются в Excel с помощью функции СТАНДОТКЛОНП(). Коэффициент корреляции обязательно находится в интервале − 1 ≤ r ≤ 1 и при правильном расчёте не может выйти за эти пределы ни при каких исходных данных (если только количе- ство данных в рядах одинаково). По абсолютной величине коэффициента корреляции судят о тесноте связи между призна- ками в рядах, а по его знаку – о направлении этой связи: r ≈ 0 – корреляция отсутствует; 0 < r < 0,4 – корреляционная зависимость слабая; 0,4 < r < 0,7 – корреляционная зависимость средней тесноты; 0,7 < r < 1 – корреляционная зависимость тесная; r ≈ 1 – корреляционная зависимость полная, имеет место жёсткая функциональная связь между значениями рядов; r > 0 – зависимость прямая, то есть при возрастании значений одного ряда значения другого ряда также возрастают (в среднем); r < 0 – зависимость обратная, то есть при возрастании значений одного ряда значения друго- го ряда, наоборот, уменьшаются (в среднем). Кроме непосредственно нахождения коэффициента корреляции необходимо оценить сте- пень его достоверности. Рассчитывают экспериментальное и критическое значения критерия Стьюдента по формулам: r ⋅ n−2 tэ = и t кр = t p (n − 2) , 1− r 2 где t p (n ) – коэффициент Стьюдента для доверительной вероятности p и числа степеней сво- боды n. В случае, когда t э > t кр – коэффициент корреляции считается достоверным (значимым), в противном случае коэффициент корреляции не достоверен (не значим). Последняя ситуация вовсе не означает, что корреляции нет, и, тем более, что значение r ошибочно, – это означает только, что данных слишком мало и связь слишком слабая, чтобы её наличие можно было утверждать с определённой вероятностью. И, наконец, зная коэффициент корреляции, можно найти уравнения линейной регрессии – уравнения, наилучшим образом описывающие линейную зависимость средних значений од- ного ряда от значений элементов другого. Различают два уравнения линейной регрессии: Y = A ⋅ X + B – уравнение линейной регрессии ряда Y на ряд X и X = C ⋅ Y + D – уравнение линейной регрессии ряда X на ряд Y. Коэффициенты уравнений вычисляются по следующим формулам: σy σ A=r⋅ , B = y − A⋅ x , C = r ⋅ x , D = x − C ⋅ y . σx σy В свете изложенного выше будет понятно, как производятся вычисления по формулам, показанным в ячейках таблицы на следующем рисунке: Практические задания и рекомендации по информатике
Страницы
- « первая
- ‹ предыдущая
- …
- 29
- 30
- 31
- 32
- 33
- …
- следующая ›
- последняя »