Основы информатики и вычислительной техники. Шилов О.И. - 31 стр.

UptoLike

Составители: 

Статистические расчёты в Microsoft Excel
Практические задания и рекомендации по информатике
31
где
=
=
n
i
iixy
yx
n
C
1
1
так называемый коэффициент ковариации. Для его расчёта в Excel име-
ется встроенная функция
КОВАР().
2
1
2
1
xx
n
n
i
ix
=
=
σ
и
2
1
2
1
yy
n
n
i
iy
=
=
σ
средние квадратические отклонения значений рядов.
Вспомним, что средние квадратические рассчитываются в Excel с помощью функции
СТАНДОТКЛОНП().
Коэффициент корреляции обязательно находится в интервале
11
r
и при правильном
расчёте не может выйти за эти пределы ни при каких исходных данных (если только количе-
ство данных в рядах одинаково).
По абсолютной величине коэффициента корреляции судят о тесноте связи между призна-
ками в рядах, а по его знакуо направлении этой связи:
0r корреляция отсутствует;
4,00 << r корреляционная зависимость слабая;
7,04,0 << r корреляционная зависимость средней тесноты;
17,0 << r
корреляционная зависимость тесная;
1r корреляционная зависимость полная, имеет место жёсткая функциональная связь
между значениями рядов;
0>r зависимость прямая, то есть при возрастании значений одного ряда значения другого
ряда также возрастают (в среднем);
0<r зависимость обратная, то есть при возрастании значений одного ряда значения друго-
го ряда, наоборот, уменьшаются (в среднем).
Кроме непосредственно нахождения коэффициента корреляции необходимо оценить сте-
пень его достоверности. Рассчитывают экспериментальное и критическое значения критерия
Стьюдента по формулам:
2
1
2
r
nr
t
э
=
и
)2(
=
ntt
pкр
,
где
()
nt
p
коэффициент Стьюдента для доверительной вероятности p и числа степеней сво-
боды n.
В случае, когда
крэ
tt > коэффициент корреляции считается достоверным (значимым), в
противном случае коэффициент корреляции не достоверен (не значим). Последняя ситуация
вовсе не означает, что корреляции нет, и, тем более, что значение r ошибочно, – это означает
только, что данных слишком мало и связь слишком слабая, чтобы её наличие можно было
утверждать с определённой вероятностью.
И, наконец, зная коэффициент корреляции, можно найти уравнения линейной регрессии
уравнения, наилучшим образом описывающие линейную зависимость средних значений од-
ного ряда от значений элементов другого. Различают два уравнения линейной регрессии:
B
X
A
Y
+= уравнение линейной регрессии ряда Y на ряд X и
DYCX += уравнение линейной регрессии ряда X на ряд Y.
Коэффициенты уравнений вычисляются по следующим формулам:
x
y
rA
σ
σ
= , xAyB
= ,
y
x
rC
σ
σ
= , yCxD
=
.
В свете изложенного выше будет понятно, как производятся вычисления по формулам,
показанным в ячейках таблицы на следующем рисунке:
                           Статистические расчёты в Microsoft Excel                       31


            1 n
где C xy = ⋅ ∑ xi yi – так называемый коэффициент ковариации. Для его расчёта в Excel име-
            n i =1
ется встроенная функция КОВАР().
      1 n                  1 n
σ x = ⋅ ∑ xi2 − x 2 и σ y = ⋅ ∑ yi2 − y 2 – средние квадратические отклонения значений рядов.
      n i =1               n i =1
Вспомним, что средние квадратические рассчитываются в Excel с помощью функции
СТАНДОТКЛОНП().
   Коэффициент корреляции обязательно находится в интервале − 1 ≤ r ≤ 1 и при правильном
расчёте не может выйти за эти пределы ни при каких исходных данных (если только количе-
ство данных в рядах одинаково).
   По абсолютной величине коэффициента корреляции судят о тесноте связи между призна-
ками в рядах, а по его знаку – о направлении этой связи:
r ≈ 0 – корреляция отсутствует;
0 < r < 0,4 – корреляционная зависимость слабая;
0,4 < r < 0,7 – корреляционная зависимость средней тесноты;
0,7 < r < 1 – корреляционная зависимость тесная;
r ≈ 1 – корреляционная зависимость полная, имеет место жёсткая функциональная связь
между значениями рядов;
r > 0 – зависимость прямая, то есть при возрастании значений одного ряда значения другого
ряда также возрастают (в среднем);
r < 0 – зависимость обратная, то есть при возрастании значений одного ряда значения друго-
го ряда, наоборот, уменьшаются (в среднем).
   Кроме непосредственно нахождения коэффициента корреляции необходимо оценить сте-
пень его достоверности. Рассчитывают экспериментальное и критическое значения критерия
Стьюдента по формулам:
                                     r ⋅ n−2
                                tэ =           и t кр = t p (n − 2) ,
                                        1− r 2
где t p (n ) – коэффициент Стьюдента для доверительной вероятности p и числа степеней сво-
боды n.
  В случае, когда t э > t кр – коэффициент корреляции считается достоверным (значимым), в
противном случае коэффициент корреляции не достоверен (не значим). Последняя ситуация
вовсе не означает, что корреляции нет, и, тем более, что значение r ошибочно, – это означает
только, что данных слишком мало и связь слишком слабая, чтобы её наличие можно было
утверждать с определённой вероятностью.
   И, наконец, зная коэффициент корреляции, можно найти уравнения линейной регрессии –
уравнения, наилучшим образом описывающие линейную зависимость средних значений од-
ного ряда от значений элементов другого. Различают два уравнения линейной регрессии:
Y = A ⋅ X + B – уравнение линейной регрессии ряда Y на ряд X и
 X = C ⋅ Y + D – уравнение линейной регрессии ряда X на ряд Y.
   Коэффициенты уравнений вычисляются по следующим формулам:
                               σy                         σ
                        A=r⋅      , B = y − A⋅ x , C = r ⋅ x , D = x − C ⋅ y .
                               σx                         σy
  В свете изложенного выше будет понятно, как производятся вычисления по формулам,
показанным в ячейках таблицы на следующем рисунке:



Практические задания и рекомендации по информатике