Математическая статистика. Крашенинников В.Р - 25 стр.

UptoLike

- 25 -
Таким образом, окончательно получаем выборочные уравнения
линейной среднеквадратической регрессии Y на X:
y = ρ*
y
x
σ
σ
(x –
x
m
) +
y
m
(1.49)
и
X на Y:
x = ρ*
y
x
σ
σ
(y –
y
m
) +
x
m
. (1.50)
Отметим также, что прямые (1.49) и (1.50) получены по выборке, поэтому
они, вообще говоря, отличаются от прямых (1.44) и (1.45). Однако сходимость
оценок
x
m
,
y
m
,
x
σ
,
y
σ
, ρ
*
к их точным значениям при n обеспечивает
сходимость выборочных уравнений регрессии (1.49) и (1.50) к (1.44) и (1.46).
Уравнения (1.49) и (1.50) можно получить другим способом, применяя
метод наименьших квадратов, то есть из условия минимума средних квадратов
отклонений точек выборки от линии регрессии:
n
2
ii
i=1
1
(ax + b
y
)=min
n
,
(1.51)
n
2
ii
i=1
1
(α
y
+ β x) =min
n
.
Уравнения же (1.44) и (1.46) получены из условия минимума математических
ожиданий (1.41) и (1.45).
Отметим один важный момент. Применяя формулу (1.48), мы всегда
получим какою-то оценку ρ
* коэффициента корреляции ρ. Причём эта оценка
обычно отлична от нуля, даже если ρ
=0. Поэтому возникает вопрос о
значимости выборочного коэффициента корреляции, полученного по
формуле (1.48). То есть достаточно ли у нас оснований считать, что
коэффициент корреляции не равен нулю, другими словами, имеется ли вообще
корреляция между исследуемыми случайными величинами?
Для ответа на этот вопрос применяется следующий критерий. Пусть по
выборке объёма
n получено выборочное значение коэффициента корреляции
ρ
* и выдвинута гипотеза Η
0
= (ρ = 0). Для проверки этой гипотезы с уровнем
значимости β
вычисляется наблюдаемое значение
набл
2
ρ n2
t=
1(ρ )
(1.52)
и применяется решающее правило
набл β
tt
Η
0
принимается,
(1.53)