Прикладной регрессионный анализ. Многофакторная регрессия. Шашков В.Б. - 12 стр.

UptoLike

Составители: 

12
отклика y
g
светлыми точками и соединим их линией, которая будет имитиро-
вать экспериментально найденную зависимость. Линия, проходящая через
координаты математических ожиданий М
{
y
g
}
, будет отвечать той функции
истинного отклика
ϕ
(х), которую мы должны аппроксимировать полиномом
регрессии. Отсюда следует, что если бы в таблице экспериментальных дан-
ных вместо случайной величины y
g
стояли постоянные величины М
{
y
g
}
,
табличная зависимость
ϕ
(х1,х2,…,хк) потеряла бы свой стохастический ха-
рактер. В этом случае система имела бы единственное решение в виде иде-
альной математической модели функции истинного отклика
ϕ
(х), а именно в
виде полинома
η
(х,
β
), где
β
- истинные коэффициенты "идеальной" регрес-
сии. Модель
η
(х,
β
) адекватна функции
ϕ
(х) и, таким образом,
η
(х,
β
) =
ϕ
(х).
Но в силу случайного характера отклика объекта исследования, полином рег-
рессии
η
(х,b), найденный по экспериментальным
данным,
является только
статистической оценкой идеальной модели
η
(х,
β
). Отсюда следует, что рас-
считанное по уравнению регрессии значение y
g
( будем впредь обозначать
его как y
gr
) является оценкой математического ожидания М
{
y
g
}
. Линия, про-
ходящая через светлые точки, и будет графической интерпретацией экспери-
ментально найденного полинома
η
(х,b).
Дисперсия случайной величины y
g
на данной строке таблицы
2
yg
σ
явля-
ется характеристикой поведения объекта исследования и определяется толь-
ко его природой. Поэтому значение величины
2
yg
σ
одинаково на всех строках
таблицы данных
222
2
2
1
............
kg
σ
σ
σ
σ
=
=
=
== ,
а сама дисперсия называется дисперсией воспроизводимости
2
vos
σ
. Таким
образом, графики распределения величины y
g
на рисунке 2 отличаются толь-
ко математическими ожиданиями
{
М y
g
}
, а дисперсии их одинаковы.
Табличное значение величины y
g
является экспериментальной оцен-
кой М
{
y
g
}
.
Надежность оценок зависит от двух факторов: объема выборки и
дисперсии оцениваемой случайной величины. На рисунке 4 представлены
графики законов распределения трех случайных величин при одном значении
математического ожидания и различных значениях дисперсии /8/. Наглядно
иллюстрируется то положение, что чем больше дисперсия, тем более сглаже-
на кривая распределения и тем больше вероятность того, что эксперимен-
тальное значение отклика y
g
будет дальше от "идеального" значения М
{
y
g
}
.
Поэтому разность ( y
g
- М
{
y
g
}
), обусловленную влиянием шума
δ{
w
}
(см.
уравнение (1)), можно рассматривать как "ошибку" экспериментального оп
ределения значения отклика y
g
, а дисперсию
2
vos
σ
как меру этой ошибки.
Это обуславливает особое значение дисперсии воспроизводимости для обра-
ботки экспериментальных данных.
отклика yg светлыми точками и соединим их линией, которая будет имитиро-
вать экспериментально найденную зависимость. Линия, проходящая через
координаты математических ожиданий М{yg}, будет отвечать той функции
истинного отклика ϕ(х), которую мы должны аппроксимировать полиномом
регрессии. Отсюда следует, что если бы в таблице экспериментальных дан-
ных вместо случайной величины yg стояли постоянные величины М{ yg },
табличная зависимость ϕ(х1,х2,…,хк) потеряла бы свой стохастический ха-
рактер. В этом случае система имела бы единственное решение в виде иде-
альной математической модели функции истинного отклика ϕ(х), а именно в
виде полинома η(х,β), где β - истинные коэффициенты "идеальной" регрес-
сии. Модель η(х,β) адекватна функции ϕ(х) и, таким образом, η(х,β) = ϕ(х).
Но в силу случайного характера отклика объекта исследования, полином рег-
рессии η(х,b), найденный по экспериментальным данным, является только
статистической оценкой идеальной модели η(х,β). Отсюда следует, что рас-
считанное по уравнению регрессии значение yg ( будем впредь обозначать
его как ygr) является оценкой математического ожидания М{yg}. Линия, про-
ходящая через светлые точки, и будет графической интерпретацией экспери-
ментально найденного полинома η(х,b).
      Дисперсия случайной величины yg на данной строке таблицы σ yg
                                                                  2 явля-

ется характеристикой поведения объекта исследования и определяется толь-
ко его природой. Поэтому значение величины σ yg
                                             2 одинаково на всех строках

таблицы данных
              σ 12 = σ 22 = ...... = σ g2 = ...... = σ k2 ,
а сама дисперсия называется дисперсией воспроизводимости      σ vos
                                                                2 . Таким

образом, графики распределения величины yg на рисунке 2 отличаются толь-
ко математическими ожиданиями {М yg}, а дисперсии их одинаковы.
      Табличное значение величины yg является экспериментальной оцен-
кой М{yg}. Надежность оценок зависит от двух факторов: объема выборки и
дисперсии оцениваемой случайной величины. На рисунке 4 представлены
графики законов распределения трех случайных величин при одном значении
математического ожидания и различных значениях дисперсии /8/. Наглядно
иллюстрируется то положение, что чем больше дисперсия, тем более сглаже-
на кривая распределения и тем больше вероятность того, что эксперимен-
тальное значение отклика yg будет дальше от "идеального" значения М{yg}.
Поэтому разность ( yg - М{yg} ), обусловленную влиянием шума δ{w} (см.
уравнение (1)), можно рассматривать как "ошибку" экспериментального оп –
ределения значения отклика yg, а дисперсию σ vos
                                             2 как меру этой ошибки.

Это обуславливает особое значение дисперсии воспроизводимости для обра-
ботки экспериментальных данных.


12