Математическое моделирование и хаотические временные ряды. Безручко Б.П - 230 стр.

UptoLike

Рубрика: 

Часть II. Моделирование по временным рядам
216
переобучена. Это основное проявление некорректности постановки задачи.
Избежать переобучения моделиодна из важнейших проблем при
эмпирическом моделировании!
Рис.7.4. Аппроксимация зависимости при квадратичной функции
F(t) по ряду длиной
N = 16 точек многочленами различных порядков. а) Графики модельных функций
различных порядков 1=
P
K
. Тонкая линиянедообученная модель, жирная линия
переобученная. Штриховая линияоптимальная. б) Выбор оптимального порядка по
ошибкам прогноза (общая иллюстрация). в) Выбор оптимального порядка по
критериям Шварца и Акаике. Результаты расчетов для примера, показанного на
рисунке (а)
7.2.3.2. Критерий минимума тестовой ошибки.
Если в
распоряжении исследователя есть еще один временной ряд того же
процесса Nit
ii
=
,...,1,,
η
(тестовый), то хорошим критерием выбора
порядка многочлена является минимум тестовой ошибки аппроксимации
для модели с заданным порядком многочлена, полученной по
тренировочному ряду,
()
=
=
N
i
iitest
tf
N
1
2
2
)
ˆ
,(
1
ˆ
c
ηε
. (7.29)
Причем можно пользоваться еще и следующим соображением: для
непереобученной модели величины
2
ˆ
ε
и
2
ˆ
test
ε
примерно равны.
Минимизация (7.29) – самый надежный способ выбора K (рис.7.4,б,
светлые кружки), поскольку он основан на расчете не по той выборке, по
которой строилась модель. Такие критерии называются вневыборочными.
7.2.3.3. Критерий насыщения «тренировочной» ошибки. Однако
тестовый ряд не всегда есть в наличии, и приходится извлекать
необходимую информацию из имеющегося тренировочного ряда.
Соответствующие критерии называют внутривыборочными. Если по
характеру уменьшения
2
ˆ
ε
с ростом K видно, что при значениях K,
больших некоторого «порогового», погрешность меняется слабо
наблюдается насыщение, то это пороговое значение и можно выбрать как
наилучшее (рис.7.4,б, треугольники). Нередко такой подход может дать