Составители:
Рубрика:
Часть II. Моделирование по временным рядам
216
переобучена. Это основное проявление некорректности постановки задачи.
Избежать переобучения модели – одна из важнейших проблем при
эмпирическом моделировании!
Рис.7.4. Аппроксимация зависимости при квадратичной функции
F(t) по ряду длиной
N = 16 точек многочленами различных порядков. а) Графики модельных функций
различных порядков 1−=
P
K
. Тонкая линия – недообученная модель, жирная линия –
переобученная. Штриховая линия – оптимальная. б) Выбор оптимального порядка по
ошибкам прогноза (общая иллюстрация). в) Выбор оптимального порядка по
критериям Шварца и Акаике. Результаты расчетов для примера, показанного на
рисунке (а)
7.2.3.2. Критерий минимума тестовой ошибки.
Если в
распоряжении исследователя есть еще один временной ряд того же
процесса Nit
ii
′
=
′′
,...,1,,
η
(тестовый), то хорошим критерием выбора
порядка многочлена является минимум тестовой ошибки аппроксимации
для модели с заданным порядком многочлена, полученной по
тренировочному ряду,
()
∑
′
=
′
−
′
′
=
N
i
iitest
tf
N
1
2
2
)
ˆ
,(
1
ˆ
c
ηε
. (7.29)
Причем можно пользоваться еще и следующим соображением: для
непереобученной модели величины
2
ˆ
ε
и
2
ˆ
test
ε
примерно равны.
Минимизация (7.29) – самый надежный способ выбора K (рис.7.4,б,
светлые кружки), поскольку он основан на расчете не по той выборке, по
которой строилась модель. Такие критерии называются вневыборочными.
7.2.3.3. Критерий насыщения «тренировочной» ошибки. Однако
тестовый ряд не всегда есть в наличии, и приходится извлекать
необходимую информацию из имеющегося тренировочного ряда.
Соответствующие критерии называют внутривыборочными. Если по
характеру уменьшения
2
ˆ
ε
с ростом K видно, что при значениях K,
больших некоторого «порогового», погрешность меняется слабо –
наблюдается насыщение, то это пороговое значение и можно выбрать как
наилучшее (рис.7.4,б, треугольники). Нередко такой подход может дать
Страницы
- « первая
- ‹ предыдущая
- …
- 228
- 229
- 230
- 231
- 232
- …
- следующая ›
- последняя »
