Математическое моделирование и хаотические временные ряды. Безручко Б.П - 229 стр.

UptoLike

Рубрика: 

Глава 7. Восстановление функциональных временных зависимостей
215
выбора порядка многочлена
1
+
=
P
K
. Теоретическое обоснование для
использования алгебраического многочлена дает знаменитая теорема
Вейерштрасса, согласно которой любая непрерывная на отрезке функция
может быть сколь угодно точно равномерно приближена алгебраическим
многочленом. Отсюда следует, что с помощью многочлена достаточно
высокого порядка K можно обеспечить сколь угодно малую величину
),(
F
f
ρ
.
7.2.3.1. Понятия недообученной и переобученной модели.
Какую
именно величину K выбрать на практике? Очень малый порядок
многочлена зачастую не годится, т.к. не дает возможности с хорошей
точностью аппроксимировать сложные зависимости. В таких случаях
говорят, что модель недообучена. Но, как мы покажем ниже, и слишком
высокие порядки не годятся. Важно строить достаточно «экономичную»
модель!
Проверенный способ действия состоит в том, чтобы строить модели с
многочленами f различных порядков, начиная с 0, и остановиться на том
значении K, когда дальнейшее увеличение перестает приводить к
улучшению модели по некоторому критерию. Таких критериев имеется
несколько: минимум тестовой ошибки
)
ˆ
(
ˆ
22
c
testtest
εε
= ; насыщение
эмпирической ошибки
2
ˆ
ε
; «скользящий контроль»; минимум некоторой
целевой функции, которая является суммой эмпирической ошибки
2
ˆ
ε
и
штрафного слагаемого (см. п. 7.2.3.5).
Все эти критерии направлены на «борьбу с некорректностью» задачи,
проявляющейся в том, что существует бесконечно много модельных
функций, способных одинаково хорошо описать конечный набор
экспериментальных точек на плоскости ),(
η
. Именно по этой причине
нельзя использовать для выбора порядка многочлена
K
простой и, казалось
бы, логичный критерий минимума эмпирической ошибки
2
ˆ
ε
. Дело в том,
что
2
ˆ
ε
всегда является невозрастающей функцией порядка K. Она равна
нулю, когда число коэффициентов многочлена P равно числу точек ряда N
(и все
i
t различны), т.е. график многочлена проходит в точности через
экспериментальные точки
(
)
ii
t
η
,. Но такая модель, как правило, крайне
плоха. Она «научилась» точно воспроизводить только наблюдаемую
случайную реализацию вместе со всеми ее шумами (рис.7.4,а). Из-за этого
она будет очень плохо предсказывать в среднем новые наблюдения, т.к.
при новых наблюдениях конкретные значения помехи будут другими.
Полученная таким образом функция )
ˆ
,(
c
f
как оценка )(
F
обладает
огромной дисперсией. Даже если эта оценка несмещена, ее случайная
погрешность может быть сколь угодно велика. Говорят, что такая модель
обладает плохой способностью к обобщению информации, она