ВУЗ:
Составители:
30
3.2.1.3. Алгоритм Левенберга–Марквардта (АЛМ)
Как и АПМ, АЛМ относится к ньютоновским методам оптимизации с
заменой
()
Hw
r
приближенным
()
Gw
r
, рассчитываемым на основе имеющейся
информации о
()
gw
rr
с учетом некоторого фактора регуляризации. Обозначая
( )
( )
( )
( )
( )
11
1
1
2
1
;,
n
pp
p
n
ee
ew
ww
ew
ewJw
ee
ew
ww
éù
¶¶
éù
êú
¶¶
êú
êú
êú
êú
ºº
êú
êú
¶¶
êú
êú
êú
ëû
êú
¶¶
ëû
r
L
r
rr
MM
M
r
L
(3.8)
где
(
)
(
)
iii
ewywd
º-
éù
ëû
rr
, вектор градиента
()
gw
rr
и матрицу
()
Gw
r
можно
представить в виде
( ) ( ) ( )
( ) ( ) ( ) ( )
;
,
T
T
gwJwew
GwJwJwRw
=éù
ëû
=+éù
ëû
rrrrr
rrrr
(3.9)
где
()
Rw
r
– компоненты
()
Hw
r
с высшими производными относительно
w
r
, ко-
торые в АЛМ аппроксимируются с помощью скалярного параметра Левенбер-
га–Марквардта
u
, изменяющегося в процессе оптимизации таким образом, что
( ) ( ) ( )
.
T
tttt
GwJwJw
u
éù
=+×
ëû
1
rrr
(3.10)
В начале обучения, когда значения
t
w
r
далеки от решения, использу-
ют
(
)
[
]
(
)
wJwJ
T
t
r
r
>>
u
, то есть
(
)
1
×
»
ti
wG
u
r
и
()
t
t
t
gw
p
u
=-
rr
r
, однако по мере
уменьшения погрешности
(
)
i
ew
r
первое слагаемое в (3.10) начинает играть
все более важную роль. Эффективность метода сильно зависит от выбора
u
t
. Существуют различные способы подбора этого параметра, однако наи-
более известна методика Д. Марквардта:
– если
1t
t
EE
r
u
-
æö
£
ç÷
èø
, то
1
t
t
r
u
u
-
=
, где r>1 – коэффициент уменьшения
u
;
– если
1t
t
EE
r
u
-
æö
>
ç÷
èø
, а
(
)
1
tt
EE
u
-
<
, то
1
tt
uu
-
=
;
– если
1t
t
EE
r
u
-
æö
>
ç÷
èø
и
(
)
1
tt
EE
u
-
>
, то
1
m
tt
r
uu
-
= до достижения
(
)
1
m
tt
ErE
u
-
£
.
3.2.1.3. Алгоритм Левенберга–Марквардта (АЛМ)
Как и АПМ, АЛМ относится к ньютоновским методам оптимизации с
� �
заменой H ( w) приближенным G ( w) , рассчитываемым на основе имеющейся
� �
информации о g ( w) с учетом некоторого фактора регуляризации. Обозначая
� � �e1 �e1 �
� e1 � w � � � �w �
� � � �wn �
� � � e2 � w � � � 1 �
e � w� � ; J � w� � � � � �, (3.8)
� � � � �
� � � � �e p � �e p �
�e p � w � � �� �w1 �wn ��
� � � � �
где ei � w � � �� yi � w � � di �� , вектор градиента g ( w) и матрицу G ( w) можно
представить в виде
� � � T� �
g � w � � �� J � w � �� e � w � ;
� � T � � (3.9)
G � w � � �� J � w � �� J � w � � R � w � ,
� � �
где R( w) – компоненты H ( w) с высшими производными относительно w , ко-
торые в АЛМ аппроксимируются с помощью скалярного параметра Левенбер-
га–Марквардта �, изменяющегося в процессе оптимизации таким образом, что
� � T �
G � wt � � �� J � wt � �� J � wt � � �t � 1. (3.10)
�
В начале обучения, когда значения wt далеки от решения, использу-
� �
� T � � � g ( wt )
ют � t �� �J �w�� J �w� , то есть G �wi � � � t � 1 и pt � � , однако по мере
�t
�
уменьшения погрешности ei � w � первое слагаемое в (3.10) начинает играть
все более важную роль. Эффективность метода сильно зависит от выбора
�t. Существуют различные способы подбора этого параметра, однако наи-
более известна методика Д. Марквардта:
�� � �
– если E � t �1 � � Et , то �t � t �1 , где r>1 – коэффициент уменьшения �;
� r � r
�� �
– если E � t �1 � � Et , а E ��t �1 � � Et , то �t � �t �1 ;
� r �
�� �
– если E � t �1 � � Et и E ��t �1 � � Et , то �t � �t �1r m до достижения
� r �
E ��t �1r m � � Et .
30
Страницы
- « первая
- ‹ предыдущая
- …
- 28
- 29
- 30
- 31
- 32
- …
- следующая ›
- последняя »
