Нейросетевые структуры и технологии. Часть 1. Электрические и математические модели нейронов. НС прямого распространения. Клюкин В.И - 30 стр.

UptoLike

ВУЗ:

ВГУ | Воронеж

Составители:

Рубрика:

Информатика и информационные технологии

3.2.1.3. Алгоритм Левенберга–Марквардта (АЛМ)

Как и АПМ, АЛМ относится к ньютоновским методам оптимизации с

заменой

()

приближенным

()

, рассчитываемым на основе имеющейся

информации о

()

с учетом некоторого фактора регуляризации. Обозначая

( )

ewJw

éù

¶¶

éù

êú

¶¶

êú

ºº

êú

¶¶

êú

ëû

êú

¶¶

ëû

(3.8)

где

(

)

(

)

iii

ewywd

º-

éù

ëû

, вектор градиента

()

и матрицу

()

можно

представить в виде

( ) ( ) ( )

( ) ( ) ( ) ( )

;

gwJwew

GwJwJwRw

=éù

ëû

=+éù

ëû

rrrrr

rrrr

(3.9)

где

()

– компоненты

()

с высшими производными относительно

, ко-

торые в АЛМ аппроксимируются с помощью скалярного параметра Левенбер-

га–Марквардта

, изменяющегося в процессе оптимизации таким образом, что

( ) ( ) ( )

tttt

GwJwJw

éù

=+×

ëû

rrr

(3.10)

В начале обучения, когда значения

далеки от решения, использу-

ют

(

)

[

]

(

)

wJwJ

, то есть

(

)

()

, однако по мере

уменьшения погрешности

(

)

первое слагаемое в (3.10) начинает играть

все более важную роль. Эффективность метода сильно зависит от выбора

. Существуют различные способы подбора этого параметра, однако наи-

более известна методика Д. Марквардта:

– если

æö

ç÷

èø

, то

, где r>1 – коэффициент уменьшения

;

– если

æö

ç÷

èø

, а

(

)

, то

;

– если

æö

ç÷

èø

(

)

, то

= до достижения

(

)

ErE

3.2.1.3. Алгоритм Левенберга–Марквардта (АЛМ)
       Как и АПМ, АЛМ относится к ньютоновским методам оптимизации с
             �                   �
заменой H ( w) приближенным G ( w) , рассчитываемым на основе имеющейся
               � �
информации о g ( w) с учетом некоторого фактора регуляризации. Обозначая

                                           �                � �e1            �e1 �
                                    � e1 � w � �            � �w �
                                    �      �   �                             �wn �
                        � � � e2 � w � �                    � 1                   �
                        e � w� �                 ; J � w� � � �               � �,           (3.8)
                                    � � �                   �                     �
                                    �      � �              � �e p �         �e p �
                                    �e p � w � �            �� �w1           �wn ��
         �             �                                        � �                      �
где ei � w � � �� yi � w � � di �� , вектор градиента g ( w) и               матрицу G ( w) можно
представить в виде
                       � �              � T� �
                       g � w � � �� J � w � �� e � w � ;
                           �            � T         �        �         (3.9)
                       G � w � � �� J � w � �� J � w � � R � w � ,
       �                    �                                        �
где R( w) – компоненты H ( w) с высшими производными относительно w , ко-
торые в АЛМ аппроксимируются с помощью скалярного параметра Левенбер-
га–Марквардта �, изменяющегося в процессе оптимизации таким образом, что
                                  �             � T         �
                              G � wt � � �� J � wt � �� J � wt � � �t � 1.                  (3.10)
                                                       �
        В начале обучения, когда значения wt далеки от решения, использу-
                                                                     � �
                  � T �                    �                �        g ( wt )
ют � t �� �J �w�� J �w� , то есть G �wi � � � t � 1 и pt � �                  , однако по мере
                                                                       �t
                                     �
уменьшения погрешности ei � w � первое слагаемое в (3.10) начинает играть
все более важную роль. Эффективность метода сильно зависит от выбора
�t. Существуют различные способы подбора этого параметра, однако наи-
более известна методика Д. Марквардта:
                     �� �                �
        – если E � t �1 � � Et , то �t � t �1 , где r>1 – коэффициент уменьшения �;
                     � r �                 r
                     �� �
        – если E � t �1 � � Et , а E ��t �1 � � Et , то �t � �t �1 ;
                     � r �
                      �� �
        – если E � t �1 � � Et и E ��t �1 � � Et , то �t � �t �1r m до достижения
                      � r �
E ��t �1r m � � Et .

                                                       30

Заказать работу

Нейросетевые структуры и технологии. Часть 1. Электрические и математические модели нейронов. НС прямого распространения. Клюкин В.И - 30 стр.

UptoLike

ВУЗ:

Клюкин В.И.

Николаенков Ю.К.

Информатика и информационные технологии

Вы здесь

Нейросетевые структуры и технологии. Часть 1. Электрические и математические модели нейронов. НС прямого распространения. Клюкин В.И - 30 стр.

UptoLike

ВУЗ:

Клюкин В.И.

Николаенков Ю.К.

Информатика и информационные технологии

Страницы