Нейросетевые структуры и технологии. Часть 1. Электрические и математические модели нейронов. НС прямого распространения. Клюкин В.И - 27 стр.

UptoLike

ВУЗ:

ВГУ | Воронеж

Составители:

Рубрика:

Информатика и информационные технологии

Основным критерием для сравнения эффективности различных ме-

тодов обучения ИНС являются вычислительные затраты, то есть количест-

во циклов (время) плюс количество операций.

3.2.1. Градиентные методы

Согласно теории среди детерминированных методов оптимизации наи-

более эффективными считаются градиентные методы, связанные с разложе-

нием целевой функции

()

в ряд Тейлора в окрестности

решения

[ ]

()()()()(),

EwpEwgwppHwpOh

+=+++

rrrrrrrrr

(3.2)

где

(),,,

EEE

gwE

www

éù

¶¶¶

=Ñ=

êú

¶¶¶

ëû

K – вектор градиента,

, а симмет-

ричная квадратная матрица

()

производных 2-го порядка

111

()

nnn

wwww

éù

¶¶

êú

¶¶¶¶

êú

¶¶

êú

¶¶¶¶

ëû

называется гессианом.

Выражение (3.2) можно считать квадратичным приближением

()

ближайшей окрестности w. Точкой решения

будем считать точку, где

достигается минимум

()

с точностью O(h

), то есть

()0

, а гессиан

()

– положительно определен.

В процессе нахождения минимума

()

направление поиска

шаг h подбираются таким образом, чтобы для каждой очередной точки

(

)

tttt

wtwwp

+º=+

rrrr

выполнялось условие

(

)

(

)

EwEw

. Поиск про-

должается, пока

(

)

не станет меньше наперед заданной погрешности

e, или не будет превышено максимальное время вычислений (количество

итераций). В соответствии с этим универсальный оптимизационный алго-

ритм обучения ИНС можно представить в следующем виде (считаем, что

начальное значение

известно):

1. Проверка оптимальности текущего значения

, если «ДА», то

«STOP», если «НЕТ», то переход к пункту 2.

2. Определение вектора направления оптимизации

для точки

3. Выбор шага h

в направлении

, при котором выполняется усло-

вие

(

)

(

)

EwEw

     Основным критерием для сравнения эффективности различных ме-
тодов обучения ИНС являются вычислительные затраты, то есть количест-
во циклов (время) плюс количество операций.
3.2.1. Градиентные методы
       Согласно теории среди детерминированных методов оптимизации наи-
более эффективными считаются градиентные методы, связанные с разложе-
                          �                             �         �
нием целевой функции E ( w) в ряд Тейлора в окрестности p решения w

                   � �           �      � � T � 1�          � �
               E ( w � p ) � E ( w) � � g ( w) � p � pT H ( w) p � O (h3 ),      (3.2)
                                                    2
                                         T
    � �           � �E �E       �E �                          �
где g ( w) � �E � �    ,    ,�,     � – вектор градиента, h � p , а симмет-
                  � �w1 �w2     �wn �
                                 �
ричная квадратная матрица H ( w) производных 2-го порядка

         � �2E        �2E �
         � �w �w � �w �w �
    � �
             1   1     1   n �

H ( w) � � �            � � называется гессианом.
         � 2                  �
         � � E     �
                      �2E �
         � �wn �w1   �wn �wn ��
         �
                                                                                  �
Выражение (3.2) можно считать квадратичным приближением E ( w) в
                                                   �
ближайшей окрестности w. Точкой решения wp будем считать точку, где
                                 �                               � �
достигается минимум E ( w) с точностью O(h3), то есть g ( wp ) � 0 , а гессиан
     �
H ( w) – положительно определен.
                                                   �                                �
         В процессе нахождения минимума E ( w) направление поиска p и
шаг h подбираются таким образом, чтобы для каждой очередной точки
 �           �       �       �                          �             �
w � t � 1� � wt �1 � wt � ηt pt выполнялось условие E � wt �1 � � E � wt � . Поиск про-
                        � �
должается, пока g � p � не станет меньше наперед заданной погрешности
�, или не будет превышено максимальное время вычислений (количество
итераций). В соответствии с этим универсальный оптимизационный алго-
ритм обучения ИНС можно представить в следующем виде (считаем, что
                             � �
начальное значение wt �0 � w0 известно):
                                                      �
      1. Проверка оптимальности текущего значения wt , если «ДА», то
«STOP», если «НЕТ», то переход к пункту 2.
                                                        �
      2. Определение вектора направления оптимизации pt для точки wt .
                                         �
      3. Выбор шага �t в направлении pt , при котором выполняется усло-
вие E � wt �1 � � E � wt � .
                                               27

Заказать работу

Нейросетевые структуры и технологии. Часть 1. Электрические и математические модели нейронов. НС прямого распространения. Клюкин В.И - 27 стр.

UptoLike

ВУЗ:

Клюкин В.И.

Николаенков Ю.К.

Информатика и информационные технологии

Вы здесь

Нейросетевые структуры и технологии. Часть 1. Электрические и математические модели нейронов. НС прямого распространения. Клюкин В.И - 27 стр.

UptoLike

ВУЗ:

Клюкин В.И.

Николаенков Ю.К.

Информатика и информационные технологии

Страницы