Нейросетевые технологии. Каширина И.Л. - 20 стр.

UptoLike

ВУЗ:

ВГУ | Воронеж

Составители:

Каширина И.Л.

Рубрика:

Информатика и информационные технологии

При обучении нейронной сети ставится задача минимизации целе-

вой

функции ошибки, которая находится по методу наименьших квадратов:

∑

−=

dyVWE

)(

),( ,

где

– полученное реальное значение k-го выхода нейросети при подаче

на нее одного из входных образов обучающей выборки;

– требуемое (це-

левое) значение

k-го выхода для этого образа.

Обучение нейросети производится известным оптимизационным ме-

тодом градиентного спуска, т. е. на каждой итерации изменение веса про-

изводится по формулам:

∂

−=

∂

−=

где

– параметр, определяющий скорость обучения.

В качестве активационной функции в сети обратного распростране-

ния обычно используется логистическая функция

−

)(, где

s –

взвешенная сумма входов нейрона. Эта функция удобна для вычислений в

градиентном методе, так как имеет простую производную:

))(1)((

)1(

)('

sfsf

−=

−

Функция ошибки в явном виде не содержит зависимости от весовых

коэффициентов

w , поэтому для вычисления производных

∂

воспользуемся формулами дифференцирования сложной функции:

Рис. 11. Ней

онная сеть об

атного

асп

ост

анения

           Рис. 11. Нейронная сеть обратного распространения
      При обучении нейронной сети ставится задача минимизации целе-
вой функции ошибки, которая находится по методу наименьших квадратов:
                                     1 p
                       E (W ,V ) = ∑ ( yk − d k ) 2 ,
                                     2 k =1
где yk  полученное реальное значение k-го выхода нейросети при подаче
на нее одного из входных образов обучающей выборки; dk  требуемое (це-
левое) значение k-го выхода для этого образа.
      Обучение нейросети производится известным оптимизационным ме-
тодом градиентного спуска, т. е. на каждой итерации изменение веса про-
изводится по формулам:
                                           ∂E                          ∂E
                      wijN +1 = wijN − α       , v Njk +1 = v Njk − α       ,
                                          ∂wij                        ∂v jk

где α  параметр, определяющий скорость обучения.
         В качестве активационной функции в сети обратного распростране-
                                                            1
ния обычно используется логистическая функция f ( s ) =           , где s 
                                                         1 + e− s
взвешенная сумма входов нейрона. Эта функция удобна для вычислений в
градиентном методе, так как имеет простую производную:
               e− s
 f ' (s) =                = f ( s )(1 − f ( s )) .
           (1 + e − s ) 2

     Функция ошибки в явном виде не содержит зависимости от весовых
                                                              ∂E    ∂E
коэффициентов Vjk и wij , поэтому для вычисления производных      ,
                                                             ∂v jk ∂wij
воспользуемся формулами дифференцирования сложной функции:
                                     20

Заказать работу

Вы здесь

Нейросетевые технологии. Каширина И.Л. - 20 стр.

UptoLike

ВУЗ:

Каширина И.Л.

Информатика и информационные технологии

Страницы