Нейросетевые технологии. Каширина И.Л. - 24 стр.

UptoLike

Составители: 

24
Дополнительное преимущество от введения моментапоявляющая-
ся у алгоритма способность преодолевать мелкие локальные минимумы.
Правда, недостатком данного метода является введение еще одного гло-
бального настроечного параметра.
Еще одной удачной модификацией обучения является
алгоритм
RPROP
, в котором каждый вес имеет свой адаптивно настраиваемый темп
обучения.
RPROP использует лишь знаки частных производных по каждому
весу, а не их значения:
1
,
NNN
ij ij ij
www
+
=+Δ где
1
1
1
1
,0
.
,0
NN
N
ij
ij ij
N
ij
NN
N
ij
ij ij
EE
w
ww
w
EE
w
ww
η
η
+−
−−
∂∂
Δ
>
∂∂
Δ=
∂∂
Δ
<
∂∂
Если знак производной по данному весу изменил направление, значит пре-
дыдущее значение шага по данной координате было слишком велико, и ал-
горитм уменьшает его в η
1 раз. В противном случае шаг увеличивается
в
η
+
> 1 раз для ускорения обучения вдали от минимума. Рекомендованные
значения
η
= 0.5, η
+
= 1.2.
Обратное распространение было использовано в широкой сфере
прикладных исследований. В частности фирма NEC в Японии использова-
ла обратное распространение для визуального распознавания букв (в том
числе рукописных), причем точность превысила 99 %. Достигнут впечат-
ляющий успех с Net-Talk, системой, которая превращает печатный англий-
ский текст в высококачественную речь. Магнитофонная запись процесса
обучения сильно напоминает
звуки ребенка на разных этапах обучения ре-
чи. Но несмотря на многочисленные успешные применения обратного
распространения, оно не является панацеей. Больше всего неприятностей
приносит неопределенно долгий процесс обучения. В сложных задачах для
обучения сети могут потребоваться часы или даже дни, она может и вооб-
ще не обучиться. Неудачи в обучении часто
возникают по причине попа-
дания сети в локальный минимум, что, к сожалению, является характерной
особенностью методов градиентного спуска. Исправить ситуацию в таком
случае иногда помогают небольшие случайные изменения весовых значе-
ний сети.
УПРАЖНЕНИЯ
1. Напишите программу, обучающую сеть обратного распространения игре
в «крестики-нолики» 3 × 3. Клетки доски закодированы позициями 1..9.
Входным вектором является девятимерный вектор, в котором в соответ-
ствующей позиции задается 0.01, если в ней находится «нолик», 0.99 – если
       Дополнительное преимущество от введения момента – появляющая-
ся у алгоритма способность преодолевать мелкие локальные минимумы.
Правда, недостатком данного метода является введение еще одного гло-
бального настроечного параметра.
       Еще одной удачной модификацией обучения является алгоритм
RPROP, в котором каждый вес имеет свой адаптивно настраиваемый темп
обучения.
       RPROP использует лишь знаки частных производных по каждому
весу, а не их значения:
                              ⎧                         N −1
                               ⎪ η + Δw N −1 , ∂ E ∂ E > 0
                                                  N

                               ⎪       ij
  N +1
                               ⎪⎪              ∂ wij ∂ wij
wij = wij + Δwij , где Δwij = ⎨
         N      N         N
                                                             .
                                ⎪ − N −1 ∂ E N ∂ E N −1
                                ⎪
                              ⎪ η Δwij , ∂ w ∂ w < 0
                              ⎪⎩                  ij     ij

Если знак производной по данному весу изменил направление, значит пре-
дыдущее значение шага по данной координате было слишком велико, и ал-
горитм уменьшает его в η–≤ 1 раз. В противном случае шаг увеличивается
в η+ > 1 раз для ускорения обучения вдали от минимума. Рекомендованные
значения η– = 0.5, η+ = 1.2.
       Обратное распространение было использовано в широкой сфере
прикладных исследований. В частности фирма NEC в Японии использова-
ла обратное распространение для визуального распознавания букв (в том
числе рукописных), причем точность превысила 99 %. Достигнут впечат-
ляющий успех с Net-Talk, системой, которая превращает печатный англий-
ский текст в высококачественную речь. Магнитофонная запись процесса
обучения сильно напоминает звуки ребенка на разных этапах обучения ре-
чи. Но несмотря на многочисленные успешные применения обратного
распространения, оно не является панацеей. Больше всего неприятностей
приносит неопределенно долгий процесс обучения. В сложных задачах для
обучения сети могут потребоваться часы или даже дни, она может и вооб-
ще не обучиться. Неудачи в обучении часто возникают по причине попа-
дания сети в локальный минимум, что, к сожалению, является характерной
особенностью методов градиентного спуска. Исправить ситуацию в таком
случае иногда помогают небольшие случайные изменения весовых значе-
ний сети.

                            УПРАЖНЕНИЯ
1. Напишите программу, обучающую сеть обратного распространения игре
в «крестики-нолики» 3 × 3. Клетки доски закодированы позициями 1..9.
Входным вектором является девятимерный вектор, в котором в соответ-
ствующей позиции задается 0.01, если в ней находится «нолик», 0.99 – если
                                   24