ВУЗ:
Составители:
ipjpijp
yw
ηδ
=
∆
(2.5)
где изменение в силе связи w
ij
для p-й обучающей пары пропорционально произ-
ведению сигнала ошибки δ
j
-го блока, получающего входной сигнал по этой связи,
и выходного сигнала блока i, посылающего сигнал по этой связи. η-коэффициент,
определяющий скорость обучения (маленькая величина). Определение сигнала
ошибки является рекурсивным процессом, который начинается с выходных бло-
ков (с конца).
Для выходного блока сигнал ошибки
)(
ipjpjip
ody −
′
=
δ
(2.6)
где d
j
и o
j
- желаемое и действительное значения выходного сигнала j-го бло-
ка;
у
j
' - производная нелинейности блока.
Сигнал ошибки для скрытого блока определяется рекурсивно через сигнал
ошибки блоков, с которым соединен его выход, и веса этих связей:
∑
′
=
k
kjkpjip
wy
δδ
(2.7)
Для используемой сигмовидной нелинейности:
)1(
jjj
yyy −=
′
,
(2.8)
т. к. 0 ≤ y
j
≤ 1, то производная максимальна при у
j
= 0,5 и равна нулю при у
j
= 0
или 1. Соответственно веса изменяются максимально для блоков, которые еще
не выбрали свое состояние (если у
j
= 0 или 1 - оно выбрано).
Т. к. при конечных весах выходные сигналы блоков не могут достигать
значений 0 или 1, поэтому
〉
〈
=
9.0 если ,1
1.0 если ,0
j
j
j
y
y
y
Модификация весов производится после предъявления каждой пары вход -
выход.
Причем, если коэффициент η, определяющий скорость обучения, мал, то
можно показать, что обобщенное дельта-правило достаточно хорошо аппрокси-
мирует минимизацию общей ошибки функционирования сети D методом гради-
ентного спуска в пространстве весов. Общая ошибка функционирования сети
определяется так:
∑∑
−=
pj
jpjp
doD
2
)(
2
1
(2.9)
Обучение продолжается до тех пор, пока ошибка не уменьшится до задан-
ной величины.
Эмпирические результаты свидетельствуют о том, что при малых η систе-
ма находит достаточно хороший минимум D.
14
∆ p wij = ηδ jp y ip (2.5) где изменение в силе связи wij для p-й обучающей пары пропорционально произ- ведению сигнала ошибки δj-го блока, получающего входной сигнал по этой связи, и выходного сигнала блока i, посылающего сигнал по этой связи. η-коэффициент, определяющий скорость обучения (маленькая величина). Определение сигнала ошибки является рекурсивным процессом, который начинается с выходных бло- ков (с конца). Для выходного блока сигнал ошибки δ ip = y j ′ (d jp − oip ) (2.6) где dj и oj - желаемое и действительное значения выходного сигнала j-го бло- ка; уj' - производная нелинейности блока. Сигнал ошибки для скрытого блока определяется рекурсивно через сигнал ошибки блоков, с которым соединен его выход, и веса этих связей: δ ip = y j ′ ∑ δ kp wkj (2.7) k Для используемой сигмовидной нелинейности: ′ y j = y j (1 − y j ) , (2.8) т. к. 0 ≤ yj ≤ 1, то производная максимальна при уj = 0,5 и равна нулю при уj = 0 или 1. Соответственно веса изменяются максимально для блоков, которые еще не выбрали свое состояние (если уj = 0 или 1 - оно выбрано). Т. к. при конечных весах выходные сигналы блоков не могут достигать значений 0 или 1, поэтому 0, если y j 〈 0.1 yj = 1, если y j 〉 0.9 Модификация весов производится после предъявления каждой пары вход - выход. Причем, если коэффициент η, определяющий скорость обучения, мал, то можно показать, что обобщенное дельта-правило достаточно хорошо аппрокси- мирует минимизацию общей ошибки функционирования сети D методом гради- ентного спуска в пространстве весов. Общая ошибка функционирования сети определяется так: 1 D= ∑∑ 2 p j (o jp − d jp ) 2 (2.9) Обучение продолжается до тех пор, пока ошибка не уменьшится до задан- ной величины. Эмпирические результаты свидетельствуют о том, что при малых η систе- ма находит достаточно хороший минимум D. 14
Страницы
- « первая
- ‹ предыдущая
- …
- 11
- 12
- 13
- 14
- 15
- …
- следующая ›
- последняя »