ВУЗ:
Составители:
41
несущественным флуктуациям обучающих данных. Такая ситуация осо-
бенно заметна при использовании сети с излишним количеством весов.
Для предотвращения перетренированности НС служит контрольное под-
множество V, с помощью которого осуществляется оперативная проверка
фактически набранного уровня обобщения
()
G
Ew
r
.
3.3.2. Методы редукции и наращивания НС
Редукция ИНС производится для сокращения количества скрытых
нейронов и межнейронных связей, что усиливает способность сети к обоб-
щению. Большинство методов сокращения размерности НС можно разде-
лить на три группы:
1. Редукция НС с учетом величины весов предполагает отсечение ве-
сов, значительно меньших средних значений, поскольку они оказывают
небольшое влияние на уровень выходного сигнала связанных с ними ней-
ронов. Однако это не всегда справедливо и может быть связано, например,
с неудачным выбором
0
w
r
, то есть в случае отсечения могут произойти зна-
чительные изменения в функционировании НС. Поэтому этим методом це-
лесообразно пользоваться в редких и простейших случаях (например, от-
сечение одного или нескольких весов).
2. Редукция НС с учетом чувствительности основана на разложении
()
Ew
r
в ряд Тейлора (3.2) с использованием в качестве показателя важно-
сти конкретных весов вторых производных целевой функции. Одним из
лучших методов регуляризации НС считается метод OBD (Optimal Brain
Damage), в котором для упрощения задачи автор [Ле Кун] исходит из по-
ложительной определенности гессиана
()
Hw
r
, когда в качестве меры зна-
чимости используется коэффициент асимметрии
2
2
2
1
,
2
ijij
ij
E
Sw
w
¶
=
¶
(3.18)
содержащий только диагональные элементы
()
Hw
r
. Алгоритм OBD
выглядит следующим образом:
- полное предварительное обучение НС (любым способом);
- определение элементов S
ij
;
- сортировка w
ij
в порядке убывания S
ij
и отсечение наименее зна-
чимых (с минимальными S
ij
) w
ij
;
- возврат к началу и повторение процедуры с редуцированной НС.
Развитием метода OBD считается метод OBS (Optimal Brain Surgeon),
предложенный Б. Хассиби и Д. Шторком, где величина
2
1
1
2
i
i
ii
w
S
H
-
=
éù
ëû
(3.19)
несущественным флуктуациям обучающих данных. Такая ситуация осо-
бенно заметна при использовании сети с излишним количеством весов.
Для предотвращения перетренированности НС служит контрольное под-
множество V, с помощью которого осуществляется оперативная проверка
�
фактически набранного уровня обобщения EG ( w) .
3.3.2. Методы редукции и наращивания НС
Редукция ИНС производится для сокращения количества скрытых
нейронов и межнейронных связей, что усиливает способность сети к обоб-
щению. Большинство методов сокращения размерности НС можно разде-
лить на три группы:
1. Редукция НС с учетом величины весов предполагает отсечение ве-
сов, значительно меньших средних значений, поскольку они оказывают
небольшое влияние на уровень выходного сигнала связанных с ними ней-
ронов. Однако это не всегда справедливо и может быть связано, например,
�
с неудачным выбором w0 , то есть в случае отсечения могут произойти зна-
чительные изменения в функционировании НС. Поэтому этим методом це-
лесообразно пользоваться в редких и простейших случаях (например, от-
сечение одного или нескольких весов).
2. Редукция НС с учетом чувствительности основана на разложении
�
E ( w) в ряд Тейлора (3.2) с использованием в качестве показателя важно-
сти конкретных весов вторых производных целевой функции. Одним из
лучших методов регуляризации НС считается метод OBD (Optimal Brain
Damage), в котором для упрощения задачи автор [Ле Кун] исходит из по-
�
ложительной определенности гессиана H ( w) , когда в качестве меры зна-
чимости используется коэффициент асимметрии
1 �2E 2
Sij � wij , (3.18)
2 �wij2
�
содержащий только диагональные элементы H ( w) . Алгоритм OBD
выглядит следующим образом:
� полное предварительное обучение НС (любым способом);
� определение элементов Sij;
� сортировка wij в порядке убывания Sij и отсечение наименее зна-
чимых (с минимальными Sij) wij;
� возврат к началу и повторение процедуры с редуцированной НС.
Развитием метода OBD считается метод OBS (Optimal Brain Surgeon),
предложенный Б. Хассиби и Д. Шторком, где величина
1 wi2
Si � (3.19)
2 �� H �1 ��
ii
41
Страницы
- « первая
- ‹ предыдущая
- …
- 39
- 40
- 41
- 42
- 43
- …
- следующая ›
- последняя »
