ВУЗ:
Составители:
42
стремятся к состоянию минимума энергии, но при высоких температурах
энергия атомных движений препятствует этому. В процессе постепенного
охлаждения металла возникают все более низкоэнергетические состояния,
пока в конце концов не будет достигнуто наиболее низкое из возможных
состояний – глобальный минимум. В процессе отжига распределение энер-
гетических уровней описывается следующим соотношением:
kT
E
eEP
−
=)(,
где Р(E) – вероятность того, что система находится в состоянии с энергией E;
k – постоянная Больцмана; Т – температура по шкале Кельвина.
При высоких температурах Р(E) приближается к единице для всех
энергетических состояний. Таким образом, высокоэнергетическое состоя-
ние почти столь же вероятно, как и низкоэнергетическое. По мере умень-
шения температуры
вероятность высокоэнергетических состояний умень-
шается по сравнению с низкоэнергетическими. При приближении темпера-
туры к нулю становится весьма маловероятным, чтобы система находилась
в высокоэнергетическом состоянии.
Этот стохастический метод непосредственно применим к обучению
искусственных нейронных сетей и относится к классу алгоритмов обуче-
ния с учителем.
Алгоритм обучения Больцмана
Шаг 1.
Определить переменную Т, представляющую искусственную тем-
пературу. Придать Т большое начальное значение.
Шаг 2. Подать на вход сети один из входных образов обучающей выборки
и вычислить реальный выход и значение функции ошибки сети (как в ал-
горитме обратного распространения).
Шаг 3. Придать случайное изменение
ij
w
Δ
выбранному весу
ij
w и пере-
считать выход сети и изменение функции ошибки в соответствии со сде-
ланным изменением веса.
Шаг 4. Если функция ошибки уменьшилась, то сохранить изменение веса.
Если изменение веса приводит к увеличению функции ошибки, то вероят-
ность сохранения этого изменения вычисляется с помощью распределения
Больцмана:
T
w
ij
ij
ewP
Δ−
=Δ )(. Выбирается случайное число r из равномерно-
го распределения от нуля до единицы. Если )(
ij
wP
Δ
больше, чем r, то из-
менение сохраняется, в противном случае величина веса возвращается к
предыдущему значению.
Шаг 5. Повторять шаги 3 и 4 для каждого из весов сети, постепенно
уменьшая температуру Т, пока не будет достигнуто допустимо низкое зна-
чение целевой функции.
стремятся к состоянию минимума энергии, но при высоких температурах энергия атомных движений препятствует этому. В процессе постепенного охлаждения металла возникают все более низкоэнергетические состояния, пока в конце концов не будет достигнуто наиболее низкое из возможных состояний глобальный минимум. В процессе отжига распределение энер- −E гетических уровней описывается следующим соотношением: P ( E ) = ,e kT где Р(E) вероятность того, что система находится в состоянии с энергией E; k постоянная Больцмана; Т температура по шкале Кельвина. При высоких температурах Р(E) приближается к единице для всех энергетических состояний. Таким образом, высокоэнергетическое состоя- ние почти столь же вероятно, как и низкоэнергетическое. По мере умень- шения температуры вероятность высокоэнергетических состояний умень- шается по сравнению с низкоэнергетическими. При приближении темпера- туры к нулю становится весьма маловероятным, чтобы система находилась в высокоэнергетическом состоянии. Этот стохастический метод непосредственно применим к обучению искусственных нейронных сетей и относится к классу алгоритмов обуче- ния с учителем. Алгоритм обучения Больцмана Шаг 1. Определить переменную Т, представляющую искусственную тем- пературу. Придать Т большое начальное значение. Шаг 2. Подать на вход сети один из входных образов обучающей выборки и вычислить реальный выход и значение функции ошибки сети (как в ал- горитме обратного распространения). Шаг 3. Придать случайное изменение Δwij выбранному весу wij и пере- считать выход сети и изменение функции ошибки в соответствии со сде- ланным изменением веса. Шаг 4. Если функция ошибки уменьшилась, то сохранить изменение веса. Если изменение веса приводит к увеличению функции ошибки, то вероят- ность сохранения этого изменения вычисляется с помощью распределения − Δwij Больцмана: P(Δwij ) = e T . Выбирается случайное число r из равномерно- го распределения от нуля до единицы. Если P( Δwij ) больше, чем r, то из- менение сохраняется, в противном случае величина веса возвращается к предыдущему значению. Шаг 5. Повторять шаги 3 и 4 для каждого из весов сети, постепенно уменьшая температуру Т, пока не будет достигнуто допустимо низкое зна- чение целевой функции. 42
Страницы
- « первая
- ‹ предыдущая
- …
- 40
- 41
- 42
- 43
- 44
- …
- следующая ›
- последняя »