Нейронные сети и нейроконтроллеры. Бураков М.В. - 119 стр.

UptoLike

Составители: 

119
вается нескоррелированной с ошибкой обучения инверсного кон-
троллера e
u
(t), т. е. она может иметь другие знак и амплитуду [26].
В то же время любая достаточно грубая аппроксимация e
u
(t) с
помощью e
y
(t) позволяет процессу обучения сходиться.
Для того чтобы избежать проблем специализированного инверс-
ного обучения была разработана схема обратного распростране-
ния ошибки во времени [26, 43].
Этот алгоритм основан на идее применения двух нейронных
сетей, одна из которых выполняет функцию нейроконтроллера, а
вторая функцию нейроэмулятора, который обучается моделиро-
вать динамику объекта управления.
На первом этапе происходит обучение нейроэмулятора в режи-
ме offline. Нейроэмулятор считается обученным, если при одина-
ковых значениях на его входах и входах реального объекта разли-
чие их значений на выходах становится незначительным. После
завершения обучения нейроэмулятора проводится обучение ней-
роконтроллера. Обучение выполняется в режиме on line по такой
же схеме, как и в случае инверсного специализированного нейро-
управления (рис. 4.28).
В процессе обучения НК текущая ошибка управления пропуска-
ется через нейроэмулятор в обратном направлении.
Алгоритм позволяет эмулировать e
u
(t) посредством использова-
ния ошибки обратного распространения e
y
(t) через предсказываю-
щую модель (forward model). Здесь ошибка e
y
(t), распространяясь
обратно к входному слою, будет соответствовать ошибке e
u
(t). Это
делает схему обучения пригодной для использования в большин-
стве линейных систем.
Механизм обратного прохождения ошибки через нейроэмуля-
тор реализует локальную инверсную модель в текущей точке про-
Рис. 4.28. Обратное распространение во времени
е
u
(t)
Обучение
u (t)
Объект
y(t)
Нейро-
контроллер
g(t)
Нейроэмулятор
y
*
(t)
+
е
y
(t)