ВУЗ:
Составители:
формулируется следующим образом /8/.
Оптимальное управление
(поведение) определяется лишь целью и состоянием системы в
рассматриваемый момент времени и не зависит от состояний в
предыдущие моменты времени.
Из сформулированного принципа оптимальности следует, что в текущем
состоянии системы и поставленной цели заключена вся информация,
необходимая для определения дальнейшего оптимального управления.
Использование принципа оптимальности позволяет построить алгоритм
определения оптимального управления в динамической системе, т. е. развить
так называемый
метод динамического программирования.
Для изложения метода динамического программирования
применительно к непрерывным системам и процессам в них рассмотрим
внутри интервала
(t
0
, t
k
) момент времени t такой, что t
0
≤ t ≤ t
k
, и введем
функционал потерь вида
∫
+=
k
t
t
2k1k
ф)d
ф
u,(Y,l)t(Y,l)tu,Y,I(t, . (95)
Этот функционал учитывает как потери в конечном состоянии системы,
так и оставшиеся потери на интервале
(t, t
k
). При этом на управление
накладывается дополнительное ограничение
(
)
riUu
ii
,1,|
0
|
=
≤
. (95а)
В рассматриваемой стохастической задаче и при неточных измерениях
вектора фазовых координат вся информация о состоянии объекта измерения
содержится в апостериорной функции плотности вероятности
при
наблюдении вектора
Z(t) в интервале (t
)t,y(
€
)l(
1
ω
0
, t). Функционал потерь (95) является
случайной величиной. Наилучшей оценкой его в смысле минимума средней
квадратической ошибки при наблюдения вектора
Z(t) является условное
математическое ожидание. Условное математическое ожидание функционала
(95) зависит от указанной апостериорной функция плотности вероятности.
81
формулируется следующим образом /8/. Оптимальное управление (поведение) определяется лишь целью и состоянием системы в рассматриваемый момент времени и не зависит от состояний в предыдущие моменты времени. Из сформулированного принципа оптимальности следует, что в текущем состоянии системы и поставленной цели заключена вся информация, необходимая для определения дальнейшего оптимального управления. Использование принципа оптимальности позволяет построить алгоритм определения оптимального управления в динамической системе, т. е. развить так называемый метод динамического программирования. Для изложения метода динамического программирования применительно к непрерывным системам и процессам в них рассмотрим внутри интервала (t0, tk) момент времени t такой, что t0 ≤ t ≤ tk, и введем функционал потерь вида tk I(t,Y,u,t k ) = l1 (Y,t k ) + ∫ l 2 (Y,u, ф)dф. (95) t Этот функционал учитывает как потери в конечном состоянии системы, так и оставшиеся потери на интервале (t, tk). При этом на управление накладывается дополнительное ограничение | ui |≤ U 0i , (i = 1, r ) . (95а) В рассматриваемой стохастической задаче и при неточных измерениях вектора фазовых координат вся информация о состоянии объекта измерения содержится в апостериорной функции плотности вероятности ω€1( l ) ( y ,t ) при наблюдении вектора Z(t) в интервале (t0, t). Функционал потерь (95) является случайной величиной. Наилучшей оценкой его в смысле минимума средней квадратической ошибки при наблюдения вектора Z(t) является условное математическое ожидание. Условное математическое ожидание функционала (95) зависит от указанной апостериорной функция плотности вероятности. 81
Страницы
- « первая
- ‹ предыдущая
- …
- 79
- 80
- 81
- 82
- 83
- …
- следующая ›
- последняя »