ВУЗ:
Составители:
формулируется следующим образом /8/.
Оптимальное управление
(поведение) определяется лишь целью и состоянием системы в
рассматриваемый момент времени и не зависит от состояний в
предыдущие моменты времени.
Из сформулированного принципа оптимальности следует, что в текущем
состоянии системы и поставленной цели заключена вся информация,
необходимая для определения дальнейшего оптимального управления.
Использование принципа оптимальности позволяет построить алгоритм
определения оптимального управления в динамической системе, т. е. развить
так называемый
метод динамического программирования.
Для изложения метода динамического программирования
применительно к непрерывным системам и процессам в них рассмотрим
внутри интервала
(t
0
, t
k
) момент времени t такой, что t
0
≤ t ≤ t
k
, и введем
функционал потерь вида
∫
+=
k
t
t
2k1k
ф)d
ф
u,(Y,l)t(Y,l)tu,Y,I(t, . (95)
Этот функционал учитывает как потери в конечном состоянии системы,
так и оставшиеся потери на интервале
(t, t
k
). При этом на управление
накладывается дополнительное ограничение
(
)
riUu
ii
,1,|
0
|
=
≤
. (95а)
В рассматриваемой стохастической задаче и при неточных измерениях
вектора фазовых координат вся информация о состоянии объекта измерения
содержится в апостериорной функции плотности вероятности
при
наблюдении вектора
Z(t) в интервале (t
)t,y(
€
)l(
1
ω
0
, t). Функционал потерь (95) является
случайной величиной. Наилучшей оценкой его в смысле минимума средней
квадратической ошибки при наблюдения вектора
Z(t) является условное
математическое ожидание. Условное математическое ожидание функционала
(95) зависит от указанной апостериорной функция плотности вероятности.
81
формулируется следующим образом /8/. Оптимальное управление
(поведение) определяется лишь целью и состоянием системы в
рассматриваемый момент времени и не зависит от состояний в
предыдущие моменты времени.
Из сформулированного принципа оптимальности следует, что в текущем
состоянии системы и поставленной цели заключена вся информация,
необходимая для определения дальнейшего оптимального управления.
Использование принципа оптимальности позволяет построить алгоритм
определения оптимального управления в динамической системе, т. е. развить
так называемый метод динамического программирования.
Для изложения метода динамического программирования
применительно к непрерывным системам и процессам в них рассмотрим
внутри интервала (t0, tk) момент времени t такой, что t0 ≤ t ≤ tk, и введем
функционал потерь вида
tk
I(t,Y,u,t k ) = l1 (Y,t k ) + ∫ l 2 (Y,u, ф)dф. (95)
t
Этот функционал учитывает как потери в конечном состоянии системы,
так и оставшиеся потери на интервале (t, tk). При этом на управление
накладывается дополнительное ограничение
| ui |≤ U 0i , (i = 1, r ) . (95а)
В рассматриваемой стохастической задаче и при неточных измерениях
вектора фазовых координат вся информация о состоянии объекта измерения
содержится в апостериорной функции плотности вероятности ω€1( l ) ( y ,t ) при
наблюдении вектора Z(t) в интервале (t0, t). Функционал потерь (95) является
случайной величиной. Наилучшей оценкой его в смысле минимума средней
квадратической ошибки при наблюдения вектора Z(t) является условное
математическое ожидание. Условное математическое ожидание функционала
(95) зависит от указанной апостериорной функция плотности вероятности.
81
Страницы
- « первая
- ‹ предыдущая
- …
- 79
- 80
- 81
- 82
- 83
- …
- следующая ›
- последняя »
