ВУЗ:
Составители:
Выражение
Κ
S при существовании соответствующего предела можно
рассматривать как производную от условного математического ожидания
функционала. Функциональное уравнение Беллмана (98) является общим со-
отношением, решающим поставленную задачу оптимизации функционала
(95) и определения оптимального управления.
Приведем доказательство этой теоремы, опираясь на доказательство,
полученное в /9/ для детерминированной задачи оптимизации.
Рассмотрим интервал времени
(t, t
k
), где t
0
≤
t
≤
t
k
. По определению
оптимальное управление на этом интервале доставляет минимум
функционалу
M
z
[I(t, Y, u, t
k
)]
S
. (100)
+=
∫
∈
∈
k
)
k
t,t(
0
t
t
2k1z
U)(u
)l(
1
d),u,Y(l)t,Y(lMmin))t,y(
€
,t(
ττω
τ
τ
Пользуясь аддитивностью интегралов для интервалов времени
t ≤ t +
∆
t
≤
t
k
, перепишем формулу (100) в виде
[]
+
+=
∫∫
+
+
∈
∈
k
)
k
t,t(
0
t
tt
2z
tt
t
2zk1z
U)(u
)l(
1
d),u,Y(lMd),u,Y(lM)t,Y(lMmin))t,y(
€
,t(S
∆
∆
τ
ττττω
τ
(101)
Применим сформулированный принцип оптимальности к выражению
(101). На основании этого принципа оптимальное управление
и для системы
на интервале
(t, t
k
) обладает следующим свойством: для любого момента
времени t +
∆
t, заключенного в интервале t ≤ t +
∆
t
≤
t
k
, управление должно
быть оптимальным относительно состояния Y
t+∆t
независимо от значений,
которое оно принимало на предшествующем интервале
(t, t +
∆
t). На
основании этого запишем
+++
=
∫
+
∈
∈
))]tt,y(
€
,tt(S[Md),u,Y(lMmin))t,y(
€
,t(S
)l(
1z
tt
t
2z
U)(u
)l(
1
tt
)
k
t,t(
0
∆ω∆ττω
∆
τ
τ
(102)
где
83
Выражение ΚS при существовании соответствующего предела можно рассматривать как производную от условного математического ожидания функционала. Функциональное уравнение Беллмана (98) является общим со- отношением, решающим поставленную задачу оптимизации функционала (95) и определения оптимального управления. Приведем доказательство этой теоремы, опираясь на доказательство, полученное в /9/ для детерминированной задачи оптимизации. Рассмотрим интервал времени (t, tk), где t0 ≤ t ≤ tk. По определению оптимальное управление на этом интервале доставляет минимум функционалу Mz[I(t, Y, u, tk)] tk ω S ( t , €1( l )( y ,t )) = min M z l1( Y ,tk ) + ∫ l2 ( Y ,u ,τ )dτ . (100) u ( τ )∈U 0 τ ∈( t ,t k ) t Пользуясь аддитивностью интегралов для интервалов времени t ≤ t + ∆t ≤ tk, перепишем формулу (100) в виде t + ∆t tk S ( t ,ω€1( l ) ( y ,t )) = min M z [l1 ( Y ,t k )] + M z ∫ l 2 ( Y ,u ,τ )dτ + M z ∫ l 2 ( Y ,u ,τ )dτ u ( τ )∈U 0 τ ∈( t ,t k ) t t + ∆t (101) Применим сформулированный принцип оптимальности к выражению (101). На основании этого принципа оптимальное управление и для системы на интервале (t, tk) обладает следующим свойством: для любого момента времени t + ∆t, заключенного в интервале t ≤ t + ∆t ≤ tk, управление должно быть оптимальным относительно состояния Yt+∆t независимо от значений, которое оно принимало на предшествующем интервале (t, t + ∆t). На основании этого запишем t + ∆t ω S ( t , €1( l ) ( y ,t )) = min M zt ∫ l 2 ( Y ,u ,τ )dτ + M zt [ S ( t + ∆t ,ω€1( l ) ( y ,t + ∆t ))] u ( τ )∈U 0 τ ∈( t ,t k ) t (102) где 83
Страницы
- « первая
- ‹ предыдущая
- …
- 81
- 82
- 83
- 84
- 85
- …
- следующая ›
- последняя »