Специальные разделы теории управления. Оптимальное управление динамическими системами. Громов Ю.Ю - 27 стр.

UptoLike

0),,( =
+
x
xH
V
t
t
V
, (48)
где функция H получена в результате подстановки в функцию ),,,( ux
x
VtH управления ),,(
00
x
xuu Vt= , найденного из
условия стационарности этой функции,
),1(0 mj
u
H
j
==
. (49)
Из (45) можно определить оптимальный закон управления
=
==
x
xuu
x
xxvu
u
V
t
V
tHt
m
U
,,,,,minarg),(
***
. (50)
Геометрический смысл условия (50) пояснен на рис. 3.8. Если функция V(t, x) найдена путем решения уравнения (45) с
условием (46), то проблема синтеза решена, так как для известной функции V(t,
x) имеем
),(
),(
,,
***
xv
x
x
xuu t
tV
t =
=
. (51)
Рис. 3.8. Геометрический смысл условия
)],,([min),,,(min uxux
x
u
x
u
tfVVtH
mm
UU
=
:
,0,2,)],([min),(
0
===
==
fmn
V
VtuJtV
m
U
x
x
x
u
*
x
&
оптимальная фазовая скорость:
),,(
**
uxfx t=
&
;
u
*
(t, x) – оптимальное управление:
),,,(minarg
*
uxu
x
u
VtH
m
U
=
;
x
*
оптимальная траектория
Подобно тому, как принцип максимума Понтрягина придает удобную форму и уточняет условие Вейерштрасса (см. п.
9.3) для основной задачи оптимального программного управления в случае замкнутой области значений управления
m
U , так
и уравнение ГамильтонаБеллмана является уточнением и обобщением уравнения ГамильтонаЯкоби. Уточнение состоит в
том, что вместо условия стационарности
0= uH там, где оно не отвечает существу дела, в (45) используется условие
u
x
x
u
,,,min
V
tH
m
U
.
В приведенном условии (45) требование непрерывной дифференцируемости (гладкости) функции V(t, x) является суще-
ственным. Но в отличие от принципа максимума, где утверждается существование необходимой для него вектор-функции
)(tλ , существование гладкого потенциала V(t, x) в методе динамического программирования не доказывается. Это снижает
ценность необходимого условия (45), так как для негладкой функции V(t,
x) трудно сохранить необходимость его в полном
объеме.