ВУЗ:
Составители:
Рубрика:
0),,( =
∂
∂
+
∂
∂
x
xH
V
t
t
V
, (48)
где функция H получена в результате подстановки в функцию ),,,( ux
x
VtH управления ),,(
00
x
xuu Vt= , найденного из
условия стационарности этой функции,
),1(0 mj
u
H
j
==
∂
∂
. (49)
Из (45) можно определить оптимальный закон управления
∂
∂
=
∂
∂
==
∈
x
xuu
x
xxvu
u
V
t
V
tHt
m
U
,,,,,minarg),(
***
. (50)
Геометрический смысл условия (50) пояснен на рис. 3.8. Если функция V(t, x) найдена путем решения уравнения (45) с
условием (46), то проблема синтеза решена, так как для известной функции V(t,
x) имеем
),(
),(
,,
***
xv
x
x
xuu t
tV
t =
∂
∂
=
. (51)
Рис. 3.8. Геометрический смысл условия
)],,([min),,,(min uxux
x
u
x
u
tfVVtH
mm
UU ∈∈
=
:
,0,2,)],([min),(
0
===
∂
∂
==
∈
fmn
V
VtuJtV
m
U
x
x
x
u
*
x
&
– оптимальная фазовая скорость:
),,(
**
uxfx t=
&
;
u
*
(t, x) – оптимальное управление:
),,,(minarg
*
uxu
x
u
VtH
m
U∈
=
;
x
*
– оптимальная траектория
Подобно тому, как принцип максимума Понтрягина придает удобную форму и уточняет условие Вейерштрасса (см. п.
9.3) для основной задачи оптимального программного управления в случае замкнутой области значений управления
m
U , так
и уравнение Гамильтона–Беллмана является уточнением и обобщением уравнения Гамильтона–Якоби. Уточнение состоит в
том, что вместо условия стационарности
0=∂∂ uH там, где оно не отвечает существу дела, в (45) используется условие
∂
∂
∈
u
x
x
u
,,,min
V
tH
m
U
.
В приведенном условии (45) требование непрерывной дифференцируемости (гладкости) функции V(t, x) является суще-
ственным. Но в отличие от принципа максимума, где утверждается существование необходимой для него вектор-функции
)(tλ , существование гладкого потенциала V(t, x) в методе динамического программирования не доказывается. Это снижает
ценность необходимого условия (45), так как для негладкой функции V(t,
x) трудно сохранить необходимость его в полном
объеме.
Страницы
- « первая
- ‹ предыдущая
- …
- 25
- 26
- 27
- 28
- 29
- …
- следующая ›
- последняя »