Специальные разделы теории управления. Оптимальное управление динамическими системами - 47 стр.

UptoLike

При решении задачи методом динамического программирования целесообразно руководствоваться
последовательностью действий, изложенной в сводке общих процедур (см. табл. 2). В соответствии с
табл. 2 составляем функцию ),,,( uλxtH (гамильтониан) для данной задачи
)()(
2
1
),,(),,(),,,(
0
fuxλuuxuuxxx
lxluxλuxuλx
T
3
T
2
CBAPNNQ
utftftH
TTTTTT
T
+++++++
++=+=
и заменяем сопряженный вектор
T
λ на градиент ),( x
x
tV (градиент ),(
),(
x
x
x
x
tV
tV
=
функции ),( xtV счи-
тается вектором-строкой) функции V(t, x) по x:
)()2(
2
1
),,,( fuxuuuxxxulxlux
x
T
3
T
2x
CBAVPNQVtH
TTT
+++++++= .
Дифференциальное уравнение ГамильтонаБеллмана (45) в данном случае имеет вид
0
)(
)2(
2
1
min =
+++
+++++
+
fux
uuuxxxulxl
x
T
3
T
2
u
CBAV
PNQ
t
V
TTT
, (IV)
где функция V(t, x) удовлетворяет граничному условию (55"):
xxxlx
T
1
11
2
1
),( RtV
T
+= . (V)
Поскольку, по предположению, P(t) – положительно определенная матрица, то минимум
),,,( ux
x
VtH по достигается в стационарной точке, где
0=
u
H
.
][),,,(minarg
3
1*
TTT
VBNPVtH
xx
u
xluxu ++==
. (VI)
Подставляя теперь полученное выражение для u
*
в (VI), находим окончательный вид основного
дифференциального уравнения динамического программирования (в данном случае это будет диффе-
ренциальное уравнение ГамильтонаЯкоби, так как u
*
найдено из условия стационарности H):
.0
2
1
2
1
2
1
2
1
2
1
2
1
1
1
3
1
33
1
32
11
3
1
=+
+++
++
xxxx
lxlllxlf
xl
xx
xxxxx
TTT
TTTTTT
TTT
NNPQ
VBPNPPCV
VBBPVNBPVBPVAxV
t
V
(VII)