Специальные разделы теории управления. Оптимальное управление динамическими системами. Громов Ю.Ю - 30 стр.

UptoLike

==
x
x
xuxvu
),(
,,),(
***
tV
tt
5.4. Сводка общих процедур метода динамического
программирования для вычисления оптимального закона
управления
u
*
= v
*
(t, x)
Пример 2. Синтез оптимального закона управления для линейной системы с квадратичным критерием качества. Про-
блема аналитического конструирования оптимальных автопилотов.
Пусть нестационарная линейная система описывается векторным линейным дифференциальным уравнением
)()()( tCtBtA fuxx +
+
=
&
(I)
с начальным условием
100
;)( tttt
=
xx , (II)
где
1
t фиксировано;
00
, xt известные величины (которые, однако, специально не выбираются), и пусть критерий качест-
ва имеет вид
)III(.
))()()()((
2
1
)()()(
2
1
][
1
0
11111
++++
++
+
++=
t
t
T
dt
tPtNtNtQ
ttt
RJ
uuxuuxxx
ulxl
xxxlu
TTTT
T
3
T
2
TT
Здесь
T
n
T
n
ffxxx )...,,(;)...,,,(
121
== fx ; C, A(t) – матрицы размерности n × n; )(,)...,,(
111
tuu
T
m
xxu == ; B(t), N(t) – мат-
рицы размерности n × m;
)(,
1
tQR положительно полуопределенные симметричные матрицы размерности n × n; P(t) –
положительно определенная симметричная матрица размерности m × m; P(t) – известная функция времени;
)(,
21
tll , )(,
21
tll
n-мерные векторы;
)(
3
tl m-мерный вектор.
Напомним, что симметричная матрица Q называется положительно полуопределенной, если все ее собственные значе-
ния неотрицательны или если соответствующая ей квадратичная форма неотрицательна, т.е.
0xx Q
T
для всех
0)...,,,(
21
=
T
n
xxxx . Для того чтобы матрица Q была положительно полуопределенной, необходимо и достаточно, чтобы
все главные (а не только угловые!) миноры были неотрицательны:
),1;...1(0
...
...
21
21
21
npniii
i
i
ii
ii
Q
p
p
p
=<<<
.
Предполагается, что на значения управляющего вектора u не накладывается каких-либо ограничений, а матрицы Q(t),
N(t), P(t) таковы, что выполняется условие
0)()()()(
1
tNtPtNtQ
T
(это условие гарантирует отсутствие сопряженных точек в данной задаче).
Необходимо найти закон управления с обратной связью
u
*
= v
*
(x, t),
минимизирующий критерий J[
u]. Заметим, что значения вектора фазовых координат x при
1
tt = не заданы (т.е. рассматри-
ваемая задача относится к числу задач оптимального управления со свободным правым концом).
Пусть V(t,
x) – минимальное значение критерия качества J[u] при движении системы (I) из произвольной начальной
точки (t,
x) (нижний индекс «0» опущен) на отрезке времени
11
],,[ tttt
:
][min),(
min
*
ux
u
JtVJJ == .
При решении задачи методом динамического программирования целесообразно руководствоваться последовательно-
стью действий, изложенной в сводке общих процедур (см. табл. 2). В соответствии с табл. 2 составляем функцию
),,,( uλxtH
(гамильтониан) для данной задачи
)()(
2
1
),,(),,(),,,(
0
fuxλuuxuuxxx
lxluxλuxuλx
T
3
T
2
CBAPNNQ
utftftH
TTTTTT
T
+++++++
++=+=
и заменяем сопряженный вектор
T
λ
на градиент ),( x
x
tV (градиент ),(
),(
x
x
x
x
tV
tV
=
функции ),( xtV считается вектором-