ВУЗ:
Составители:
Рубрика:
каким образом пришла система к данному состоянию при tt
′
=
(т.е. не зависит от «предыстории» движения) и для будущих
моментов времени полностью определяется лишь состоянием системы в рассматриваемый момент времени.
Как частный случай в динамическом программировании рассматриваются задачи управления непрерывными процесса-
ми (основная задача оптимального координатного управления).
Краткая формулировка задачи. Пусть дана система уравнений движения
),,( uxf
x
t
dt
d
=
, (41)
где
mT
m
Uuuu ∈= )...,,,(
21
u ;
nT
n
Xxxx ∈= )...,,,(
21
x ;
T
n
tftftf )),,(...,),,,(),,,((
21
uxuxuxf = ,
и граничные условия
1100
)(;)( xxxx =
=
tt . (42)
Требуется синтезировать закон оптимального управления u
*
= v
*
(x, t), минимизирующий значение функционала
dttftJ
t
t
∫
=
1
0
),,(],,[
000
uxux . (43)
Необходимые условия. Пусть в (n + 1)-мерном пространстве
),( TX
n
имеется некоторая область G(x, t) начальных
значений
)),(),((,
0000
tGtt xxx ∈ , для каждой точки которой существует оптимальное (в смысле минимума ],,[
00
uxtJ
управление
u
*
(t), переводящее эти начальные точки в некоторую фиксированную точку ),)((
111
tt xx = ;
11
, tx – заданы. На
таких оптимальных управлениях минимальное значение критерия качества (43) будет зависеть лишь от начальных значений
00
, tx . Таким образом,
),(
00
*
min
xtVJJ == ,
где ),(
00
xtV – некоторая функция (n + 1) переменного
0100
...,,,
n
xxt .
Имея в виду произвольную точку области G(
x, t), в дальнейшем, в целях упрощения записи, нижний индекс «0» будем
опускать.
Таким образом, функция V(t,
x) – минимальное значение критерия качества (43) на оптимальных траекториях системы
(41), начинающихся в точке (t,
x) и заканчивающихся в фиксированной точке (t
1
, x
1
),
∫
∈
=
1
),,(min),(
0
t
t
U
dttftV
m
uxx
u
(44)
на траекториях (1) из (t, x) в (t
1
, x
1
).
Функция V(t,
x) является аналогом «действия» в аналитической механике и «экстремального интеграла» в классическом
вариационном исчислении.
Если функция V(t,
x) существует и является непрерывно дифференцируемой по (t, x), то она удовлетворяет основному
уравнению
динамического программирования, которое является необходимым и достаточным условием, – дифференциальному уравне-
нию в частных производных первого порядка (уравнению Гамильтона–Беллмана)
0),,,(min =
∂
∂
+
∂
∂
∈
u
x
x
u
V
tH
t
V
m
U
(45)
с граничным условием
0),(
11
=xtV ; (46)
здесь
),,(),,(),,,(
0
uxfuxux
xx
tVtfVtH +
=
, (47)
где
x
x
∂
∂
=
V
V
(см. табл. 2).
Уравнение (45) аналогично уравнению Гамильтона–Якоби классического вариационного исчисления – достаточное ус-
ловие:
Страницы
- « первая
- ‹ предыдущая
- …
- 24
- 25
- 26
- 27
- 28
- …
- следующая ›
- последняя »