Оптимальное управление непрерывными динамическими системами. Заболотнов Ю.М. - 40 стр.

UptoLike

Составители: 

40
Решение уравнения Беллмана (4.12) ищем в виде квадратичной формы
[3]
ytAyyytAtyv )(
*
)(),( =
∑∑
=
αβ
βααβ
, (4.13)
где
)(tA
αβ
- определяемые компоненты матрицы )(
t
A
.
Далее необходимо подставить квадратичную форму (4.13) в уравнение
(4.12) и приравнять коэффициенты при одинаковых слагаемых. В результате
получим
)()(
1
)(
111
===
++=
n
k
kk
n
k
kkkk
n
k
kk
mAmA
c
bAbAa
dt
dA
βααββααβ
αβ
, (4.14)
где
n,...1=
α
, n,...1=
β
и
β
α
.
Систему обыкновенных дифференциальных уравнений (4.14)
необходимо проинтегрировать по времени. В работе [3] предлагается
определять коэффициенты
)(tA
αβ
методом численного интегрирования с
учетом требуемых конечных граничных условий
0)(
=
T
y . Тогда можно задать
0)( =TA
αβ
и проинтегрировать систему (4.14) обратно с отрицательным
шагом до начального времени
o
tt
=
. Если
T
, то время
T
берется
достаточно большим, чтобы при его изменении в большую сторону величины
)(
o
tA
αβ
практически не изменялись. После того, как с помощью этого
способа определены функции
)(tA
αβ
, управление определяется из
выражения (4.11) в виде
=
=
n
k
k
yt
k
py
o
u
1
)()( . (4.15)
Здесь
=
=
n
k
mt
k
A
c
t
k
p
1
)(
1
)(
α
α
, (4.16)