Практикум по теории управления в среде MATLAB. Никульчев Е.В. - 65 стр.

UptoLike

Составители: 

Если существуют функция φ(t, x) C
1,1
, удовлетворяющая урав-
нению Беллмана с граничным условием:
,R),(),(
,),(,0),,(),,(
),(),(
max
1
1
0
U
n
n
i
i
i
u
xxFxt
xtuxtfuxtf
x
xt
t
xt
=φ
=
φ
+
φ
=
(5.7)
и управление u*(t, x) U
n
, удовлетворяющее условию
,),,(),,(
),(
maxarg),(*
1
0
U
φ
=
=
n
i
i
i
u
uxtfuxtf
x
xt
xtu
то u*(t, x) является оптимальным управлением с полной обратной
связью. При этом минимальное значение функционала (5.5)
n
u
xxtJ R),,(min
000
φ=
. (5.8)
Пусть система, описывающая поведение модели объекта
управления, имеет вид
x
(t) = A(t) x(t) + B(t) u(t), (5.9)
y(t) = C(t) x(t) +D(t) u(t)
Пусть функционал качества управления квадратичный:
[]
)()(
2
1
)()()()()()(
2
1
11
1
0
txtxdttutQtutxtStxJ
T
t
t
TT
Λ++=
(5.10)
гяе S(t), Λ - неотрицательно определенные симметрические матрицы
размера (n×n), a Q(t) - положительно определенная симметрическая
матрица (q × q).
Используем известные правила и обозначения :
()
(
)
.tr.5;00.4
;).(3;.2;.1
==+
=+=
=
i
ii
TT
TTTT
T
T
aAAAAxx
ABABxAAx
x
Axx
A
x
Ax
Уравнение Беллмана для данной задачи имеет вид
[]
[]
,0)()()()()()(
2
1
)()(
),(),(
max =
++
ϕ
+
ϕ
tutQtutxtStxutBxtA
t
xt
t
xt
TT
T
Ru
q
xxxt
T
Λ=ϕ
2
1
),(
1
(5.11)
Отсюда
ϕ
=
)()()(
2
1
)(
),(
maxarg),(*u
U
tutQtuutB
t
xt
xt
T
T
u
.
65 –
     Если существуют функция φ(t, x) ∈ C1,1, удовлетворяющая урав-
нению Беллмана с граничным условием:
          ⎧ ∂ φ(t , x) n ∂ φ(t , x)                                  ⎫
      max ⎨           +∑            f i (t , x, u ) − f 0 (t , x, u )⎬ = 0, ∀(t , x),
      u∈U
          ⎩ ∂t         i =1 ∂xi                                      ⎭                (5.7)
                                φ(t1 , x) = − F ( x),         ∀x ∈ R n ,
и управление u*(t, x) ∈ Un, удовлетворяющее условию
                               ⎧ n ∂ φ(t , x)                                  ⎫
         u * (t , x) = arg max ⎨∑             f i (t , x, u ) − f 0 (t , x, u )⎬,
                           u∈U i =1
                               ⎩      ∂xi                                      ⎭
то u*(t, x) является оптимальным управлением с полной обратной
связью. При этом минимальное значение функционала (5.5)
                        min J = −φ(t0 , x0 ), ∀x0 ∈ R n . (5.8)
                                       u
     Пусть система,                 описывающая               поведение       модели        объекта
управления, имеет вид
                       x (t) = A(t) x(t) + B(t) u(t),                                             (5.9)
                       y(t) = C(t) x(t) +D(t) u(t)
        Пусть функционал качества управления квадратичный:
                 1 t1 T
                        [                                       ]1
              J = ∫ x (t ) S (t ) x(t ) + uT (t )Q(t )u (t ) dt + xT (t1 )Λx(t1 )
                 2 t0                                            2
                                                                                               (5.10)

гяе S(t), Λ - неотрицательно определенные симметрические матрицы
размера (n×n), a Q(t) - положительно определенная симметрическая
матрица (q × q).
      Используем известные правила и обозначения :

                1.
                   ∂ ( Ax )    T
                            = A ; 2.
                                       (
                                     ∂ x T Ax  )
                                              = Ax + AT x; 3.( AB ) T = B T AT ;
                     ∂x                 ∂x
                        4. x Ax ≡ 0 ⇔ A + AT = 0; 5. tr A = ∑i aii .
                             T


        Уравнение Беллмана для данной задачи имеет вид
     ⎧⎪ ∂ϕ(t , x) ⎛ ∂ϕ(t , x) ⎞T                                                                 ⎫⎪
maxq ⎨           +⎜
                                                       1 T
                                                          [                                    ]
                              ⎟ [ A(t ) x + B (t )u ] − x (t ) S (t ) x(t ) + u (t )Q (t )u (t ) ⎬ = 0,
                                                                               T

      ⎩ ∂t        ⎝ ∂t ⎠                               2
u∈R ⎪                                                                                             ⎪⎭
                                                1
                                    ϕ(t1, x) = − xT Λx                                         (5.11)
                                                2
Отсюда
                                   ⎧⎪⎛ ∂ϕ(t , x) ⎞T         1 T               ⎫⎪
             u * (t , x) = arg max ⎨⎜            ⎟ B (t )u − u (t )Q(t )u (t )⎬ .
                               u∈U ⎪⎝
                                    ⎩    ∂t ⎠               2                  ⎪⎭



                                             – 65 –