Линейные задачи оптимизации. Ч.2. Оптимальное управление линейными динамическими объектами. Лутманов С.В. - 72 стр.

UptoLike

Составители: 

Рубрика: 

2. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ЛИНЕЙНЫМИ ДИНАМИЧЕСКИМИ ОБЪЕКТАМИ С ФИКСИРОВАН-
НЫМ ВРЕМЕНЕМ И ТЕРМИНАЛЬНЫМ КРИТЕРИЕМ КАЧЕСТВА
72
()
()
0
x
TΦ , вычисленная в результате интегрирования исходной системы диффе-
ренциальных уравнений после подстановки в нее программного управления,
определенного из условия (4), совпадает с величиной
0
ε
, вычисленной по фор-
муле (5), то это программное управление является оптимальным.
Пример 4. Рассмотрим линейный управляемый динамический объект из
примера 1. Терминальный критерий качества
() ( )
2
2
12
2xxxΦ= + можно
трактовать как расстояние в конечный момент времени от фазового вектора
до точки
0
2
m
⎛⎞
=
⎜⎟
⎝⎠
. Для данного примера выполнены равенства
[]
()
10 10
2, , ,
01 01
kXt Bt
τ
⎛⎞ ⎛⎞
== =
⎜⎟ ⎜⎟
⎝⎠ ⎝⎠
,
00
ll
=
.
Последовательно вычисляем
[] []
()
0
00 0 0
00
max , , , min , ,
T
uP
mM
t
ml X T t x l X T B u l d
ε
ττ τ
=− + + =
()
11
111
212
11
222
00
0
max , min , max 2
2
uP
ll
lul
dllld
lul
ττ
==
⎡⎤
⎛⎞ ⎛⎞
⎛⎞
=− + =−+ =
⎢⎥
⎜⎟ ⎜⎟
⎜⎟
⎢⎥
⎝⎠
⎝⎠ ⎝⎠
⎣⎦
∫∫
(
)
212
1
max 2 1
l
lll
=
⎡⎤
=−+=
⎣⎦
,
0
1
0
2
0
1
l
l
⎛⎞
⎛⎞
=
⎜⎟
⎜⎟
⎝⎠
⎝⎠
.
Необходимые условия оптимальности программного управления здесь
принимают вид
()
(
)
(
)
(
)
[
0000
1102
,,0,1ut signl ut signl t=− =−
. (7)
В силу
0
1
0l = условия(7) определяют программную стратегию неодно-
значно. В частности, им удовлетворяет стратегия
()
(
)
()
[]
1
0
00
1
1
0
,0,0,1
1
ut
Ut u d t
ττ
⎛⎞
==
⎜⎟
⎝⎠
.
При этом
(
)
00
1IU
ε
⎡⎤
==
⎣⎦
.
Следовательно, стратегия
(
)
0
U
является оптимальной.
2. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ЛИНЕЙНЫМИ ДИНАМИЧЕСКИМИ ОБЪЕКТАМИ С ФИКСИРОВАН-
              НЫМ ВРЕМЕНЕМ И ТЕРМИНАЛЬНЫМ КРИТЕРИЕМ КАЧЕСТВА
Φ ( x 0 (T ) ) , вычисленная в результате интегрирования исходной системы диффе-

ренциальных уравнений после подстановки в нее программного управления,
определенного из условия (4), совпадает с величиной ε 0 , вычисленной по фор-
муле (5), то это программное управление является оптимальным.
     Пример 4. Рассмотрим линейный управляемый динамический объект из

примера 1. Терминальный критерий качества Φ ( x ) = x12 + ( x2 − 2 )
                                                                                                        2
                                                                                                            можно

трактовать как расстояние в конечный момент времени от фазового вектора
              ⎛0⎞
до точки m = ⎜ ⎟ . Для данного примера выполнены равенства
              2
              ⎝ ⎠

                                             ⎛1 0⎞            ⎛1 0⎞
                      k = 2,    X [ t ,τ ] = ⎜   ⎟ , B (t ) = ⎜   ⎟, l =l .
                                                                      0∗ 0

                                             ⎝0 1⎠            ⎝0 1⎠

     Последовательно вычисляем
                                                                 T
             ε = − max m, l + X [T , t0 ] x0 , l + ∫ min X [T ,τ ] B (τ ) u, l 0 dτ =
               0                0                          0
                     m∈M                                              u∈P
                                                                 t0


                  ⎡ ⎛0⎞ ⎛ l ⎞ 1        ⎛u ⎞ ⎛l ⎞         ⎤        ⎡      1
                                                                                          ⎤
         = max ⎢ − ⎜ ⎟ , ⎜ 1 ⎟ + ∫ min ⎜ 1 ⎟ , ⎜ 1 ⎟ dτ ⎥ = max ⎢ −2l2 − ∫ ( l1 + l2 ) dτ ⎥ =
                 ⎣⎢ ⎝ 2 ⎠ ⎝ l2 ⎠       ⎝ u2 ⎠ ⎝ l2 ⎠    ⎦⎥
            l =1                   u∈P                       l =1
                                 0                                ⎣      0                ⎦

                                                                 ⎛ l10 ⎞ ⎛ 0 ⎞
                            = max ⎡⎣ −2l2 − ( l1 + l2 ) ⎤⎦ = 1 , ⎜ 0 ⎟ = ⎜ ⎟ .
                               l =1
                                                                 ⎝ l2 ⎠ ⎝ −1⎠

     Необходимые условия оптимальности программного управления здесь
принимают вид
                               u10 ( t ) = − sign ( l10 ) , u00 ( t ) = − sign ( l20 ) , t ∈ [ 0,1] .          (7)

     В силу l10 = 0 условия(7) определяют программную стратегию неодно-
значно. В частности, им удовлетворяет стратегия
                                     ⎛ u10 ( t ) ⎞ 1 0
                            U (t ) = ⎜           ⎟ , ∫ u1 (τ )dτ = 0, t ∈ [ 0,1] .
                               0

                                     ⎝    1      ⎠ 0

При этом
                                              I ⎣⎡U 0 ( ⋅) ⎦⎤ = 1 = ε 0 .

Следовательно, стратегия U 0 ( ⋅) является оптимальной.



                                                          72