Линейные задачи оптимизации. Ч.2. Оптимальное управление линейными динамическими объектами. Лутманов С.В. - 38 стр.

UptoLike

Составители: 

Рубрика: 

1. ЛИНЕЙНЫЕ УПРАВЛЯЕМЫЕ ДИНАМИЧЕСКИЕ ОБЪЕКТЫ
38
Класс допустимых программных стратегий должен удовлетворять сле-
дующему свойству: любую допустимую программную стратегию
()
U
можно
сколь угодно точно приблизить (в смысле сходимости в среднем
() ()
0
0,
T
s
t
ut Utdt s−→
) реализацией вектора управляющих параметров
(
)
,1,2,
s
ut s= ,
[]
0
,ttT .
В частности, пусть класс допустимых программных стратегий принадле-
жит пространству
[
]
[
]
0
,, 1,
r
p
LtT p∈∞
. Тогда указанное свойство следует из того,
что множество непрерывных функций всюду плотно в
[
]
10
,
r
LtT [16 ].
В дальнейшем, если не оговорено противное, множество допустимых
программных стратегий будем считать принадлежащим пространству сумми-
руемых по Лебегу функций.
Определение 9. Движением динамического объекта на интервале време-
ни
[
]
0
,tT, выходящим из начального положения
{
}
00
,tx и порожденным допусти-
мой программной стратегией
(
)
U
, называется функция
[
]
0
:,
n
x
tT R , опреде-
ленная равенством
[ ] [ ]() () [ ]() [ ]
00
00 0
() , , , , ,
tt
tt
x
tXttx XtBUd XtCdttTττ ττ τττ=+ +
∫∫
. (1)
В общем случае интегралы в формуле (1) следует понимать в смысле Лебега.
Движение объекта, определенное формулой (1), обозначим символом
(
)
(
)
(
)
00
,, ,xxtxU
=⋅ .
Пусть
()
{
}
s
u
- последовательность реализаций вектора управляющих воз-
действий, аппроксимирующая программное управление
()
U , и
()
s
x движение
объекта, отвечающее реализации
(
)
,1,2,
s
us⋅= . Тогда справедлива оценка
() ()
[]
() () () () ()
0 0
,,
tT
sss
tt
x
txt XtBUudMUud
τ
ττ ττ τ ττ
−=
⎡⎤
⎣⎦
∫∫
[
]
0
,,t t T M const∈=
.
                    1. ЛИНЕЙНЫЕ УПРАВЛЯЕМЫЕ ДИНАМИЧЕСКИЕ ОБЪЕКТЫ

         Класс допустимых программных стратегий должен удовлетворять сле-
дующему свойству: любую допустимую программную стратегию U (⋅) можно

сколь угодно точно приблизить (в смысле сходимости в среднем
T

∫ u ( t ) − U ( t ) dt → 0, s → ∞ ) реализацией вектора управляющих параметров
t0
     s




                                                 us ( t ) , s = 1, 2,     , t ∈ [t 0 , T ] .

         В частности, пусть класс допустимых программных стратегий принадле-
жит пространству Lrp [t0 , T ], p ∈ [1, ∞] . Тогда указанное свойство следует из того,

что множество непрерывных функций всюду плотно в L1r [t0 , T ] [16 ].

         В дальнейшем, если не оговорено противное, множество допустимых
программных стратегий будем считать принадлежащим пространству сумми-
руемых по Лебегу функций.
         Определение 9. Движением динамического объекта на интервале време-
ни [t0 , T ] , выходящим из начального положения {t0 , x0 } и порожденным допусти-

мой программной стратегией U ( ⋅) , называется функция x : [t0 , T ] → R n , опреде-

ленная равенством
                                             t                                          t

               x(t ) = X [t , t0 ] x0 + ∫ X [t , τ ]B (τ )U (τ ) d τ + ∫ X [t , τ ]C (τ ) d τ , t ∈ [t0 , T ] .              (1)
                                             t0                                        t0


В общем случае интегралы в формуле (1) следует понимать в смысле Лебега.
         Движение объекта, определенное формулой (1), обозначим символом
                                                     x ( ⋅) = x ( ⋅, t0 , x0 , U ( ⋅) ) .

         Пусть {us ( ⋅)} - последовательность реализаций вектора управляющих воз-

действий, аппроксимирующая программное управление U ( ⋅) , и xs ( ⋅) движение

объекта, отвечающее реализации us ( ⋅) , s = 1, 2, . Тогда справедлива оценка
                                        t                                                           T
                 x ( t ) − xs ( t ) =   ∫ X [t ,τ ]B (τ ) ⎡⎣U (τ ) − u (τ )⎤⎦ dτ
                                        t0
                                                                                 s             ≤ M ∫ U (τ ) − us (τ ) dτ ,
                                                                                                    t0


                                                     t ∈ [t0 , T ] , M = const .




                                                                    38