ВУЗ:
Составители:
Рубрика:
4. ЛИНЕЙНАЯ ЗАДАЧА ТЕОРИИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ
КАК ФУНКЦИОНАЛЬНАЯ ПРОБЛЕМА МОМЕНТОВ
117
4. ЛИНЕЙНАЯ ЗАДАЧА ТЕОРИИ ОПТИМАЛЬНОГО УПРАВЛЕ-
НИЯ КАК ФУНКЦИОНАЛЬНАЯ ПРОБЛЕМА МОМЕНТОВ
4.1. Сведение задачи теории оптимального управления к функцио-
нальной проблеме моментов. Рассмотрим задачу теории оптимального управ-
ления, в которой
{}
{
}
{
}
{
}
r
T
RPxSxSTt ===== ,,,,
100100
θθ
, а минимизируемый
функционал имеет вид
()
[]
()()
ττ
dufuI
T
t
∫
=⋅
0
0
. (1)
Класс программных стратегий отождествим с множеством
[]
TtL
p
r
,
0
измеримых
по Лебегу
r
-мерных вектор-функций
[
]
0
:,
r
UtT R→
, для которых функция
()
p
U ⋅ ,
[
)
∞∈ ,1p суммируема на
[
]
Tt ,
0
в смысле Лебега.
Относительно минимизируемого функционала
I
дополнительно предпо-
ложим:
1) для всех
()
[
]
0
,
p
r
ULtT⋅∈ справедливо неравенство
()
0IU⋅≥⎡⎤
⎣⎦
, причем
()
0IU⋅=⎡⎤
⎣⎦
тогда и только тогда, когда
(
)
0Ut
=
почти всюду на
[]
Tt ,
0
;
2) для всех
() ()
[
]
12 0
,,
p
r
UU LtT⋅⋅∈ справедливо неравенство
(
)
(
)
(
)
(
)
12 1 2
IU U IU IU
⋅
+⋅≤ ⋅+ ⋅⎡⎤⎡⎤⎡⎤
⎣⎦⎣⎦⎣⎦
;
3) для всех
()
[
]
1
0
,,
p
r
ULtT R
λ
⋅∈ ∈ имеет место равенство
(
)
(
)
IU IU
λλ
⋅
=⋅
⎡
⎤⎡⎤
⎣
⎦⎣⎦
.
Условия 1)-3) позволяют истолковать функционал
I
как некоторую норму
на функциональном пространстве
[
]
TtL
p
r
,
0
.
Следуя [17], осуществим сведение задачи теории оптимального управле-
ния к функциональной проблеме моментов. Пусть
(
)
[
]
0
,
p
r
ULtT⋅∈
– некоторое
программное управление, переводящее фазовый вектор из положения
0
x в мо-
мент времени
0
t в положение
T
x в момент времени
T
, и
()
(
)
()
00
,, ,xxtxU⋅= ⋅ ⋅ . То-
гда с учетом
()
T
xTx
=
по формуле Коши получим
4. ЛИНЕЙНАЯ ЗАДАЧА ТЕОРИИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ КАК ФУНКЦИОНАЛЬНАЯ ПРОБЛЕМА МОМЕНТОВ 4. ЛИНЕЙНАЯ ЗАДАЧА ТЕОРИИ ОПТИМАЛЬНОГО УПРАВЛЕ- НИЯ КАК ФУНКЦИОНАЛЬНАЯ ПРОБЛЕМА МОМЕНТОВ 4.1. Сведение задачи теории оптимального управления к функцио- нальной проблеме моментов. Рассмотрим задачу теории оптимального управ- ления, в которой θ 0 = {t 0 }, θ 1 = {T }, S 0 = {x 0 }, S1 = {x T }, P = R r , а минимизируемый функционал имеет вид T I [u (⋅)] = ∫ f 0 (u (τ )) dτ . (1) t0 Класс программных стратегий отождествим с множеством Lrp [t 0 , T ] измеримых по Лебегу r -мерных вектор-функций U : [t0 , T ] → R r , для которых функция U ( ⋅) , p ∈ [1, ∞ ) суммируема на [t 0 , T ] в смысле Лебега. p Относительно минимизируемого функционала I дополнительно предпо- ложим: 1) для всех U ( ⋅) ∈ Lrp [t0 , T ] справедливо неравенство I ⎡⎣U ( ⋅) ⎤⎦ ≥ 0 , причем I ⎡⎣U ( ⋅) ⎤⎦ = 0 тогда и только тогда, когда U ( t ) = 0 почти всюду на [t 0 , T ] ; 2) для всех U1 ( ⋅) , U 2 ( ⋅) ∈ Lrp [t0 , T ] справедливо неравенство I ⎡⎣U1 ( ⋅) + U 2 ( ⋅) ⎤⎦ ≤ I ⎡⎣U1 ( ⋅) ⎤⎦ + I ⎡⎣U 2 ( ⋅) ⎤⎦ ; 3) для всех U ( ⋅) ∈ Lrp [t0 , T ] , λ ∈ R1 имеет место равенство I ⎡⎣λU ( ⋅) ⎤⎦ = λ I ⎡⎣U ( ⋅) ⎤⎦ . Условия 1)-3) позволяют истолковать функционал I как некоторую норму на функциональном пространстве Lrp [t 0 , T ] . Следуя [17], осуществим сведение задачи теории оптимального управле- ния к функциональной проблеме моментов. Пусть U ( ⋅) ∈ Lrp [t0 , T ] – некоторое программное управление, переводящее фазовый вектор из положения x 0 в мо- мент времени t 0 в положение x T в момент времени T , и x ( ⋅) = x ( ⋅, t0 , x0 ,U ( ⋅) ) . То- гда с учетом x (T ) = x T по формуле Коши получим 117
Страницы
- « первая
- ‹ предыдущая
- …
- 115
- 116
- 117
- 118
- 119
- …
- следующая ›
- последняя »