ВУЗ:
Составители:
Рубрика:
Пусть
)(tu – некоторое оптимальное управление, a )(tx – соответствующая этому управлению оптимальная траекто-
рия. Рассмотрим в каждый момент времени t ∈ [t
0
, T] задачу многокритериальной оптимизации с начальными условиями t,
)(tx , которую обозначим через )),((Г tTtx − .
В общем случае траектория
)(
τ
x , t ≤ τ ≤ T не обязательно является оптимальной в задаче )),((Г tTtx − . Такое свойство
оптимальных решений называется динамической неустойчивостью. С другой стороны, если
)(τx является оптимальной тра-
екторией в текущей задаче многокритериальной оптимизации
)),((Г tTtx
−
∀ t ∈ [t
0
, T], то оптимальное управление )(tu и
траекторию
)(tx называют динамически устойчивыми.
Если динамически устойчивыми оказываются все оптимальные управления, то говорят о динамической устойчивости
решения и принципа оптимальности.
Вопрос динамической устойчивости тесно связан с выбором принципа оптимальности. Существует целый ряд принци-
пов оптимальности, для которых оптимальные решения оказываются динамически устойчивыми. К таким принципам отно-
сятся оптимальность по Парето и Слейтеру, равновесие по Нэшу и ряд других. Существуют также принципы оптимальности,
которые не обладают свойством динамической устойчивости.
В рамках данного параграфа мы покажем динамическую устойчивость Парето-оптимальных решений. Действительно,
пусть
),(
0
0
tTx
P
−D – Парето-оптимальное множество оценок и )),((
0
0
tTxP −χ – Парето-оптимальное множество решений
(управлений) в многокритериальной динамической задаче оптимизации Г(x
0
, T – t
0
) для начального состояния x
0
с предпи-
санной продолжительностью T – t
0
. Пусть {H
i
*
} = H
*
– вектор оценок из множества ),(
0
0
tTx
P
−D . Предположим, что вы-
браны управление u(t) и соответствующая траектория x(t), при которых в конце процесса реализуется оценка H
*
= {H
i
*
}. Это
означает, что управление u(t) таково, что x(t) в момент времени Т (в момент окончания процесса) проходит через точку х(Т),
в которой Н(х(Т)) = {H
i
(x(T))} равно как раз вектору полезностей H
*
= {H
i
*
}. Пусть
0
tT
C
−
– множество достижимости управ-
ляемой системы из начального состояния
x
0
. Рассматривая изменение этого множества вдоль траектории x(τ), можно заме-
тить, что
))(())((
21
21
τ⊃τ
τ−τ−
xCxC
TT
, Tt
≤
τ<τ≤
210
. (3.12)
Из (3.12) имеем
)),(()),((
2211
τ−τ
⊃
τ
−
τ
TxTx DD . (3.13)
Поскольку вектор H
*
= {H
i
*
} принадлежит Парето-оптимальному множеству, то не существует такого вектора
*
'
H
H
≠
,
принадлежащего
),,(
0
0
tTx −D
что
*
ii
HH ≥
′
для всех i = l, 2, ..., п. Поэтому из (3.13) следует, что тем более это имеет место
для множества
)),(( τ−τ TxD , Tt ≤
τ
≤
0
. Следовательно, вектор оценок H
*
= {H
i
*
} не доминируется ни одним из векторов
множества
)),(( τ−τ TxD , или, что то же, принадлежит Парето-оптимальному множеству текущей задачи с начальным усло-
вием
х(τ) и продолжительностью Т – τ. Таким образом, вектор H
*
во всех текущих задачах остается Парето-оптимальным
при движении системы вдоль оптимальной траектории
х(τ). Поскольку вектор полезностей Н
*
был выбран произвольно из
множества
),(
0
0
tTx
P
−D , то это означает динамическую устойчивость любого Парето-оптимального решения, а следова-
тельно, и Парето-оптимального множества в целом.
3.2.2. Принцип максимума в многокритериальных задачах
Мы уже говорили, что основным методом решения многокритериальных задач является их скаляризация и рассмотре-
ние λ-свертки исходной задачи. Это позволяет заменить многокритериальную задачу оптимального управления на задачу с
одним критерием, а затем воспользоваться для отыскания оптимальных решений принципом максимума Понтрягина. Рас-
смотрим систему дифференциальных уравнений
UuExuxFx
m
∈
∈
=
,),,(
&
,
],[,)(
0
0
0
Tttxtx ∈= . (3.14)
Критерий качества управления выберем в виде
))((),(),(
00
0
TxHdtuxfuxK
T
t
+=
∫
. (3.15)
Однокритериальной задачей оптимального управления называется задача
max),( →uxK ,
Uuxtxuxfx ∈== ,)(),,(
0
0
&
. (3.16)
Если в правой части выражения (3.15) ,0),,(
0
≡
tuxf то критерий качества называется терминальным, а если H
0
(x(T)) ≡ 0
– интегральным.
Существует стандартный способ сведения интегрального критерия к терминальному с помощью увеличения числа фа-
зовых переменных. В однокритериальных задачах поступают следующим образом. Положим
Страницы
- « первая
- ‹ предыдущая
- …
- 56
- 57
- 58
- 59
- 60
- …
- следующая ›
- последняя »