Системный анализ в информационных технологиях - 112 стр.

UptoLike

Решением дифференциальной игры называется множество всех управлений, оптимальных в смысле
выбранного принципа оптимальности. Обозначим решение игры T(t
0
, x
0
) через M(t
0
, х
0
).
Выберем оптимальное управление (u(t), v
1
(t), ..., v
n
(t)) из множества M (t
0
, х
0
) и обозначим соответ-
ствующую оптимальную траекторию через x(t).
Важным свойством всякого оптимального решения является его динамическая устойчивость. Ока-
зывается, что далеко не все принципы оптимальности обладают этим свойством. Напомним, в чем со-
стоит понятие динамической устойчивости решений дифференциальных игр. Предположим, что систе-
ма развивается вдоль оптимальной траектории x(t) под воздействием оптимальных управлений u(t),
v
1
(t), ..., v
n
(t).
В каждый момент времени будем рассматривать игру T(t, x(t)), в которой множества допустимых управ-
лений представляют собой сужения множеств U, V
1
, V
2
, ..., V
n
на интервал времени [t, Т]. Обозначим эти
множества через U
t
t
V
1
, ...,
t
n
V . Они будут включать в себя измеримые функции, заданные на интервале
[t, Т]. Обозначим через
()
....,,2,1,0
,)v...,,v,,(v...,,v,
,
,
1
,,
,
1
,
ni
duxhuH
T
t
Tt
n
Tt
Tt
i
Tt
n
Tt
Ttt
i
=
τ=
функционалы выигрышей в игре T(t, x(t)), где и
t,T
U
t
, v
t,T
U
t
. Обозначим также через u
t
t
1
v , ...,
t
n
v су-
жения оптимальных управлений игроков на отрезок [t, Т], т.е., например, u'(τ) = u(τ), t < τ < T, и т.д. Иг-
ра T(t, x, {t}) называется текущей игрой.
Пусть M(t, x(t)) – решение текущей игры, которая развивается вдоль оптимальной траектории x(t), a
u(t), v
1
(t), ..., v
n
(t) – оптимальные управления игроков.
Говорят, что ситуация (и, v
1
, v
2
, ..., v
n
) M(t
0
, x
0
) динамически устойчива, если в любой момент
времени сужения оптимальных управлений игроков образуют ситуацию в текущей игре (u
t
t
1
v , ...,
t
n
v ),
которая принадлежит решению игры Г(t, x(t)), т.е. (u
t
t
1
v , ...,
t
n
v ) M(t, x(t)).
Определение. Решение M(t
0
, х
0
) дифференциальной игры
T(t
0
, х
0
) называется динамически устойчивым, если для любого t [t
0
, Т] и любой ситуации (и, v
1
, v
2
, ...,
v
n
) M(t
0
, x
0
) выполнено условие
))(,()v...,,v,v,(
21
txtMu
t
n
ttt
,
где x(t) – оптимальная траектория системы (3.62), соответствующая оптимальным управлениям и, v
1
, v
2
,
..., v
n
.
Свойство динамической устойчивости является очень важной характеристикой решения дифферен-
циальной игры. Если какая-либо ситуация (и, v
1
, v
2
, ..., v
n
) M(t
0
, x
0
) не является динамически устойчи-
вой (т.е. решение M(t
0
, x
0
) не является динамически устойчивым), то это означает, что в некоторый мо-
мент времени t управления u
t
t
1
v , ...,
t
n
v не будут оптимальными в текущей игре T(t
0
, x
0
), и игроки пере-
станут придерживаться этих управлений в дальнейшем. Если же решение динамически устойчиво, то у
игроков не будет оснований изменять свои управления до конца игры.
Свойство динамической устойчивости присуще далеко не всем принципам оптимальности, напри-
мер, равновесие по Нэшу является динамически устойчивым, а равновесие по Штакельбергу таковым не
является.
Практическая ценность свойства динамической устойчивости решений дифференциальных игр со-
стоит в том, что если игроки договариваются в начале игры о реализации некоторой оптимальной си-
туации в течение всей игры, то эта договоренность для динамически устойчивых принципов оптималь-
ности сохраняется до конца игры.
Покажем, что равновесие по Нэшу в дифференциальной игре
T(t
0
, x
0
) является динамически устойчивым. На первом уровне иерархии находится игрок А
0
. на втором
игроки В
1
, B
2
, .., В
п
, входящие в множество I. Обозначим через )v...,,v,v(v
21 n
=
вектор управлений игро-
ков нижнего уровня. Пусть оптимальные управления являются программными, т.е. являются функция-