Системный анализ в информационных технологиях. Громов Ю.Ю - 82 стр.

UptoLike

2) вектор-функция fE
m
непрерывно дифференцируема по своим переменным;
3) существует константа х > 0, такая, что при любых
Uu
,
ii
V
v выполнено неравенство
)1()v...,,v,v,,(
21
xxuxf
n
+ ;
4) функции h
i
(x, и, v
1
, v
2
, , v
n
) положительны и интегрируемы, i = l, 2, ..., п.
Выполнения этих условий достаточно для существования единственного решения задачи Коши при любых кусочно-
непрерывных допустимых управлениях. Анализ такой иерархической системы может быть сведен к исследованию решений
дифференциальной иерархической игры. Под стратегиями игроков (центра и подсистем) мы будем понимать выбор ими
управлений u(t), v
1
(t), ..., v
n
(t), т.е. в данном случае можно считать, что стратегиями игроков являются их управления.
Рассмотрим дифференциальную иерархическую игру
IiiIii
HHVUIAxt
= },{,},{},,{),(Г
00
0
0
,
динамика которой описывается системой дифференциальных уравнений (3.62) с функционалами выигрышей (3.63).
Решением дифференциальной игры называется множество всех управлений, оптимальных в смысле выбранного прин-
ципа оптимальности. Обозначим решение игры T(t
0
, x
0
) через M(t
0
, х
0
).
Выберем оптимальное управление (u(t), v
1
(t), ..., v
n
(t)) из множества M (t
0
, х
0
) и обозначим соответствующую оптималь-
ную траекторию через x(t).
Важным свойством всякого оптимального решения является его динамическая устойчивость. Оказывается, что далеко
не все принципы оптимальности обладают этим свойством. Напомним, в чем состоит понятие динамической устойчивости
решений дифференциальных игр. Предположим, что система развивается вдоль оптимальной траектории x(t) под воздейст-
вием оптимальных управлений u(t), v
1
(t), ..., v
n
(t). В каждый момент времени будем рассматривать игру T(t, x(t)), в которой
множества допустимых управлений представляют собой сужения множеств U, V
1
, V
2
, ..., V
n
на интервал времени [t, Т]. Обо-
значим эти множества через U
t
t
V
1
, ...,
t
n
V . Они будут включать в себя измеримые функции, заданные на интервале [t, Т].
Обозначим через
()
....,,2,1,0
,)v...,,v,,(v...,,v,
,
,
1
,,
,
1
,
ni
duxhuH
T
t
Tt
n
Tt
Tt
i
Tt
n
Tt
Ttt
i
=
τ=
функционалы выигрышей в игре T(t, x(t)), где и
t,T
U
t
, v
t,T
U
t
. Обозначим также через u
t
t
1
v
, ...,
t
n
v
сужения оптимальных
управлений игроков на отрезок [t, Т], т.е., например, u'(τ) = u(τ), t < τ < T, и т.д. Игра T(t, x, {t}) называется текущей игрой.
Пусть M(t, x(t)) – решение текущей игры, которая развивается вдоль оптимальной траектории x(t), a u(t), v
1
(t), ..., v
n
(t) –
оптимальные управления игроков.
Говорят, что ситуация (и, v
1
, v
2
, ..., v
n
) M(t
0
, x
0
) динамически устойчива, если в любой момент времени сужения опти-
мальных управлений игроков образуют ситуацию в текущей игре (u
t
t
1
v , ...,
t
n
v ), которая принадлежит решению игры Г(t,
x(t)), т.е. (u
t
t
1
v , ...,
t
n
v ) M(t, x(t)).
Определение. Решение M(t
0
, х
0
) дифференциальной игры T(t
0
, х
0
) называется динамически устойчивым, если для
любого t [t
0
, Т] и любой ситуации (и, v
1
, v
2
, ..., v
n
) M(t
0
, x
0
) выполнено условие
))(,()v...,,v,v,(
21
txtMu
t
n
ttt
,
где x(t) – оптимальная траектория системы (3.62), соответствующая оптимальным управлениям и, v
1
, v
2
, ..., v
n
.
Свойство динамической устойчивости является очень важной характеристикой решения дифференциальной игры. Если
какая-либо ситуация (и, v
1
, v
2
, ..., v
n
) M(t
0
, x
0
) не является динамически устойчивой (т.е. решение M(t
0
, x
0
) не является дина-
мически устойчивым), то это означает, что в некоторый момент времени t управления u
t
t
1
v , ...,
t
n
v не будут оптимальными в
текущей игре T(t
0
, x
0
), и игроки перестанут придерживаться этих управлений в дальнейшем. Если же решение динамически
устойчиво, то у игроков не будет оснований изменять свои управления до конца игры.
Свойство динамической устойчивости присуще далеко не всем принципам оптимальности, например, равновесие по
Нэшу является динамически устойчивым, а равновесие по Штакельбергу таковым не является.
Практическая ценность свойства динамической устойчивости решений дифференциальных игр состоит в том, что если
игроки договариваются в начале игры о реализации некоторой оптимальной ситуации в течение всей игры, то эта догово-
ренность для динамически устойчивых принципов оптимальности сохраняется до конца игры.
Покажем, что равновесие по Нэшу в дифференциальной игре T(t
0
, x
0
) является динамически устойчивым. На первом
уровне иерархии находится игрок А
0
. на второмигроки В
1
, B
2
, .., В
п
, входящие в множество I. Обозначим через
)v...,,v,v(v
21 n
= вектор управлений игроков нижнего уровня. Пусть оптимальные управления являются программными,
т.е. являются функциями времени:
)(vv),( ttuu == .
Предположим, что для некоторого момента времени )).(,()v,( τττ
ττ
xMu Следовательно, найдутся игрок нижнего
уровня j и управление
T
j
,
v
τ
или управление центра
T
u
,τ
такие, что выполнено одно из неравенств
)v,(),(
,
τττ
τ
τττ
> uHuuuH
j
T
jj
; (3.64)