Системный анализ в информационных технологиях. Громов Ю.Ю - 75 стр.

UptoLike

лами выигрышей (3.50) называют дифференциальной игрой в нормальной форме и обозначают
IiKDxt
i
xt
i
= ,,),(Г
0
0
,
0
0
.
В этом параграфе изложены лишь некоторые основные понятия теории игр и возможности ее использования в систем-
ном анализе. Для более глубокого ознакомления с этой теорией рекомендуем обратиться к книгам [7, 8, 11, 16, 17, 20, 21].
3.5.2. Принципы оптимальности в иерархических
теоретико-игровых моделях
Мы уже упоминали о таких принципах оптимальности, используемых при принятии решений, как гарантированный ре-
зультат и равновесие по Нэшу [20]. Здесь более подробно остановимся на понятиях равновесия по Нэшу и по Штакельбергу
для дифференциальных иерархических игр.
Рассмотрим двухуровневую иерархическую игру, в которой игрок A
0
, находящийся на первом уровне иерархии, называ-
ется центром. На втором уровне иерархии находятся игроки B
1
, B
2
, …, В
п
. Динамика игры описывается системой дифферен-
циальных уравнений:
,v,,)0(,)0(],,0[
,...,,2,1),,v,(),,(
00
iiii
iiii
VUuyyxxTt
niuygyuxfx
==
===
&&
где иуправление центра; {v
i
} – управления игроков, выбираемые из областей допустимых управлений U и V соответствен-
но.
Для каждого игрока определены функционалы выигрышей:
,)v,,,()v,(
;)v,,,()v,(
0
0
0
=
=
T
iiiii
T
i
dtuyxhuH
dtuyxhuH
(3.51)
где h
i
, h
0
интегрируемые функции своих аргументов.
Целью каждого игрока является максимизация своего выигрыша.
Центр, используя программное управление, сообщает u(t) игрокам нижнего уровня, а те максимизируют свои функцио-
налы, т.е. их реакция на управление центра следующая:
))((v)}(v{)v,(maxArg{)(
)(v
tutuHuR
uV
ii
ii
==
=
, (3.52)
)(v t
i
есть управление, максимизирующее функцию H
i
(u,
i
v ) при заданном управлении центра.
Центр, зная реакцию игроков нижнего уровня, выбирает управление
)(tu , которое максимизирует функционал
))(v,(
0
uuH .
Ситуация
)v,(u является ситуацией равновесия по Нэшу в рассматриваемой иерархической игре. Действительно,
∫∫
==
TT
uuHdtuuyxhdtuyxhuH
0
0
0
000
)).(v,())(v,,,()v,,,()v,(
Для всех i = l, 2, ..., п
∫∫
==
T
ii
T
iiiiiiiii
uHdtuyxhdtuyxhuH
00
)v,()v,,,()v,,,()v,(
.
Таким образом, ни одному из игроков невыгодно отклоняться от ситуации )v,(u , т.е. она является равновесной но На-
шу,
Дадим определение равновесия по Штакельбергу. Предположим, что центр выбрал программное управление u(t), тогда
игроки нижнего уровня определяют множество оптимальных реакций следующим образом:
}v)v,()v,(,...v|v{)(
21 iiiiiin
VuHuHVVVuR
×
×
×= .
Игрок A
0
, зная множество оптимальных реакций игроков нижнего уровня, выбирает такую стратегию и
*
, чтобы
UuuHuH
n
uR
n
uR
υ
)v...,,v,v,(min)v...,,v,v,(min
210
)(
21
*
0
)(v
*
.
Управление и
*
называется оптимальным иерархическим решением центра. Пара )v,(
**
u где )(v
**
uR , называется си-
туацией равновесия по Штакельбергу в иерархической дифференциальной игре, а множество таких всевозможных парре-