ВУЗ:
Составители:
Рубрика:
лами выигрышей (3.50) называют дифференциальной игрой в нормальной форме и обозначают
IiKDxt
i
xt
i
∈= ,,),(Г
0
0
,
0
0
.
В этом параграфе изложены лишь некоторые основные понятия теории игр и возможности ее использования в систем-
ном анализе. Для более глубокого ознакомления с этой теорией рекомендуем обратиться к книгам [7, 8, 11, 16, 17, 20, 21].
3.5.2. Принципы оптимальности в иерархических
теоретико-игровых моделях
Мы уже упоминали о таких принципах оптимальности, используемых при принятии решений, как гарантированный ре-
зультат и равновесие по Нэшу [20]. Здесь более подробно остановимся на понятиях равновесия по Нэшу и по Штакельбергу
для дифференциальных иерархических игр.
Рассмотрим двухуровневую иерархическую игру, в которой игрок A
0
, находящийся на первом уровне иерархии, называ-
ется центром. На втором уровне иерархии находятся игроки B
1
, B
2
, …, В
п
. Динамика игры описывается системой дифферен-
циальных уравнений:
,v,,)0(,)0(],,0[
,...,,2,1),,v,(),,(
00
iiii
iiii
VUuyyxxTt
niuygyuxfx
∈∈==∈
===
&&
где и – управление центра; {v
i
} – управления игроков, выбираемые из областей допустимых управлений U и V соответствен-
но.
Для каждого игрока определены функционалы выигрышей:
,)v,,,()v,(
;)v,,,()v,(
0
0
0
∫
∫
=
=
T
iiiii
T
i
dtuyxhuH
dtuyxhuH
(3.51)
где h
i
, h
0
– интегрируемые функции своих аргументов.
Целью каждого игрока является максимизация своего выигрыша.
Центр, используя программное управление, сообщает u(t) игрокам нижнего уровня, а те максимизируют свои функцио-
налы, т.е. их реакция на управление центра следующая:
))((v)}(v{)v,(maxArg{)(
)(v
tutuHuR
uV
ii
ii
==
=
∈
, (3.52)
)(v t
i
есть управление, максимизирующее функцию H
i
(u,
i
v ) при заданном управлении центра.
Центр, зная реакцию игроков нижнего уровня, выбирает управление
)(tu , которое максимизирует функционал
))(v,(
0
uuH .
Ситуация
)v,(u является ситуацией равновесия по Нэшу в рассматриваемой иерархической игре. Действительно,
∫∫
=≥=
TT
uuHdtuuyxhdtuyxhuH
0
0
0
000
)).(v,())(v,,,()v,,,()v,(
Для всех i = l, 2, ..., п
∫∫
=≥=
T
ii
T
iiiiiiiii
uHdtuyxhdtuyxhuH
00
)v,()v,,,()v,,,()v,(
.
Таким образом, ни одному из игроков невыгодно отклоняться от ситуации )v,(u , т.е. она является равновесной но На-
шу,
Дадим определение равновесия по Штакельбергу. Предположим, что центр выбрал программное управление u(t), тогда
игроки нижнего уровня определяют множество оптимальных реакций следующим образом:
}v)v,()v,(,...v|v{)(
21 iiiiiin
VuHuHVVVuR
∈
′
∀
′
≥
×
×
×∈= .
Игрок A
0
, зная множество оптимальных реакций игроков нижнего уровня, выбирает такую стратегию и
*
, чтобы
UuuHuH
n
uR
n
uR
∈∀≥
∈υ
∈
)v...,,v,v,(min)v...,,v,v,(min
210
)(
21
*
0
)(v
*
.
Управление и
*
называется оптимальным иерархическим решением центра. Пара )v,(
**
u где )(v
**
uR∈ , называется си-
туацией равновесия по Штакельбергу в иерархической дифференциальной игре, а множество таких всевозможных пар – ре-
Страницы
- « первая
- ‹ предыдущая
- …
- 73
- 74
- 75
- 76
- 77
- …
- следующая ›
- последняя »