Системный анализ в информационных технологиях - 109 стр.

UptoLike

при построении ситуации равновесия по Нэшу.
Множество оптимальных реакций игроков B
1
, B
2
будем строить, исходя из того, что они должны
обеспечить себе гарантированный результат при наихудших для каждого из них действиях игрока B
3
.
Обозначим
)v,v,(min)v,v(
311
v,v,(v
211
)2133
uHH
uR
u
= , (3.60)
)v,v,(min)v,v(
322
v,v,(v
212
)2133
uHH
uR
u
=
. (3.61)
Эти функции задают значения выигрышей в ситуации, когда игроки B
1
и B
2
придерживаются стра-
тегий v
1
и v
2
, а игрок B
3
выбирает управления, наихудшие соответственно для B
1
или B
2
. Множество оп-
тимальных реакций игроков B
1
, B
2
определим следующим образом:
)v,v()v,v(,v,v|)v,v{()(
2112112211212,1
=
uu
HHVVuR
,
}v,v)v,v()v,v(
2211212212
VVHH
uu
,
или, что то же самое,
=
)v,v,(min,v,v|)v,v{()(
311
)v,v,(v
2211212,1
2133
uHVVuR
uR
)v,v,(min),v,v,(min
322
)v,v,(v
311
),v,(v
21332133
uHuH
uRvuR
.}v,v)v,v,(min
2211322
)v,v,(v
2133
VVuH
uR
Множество оптимальных управлений центра в соответствии с определением решения по Штакель-
бергу запишем в виде
=
)v,v,v,(minmin,|{
3210
)v,v,(v)()v,v(
21332,121
uHUuuPR
uRuR
}')v,v,v,'(minmin
3210
)v,v,(v)()v,v(
21332,121
UuuH
uRuR
.
Решением по Штакельбергу ромбовидной игры будет любой
вектор (
0
3
0
2
0
1
0
v,v,v,u ), такой, что u
0
PR, )v,v(
0
2
0
1
)(
0*
2,1
uR ,
0
3
v ( )v,v,(
0
2
0
1
0
3
uR ).
Здесь, очевидно, требует некоторого обсуждения построение множества оптимальных реакций
R
1,2
(u) игроков В
1
и В
2
. Если множество R
3
(u, v
1
, v
2
) для всех значений и, v
1
, v
2
является одноэлементным
множеством или минимумы выражений (3.60) и (3.61) достигаются на одних и тех же управлениях иг-
рока
В
3
, то множество R
1,2
(u) является множеством ситуации равновесия по Нэшу в неантагонистиче-
ской игре двух лиц (игроков
B
1
и B
2
) с функциями выигрышей Н
1
(и, v
1
, v
3
(и, v
1
, v
2
)) и Н
1
(и, v
1
, v
3
(и, v
1
,
v
2
)), где
)v,v,(minArg)v,v,(minArg)v,v,(
322
)v,v,(v
311
)v,v,(v
213
21332133
uHuHuv
uRuR
=
= .