Системный анализ в информационных технологиях. Громов Ю.Ю - 80 стр.

UptoLike

Учитывая определение множества
)(
*
2,1
uR , получим, что для любых v
1
V
1
, v
2
V
2
справедливы неравенства
))v,v,(v,v,())v,v,(v),(v,(
2131121311
uuHuuuH ,
))v,v,(v,v,())v,v,(v),(v,(
3232221322
uuHuuuH .
И, наконец, из определения множества R
3
(u, v
1
, v
2
) следует
)v),(v),(v,())v,v,(v),(v),(v,(
3213213213
uuuHuuuuH
для любого управления v
3
V
3
. Таким образом, построенная ситуация является ситуацией равновесия по Нэшу.
Рассмотрим теперь процесс построения ситуации равновесия по Штакельбергу в ромбовидной игре. В соответствие с
определением решения по Штакельбергу множество оптимальных реакций игрока В
3
будет следующим:
}v)v,v,v,()v,v,v,(,v|v{)v,v,(
3332133213333213
VuHuHVuR
=
.
Нетрудно заметить, что в данном случае множество оптимальных реакций игрока B
3
такое же, что и при построении си-
туации равновесия по Нэшу.
Множество оптимальных реакций игроков B
1
, B
2
будем строить, исходя из того, что они должны обеспечить себе гаран-
тированный результат при наихудших для каждого из них действиях игрока B
3
. Обозначим
)v,v,(min)v,v(
311
v,v,(v
211
)2133
uHH
uR
u
= , (3.60)
)v,v,(min)v,v(
322
v,v,(v
212
)2133
uHH
uR
u
=
. (3.61)
Эти функции задают значения выигрышей в ситуации, когда игроки B
1
и B
2
придерживаются стратегий v
1
и v
2
, а игрок
B
3
выбирает управления, наихудшие соответственно для B
1
или B
2
. Множество оптимальных реакций игроков B
1
, B
2
опреде-
лим следующим образом:
)v,v()v,v(,v,v|)v,v{()(
2112112211212,1
=
uu
HHVVuR
,
}v,v)v,v()v,v(
2211212212
VVHH
uu
,
или, что то же самое,
=
)v,v,(min,v,v|)v,v{()(
311
)v,v,(v
2211212,1
2133
uHVVuR
uR
)v,v,(min),v,v,(min
322
)v,v,(v
311
),v,(v
21332133
uHuH
uRvuR
.}v,v)v,v,(min
2211322
)v,v,(v
2133
VVuH
uR
Множество оптимальных управлений центра в соответствие с определением решения по Штакельбергу запишем в виде
=
)v,v,v,(minmin,|{
3210
)v,v,(v)()v,v(
21332,121
uHUuuPR
uRuR
}')v,v,v,'(minmin
3210
)v,v,(v)()v,v(
21332,121
UuuH
uRuR
.
Решением по Штакельбергу ромбовидной игры будет любой вектор (
0
3
0
2
0
1
0
v,v,v,u ), такой, что u
0
PR, )v,v(
0
2
0
1
)(
0*
2,1
uR ,
0
3
v ()v,v,(
0
2
0
1
0
3
uR ).
Здесь, очевидно, требует некоторого обсуждения построение множества оптимальных реакций R
1,2
(u) игроков В
1
и В
2
.
Если множество R
3
(u, v
1
, v
2
) для всех значений и, v
1
, v
2
является одноэлементным множеством или минимумы выражений
(3.60) и (3.61) достигаются на одних и тех же управлениях игрока В
3
, то множество R
1,2
(u) является множеством ситуации
равновесия по Нэшу в неантагонистической игре двух лиц (игроков B
1
и B
2
) с функциями выигрышей Н
1
(и, v
1
, v
3
(и, v
1
, v
2
)) и
Н
1
(и, v
1
, v
3
(и, v
1
, v
2
)), где
)v,v,(minArg)v,v,(minArg)v,v,(
322
)v,v,(v
311
)v,v,(v
213
21332133
uHuHuv
uRuR
=
= .
В противном случае множество R
1,2
(u) является множеством ситуаций равновесия по Нэшу в неантагонистической игре
игроков В
1
и B
2
с функциями выигрыша
u
H
1
(v
1
, v
2
) и
u
H
2
(v
1
, v
2
). Любая ситуация (v
1
, v
2
) R
1,2
(u) характерна тем, что каж-
дый из игроков В
1
, B
2
в этой ситуации гарантирует себе максимальный выигрыш при фиксированной стратегии другого и
наихудшем выборе управления игроком B
3
.
Для иллюстрации описанного процесса нахождения оптимального по Штакельбергу решения в ромбовидной игре рас-