Прогнозирование устойчивости. Жигулин Г.П - 12 стр.

UptoLike

14
изменил стратегию, например на
3
B , а A придерживается своей оптимальной
3
A . Такое отклонение не может быть выгодным для игрока
B
, т.к.
6,0
=
ν
является минимальным в своей строке. То же самое происходит, если
A
отклоняется от своей оптимальной стратегии, а
B
придерживается своей
оптимальной стратегии, т.е. для
A такое отклонение оказывается невыгодным.
Итак, для игры с седловой точкой оптимальные стратегии являются
устойчивыми. В таких играх чистая цена игры
ν
является тем значением
выигрыша, которое в игре против разумного противника, игрок
A не может
увеличить, а игрок
B
уменьшить.
Отметим ещё, что в матрице одновременно может быть несколько
седловых точек, однако все они дают одно и то же значение выигрыша.
Пример 3. См. Табл. 1.8.:
Таблица 1.8.
A
i
B
j
B
1
B
2
B
3
B
4
B
5
i
α
A
1
2 2 1 1 2 1
A
2
0 1 1 1 1 0
A
3
1 1 1 1 2 1
A
4
1 2 1 1 2 1
В данном примере шесть седловых точек, с общим значением выигрыша
1===
ν
β
α
. Этим седловым точкам соответствуют пары оптимальных
стратегий:
443443334131
;;;;; BABABABABABA .
1.1.5. Решение игры в смешанных стратегиях
Практически шире распространены игры, когда нижняя и верхняя цены
игры различны. Мы уже показывали, что для получения гарантированного
выигрыша, равного нижней цене игры, игрок
A должен придерживаться своей
максиминной стратегии. Однако, встаёт вопрос:
A
нельзя ли каким-нибудь
образом получить средний выигрыш больше нижней цены игры? Оказывается,
что при применении не одной чистой максиминной стратегии, а, чередуя
случайным образом несколько стратегий, можно гарантировать средний
выигрыш больше, чем нижняя цена игры. Такие стратегии называются, как уже
отмечалось, смешанными стратегиями.
Допустим, имеем некоторую игру
U
. Игрок
A
имеет m стратегий
;,...,,
21 m
AAA
miA
i
,1, =
. Игрок В имеет n стратегий ;,...,,
21 n
BBB njB
j
,1, = .
Обозначим:
)...,,,(
21 mA
pppS = смешанная стратегия игрока
A
, в которой
стратегии
i
A применяются с
вероятностями
i
p , причём
1
1
=
=
m
i
i
p
.