Прогнозирование устойчивости. Жигулин Г.П - 10 стр.

UptoLike

12
Величина
β
называется верхней ценой игры, или минимаксным
выигрышем или минимаксом. Та стратегия игрока
B
, которая соответствует
минимаксу
β
, называется его минимаксной стратегией.
Принцип осторожности, диктующий игрокам выбор соответствующих
стратегий (максиминной и минимаксной), является в теории игр основным и
называется принципом минимакса.
Отметим, что минимаксные стратегии обладают одним неприятным
свойством: они являются неустойчивыми. Что это означает? Если оба игрока
пользуются своими максиминными стратегиями, то сведения об этом,
поступившие одному
из игроков, позволяет ему увеличить выигрыш, т.е.
сделать его выше нижней цены или ниже верхней цены.
Минимаксные стратегии устойчивы тогда, когда нижняя и верхняя цены
игры равны между собой, т.е.
β
α
=
. В этом случае максиминные стратегии
являются оптимальными и не зависят от того, знает ли противник о нашей
стратегии. Эти сведения не дают возможности игрокам увеличить свой
выигрыш. Если какой-то игрок отойдёт от оптимальной стратегии, то он только
уменьшит свой выигрыш.
Рассмотрим числовые примеры.
Пример 1. Игроки
A и
B
одновременно и независимо друг от друга
записывают одно из трёх чисел: 1, 2 или 3. Если сумма чисел чётная, то игрок В
платит эту сумму игроку А, если же она нечётная, то игрок
A
платит
полученную сумму игроку
B
.
У игроков имеется по три одинаковых стратегии:
1
A (
1
B ) – писать число 1;
2
A
(
2
B
) – писать число 2;
3
A (
3
B ) – писать число 3.
Как видим игра
33×
и имеет следующую матрицу (табл. 1.6.):
Таблица 1.6.
A
i
B
j
B
1
B
2
B
3
i
α
A
1
2 –3 4 –3
A
2
–3 4 –5 –5
A
3
4 –5 6 –5
j
β
4 4 6
Нижняя цена игры максимин
3
=
;
Верхняя цена игры минимакс
4
=
β
.
Итак, если игрок
A будет всегда применять максиминную стратегию,
1
A ,
то ему твёрдо гарантирован выигрыш равный – 3 (т.е. проигрыш 3 единицы).
Если же игрок
B
будет применять свою максиминную стратегию
1
B или
2
B , то
он гарантирован, что проиграет не больше 4 единиц.