Основы теории игр. Садовин H.C - 23 стр.

UptoLike

Составители: 

Рубрика: 

23
Определим минимаксную стратегию второго игрока, выбрав
наибольшие значения проигрышей для второго игрока в каждом
столбце матрицы выигрышей:
123452
8, 5, 12, 7, 1, min 5
bbbbbbb
=======Þ
j
B
.
Здесь уже нет седловой точки, так как
ab
<
.
Допустим, что первому игроку стало известно, что второй иг-
рок принял минимаксную стратегию
2
B
, тогда оптимальной для
первого игрока будет не максиминная стратегия
2
A
, а стратегия
A
, дающая ему выигрыш
5
a
>
.
Это означает, что бывают ситуации, когда первый игрок мо-
жет получить выигрыш, превосходящий максиминный, если ему
известны намерения второго игрока (при многократном повторении
игры в сходных условиях).
2.3. Смешанные стратегии
Рассмотрим теперь подробнее случай отсутствия седловой
точки, то есть случай, когда
ab
<
. Это означает, что первый иг-
рок может обеспечить себе выигрыш, не меньший
a
, а второй
проигрыш, не больший
b
. Возникает вопрос, как «справедливо»
разделить разность
ba
-
между игроками.
Оказывается, что компромиссного распределения разности
ba
-
между игроками можно добиться путем случайного чере-
дования игроками чистых стратегий. При этом можно получить
выигрыш «в среднем» больший, чем
a
, но меньший, чем
b
.
Для этого применяют так называемые смешанные стратегии,
которые можно представить в виде случайных величин, возмож-
ными значениями которых являются чистые стратегии.
Для первого игрока имеем смешанную стратегию
12
1
12
...
...
æö
=
ç÷
èø
m
m
AAA
S
ppp
, (2.7)
    Определим минимаксную стратегию второго игрока, выбрав
наибольшие значения проигрышей для второго игрока в каждом
столбце матрицы выигрышей:

    b1 8, b
    =     = 2    b3 12,=
              5, =     b4        b 5 1,=
                               7,=     b min
                                           =b j    5 Þ B2 .

     Здесь уже нет седловой точки, так как a < b .
     Допустим, что первому игроку стало известно, что второй иг-
рок принял минимаксную стратегию B2 , тогда оптимальной для
первого игрока будет не максиминная стратегия A2 , а стратегия
A1 , дающая ему выигрыш 5 > a .
     Это означает, что бывают ситуации, когда первый игрок мо-
жет получить выигрыш, превосходящий максиминный, если ему
известны намерения второго игрока (при многократном повторении
игры в сходных условиях).

                    2.3. Смешанные стратегии

    Рассмотрим теперь подробнее случай отсутствия седловой
точки, то есть случай, когда a < b . Это означает, что первый иг-
рок может обеспечить себе выигрыш, не меньший a , а второй —
проигрыш, не больший b . Возникает вопрос, как «справедливо»
разделить разность b - a между игроками.
    Оказывается, что компромиссного распределения разности
b - a между игроками можно добиться путем случайного чере-
дования игроками чистых стратегий. При этом можно получить
выигрыш «в среднем» больший, чем a , но меньший, чем b .
    Для этого применяют так называемые смешанные стратегии,
которые можно представить в виде случайных величин, возмож-
ными значениями которых являются чистые стратегии.
    Для первого игрока имеем смешанную стратегию

         æA     A2 ... Am ö
    S1 = ç 1              ÷,                                  (2.7)
         è p1   p2 ... pm ø

                                23