Математика. Курзина В.М - 331 стр.

UptoLike

Составители: 

Рубрика: 

331
=
110
011
101
P .
Для первой строки платежной матрицы, т.е. при выборе игроком
стратегии
1
A , получаем число .1)1;0;1min(min
1
3,2,1
1
=
=
=
α
=
j
j
a Это число
достигается при выборе игроком В стратегии
1
B . Для второй строки (стра-
тегия
2
A
) число
1)0;1;1min(min
2
3,2,1
2
=
=
=α
=
j
j
a
(стратегия
2
B
). Для
третьей строки
(стратегия
3
A ) число
1)1;1;0min(min
3
3,2,1
3
=
=
=
α
=
j
j
a
, что
соответствует стратегии
3
B игрока В. Гарантируя себе минимальный вы-
игрыш при любой стратегии игрока В, т.е. 1)1;1;1max(max
,..,1
=
=
α
=
α
=
i
mi
,
игрок А может выбирать любую из своих стратегий, поскольку каждая из
них для данной игры является максиминной.
Аналогично максимальный проигрыш игрока В при выборе страте-
гии
1
B определяется числом .1)0;1;1max(
1
=
=
β
При выборе стратегии
2
B
числом
.1)1;1;0max(
2
=
=
β
При выборе стратегии
3
B
числом
.1)1;0;1max(
3
==β Минимальный проигрыш игрока В при любой страте-
гии игрока А равен верхней цене игры 1)1;1;1min(
=
=
β
. Этот же результат
получаем, используя непосредственно формулу (5.5):
1)1;1;1(minmaxminmaxmin
3,2,1
3,2,1
3,2,1
,..,1
,...,1
=
=
=
=β
=
=
=
=
= j
ij
i
j
ij
mi
nj
aa .
Таким образом. любая стратегия игрока В является минимаксной. Ре-
зультаты решения задачи можно представить в таблице 1.
Таблица 1
j
B
i
A
1
B
2
B
3
B
i
α
1
A
1 0 1 1
2
A
1 1 0 1
3
A
0 1 1 1
j
β
1
1
1
1
1
=β
=α
В рассмотренном примере нижняя и верхняя цены игры различны.
При многократном повторении этой игры средняя цена игры будет равна
числу v, которое принимает значение из промежутка, определяемом чис-
лами α и β, а именно, справедливо неравенство
                                                          331

                                            ⎛−1 0  1⎞
                                            ⎜         ⎟
                                        P = ⎜ 1 −1 0 ⎟.
                                            ⎜ 0 1 − 1⎟⎠
                                            ⎝

      Для первой строки платежной матрицы, т.е. при выборе игроком
стратегии A1 , получаем число α1 = min a1 j = min(−1;0; 1) = −1. Это число
                                                               j =1, 2 ,3
достигается при выборе игроком В стратегии B1 . Для второй строки (стра-
тегия A2 ) − число α 2 = min a2 j = min(1;−1;0) = −1 (стратегия B2 ). Для
                                        j =1, 2, 3
третьей строки (стратегия A3 ) − число α 3 = min a3 j = min(0; 1;−1) = −1 , что
                                                                            j =1, 2, 3
соответствует стратегии B3 игрока В. Гарантируя себе минимальный вы-
игрыш при любой стратегии игрока В, т.е. α = max α i = max(−1;−1;−1) = −1,
                                                                                i =1,.., m
игрок А может выбирать любую из своих стратегий, поскольку каждая из
них для данной игры является максиминной.
       Аналогично максимальный проигрыш игрока В при выборе страте-
гии B1 определяется числом β1 = max(−1;1; 0) = 1. При выборе стратегии
B2 − числом β 2 = max(0;−1; 1) = 1. При выборе стратегии B3 − числом
β 3 = max(1; 0;−1) = 1. Минимальный проигрыш игрока В при любой страте-
гии игрока А равен верхней цене игры β = min(1;1;1) = 1. Этот же результат
получаем, используя непосредственно формулу (5.5):
                β = min max aij = min max aij = min (1;1;1) = 1 .
                   j =1,..., n i =1,.., m            j =1, 2,3 i =1, 2,3          j =1, 2,3
      Таким образом. любая стратегия игрока В является минимаксной. Ре-
зультаты решения задачи можно представить в таблице 1.
                                                             Таблица 1

                                                          Bj
      Ai               B1                                 B2                                 B3    αi
      A1               −1                                 0                                  1      −1
      A2               1                                  −1                                 0      −1
      A3               0                                  1                                  −1     −1
                                                                                                  α = −1
     βj                  1                                 1                                  1   β =1

     В рассмотренном примере нижняя и верхняя цены игры различны.
При многократном повторении этой игры средняя цена игры будет равна
числу v, которое принимает значение из промежутка, определяемом чис-
лами α и β, а именно, справедливо неравенство