ВУЗ:
Составители:
Рубрика:
331
⎟
⎟
⎟
⎠
⎞
⎜
⎜
⎜
⎝
⎛
−
−
−
=
110
011
101
P .
Для первой строки платежной матрицы, т.е. при выборе игроком
стратегии
1
A , получаем число .1)1;0;1min(min
1
3,2,1
1
−=
−
=
=
α
=
j
j
a Это число
достигается при выборе игроком В стратегии
1
B . Для второй строки (стра-
тегия
2
A
) − число
1)0;1;1min(min
2
3,2,1
2
−
=
−
=
=α
=
j
j
a
(стратегия
2
B
). Для
третьей строки
(стратегия
3
A ) − число
1)1;1;0min(min
3
3,2,1
3
−=−
=
=
α
=
j
j
a
, что
соответствует стратегии
3
B игрока В. Гарантируя себе минимальный вы-
игрыш при любой стратегии игрока В, т.е. 1)1;1;1max(max
,..,1
−
=
−−−
=
α
=
α
=
i
mi
,
игрок А может выбирать любую из своих стратегий, поскольку каждая из
них для данной игры является максиминной.
Аналогично максимальный проигрыш игрока В при выборе страте-
гии
1
B определяется числом .1)0;1;1max(
1
=
−
=
β
При выборе стратегии
2
B
− числом
.1)1;1;0max(
2
=
−
=
β
При выборе стратегии
3
B
− числом
.1)1;0;1max(
3
=−=β Минимальный проигрыш игрока В при любой страте-
гии игрока А равен верхней цене игры 1)1;1;1min(
=
=
β
. Этот же результат
получаем, используя непосредственно формулу (5.5):
1)1;1;1(minmaxminmaxmin
3,2,1
3,2,1
3,2,1
,..,1
,...,1
=
=
=
=β
=
=
=
=
= j
ij
i
j
ij
mi
nj
aa .
Таким образом. любая стратегия игрока В является минимаксной. Ре-
зультаты решения задачи можно представить в таблице 1.
Таблица 1
j
B
i
A
1
B
2
B
3
B
i
α
1
A
−1 0 1 −1
2
A
1 −1 0 −1
3
A
0 1 −1 −1
j
β
1
1
1
1
1
=β
−=α
В рассмотренном примере нижняя и верхняя цены игры различны.
При многократном повторении этой игры средняя цена игры будет равна
числу v, которое принимает значение из промежутка, определяемом чис-
лами α и β, а именно, справедливо неравенство
331 ⎛−1 0 1⎞ ⎜ ⎟ P = ⎜ 1 −1 0 ⎟. ⎜ 0 1 − 1⎟⎠ ⎝ Для первой строки платежной матрицы, т.е. при выборе игроком стратегии A1 , получаем число α1 = min a1 j = min(−1;0; 1) = −1. Это число j =1, 2 ,3 достигается при выборе игроком В стратегии B1 . Для второй строки (стра- тегия A2 ) − число α 2 = min a2 j = min(1;−1;0) = −1 (стратегия B2 ). Для j =1, 2, 3 третьей строки (стратегия A3 ) − число α 3 = min a3 j = min(0; 1;−1) = −1 , что j =1, 2, 3 соответствует стратегии B3 игрока В. Гарантируя себе минимальный вы- игрыш при любой стратегии игрока В, т.е. α = max α i = max(−1;−1;−1) = −1, i =1,.., m игрок А может выбирать любую из своих стратегий, поскольку каждая из них для данной игры является максиминной. Аналогично максимальный проигрыш игрока В при выборе страте- гии B1 определяется числом β1 = max(−1;1; 0) = 1. При выборе стратегии B2 − числом β 2 = max(0;−1; 1) = 1. При выборе стратегии B3 − числом β 3 = max(1; 0;−1) = 1. Минимальный проигрыш игрока В при любой страте- гии игрока А равен верхней цене игры β = min(1;1;1) = 1. Этот же результат получаем, используя непосредственно формулу (5.5): β = min max aij = min max aij = min (1;1;1) = 1 . j =1,..., n i =1,.., m j =1, 2,3 i =1, 2,3 j =1, 2,3 Таким образом. любая стратегия игрока В является минимаксной. Ре- зультаты решения задачи можно представить в таблице 1. Таблица 1 Bj Ai B1 B2 B3 αi A1 −1 0 1 −1 A2 1 −1 0 −1 A3 0 1 −1 −1 α = −1 βj 1 1 1 β =1 В рассмотренном примере нижняя и верхняя цены игры различны. При многократном повторении этой игры средняя цена игры будет равна числу v, которое принимает значение из промежутка, определяемом чис- лами α и β, а именно, справедливо неравенство
Страницы
- « первая
- ‹ предыдущая
- …
- 329
- 330
- 331
- 332
- 333
- …
- следующая ›
- последняя »