ВУЗ:
Составители:
Рубрика:
330
стратегию
i
A , игрок А должен рассчитывать, что игрок В ответит на нее
той стратегией
j
B , при которой выигрыш игрока А будет наименьшим.
Пусть
i
α − наименьший выигрыш игрока А при выборе им стратегии
i
A для всех возможных стратегий игрока В, тогда
ij
nj
i
a
,...,1
min
=
=
α
,
т.е. наименьшее число в i-ой строке платежной матрицы.
Среди всех чисел
i
α
( i = 1,2,..., m) выберем наибольшее:
i
mi
α
=
α
= ,..,1
max .
Следовательно,
ij
nj
mi
a
,...,1
,..,1
minmax
=
=
=
α
.
Число α называется нижней ценой игры, или максиминным выигры-
шем (максимином). Это гарантированный выигрыш игрока А при любой
стратегии игрока В. Стратегия, соответствующая максимину, называется
максиминной стратегией.
Игрок В заинтересован в том, чтобы уменьшить выигрыш игрока А,
поэтому он выбирает стратегию
j
B , учитывая при этом максимально воз-
можный выигрыш для А. Пусть
j
β
− наибольший выигрыш игрока А при
выборе им всех возможных стратегий, когда игрок В выбирает стратегию
j
B , тогда
ij
mi
j
a
,..,1
max
=
=
β .
Одновременно
j
β является наибольшим проигрышем игрока В при выборе
им стратегии
j
B , поэтому среди всех чисел
j
β
выбираем наименьшее, что-
бы найти ту стратегию игрока В, при которой его проигрыш будет наи-
меньшим. Это число обозначим β и оно равно
ij
mi
nj
a
,..,1
,...,1
maxmin
=
=
=
β .
Число β называется верхней ценой игры или минимаксным выигры-
шем (минимаксом). Это гарантированный проигрыш игрока В. Стратегия,
соответствующая минимаксу, называется минимаксной стратегией.
Принцип, диктующий игрокам выбор наиболее "осторожных" минимакс-
ной и максиминной стратегий, называется принципом минимакса. Этот
принцип следует из того, что в антагонистической игре каждый игрок
стремится достичь
цели, противоположной цели его противника.
Определим верхнюю и нижнюю цены игры и соответствующие
стратегии для
игры с платежной матрицей
330 стратегию Ai , игрок А должен рассчитывать, что игрок В ответит на нее той стратегией B j , при которой выигрыш игрока А будет наименьшим. Пусть α i − наименьший выигрыш игрока А при выборе им стратегии Ai для всех возможных стратегий игрока В, тогда α i = min aij , j = 1,...,n т.е. наименьшее число в i-ой строке платежной матрицы. Среди всех чисел α i ( i = 1,2,..., m) выберем наибольшее: α = max α i . i =1,.., m Следовательно, α = max min aij . i =1,.., m j =1,..., n Число α называется нижней ценой игры, или максиминным выигры- шем (максимином). Это гарантированный выигрыш игрока А при любой стратегии игрока В. Стратегия, соответствующая максимину, называется максиминной стратегией. Игрок В заинтересован в том, чтобы уменьшить выигрыш игрока А, поэтому он выбирает стратегию B j , учитывая при этом максимально воз- можный выигрыш для А. Пусть β j − наибольший выигрыш игрока А при выборе им всех возможных стратегий, когда игрок В выбирает стратегию B j , тогда β j = max aij . i =1,.., m Одновременно β j является наибольшим проигрышем игрока В при выборе им стратегии B j , поэтому среди всех чисел β j выбираем наименьшее, что- бы найти ту стратегию игрока В, при которой его проигрыш будет наи- меньшим. Это число обозначим β и оно равно β = min max aij . j =1,..., n i =1,.., m Число β называется верхней ценой игры или минимаксным выигры- шем (минимаксом). Это гарантированный проигрыш игрока В. Стратегия, соответствующая минимаксу, называется минимаксной стратегией. Принцип, диктующий игрокам выбор наиболее "осторожных" минимакс- ной и максиминной стратегий, называется принципом минимакса. Этот принцип следует из того, что в антагонистической игре каждый игрок стремится достичь цели, противоположной цели его противника. Определим верхнюю и нижнюю цены игры и соответствующие стратегии для игры с платежной матрицей
Страницы
- « первая
- ‹ предыдущая
- …
- 328
- 329
- 330
- 331
- 332
- …
- следующая ›
- последняя »