Теория игр: Текст лекций. Саакян Г.Р. - 6 стр.

UptoLike

Составители: 

Рубрика: 

5
r
B
g
B
b
B
r
A
2
2 1
g
A
2 1 1
b
A
3 3
1
Выделенные стратегии и являются оптимальными для игроков
g
A
b
B
A
и , B
optg
AA
=
,
optb
BB
=
в следующем смысле:
при многократном повторении игры отказ от выбранной стратегии любым из игроков
уменьшает его шансы на выигрыш (увеличивает шансы на проигрыш).
В самом деле, если игрок
A
будет придерживаться не стратегии , а выберет иную
стратегию, например, , то вряд ли стоит рассчитывать на то, что игрок этого не заме-
тит. Конечно, заметит и не преминет воспользоваться своим наблюдением. Ясно, что в этом
случае он отдаст предпочтение стратегии . А на выбор игрок ответит, например,
стратегией . В результате отказа от стратегии выигрыш игрока
opt
A
r
A B
r
B
b
A B
g
B
g
A
A
уменьшится.
Если же от стратегии отказывается игрок , выбирая, например, стратегию ,
то игрок
opt
B B
r
B
A
может ответить на это стратегией и, тем самым, увеличить свой выигрыш. В
случае стратегии ответ игрока
b
A
g
B
A
.
r
A
Тем самым, ситуация , оказывается равновесной
g
A{ }
b
B
Еще раз подчеркнем, что элементами матрицы игры являются числа, описывающие
выигрыш игрока
A
. Более точно, выигрыш соответствует положительному элементу пла-
тежной матрицы, а отрицательный указывает на проигрыш игрока
A
.
Матрица выплат игроку получается из матрицы игры заменой каждого ее элемента
на противоположный.
B
Рассмотрим теперь произвольную матричную игру:
=
mnmm
n
n
aaa
aaa
aaa
A
...
............
...
...
21
22221
11211
(строки заданной
nm
×
-матрицы соответствуют стратегиям игрока
A
, а столбцыстрате-
гиям игрока ) и опишем общий алгоритм, посредством которого можно определить, есть
ли в этой игре ситуация равновесия или ее нет.
B
В теории игр предполагается, что оба игрока действуют разумно, т.е. стремятся к
получению максимального выигрыша, считая, что соперник действует наилучшим (для себя)
образом.
Действия игрока А.
1-й шаг. В каждой строке матрицы
A
находится минимальный элемент
k
iki
mia .,...,2,1,min
=
=
α
Полученные числа
m
α
α
α
,...,,
21
                                                                                        5

                                  Br            Bg               Bb
                         Ar       −2            2                −1
                         Ag        2            1                 1
                         Ab        3            −3                1


      Выделенные стратегии Ag и Bb являются оптимальными для игроков A и B ,
                                       Ag = Aopt , Bb = Bopt
в следующем смысле:
при многократном повторении игры отказ от выбранной стратегии любым из игроков
уменьшает его шансы на выигрыш (увеличивает шансы на проигрыш).
       В самом деле, если игрок A будет придерживаться не стратегии Aopt , а выберет иную
стратегию, например, Ar , то вряд ли стоит рассчитывать на то, что игрок B этого не заме-
тит. Конечно, заметит и не преминет воспользоваться своим наблюдением. Ясно, что в этом
случае он отдаст предпочтение стратегии Br . А на выбор Ab игрок B ответит, например,
стратегией Bg . В результате отказа от стратегии Ag выигрыш игрока A уменьшится.
      Если же от стратегии Bopt отказывается игрок B , выбирая, например, стратегию Br ,
то игрок A может ответить на это стратегией Ab и, тем самым, увеличить свой выигрыш. В
случае стратегии Bg ответ игрока A – Ar .
      Тем самым, ситуация { Ag , Bb } оказывается равновесной
       Еще раз подчеркнем, что элементами матрицы игры являются числа, описывающие
выигрыш игрока A . Более точно, выигрыш соответствует положительному элементу пла-
тежной матрицы, а отрицательный указывает на проигрыш игрока A .
       Матрица выплат игроку B получается из матрицы игры заменой каждого ее элемента
на противоположный.
       Рассмотрим теперь произвольную матричную игру:
                                       ⎛ a11         a12        ... a1n ⎞
                                       ⎜                                 ⎟
                                       ⎜a            a22        ... a2 n ⎟
                                   A = ⎜ 21
                                          ...        ...        ... ... ⎟
                                       ⎜⎜                                ⎟
                                        ⎝ am1       am 2        ... amn ⎟⎠
(строки заданной m × n -матрицы соответствуют стратегиям игрока A , а столбцы – страте-
гиям игрока B ) и опишем общий алгоритм, посредством которого можно определить, есть
ли в этой игре ситуация равновесия или ее нет.
       В теории игр предполагается, что оба игрока действуют разумно, т.е. стремятся к
получению максимального выигрыша, считая, что соперник действует наилучшим (для себя)
образом.
       Действия игрока А.
       1-й шаг. В каждой строке матрицы A находится минимальный элемент
                                α i = min a ik ,               i = 1,2,..., m.
                                                           k
Полученные числа
                                       α1 , α 2 ,...,α m