Теория игр: Текст лекций. Саакян Г.Р. - 19 стр.

UptoLike

Составители: 

Рубрика: 

18
2.2. 2
×
m игры
Пусть теперь в матричной игре две чистые стратегии имеет игрок , а число чистых
стратегий у игрока
B
A
произвольно (равно ). Это означает, что платежная матрица такой
игры имеет вид
m
21
2221
1211
mm
aa
aa
aa
MM
.
Анализ такой игры во многом напоминает рассуждения, проведенные для игры n
×
2 .
Пусть произвольная смешанная стратегия игрока . Если игрок
}1,{ qqQ =
B
A
выбирает -ю чистую стратегию,
i
mi ,...,2,1
=
, то средний выигрыш игрока в ситуации
будет равным
B
},{ Qi
)1(:)(
21
qaqawi
ii
+
=
, mi ,...,2,1
=
.
Зависимость этого выигрыша от переменной описывается прямой.
q
Графиком функции
))1((
21
1
max
qaqa
ii
mi
+
является верхняя огибающая семейства прямых , соответствующих чистым стратегиям
игрока
)(i
A
(рис. 11).
w
q
1
0
0
w
0
q
Рисунок 11.
Абсцисса нижней точки полученной ломаной определяет оптимальную смешан-
ную стратегию игрока , а ордината цену игры.
0
q
B
0
w
Замечание. Отыскание оптимальной смешанной стратегии игрока
A
проводится по
той же схеме, которая позволяет найти оптимальную смешанную стратегию игрока в игре
.
B
n×2
Рассмотрим конкретный пример.
                                                                                      18

                                         2.2. m × 2 игры

       Пусть теперь в матричной игре две чистые стратегии имеет игрок B , а число чистых
стратегий у игрока A произвольно (равно m ). Это означает, что платежная матрица такой
игры имеет вид
                                                   ⎛ a11       a12 ⎞
                                                   ⎜                 ⎟
                                                   ⎜ a21       a22 ⎟
                                                                       .
                                                   ⎜ M          M ⎟
                                                   ⎜⎜                ⎟
                                                    ⎝ am1      am 2 ⎟⎠
       Анализ такой игры во многом напоминает рассуждения, проведенные для игры 2 × n .
       Пусть Q = {q,1 − q} – произвольная смешанная стратегия игрока B . Если игрок A
выбирает i -ю чистую стратегию, i = 1,2,..., m , то средний выигрыш игрока B в ситуации
{i, Q} будет равным
                         (i ) : w = ai1q + ai 2 (1 − q) , i = 1,2,..., m .
Зависимость этого выигрыша от переменной q описывается прямой.
       Графиком функции
                                  max (a          i1
                                                       q + ai 2 (1 − q) )
                                   1≤ i ≤ m

является верхняя огибающая семейства прямых (i) , соответствующих чистым стратегиям
игрока A (рис. 11).
                       w




                       w0



                                                                            1
                                                                  0
                       0                                      q                 q



                                   Рисунок 11.
                   0
       Абсцисса q нижней точки полученной ломаной определяет оптимальную смешан-
ную стратегию игрока B , а ордината w – цену игры.
                                              0


      Замечание. Отыскание оптимальной смешанной стратегии игрока A проводится по
той же схеме, которая позволяет найти оптимальную смешанную стратегию игрока B в игре
2× n.
      Рассмотрим конкретный пример.