Основы теории игр. Садовин H.C - 24 стр.

UptoLike

Составители: 

Рубрика: 

24
где
0
³
i
p вероятность того, что первый игрок применит
чистую стратегию
i
A
,
1
1
=
=
å
m
i
i
p .
А для второго игрока имеем смешанную стратегию:
12
2
12
...
...
æö
=
ç÷
èø
n
n
S
qqq
, (2.7')
где
0
³
j
q вероятность того, что второй игрок применит чистую
стратегию
j
B
,
1
1
=
=
å
n
j
j
q .
Отметим, что каждая чистая стратегия является частным слу-
чаем смешанной стратегии.
Если мы окажемся в ситуации
{
}
,
ij
AB
, то она будет реализо-
вана с вероятностью
×
ij
pq
, а выигрыш составит величину
ij
a
.
И средний выигрыш первого игрока можно определить как мате-
матическое ожидание:
( )
11
, ,
==
=
åå
mn
ijij
ij
H A p q a pq
, (2.8)
где
,
pq
вектора с компонентами
i
p
и
j
q
соответственно.
Стратегии
(
)
000
1
,...,=
m
ppp
и
(
)
000
1
,...,
=
m
qqq
называются оп-
тимальными смешанными стратегиями игроков, если выполнены
следующие соотношения:
(
)
(
)
(
)
0000
,,,,,,
££
HApq HApq HApq
. (2.9)
Поясним последнее соотношение. Левая часть этого неравен-
ства
(
)
(
)
0 00
,, ,,
£
HApq HApq
означает, что если первый игрок
отклоняется от оптимальной стратегии
0
p
, то его выигрыш
где pi ³ 0 — вероятность того, что первый игрок применит
                                       m
чистую стратегию Ai ,                  åp
                                       i =1
                                              i   =1.

    А для второго игрока имеем смешанную стратегию:

         æB       B2 ... Bn ö
    S2 = ç 1                ÷,                                          (2.7')
         è q1     q2 ... qn ø

где q j ³ 0 — вероятность того, что второй игрок применит чистую
                     n
стратегию B j ,    åq
                    j =1
                               j   = 1.

   Отметим, что каждая чистая стратегия является частным слу-
чаем смешанной стратегии.
   Если мы окажемся в ситуации { Ai , B j } , то она будет реализо-
вана с вероятностью pi × q j , а выигрыш составит величину aij .
И средний выигрыш первого игрока можно определить как мате-
матическое ожидание:
                           m       n
    H ( A, p, q ) = åå aij pi q j ,                                     (2.8)
                           i =1 j =1



где p, q — вектора с компонентами pi и q j соответственно.
    Стратегии p 0 = ( p10 ,..., pm0 ) и q 0 = ( q10 ,..., qm0 ) называются оп-
тимальными смешанными стратегиями игроков, если выполнены
следующие соотношения:

    H ( A, p, q 0 ) £ H ( A, p 0 , q 0 ) £ H ( A, p 0 , q ) .           (2.9)

    Поясним последнее соотношение. Левая часть этого неравен-
ства H ( A, p, q 0 ) £ H ( A, p 0 , q 0 ) означает, что если первый игрок
отклоняется от оптимальной стратегии p 0 , то его выигрыш

                                                        24