ВУЗ:
Составители:
Рубрика:
24
где
0
³
i
p — вероятность того, что первый игрок применит
чистую стратегию
i
A
,
1
1
=
=
å
m
i
i
p .
А для второго игрока имеем смешанную стратегию:
12
2
12
...
...
æö
=
ç÷
èø
n
n
BBB
S
qqq
, (2.7')
где
0
³
j
q — вероятность того, что второй игрок применит чистую
стратегию
j
B
,
1
1
=
=
å
n
j
j
q .
Отметим, что каждая чистая стратегия является частным слу-
чаем смешанной стратегии.
Если мы окажемся в ситуации
{
}
,
ij
AB
, то она будет реализо-
вана с вероятностью
×
ij
pq
, а выигрыш составит величину
ij
a
.
И средний выигрыш первого игрока можно определить как мате-
матическое ожидание:
( )
11
, ,
==
=
åå
mn
ijij
ij
H A p q a pq
, (2.8)
где
,
pq
— вектора с компонентами
i
p
и
j
q
соответственно.
Стратегии
(
)
000
1
,...,=
m
ppp
и
(
)
000
1
,...,
=
m
qqq
называются оп-
тимальными смешанными стратегиями игроков, если выполнены
следующие соотношения:
(
)
(
)
(
)
0000
,,,,,,
££
HApq HApq HApq
. (2.9)
Поясним последнее соотношение. Левая часть этого неравен-
ства
(
)
(
)
0 00
,, ,,
£
HApq HApq
означает, что если первый игрок
отклоняется от оптимальной стратегии
0
p
, то его выигрыш
где pi ³ 0 — вероятность того, что первый игрок применит m чистую стратегию Ai , åp i =1 i =1. А для второго игрока имеем смешанную стратегию: æB B2 ... Bn ö S2 = ç 1 ÷, (2.7') è q1 q2 ... qn ø где q j ³ 0 — вероятность того, что второй игрок применит чистую n стратегию B j , åq j =1 j = 1. Отметим, что каждая чистая стратегия является частным слу- чаем смешанной стратегии. Если мы окажемся в ситуации { Ai , B j } , то она будет реализо- вана с вероятностью pi × q j , а выигрыш составит величину aij . И средний выигрыш первого игрока можно определить как мате- матическое ожидание: m n H ( A, p, q ) = åå aij pi q j , (2.8) i =1 j =1 где p, q — вектора с компонентами pi и q j соответственно. Стратегии p 0 = ( p10 ,..., pm0 ) и q 0 = ( q10 ,..., qm0 ) называются оп- тимальными смешанными стратегиями игроков, если выполнены следующие соотношения: H ( A, p, q 0 ) £ H ( A, p 0 , q 0 ) £ H ( A, p 0 , q ) . (2.9) Поясним последнее соотношение. Левая часть этого неравен- ства H ( A, p, q 0 ) £ H ( A, p 0 , q 0 ) означает, что если первый игрок отклоняется от оптимальной стратегии p 0 , то его выигрыш 24
Страницы
- « первая
- ‹ предыдущая
- …
- 22
- 23
- 24
- 25
- 26
- …
- следующая ›
- последняя »