Составители:
Рубрика:
88 89
Пример 7.2. Рассмотрим АИ, где ИМ
2
AX
j
i
,
3,1,2,1 ji
для
игрока 1, и
1 j
для игрока 2. Тогда для стратегии поведения
1
E
имеем
систему из шести чисел (рис. 7.2):
,12,,1,
,12,,1,,12,,1,
3
3
13
3
1
2
2
12
2
11
1
11
1
1
pXbpXb
pXbpXbpXbpXb
а для стратегии поведения
2
E
– из двух:
.12,,1,
1
2
1
2
pXbpXb
Стратегии поведения зависят только от ИМ.
Вероятность выбора чистой стратегии
1,2,1
1
u
11
uq
321
1 ppp
. Смешанную стратегию
1
P
дает вектор вероятностей
^
`
,2,1,
3
1
juq
j
т. е. из стратегий поведения мы строим смешанную
стратегию. Обратное не всегда возможно, поскольку классы игр не экви-
валентны, что, однако, верно при игре с ПП (см. далее теорему Куна).
II
–2 –1 3 –4 5 2 2 6
I I
I
2
1 12
2
p
2
1 p
2
p
2
1 p
3
p
3
1 p
3
p
3
1 p
1
p
1
1 p
4
x
6
x
7
x
1
x
5
x
1
y
2
y
Рис. 7.2
Утверждение 7.1. Любой набор
n
EE E ,...,
1
стратегий поведе-
ния для n игроков определяет вероятностное распределение на партиях
игры и окончательных позициях следующим образом:
.,
z
E
ZX
j
i
Zl
j
i
lXbZP
(7.1)
Здесь произведение берется по всем
j
i
X
и l таким, что
zZX
j
i
,
и выбор в точке
ZX
j
i
альтернативы с номером l приводит в позицию,
принадлежащую пути Z.
Ожидаемый выигрыш
E
i
E
в игре G для ситуации
n
EE E ,...,
1
в стратегиях поведения определяется как математическое ожидание
¦
E
E
1n
Xx
xii
ZPxKE
,
,,1 Ni
где
x
Z
– партия, завершающаяся позицией
1
n
Xx
.
В игре с ПП каждой смешанной стратегии
i
P
можно сопоставить
некоторую стратегию поведения
i
E
.
Определение 7.3. Стратегией поведения
i
E
, соответствующей
смешанной стратегии
^`
i
ui
q P
игрока i, называется стратегия пове-
дения, определенная следующим образом:
если
i
j
i
X P Rel
, тоо
¦
¦
¿
¾
½
¯
®
¿
¾
½
¯
®
¸
¹
·
¨
©
§
i
u
j
i
X
i
u
i
u
l
j
i
X
i
u
i
u
j
i
X
i
u
i
u
j
i
q
q
lXb
Rel:
,Rel:
,
; (7.2)
если
i
j
i
X P Rel
, то на множестве
j
i
X
стратегию
i
E
можно опреде-де-
лить произвольным, отличным от (7.2), образом. (В случае
i
j
i
X P Rel
знаменатель в выражении (7.2) обращается в нуль.) Для определенности
будем полагать, что
^`
.,
:
¦
lXuu
u
j
i
j
i
ii
i
qlXb
(7.3)
Лемма 7.2. Пусть
i
E
– стратегия поведения игрока i, а
}{
i
ui
q P
–
смешанная стратегия, определяемая формулой
.,
j
i
i
X
j
i
i
j
i
u
XuXbq
Тогда
i
E
– стратегия поведения, соответствующая
i
P
.
Страницы
- « первая
- ‹ предыдущая
- …
- 43
- 44
- 45
- 46
- 47
- …
- следующая ›
- последняя »
