Составители:
Рубрика:
94 95
туации равновесия в классе смешанных стратегий и в классе стратегий
поведения) равны между собой.
Обозначим значение игры
x
G
через
1
, Xxxv
и составим функ-
циональные уравнения для
xv
.
Для каждого
1
Xx
следующая позиция
x
c
, в которой ходит игрок 1
(если таковая существует), принадлежит множеству
2
x
F
. Позиция
x
c
ре-
ализуется в результате двух последовательных выборов: игроком 1 – дуги,
инцидентной к вершине x, и игроком 2 – дуги в позициях
x
Fy
, образу-
ющих ИМ игрока 2, поэтому можно считать, что позиция
x
c
полу-
чается в результате отображения
x
T
, зависящего от выборов
ED,
игро-
ков 1 и 2, т. е.
., ED
c
x
Tx
Так как число различных альтернатив
D
и
E
конечно, то можно рассмот-т-
реть для каждого
1
Xx
МИ с матрицей выигрышей
>@
^`
., ED vA
x
Пусть
^
`
,,
*
I
*
I
D E xbx
^
`
E E ,
*
I
I
*
I
I
xbx
– оптимальные смешанные страте-
гии в игре с матрицей
x
A
. Тогда имеет место следующая далее теоремаа
о структуре оптимальных стратегий в игре
x
G
.
Теорема 7.2. В игре G оптимальная стратегия поведения игрока 1
в точке
x
(каждое ИМ игрока 1 в игре G состоит из одной позиции
1
Xx
)
предписывает каждой альтернативе
D
вероятность в соответствии со
смешанной оптимальной стратегией игрока 1 в МИ
x
A
, т. е.
D D ,,
*
I1
xbxb
.
Оптимальная стратегия поведения
^`
E,
2
2
j
Xb
игрока 2 в игре G пред-
писывает каждой альтернативе
E
вероятность в соответствии с оптималь-
ной смешанной стратегией игрока 2 в игре с матрицей
x
A
, т. е.
,,,
*
II
2
2
E E xbXb
j
где
,
1
y
Fx
если
j
Xy
2
.
Значение игры удовлетворяет следующему функциональному урав-
нению:
>@
^`
,,,Val
1
XxTvxv
x
ED
(7.4)
с граничным условием
.
3
xHxv
Xx
(7.5)
(Здесь
AVa
l
– значение игры с матрицей А.)
Пример 7.4. (Игра инспектирования). Игрок Е (нарушитель) хо-
чет совершить некоторое запрещенное действие. Имеется
N
периодов
времени, в которые это действие может быть осуществлено. Игрок
P
(инспектор), желающий предотвратить это действие, может провести
только одну инспекцию в любой из этих периодов времени. Обозначим
такую N-шаговую игру через
N
G
.
В первом периоде каждый игрок имеет две альтернативы (рис. 7.5).
Игрок
E
может предпринимать действие или не предпринимать его; иг-
рок P может инспектировать или не инспектировать. Если игрок E дей-
ствует и игрок P инспектирует, то игра заканчивается и выигрыш игрокаа
E равен –1. Если игрок E действует, а игрок P не инспектирует, то игра
заканчивается и
выигрыш равен 1. Если игрок E не действует, а игрок P
инспектирует, то выигрыш равен нулю. Если игрок E не действует,,
а игрок P не инспектирует, то переходят к следующему шагу игры, кото-
рый отличается от предыдущего только тем, что до конца игры остается
меньшее количество времени, т. е. попадают в подыгру
1N
G
. Следова-
тельно, матрица для 1-го шага игры выглядит следующим образом:
»
¼
º
«
¬
ª
1
0
11
НД
Д
Н
НДД
И
N
v
(7.6)
–1 1 0
+
+
+
–
–
–
Е
Р Р
Рис. 7.5
Страницы
- « первая
- ‹ предыдущая
- …
- 46
- 47
- 48
- 49
- 50
- …
- следующая ›
- последняя »
