ВУЗ:
Составители:
Рубрика:
8
Как показывает следующий пример, в этом случае предложенный выбор стратегий к
равновесной ситуации уже не приводит, и при многократном повторении игры у игроков
вполне могут возникнуть мотивы к нарушению рекомендаций, основанных на описанном ал-
горитме действий игроков
A
и .
B
Пример 3. Рассмотрим игру 33
×
, заданную матрицей
⎟
⎟
⎟
⎠
⎞
⎜
⎜
⎜
⎝
⎛
−
−
−
−
=
320
312
314
A
.
Применив предложенный алгоритм
4 1 -3 -3
-2 1 3 -2
0 2 -3 -3
4 2 3
находим нижнюю цену игры 2
−
=
α
и соответствующую ей стратегию , и верхнюю цену
игры
2
A
2=
β
и соответствующую ей стратегию .
2
B
Нетрудно убедиться в том, что пока игроки придерживаются этих стратегий, средний
выигрыш при многократном повторении игры будет равен 1. Он больше нижней цены игры,
но меньше верхней цены.
Однако если игроку станет известно, что игрок
B
A
придерживается стратегии ,
он немедленно ответит стратегией и сведет его выигрыш к проигрышу . В свою оче-
редь, на стратегию у игрока
2
A
1
B 2−
1
B
A
имеется ответная стратегия , дающая ему выигрыш 4.
Тем самым, ситуация равновесной не является.
1
A
},{
22
BA
1.2. Смешанные стратегии
В случае, когда нижняя цена игры
α
и верхняя цена игры
β
не совпадают,
β
α
<
,
игрок
A
может обеспечить себе выигрыш, не меньший
α
, а игрок имеет возможность не
дать ему больше, чем
B
β
.
Возникает вопрос: а как разделить между игроками разность
α
β
−
?
Предыдущие построения на этот вопрос ответа не дают – тесны рамки возможных действий
игроков. Поэтому довольно ясно, что механизм, обеспечивающий получение каждым из иг-
роков как можно большей доли этой разности, следует искать в определенном расширении
стратегических возможностей, имеющихся у игроков изначально.
Оказывается, что компромиссного распределения разности
α
β
−
между игроками и
уверенного получения каждым игроком своей доли при многократном повторении игры
можно достичь путем случайного чередования ими своих первоначальных, чистых страте-
гий. При таких действих
– во-первых, обеспечивается наибольшая скрытность выбора стратегии (результат
выбора не может стать известным противнику, поскольку он неизвестен самому
игроку),
– во-вторых, при разумном построении механизма случайного выбора стратегий
последние оказываются оптимальными.
8 Как показывает следующий пример, в этом случае предложенный выбор стратегий к равновесной ситуации уже не приводит, и при многократном повторении игры у игроков вполне могут возникнуть мотивы к нарушению рекомендаций, основанных на описанном ал- горитме действий игроков A и B . Пример 3. Рассмотрим игру 3× 3 , заданную матрицей ⎛ 4 − 1 − 3⎞ ⎜ ⎟ A = ⎜− 2 1 3 ⎟. ⎜ 0 2 − 3 ⎟⎠ ⎝ Применив предложенный алгоритм 4 1 -3 -3 -2 1 3 -2 0 2 -3 -3 4 2 3 находим нижнюю цену игры α = −2 и соответствующую ей стратегию A2 , и верхнюю цену игры β =2и соответствующую ей стратегию B2 . Нетрудно убедиться в том, что пока игроки придерживаются этих стратегий, средний выигрыш при многократном повторении игры будет равен 1. Он больше нижней цены игры, но меньше верхней цены. Однако если игроку B станет известно, что игрок A придерживается стратегии A2 , он немедленно ответит стратегией B1 и сведет его выигрыш к проигрышу − 2 . В свою оче- редь, на стратегию B1 у игрока A имеется ответная стратегия A1 , дающая ему выигрыш 4. Тем самым, ситуация { A2 , B2 } равновесной не является. 1.2. Смешанные стратегии В случае, когда нижняя цена игры α и верхняя цена игры β не совпадают, α<β, игрок A может обеспечить себе выигрыш, не меньший α , а игрок B имеет возможность не дать ему больше, чем β . Возникает вопрос: а как разделить между игроками разность β − α ? Предыдущие построения на этот вопрос ответа не дают – тесны рамки возможных действий игроков. Поэтому довольно ясно, что механизм, обеспечивающий получение каждым из иг- роков как можно большей доли этой разности, следует искать в определенном расширении стратегических возможностей, имеющихся у игроков изначально. Оказывается, что компромиссного распределения разности β − α между игроками и уверенного получения каждым игроком своей доли при многократном повторении игры можно достичь путем случайного чередования ими своих первоначальных, чистых страте- гий. При таких действих – во-первых, обеспечивается наибольшая скрытность выбора стратегии (результат выбора не может стать известным противнику, поскольку он неизвестен самому игроку), – во-вторых, при разумном построении механизма случайного выбора стратегий последние оказываются оптимальными.
Страницы
- « первая
- ‹ предыдущая
- …
- 7
- 8
- 9
- 10
- 11
- …
- следующая ›
- последняя »