Теория игр: Текст лекций. Саакян Г.Р. - 23 стр.

UptoLike

Составители: 

Рубрика: 

22
Замечая, что 4-й столбец полученной матрицы доминирует ее 3-й столбец, приходим
к игре с матрицей 32
×
:
212
101
.
Решая эту -игру графическим методом, находим ее решениецену игры и оп-
тимальные смешанные стратегии игроков
32×
A
и : B
=
2
1
,0,
2
1
,
3
1
,
3
2
,0v
.
Возвращаясь к исходной игре 44
×
, получаем окончательный ответ:
=
==
2
1
,0,0,
2
1
,0,
3
1
,0,
3
2
,0
00
QPv
.
Замечание. При отбрасывании доминируемых строк и столбцов некоторые из опти-
мальных стратегий могут быть потеряны. Однако цена игры не изменится, и по усеченной
матрице может быть найдена хотя бы одна пара оптимальных смешанных стратегий.
б) Аффинное правило.
При поиске решения матричных игр часто оказывается полезным следующее свойст-
во.
Оптимальные стратегии у матричных игр, элементы матриц
A
и которых свя-
заны равенствами
C
μ
λ
+
=
ikik
ac (
n
k
mi ,...,2,1;,...,2,1
=
=
),
где 0>
λ
, а
μ
произвольно, имеют одинаковые равновесные ситуации (либо в чистых,
либо в смешанных стратегиях), а их цены удовлетворяют следующему условию:
μ
λ
+
=
AC
vv .
Пример 7. Элементы матриц
=
212
101
A
и
=
1811
852
C
связаны равенством
53
+
=
ikik
ac для всех
k
i ,
.
Поэтому цена игры с матрицей C легко вычисляется:
550353
=
+
=
+
=
AC
vv
(см. пример 6).
2.4. Итерационный метод решения матричных игр
Опишем метод отыскания решения матричной игры (цены игры и оптимальных сме-
шанных стратегий), в известной степени верно отражающий некоторую реальную ситуацию
накопления опыта постепенной выработки игроками хороших стратегий в результате многих
повторений конфликтных ситуаций. Основная идея этого метода заключается в том, чтобы
мысленно как бы смоделировать реальное практическое «обучение» игроков в ходе самой
игры, когда каждый из них на опыте прощупывает способ поведения противника и старается
отвечать на него наиболее выгодным для себя образом. Иными словами, всякий раз при во-
зобновлении игры игрок выбирает наиболее выгодную для себя стратегию, опираясь на пре-
дыдущий выбор противника.
Проиллюстрируем этот метод на примере игры, заданной матрицей
                                                                                    22

       Замечая, что 4-й столбец полученной матрицы доминирует ее 3-й столбец, приходим
к игре с матрицей 2 × 3 :
                                      ⎛ −1 0 1 ⎞
                                      ⎜⎜        ⎟⎟ .
                                       ⎝ 2 1 − 2⎠
      Решая эту 2 × 3 -игру графическим методом, находим ее решение – цену игры и оп-
тимальные смешанные стратегии игроков A и B :
                                      ⎧2 1⎫ ⎧1          1⎫
                             v = 0, ⎨ , ⎬, ⎨ , 0, ⎬ .
                                      ⎩ 3 3⎭ ⎩ 2        2⎭
       Возвращаясь к исходной игре 4 × 4 , получаем окончательный ответ:
                                  ⎧2      1 ⎫           ⎧1      1⎫
                     v = 0, P 0 = ⎨ , 0, , 0⎬, Q 0 = ⎨ , 0, 0, ⎬ .
                                  ⎩3      3 ⎭           ⎩2      2⎭
       Замечание. При отбрасывании доминируемых строк и столбцов некоторые из опти-
мальных стратегий могут быть потеряны. Однако цена игры не изменится, и по усеченной
матрице может быть найдена хотя бы одна пара оптимальных смешанных стратегий.
       б) Аффинное правило.
       При поиске решения матричных игр часто оказывается полезным следующее свойст-
во.
       Оптимальные стратегии у матричных игр, элементы матриц A и C которых свя-
заны равенствами
                       cik = λaik + μ ( i = 1,2,..., m; k = 1,2,..., n ),
где λ > 0 , а μ – произвольно, имеют одинаковые равновесные ситуации (либо в чистых,
либо в смешанных стратегиях), а их цены удовлетворяют следующему условию:
                                      vC = λv A + μ .
       Пример 7. Элементы матриц
                              ⎛ −1 0 1 ⎞         ⎛2 5 8 ⎞
                         A = ⎜⎜        ⎟⎟ и C = ⎜⎜        ⎟⎟
                              ⎝ 2 1 − 2⎠         ⎝11 8 − 1⎠
связаны равенством
                              cik = 3aik + 5 для всех i , k .
Поэтому цена игры с матрицей C легко вычисляется:
                              vC = 3v A + 5 = 3 ⋅ 0 + 5 = 5
(см. пример 6).

                       2.4.Итерационный метод решения матричных игр

       Опишем метод отыскания решения матричной игры (цены игры и оптимальных сме-
шанных стратегий), в известной степени верно отражающий некоторую реальную ситуацию
накопления опыта постепенной выработки игроками хороших стратегий в результате многих
повторений конфликтных ситуаций. Основная идея этого метода заключается в том, чтобы
мысленно как бы смоделировать реальное практическое «обучение» игроков в ходе самой
игры, когда каждый из них на опыте прощупывает способ поведения противника и старается
отвечать на него наиболее выгодным для себя образом. Иными словами, всякий раз при во-
зобновлении игры игрок выбирает наиболее выгодную для себя стратегию, опираясь на пре-
дыдущий выбор противника.
       Проиллюстрируем этот метод на примере игры, заданной матрицей