ВУЗ:
Составители:
Рубрика:
22
Замечая, что 4-й столбец полученной матрицы доминирует ее 3-й столбец, приходим
к игре с матрицей 32
×
:
⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
−
−
212
101
.
Решая эту -игру графическим методом, находим ее решение – цену игры и оп-
тимальные смешанные стратегии игроков
32×
A
и : B
⎭
⎬
⎫
⎩
⎨
⎧
⎭
⎬
⎫
⎩
⎨
⎧
=
2
1
,0,
2
1
,
3
1
,
3
2
,0v
.
Возвращаясь к исходной игре 44
×
, получаем окончательный ответ:
⎭
⎬
⎫
⎩
⎨
⎧
=
⎭
⎬
⎫
⎩
⎨
⎧
==
2
1
,0,0,
2
1
,0,
3
1
,0,
3
2
,0
00
QPv
.
Замечание. При отбрасывании доминируемых строк и столбцов некоторые из опти-
мальных стратегий могут быть потеряны. Однако цена игры не изменится, и по усеченной
матрице может быть найдена хотя бы одна пара оптимальных смешанных стратегий.
б) Аффинное правило.
При поиске решения матричных игр часто оказывается полезным следующее свойст-
во.
Оптимальные стратегии у матричных игр, элементы матриц
A
и которых свя-
заны равенствами
C
μ
λ
+
=
ikik
ac (
n
k
mi ,...,2,1;,...,2,1
=
=
),
где 0>
λ
, а
μ
– произвольно, имеют одинаковые равновесные ситуации (либо в чистых,
либо в смешанных стратегиях), а их цены удовлетворяют следующему условию:
μ
λ
+
=
AC
vv .
Пример 7. Элементы матриц
⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
−
−
=
212
101
A
и
⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
−
=
1811
852
C
связаны равенством
53
+
=
ikik
ac для всех
k
i ,
.
Поэтому цена игры с матрицей C легко вычисляется:
550353
=
+
⋅
=
+
=
AC
vv
(см. пример 6).
2.4. Итерационный метод решения матричных игр
Опишем метод отыскания решения матричной игры (цены игры и оптимальных сме-
шанных стратегий), в известной степени верно отражающий некоторую реальную ситуацию
накопления опыта постепенной выработки игроками хороших стратегий в результате многих
повторений конфликтных ситуаций. Основная идея этого метода заключается в том, чтобы
мысленно как бы смоделировать реальное практическое «обучение» игроков в ходе самой
игры, когда каждый из них на опыте прощупывает способ поведения противника и старается
отвечать на него наиболее выгодным для себя образом. Иными словами, всякий раз при во-
зобновлении игры игрок выбирает наиболее выгодную для себя стратегию, опираясь на пре-
дыдущий выбор противника.
Проиллюстрируем этот метод на примере игры, заданной матрицей
22
Замечая, что 4-й столбец полученной матрицы доминирует ее 3-й столбец, приходим
к игре с матрицей 2 × 3 :
⎛ −1 0 1 ⎞
⎜⎜ ⎟⎟ .
⎝ 2 1 − 2⎠
Решая эту 2 × 3 -игру графическим методом, находим ее решение – цену игры и оп-
тимальные смешанные стратегии игроков A и B :
⎧2 1⎫ ⎧1 1⎫
v = 0, ⎨ , ⎬, ⎨ , 0, ⎬ .
⎩ 3 3⎭ ⎩ 2 2⎭
Возвращаясь к исходной игре 4 × 4 , получаем окончательный ответ:
⎧2 1 ⎫ ⎧1 1⎫
v = 0, P 0 = ⎨ , 0, , 0⎬, Q 0 = ⎨ , 0, 0, ⎬ .
⎩3 3 ⎭ ⎩2 2⎭
Замечание. При отбрасывании доминируемых строк и столбцов некоторые из опти-
мальных стратегий могут быть потеряны. Однако цена игры не изменится, и по усеченной
матрице может быть найдена хотя бы одна пара оптимальных смешанных стратегий.
б) Аффинное правило.
При поиске решения матричных игр часто оказывается полезным следующее свойст-
во.
Оптимальные стратегии у матричных игр, элементы матриц A и C которых свя-
заны равенствами
cik = λaik + μ ( i = 1,2,..., m; k = 1,2,..., n ),
где λ > 0 , а μ – произвольно, имеют одинаковые равновесные ситуации (либо в чистых,
либо в смешанных стратегиях), а их цены удовлетворяют следующему условию:
vC = λv A + μ .
Пример 7. Элементы матриц
⎛ −1 0 1 ⎞ ⎛2 5 8 ⎞
A = ⎜⎜ ⎟⎟ и C = ⎜⎜ ⎟⎟
⎝ 2 1 − 2⎠ ⎝11 8 − 1⎠
связаны равенством
cik = 3aik + 5 для всех i , k .
Поэтому цена игры с матрицей C легко вычисляется:
vC = 3v A + 5 = 3 ⋅ 0 + 5 = 5
(см. пример 6).
2.4.Итерационный метод решения матричных игр
Опишем метод отыскания решения матричной игры (цены игры и оптимальных сме-
шанных стратегий), в известной степени верно отражающий некоторую реальную ситуацию
накопления опыта постепенной выработки игроками хороших стратегий в результате многих
повторений конфликтных ситуаций. Основная идея этого метода заключается в том, чтобы
мысленно как бы смоделировать реальное практическое «обучение» игроков в ходе самой
игры, когда каждый из них на опыте прощупывает способ поведения противника и старается
отвечать на него наиболее выгодным для себя образом. Иными словами, всякий раз при во-
зобновлении игры игрок выбирает наиболее выгодную для себя стратегию, опираясь на пре-
дыдущий выбор противника.
Проиллюстрируем этот метод на примере игры, заданной матрицей
