ВУЗ:
Составители:
Рубрика:
22
Замечая, что 4-й столбец полученной матрицы доминирует ее 3-й столбец, приходим
к игре с матрицей 32
×
:
⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
−
−
212
101
.
Решая эту -игру графическим методом, находим ее решение – цену игры и оп-
тимальные смешанные стратегии игроков
32×
A
и : B
⎭
⎬
⎫
⎩
⎨
⎧
⎭
⎬
⎫
⎩
⎨
⎧
=
2
1
,0,
2
1
,
3
1
,
3
2
,0v
.
Возвращаясь к исходной игре 44
×
, получаем окончательный ответ:
⎭
⎬
⎫
⎩
⎨
⎧
=
⎭
⎬
⎫
⎩
⎨
⎧
==
2
1
,0,0,
2
1
,0,
3
1
,0,
3
2
,0
00
QPv
.
Замечание. При отбрасывании доминируемых строк и столбцов некоторые из опти-
мальных стратегий могут быть потеряны. Однако цена игры не изменится, и по усеченной
матрице может быть найдена хотя бы одна пара оптимальных смешанных стратегий.
б) Аффинное правило.
При поиске решения матричных игр часто оказывается полезным следующее свойст-
во.
Оптимальные стратегии у матричных игр, элементы матриц
A
и которых свя-
заны равенствами
C
μ
λ
+
=
ikik
ac (
n
k
mi ,...,2,1;,...,2,1
=
=
),
где 0>
λ
, а
μ
– произвольно, имеют одинаковые равновесные ситуации (либо в чистых,
либо в смешанных стратегиях), а их цены удовлетворяют следующему условию:
μ
λ
+
=
AC
vv .
Пример 7. Элементы матриц
⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
−
−
=
212
101
A
и
⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
−
=
1811
852
C
связаны равенством
53
+
=
ikik
ac для всех
k
i ,
.
Поэтому цена игры с матрицей C легко вычисляется:
550353
=
+
⋅
=
+
=
AC
vv
(см. пример 6).
2.4. Итерационный метод решения матричных игр
Опишем метод отыскания решения матричной игры (цены игры и оптимальных сме-
шанных стратегий), в известной степени верно отражающий некоторую реальную ситуацию
накопления опыта постепенной выработки игроками хороших стратегий в результате многих
повторений конфликтных ситуаций. Основная идея этого метода заключается в том, чтобы
мысленно как бы смоделировать реальное практическое «обучение» игроков в ходе самой
игры, когда каждый из них на опыте прощупывает способ поведения противника и старается
отвечать на него наиболее выгодным для себя образом. Иными словами, всякий раз при во-
зобновлении игры игрок выбирает наиболее выгодную для себя стратегию, опираясь на пре-
дыдущий выбор противника.
Проиллюстрируем этот метод на примере игры, заданной матрицей
22 Замечая, что 4-й столбец полученной матрицы доминирует ее 3-й столбец, приходим к игре с матрицей 2 × 3 : ⎛ −1 0 1 ⎞ ⎜⎜ ⎟⎟ . ⎝ 2 1 − 2⎠ Решая эту 2 × 3 -игру графическим методом, находим ее решение – цену игры и оп- тимальные смешанные стратегии игроков A и B : ⎧2 1⎫ ⎧1 1⎫ v = 0, ⎨ , ⎬, ⎨ , 0, ⎬ . ⎩ 3 3⎭ ⎩ 2 2⎭ Возвращаясь к исходной игре 4 × 4 , получаем окончательный ответ: ⎧2 1 ⎫ ⎧1 1⎫ v = 0, P 0 = ⎨ , 0, , 0⎬, Q 0 = ⎨ , 0, 0, ⎬ . ⎩3 3 ⎭ ⎩2 2⎭ Замечание. При отбрасывании доминируемых строк и столбцов некоторые из опти- мальных стратегий могут быть потеряны. Однако цена игры не изменится, и по усеченной матрице может быть найдена хотя бы одна пара оптимальных смешанных стратегий. б) Аффинное правило. При поиске решения матричных игр часто оказывается полезным следующее свойст- во. Оптимальные стратегии у матричных игр, элементы матриц A и C которых свя- заны равенствами cik = λaik + μ ( i = 1,2,..., m; k = 1,2,..., n ), где λ > 0 , а μ – произвольно, имеют одинаковые равновесные ситуации (либо в чистых, либо в смешанных стратегиях), а их цены удовлетворяют следующему условию: vC = λv A + μ . Пример 7. Элементы матриц ⎛ −1 0 1 ⎞ ⎛2 5 8 ⎞ A = ⎜⎜ ⎟⎟ и C = ⎜⎜ ⎟⎟ ⎝ 2 1 − 2⎠ ⎝11 8 − 1⎠ связаны равенством cik = 3aik + 5 для всех i , k . Поэтому цена игры с матрицей C легко вычисляется: vC = 3v A + 5 = 3 ⋅ 0 + 5 = 5 (см. пример 6). 2.4.Итерационный метод решения матричных игр Опишем метод отыскания решения матричной игры (цены игры и оптимальных сме- шанных стратегий), в известной степени верно отражающий некоторую реальную ситуацию накопления опыта постепенной выработки игроками хороших стратегий в результате многих повторений конфликтных ситуаций. Основная идея этого метода заключается в том, чтобы мысленно как бы смоделировать реальное практическое «обучение» игроков в ходе самой игры, когда каждый из них на опыте прощупывает способ поведения противника и старается отвечать на него наиболее выгодным для себя образом. Иными словами, всякий раз при во- зобновлении игры игрок выбирает наиболее выгодную для себя стратегию, опираясь на пре- дыдущий выбор противника. Проиллюстрируем этот метод на примере игры, заданной матрицей