Теория игр: Текст лекций. Саакян Г.Р. - 23 стр.

UptoLike

ВУЗ:

ИСОиП ДГТУ | Шахты

Составители:

Саакян Г.Р.

Рубрика:

Математика

Замечая, что 4-й столбец полученной матрицы доминирует ее 3-й столбец, приходим

к игре с матрицей 32

⎟

⎠

⎞

⎜

⎝

⎛

−

212

101

Решая эту -игру графическим методом, находим ее решение – цену игры и оп-

тимальные смешанные стратегии игроков

32×

и : B

⎭

⎬

⎫

⎩

⎨

⎧

⎭

⎬

⎫

⎩

⎨

⎧

,0,

,0v

Возвращаясь к исходной игре 44

, получаем окончательный ответ:

⎭

⎬

⎫

⎩

⎨

⎧

⎭

⎬

⎫

⎩

⎨

⎧

,0,0,

,0,

QPv

Замечание. При отбрасывании доминируемых строк и столбцов некоторые из опти-

мальных стратегий могут быть потеряны. Однако цена игры не изменится, и по усеченной

матрице может быть найдена хотя бы одна пара оптимальных смешанных стратегий.

б) Аффинное правило.

При поиске решения матричных игр часто оказывается полезным следующее свойст-

во.

Оптимальные стратегии у матричных игр, элементы матриц

и которых свя-

заны равенствами

ikik

ac (

mi ,...,2,1;,...,2,1

где 0>

, а

– произвольно, имеют одинаковые равновесные ситуации (либо в чистых,

либо в смешанных стратегиях), а их цены удовлетворяют следующему условию:

vv .

Пример 7. Элементы матриц

⎟

⎠

⎞

⎜

⎝

⎛

−

212

101

⎟

⎠

⎞

⎜

⎝

⎛

−

1811

852

связаны равенством

ikik

ac для всех

i ,

Поэтому цена игры с матрицей C легко вычисляется:

550353

⋅

(см. пример 6).

2.4. Итерационный метод решения матричных игр

Опишем метод отыскания решения матричной игры (цены игры и оптимальных сме-

шанных стратегий), в известной степени верно отражающий некоторую реальную ситуацию

накопления опыта постепенной выработки игроками хороших стратегий в результате многих

повторений конфликтных ситуаций. Основная идея этого метода заключается в том, чтобы

мысленно как бы смоделировать реальное практическое «обучение» игроков в ходе самой

игры, когда каждый из них на опыте прощупывает способ поведения противника и старается

отвечать на него наиболее выгодным для себя образом. Иными словами, всякий раз при во-

зобновлении игры игрок выбирает наиболее выгодную для себя стратегию, опираясь на пре-

дыдущий выбор противника.

Проиллюстрируем этот метод на примере игры, заданной матрицей

                                                                                    22

       Замечая, что 4-й столбец полученной матрицы доминирует ее 3-й столбец, приходим
к игре с матрицей 2 × 3 :
                                      ⎛ −1 0 1 ⎞
                                      ⎜⎜        ⎟⎟ .
                                       ⎝ 2 1 − 2⎠
      Решая эту 2 × 3 -игру графическим методом, находим ее решение – цену игры и оп-
тимальные смешанные стратегии игроков A и B :
                                      ⎧2 1⎫ ⎧1          1⎫
                             v = 0, ⎨ , ⎬, ⎨ , 0, ⎬ .
                                      ⎩ 3 3⎭ ⎩ 2        2⎭
       Возвращаясь к исходной игре 4 × 4 , получаем окончательный ответ:
                                  ⎧2      1 ⎫           ⎧1      1⎫
                     v = 0, P 0 = ⎨ , 0, , 0⎬, Q 0 = ⎨ , 0, 0, ⎬ .
                                  ⎩3      3 ⎭           ⎩2      2⎭
       Замечание. При отбрасывании доминируемых строк и столбцов некоторые из опти-
мальных стратегий могут быть потеряны. Однако цена игры не изменится, и по усеченной
матрице может быть найдена хотя бы одна пара оптимальных смешанных стратегий.
       б) Аффинное правило.
       При поиске решения матричных игр часто оказывается полезным следующее свойст-
во.
       Оптимальные стратегии у матричных игр, элементы матриц A и C которых свя-
заны равенствами
                       cik = λaik + μ ( i = 1,2,..., m; k = 1,2,..., n ),
где λ > 0 , а μ – произвольно, имеют одинаковые равновесные ситуации (либо в чистых,
либо в смешанных стратегиях), а их цены удовлетворяют следующему условию:
                                      vC = λv A + μ .
       Пример 7. Элементы матриц
                              ⎛ −1 0 1 ⎞         ⎛2 5 8 ⎞
                         A = ⎜⎜        ⎟⎟ и C = ⎜⎜        ⎟⎟
                              ⎝ 2 1 − 2⎠         ⎝11 8 − 1⎠
связаны равенством
                              cik = 3aik + 5 для всех i , k .
Поэтому цена игры с матрицей C легко вычисляется:
                              vC = 3v A + 5 = 3 ⋅ 0 + 5 = 5
(см. пример 6).

                       2.4.Итерационный метод решения матричных игр

       Опишем метод отыскания решения матричной игры (цены игры и оптимальных сме-
шанных стратегий), в известной степени верно отражающий некоторую реальную ситуацию
накопления опыта постепенной выработки игроками хороших стратегий в результате многих
повторений конфликтных ситуаций. Основная идея этого метода заключается в том, чтобы
мысленно как бы смоделировать реальное практическое «обучение» игроков в ходе самой
игры, когда каждый из них на опыте прощупывает способ поведения противника и старается
отвечать на него наиболее выгодным для себя образом. Иными словами, всякий раз при во-
зобновлении игры игрок выбирает наиболее выгодную для себя стратегию, опираясь на пре-
дыдущий выбор противника.
       Проиллюстрируем этот метод на примере игры, заданной матрицей

Заказать работу

Вы здесь

Теория игр: Текст лекций. Саакян Г.Р. - 23 стр.

UptoLike

ВУЗ:

Саакян Г.Р.

Математика

Страницы