Теория игр: Текст лекций. Саакян Г.Р. - 26 стр.

UptoLike

Составители: 

Рубрика: 

25
{} {}
33,0;67,0;0
9
3
,
9
6
,0,33,0;67,0
9
3
,
9
6
99
=
= QP
.
Соответственно, после 10-го шага получаем
{} {}
3,0;7,0;0
10
3
,
10
7
,0,3,0;7,0
10
3
,
10
7
,05,1)10(
1010
=
==
== QPv
.
Так как эта игра легко решается графически, полезно сравнить полученные результа-
ты с точными:
=
==
3
1
,
3
2
,0,
3
1
,
3
2
,1 QPv
.
Сравнивая результаты, полученные на 9-м, 10-м, а также 11-м и 12-м шагах:
96,0)11( =v
,
00,1)12(
=
v
,
{}
36,0;64,0
11
4
,
11
7
11
=P
,
{}
33,0;67,0
12
4
,
12
8
12
=P
,
{}
36,0;64,0;0
11
4
,
11
7
,0
11
=Q
,
{}
33,0;67,0;0
12
4
,
12
8
,0
12
=Q
,
можно заметить, что по мере увеличения числа шагов приближенные значения все меньше
отличаются от точных.
Сделаем несколько замечаний.
Замечание 1. При увеличении числа шагов все три величины , и будут
приближаться к цене игры , но среднее арифметическое будет приближаться к
сравнительно быстрее.
)(
*
nv
)(
*
nv
)(nv
v
)(nv
v
Замечание 2. Хотя сходимость итераций весьма медленна, тем не менее даже такой неболь-
шой расчет всегда дает возможность находить ориентировочное значение цены игры и доли
чистых стратегий.
Замечание 3. Сравнительно медленную скорость сходимости можно объяснить целым рядом
причин. Укажем одну из них, психологически наиболее интересную. Если, к примеру, игрок
A
уже нашел оптимальную смешанную стратегию, то он не склонен останавливаться на ней
он продолжит попытки выиграть у противника побольше, особенно если последний еще
не достиг оптимальной смешанной стратегии. Тем самым игрок
B
A
может невольно ухуд-
шить свое положение.
Замечание 4. Отметим два основных преимущества описанного метода:
1) итерационный метод прост и одновременно универсален (при его помощи можно
легко найти приближенное решение любой матричной игры);
2) объем и сложность вычислений сравнительно слабо растут по мере увеличения
числа стратегий игроков (размеров матрицы игры).
                                                                                      25

                  ⎧6 3⎫                      ⎧ 6 3⎫
             P9 = ⎨ , ⎬ ≈ {0,67; 0,33}, Q9 = ⎨0 , , ⎬ ≈ {0 ; 0,67 ; 0,33}.
                  ⎩9 9 ⎭                     ⎩ 9 9⎭
Соответственно, после 10-го шага получаем
                          ⎧7 3⎫                      ⎧ 7 3⎫
     v(10) = 1,05 , P10 = ⎨ , ⎬ = {0,7 ; 0,3}, Q10 = ⎨0 , , ⎬ = {0 ; 0,7 ; 0,3}.
                          ⎩10 10 ⎭                   ⎩ 10 10 ⎭
       Так как эта игра легко решается графически, полезно сравнить полученные результа-
ты с точными:
                                    ⎧2 1⎫       ⎧ 2 1⎫
                         v = 1, P = ⎨ , ⎬ , Q = ⎨0 , , ⎬ .
                                    ⎩ 3 3⎭      ⎩ 3 3⎭
Сравнивая результаты, полученные на 9-м, 10-м, а также 11-м и 12-м шагах:
                  v(11) = 0,96 ,                          v(12) = 1,00 ,
                  ⎧7 4⎫                             ⎧8 4⎫
            P11 = ⎨ , ⎬ ≈ {0,64 ; 0,36},      P12 = ⎨ , ⎬ ≈ {0,67 ; 0,33} ,
                  ⎩11 11⎭                           ⎩12 12 ⎭
             ⎧ 7 4⎫                                 ⎧ 8 4⎫
       Q11 = ⎨0 , , ⎬ ≈ {0; 0,64; 0,36} ,     Q12 = ⎨0 , , ⎬ ≈ {0; 0,67; 0,33},
             ⎩ 11 11⎭                               ⎩ 12 12 ⎭
можно заметить, что по мере увеличения числа шагов приближенные значения все меньше
отличаются от точных.

      Сделаем несколько замечаний.
Замечание 1. При увеличении числа шагов все три величины v* (n) , v (n) и v(n) будут
                                                                   *


приближаться к цене игры v , но среднее арифметическое v(n) будет приближаться к v
сравнительно быстрее.
Замечание 2. Хотя сходимость итераций весьма медленна, тем не менее даже такой неболь-
шой расчет всегда дает возможность находить ориентировочное значение цены игры и доли
чистых стратегий.
Замечание 3. Сравнительно медленную скорость сходимости можно объяснить целым рядом
причин. Укажем одну из них, психологически наиболее интересную. Если, к примеру, игрок
 A уже нашел оптимальную смешанную стратегию, то он не склонен останавливаться на ней
– он продолжит попытки выиграть у противника B побольше, особенно если последний еще
не достиг оптимальной смешанной стратегии. Тем самым игрок A может невольно ухуд-
шить свое положение.
Замечание 4. Отметим два основных преимущества описанного метода:
       1) итерационный метод прост и одновременно универсален (при его помощи можно
          легко найти приближенное решение любой матричной игры);
       2) объем и сложность вычислений сравнительно слабо растут по мере увеличения
          числа стратегий игроков (размеров матрицы игры).