Теория игр: Текст лекций. Саакян Г.Р. - 25 стр.

UptoLike

Составители: 

Рубрика: 

24
5
6
7
8
9
10
11
12
2
1
1
2
1
1
2
1
8
10
12
13
15
17
18
20
6
6
6
9
9
9
12
12
3
6
9
6
9
12
9
12
0,60
1,00
0,86
0,75
1,00
0,90
0,82
1,00
3
2
2
3
2
2
3
2
6
6
6
9
9
9
12
12
3
6
9
6
9
12
9
12
1,20
1,00
1,44
1,13
1,00
1,20
1,09
1,00
0,90
1,00
1,15
0,93
1,00
1,05
0,96
1,00
Описание таблицы
1-й столбецномер
n
шага (пары последовательных ходов игроков
A
и ), B
2-й столбецномер i стратегии, выбранной игроком
A
,
3-й столбец – «накопленный» суммарный выигрыш игрока
A
за первые шагов при выбо-
ре игроком стратегии ,
n
B
1
B
4-й столбец – «накопленный» суммарный выигрыш игрока
A
за первые шагов при выбо-
ре игроком стратегии ,
n
B
2
B
5-й столбец – «накопленный» суммарный выигрыш игрока
A
за первые шагов при выбо-
ре игроком стратегии
n
B
3
B
(минимальный из этих выигрышей выделяется полужирным шрифтом),
6-й столбецминимальный средний выигрыш игрока
A
, равный минимальному накоплен-
ному им выигрышу за первые
n
шагов, деленному на число этих шагов,
7-й столбецномер
k
стратегии, выбранной игроком , B
8-й столбец – «накопленный» суммарный выигрыш игрока
A
за первые шагов при выбо-
ре им стратегии ,
n
1
A
9-й столбец – «накопленный» суммарный выигрыш игрока
A
за первые шагов при выбо-
ре им стратегии
n
2
A
(максимальный из этих выигрышей выделяется полужирным шрифтом),
10-й столбецмаксимальный средний выигрыш игрока
A
, равный максимальному накоп-
ленному им выигрышу за первые шагов, деленному на число этих шагов,
n
11-й столбецсреднее арифметическое минимального среднего выигрыша и максимального
среднего выигрыша игрока
A
.
Решение игры определяется приближенно по окончании любого из шагов. Например,
за приближенную цену игры можно взять среднее арифметическое , полученное на -м
шаге. Смешанные стратегии противников определяются частотами появления чистых стра-
тегий.
)(nv
n
Например, после 9-го шага имеем
00,1)9(
=
v
.
При этом игрок
A
6 раз использовал стратегию и 3 раза стратегию . В свою очередь
игрок 6 раз применял стратегию , 3 раза стратегию , а стратегией не пользовался
вообще. Отсюда получаем, что
1
A
2
A
B
2
B
3
B
1
B
                                                                                        24

      5      2       8       6       3      0,60     3       6       3      1,20     0,90
      6      1       10      6       6      1,00     2       6       6      1,00     1,00
      7      1       12      6       9      0,86     2       6       9      1,44     1,15
      8      2       13      9       6      0,75     3       9       6      1,13     0,93
      9      1       15      9       9      1,00     2       9       9      1,00     1,00
      10     1       17      9       12     0,90     2       9       12     1,20     1,05
      11     2       18      12      9      0,82     3      12       9      1,09     0,96
      12     1       20      12      12     1,00     2      12       12     1,00     1,00
      …      …       …       …       …       …      …       …        …       …        …

                                   Описание таблицы

1-й столбец – номер n шага (пары последовательных ходов игроков A и B ),
2-й столбец – номер i стратегии, выбранной игроком A ,
3-й столбец – «накопленный» суммарный выигрыш игрока A за первые n шагов при выбо-
ре игроком B стратегии B1 ,
4-й столбец – «накопленный» суммарный выигрыш игрока A за первые n шагов при выбо-
ре игроком B стратегии B2 ,
5-й столбец – «накопленный» суммарный выигрыш игрока A за первые n шагов при выбо-
ре игроком B стратегии B3
(минимальный из этих выигрышей выделяется полужирным шрифтом),
6-й столбец – минимальный средний выигрыш игрока A , равный минимальному накоплен-
ному им выигрышу за первые n шагов, деленному на число этих шагов,
7-й столбец – номер k стратегии, выбранной игроком B ,
8-й столбец – «накопленный» суммарный выигрыш игрока A за первые n шагов при выбо-
ре им стратегии A1 ,
9-й столбец – «накопленный» суммарный выигрыш игрока A за первые n шагов при выбо-
ре им стратегии A2
(максимальный из этих выигрышей выделяется полужирным шрифтом),
10-й столбец – максимальный средний выигрыш игрока A , равный максимальному накоп-
ленному им выигрышу за первые n шагов, деленному на число этих шагов,
11-й столбец – среднее арифметическое минимального среднего выигрыша и максимального
среднего выигрыша игрока A .

       Решение игры определяется приближенно по окончании любого из шагов. Например,
за приближенную цену игры можно взять среднее арифметическое v(n) , полученное на n -м
шаге. Смешанные стратегии противников определяются частотами появления чистых стра-
тегий.
       Например, после 9-го шага имеем
                                        v(9) = 1,00 .
При этом игрок A 6 раз использовал стратегию A1 и 3 раза стратегию A2 . В свою очередь
игрок B 6 раз применял стратегию B2 , 3 раза стратегию B3 , а стратегией B1 не пользовался
вообще. Отсюда получаем, что