Основы теории игр. Садовин H.C - 102 стр.

UptoLike

Составители: 

Рубрика: 

102
Рассмотрим сначала так называемый «идеальный» экспери-
мент, в результате проведения которого игрок получает точную
информацию о том, какое состояние природы будет иметь место
в данной ситуации. В качестве критерия принятия решений
рассмотрим критерий Байеса.
Без проведения эксперимента в качестве оптимальной страте-
гии по критерию Байеса относительно выигрышей выбиралась
стратегия
0
i
A
с максимальным показателем эффективности (4.21):
0
1,
max
ii
im
aa
a
=
==
. (4.27)
Если в результате проведенного эксперимента выяснилось,
например, что природа будет находиться в состоянии
j
Q
, то
в качестве оптимальной надо выбирать стратегию, при которой
достигается наибольший выигрыш:
1,
max
im
a
b
=
=
,
где
j
b
,
1,
jn
= показатель благоприятности состояния приро-
ды
j
Q
. То есть надо выбирать такую стратегию, чтобы наиболь-
ший элемент
j
b
j-го столбца матрицы A находился в строке, со-
ответствующей этой стратегии. Однако такое решение мы можем
принять только после проведения эксперимента. А нам нужно
решить заранее вопрос о целесообразности проведения экспери-
мента, про который известно только, что он является идеальным,
и не известно, в каком именно состоянии
j
Q
будет находиться
природа Q, то есть нам не известен размер будущего выигрыша
игрока A.
Таким образом, разумно рассмотреть взвешенное среднее
выигрышей
j
b
с весовыми коэффициентами
j
p
, то есть выиг-
рыш в случае идеального эксперимента можно определить как:
1
n
jj
j
p
bb
=
=
å
. (4.28)
    Рассмотрим сначала так называемый «идеальный» экспери-
мент, в результате проведения которого игрок получает точную
информацию о том, какое состояние природы будет иметь место
в данной ситуации. В качестве критерия принятия решений
рассмотрим критерий Байеса.
    Без проведения эксперимента в качестве оптимальной страте-
гии по критерию Байеса относительно выигрышей выбиралась
стратегия Ai0 с максимальным показателем эффективности (4.21):

    ai0 = max ai = a .                                    (4.27)
          i =1, m


   Если в результате проведенного эксперимента выяснилось,
например, что природа будет находиться в состоянии Q j , то
в качестве оптимальной надо выбирать стратегию, при которой
достигается наибольший выигрыш:

    b j = max aij ,
          i =1, m



где b j , j = 1, n — показатель благоприятности состояния приро-
ды Q j . То есть надо выбирать такую стратегию, чтобы наиболь-
ший элемент b j j-го столбца матрицы A находился в строке, со-
ответствующей этой стратегии. Однако такое решение мы можем
принять только после проведения эксперимента. А нам нужно
решить заранее вопрос о целесообразности проведения экспери-
мента, про который известно только, что он является идеальным,
и не известно, в каком именно состоянии Q j будет находиться
природа Q, то есть нам не известен размер будущего выигрыша
игрока A.
   Таким образом, разумно рассмотреть взвешенное среднее
выигрышей b j с весовыми коэффициентами p j , то есть выиг-
рыш в случае идеального эксперимента можно определить как:
         n
    b = å pjb j .                                         (4.28)
         j =1


                              102