Основы теории игр. Садовин H.C - 59 стр.

UptoLike

Составители: 

Рубрика: 

59
(
)
( ) ( ) ( )( )
2
11 12 21 22
,
1 1 1 1.
H pq
bpqbpqb pqb pq
=
= + -+-+--
(3.4’)
Для таких игр оказывается справедливой следующая теорема,
позволяющая находить смешанные стратегии.
Теорема 3.2. Выполнение неравенств (3.3):
(
)
(
)
(
)
(
)
0 00 0 00
11 22
, , , , ,
H pq H pq H pq H pq
££,
равносильно выполнению следующих неравенств:
(
)
(
)
( ) ( )
( ) ( )
( ) ( )
0 00
11
0 00
11
0 00
22
0 00
22
1, ,,
,0 ,,
,1 ,.
H q H pq
H q H pq
H p H pq
H p H pq
ì
£
ï
ï
£
ï
í
£
ï
ï
£
ï
î
(3.5)
Другими словами, чтобы убедиться в том, что пара
(
)
00
,
pq
определяет равновесную ситуацию, достаточно проверить спра-
ведливость неравенств (3.3) не для всех
[
]
0,1
p Î и
[
]
0,1
qÎ ,
а только для двух чистых стратегий каждого игрока.
Перепишем формулу (3.4) в более удобном виде
(
)
(
)
(
)
(
)
1 11 12 21 22 12 22 21 22 22
,
Hpq a a a apqa apa aqa
= --+ + - + - +.
Положим здесь
0
p
=
и
1
p
=
:
(
)
(
)
(
)
1 11 12 21 22 12 21 22
1,
Hq aaaaqa aaq
= --+ ++ - ,
(
)
(
)
1 21 22 22
0,
H q a a qa
=-+
    H 2 ( p, q ) =
                                                                                   (3.4’)
    = b11 pq + b12 p (1 - q ) + b21 (1 - p ) q + b22 (1 - p )(1 - q ) .

    Для таких игр оказывается справедливой следующая теорема,
позволяющая находить смешанные стратегии.

   Теорема 3.2. Выполнение неравенств (3.3):

    H1 ( p, q 0 ) £ H1 ( p 0 , q 0 ) ,     H 2 ( p0 , q ) £ H 2 ( p0 , q0 ) ,

равносильно выполнению следующих неравенств:

    ì H1 ( 0, q 0 ) £ H1 ( p 0 , q 0 ) ,
    ï
    ï H1 (1, q 0 ) £ H1 ( p 0 , q 0 ) ,
    ï
    í                                                                               (3.5)
    ï H 2 ( p ,0 ) £ H 2 ( p , q ) ,
              0                0     0

    ï
    ïî H 2 ( p ,1) £ H 2 ( p , q ) .
              0               0     0




   Другими словами, чтобы убедиться в том, что пара                             ( p ,q )
                                                                                    0   0


определяет равновесную ситуацию, достаточно проверить спра-
ведливость неравенств (3.3) не для всех p Î [0,1] и q Î [ 0,1] ,
а только для двух чистых стратегий каждого игрока.
    Перепишем формулу (3.4) в более удобном виде

    H1 ( p, q ) = ( a11 - a12 - a21 + a22 ) pq + ( a12 - a22 ) p + ( a21 - a 22 ) q + a22 .

   Положим здесь p = 0 и p = 1 :

    H1 (1, q ) = ( a11 - a12 - a21 + a22 ) q + a12 + ( a21 - a22 ) q ,
    H1 ( 0, q ) = ( a21 - a22 ) q + a22

                                               59