ВУЗ:
Составители:
Рубрика:
10
),(),(),(
0000
QPMQPMQPM
AAA
≤
≤
.
Пояснение. Выписанные неравенства означают следующее:
левое неравенство – отклонение игрока
A
от оптимальной стратегии
0
P
при усло-
вии, что игрок придерживается стратегии , приводит к тому, что выигрыш отклонив-
шегося игрока
B
0
Q
A
может только уменьшиться;
правое неравенство – отклонение игрока от оптимальной стратегии при усло-
вии, что игрок
B
0
Q
A
придерживается стратегии
0
P
, приводит к тому, что выигрыш игрока
A
может только возрасти, и значит, выигрыш игрока – только уменьшиться. B
Приведенное условие оптимальности равносильно тому, что
2
),(maxmin),(),(minmax
00
QPMQPMQPM
A
P
Q
AA
Q
P
=
=
.
Величина
),(
00
QPMv
A
=
,
определяемая последней формулой, называется ценой игры.
Набор , состоящий из оптимальных смешанных стратегий игроков
),,(
00
vQP
A
и
и цены игры, называется решением матричной игры. B
Естественно, возникают два ключевых вопроса:
1) какие матричные игры имеют решение в смешанных стратегиях?
2) как найти решение матричной игры, если оно существует?
Ответы на эти вопросы дают следующие две теоремы.
1.3. Основная теорема теории матричных игр
Теорема 1 (Дж. фон Нейман). Для матричной игры с любой матрицей
A
величины
),(maxmin,),(minmax QPMQPM
A
P
Q
A
Q
P
существуют и равны между собой:
),(maxmin),(minmax QPMQPM
A
P
Q
A
Q
P
=
.
Более того, существует по крайней мере одна ситуация в смешанных стратегиях
, для которой выполняется соотношение
),(
00
QP
),(maxmin),(minmax),(
00
QPMQPMQPM
A
P
Q
A
Q
P
A
=
=
.
Иными словами, любая матричная игра имеет решение в смешанных стратегиях.
Поиск этого решения опирается на следующие установленные факты.
1.4. Основные свойства оптимальных смешанных стратегий
Теорема 2. Пусть
},...,,{
00
2
0
1
0
m
pppP =
и
},...,,{
00
2
0
1
0
n
qqqQ
=
― оптимальные смешанные стратегии и ― цена игры.
v
),(minmax QPM
A
Q
P
2
Экстремальные величины и всегда существуют вследст-
вие того, что функция является непрерывной на замкнутом множестве
),(maxmin QPM
A
P
Q
),( QPM
A
,1,0
1
=≥
∑
=
m
i
ii
pp .
∑
=
≥
n
k
kk
qq
1
,0
10
M A ( P, Q 0 ) ≤ M A ( P 0 , Q 0 ) ≤ M A ( P 0 , Q ) .
Пояснение. Выписанные неравенства означают следующее:
0
левое неравенство – отклонение игрока A от оптимальной стратегии P при усло-
0
вии, что игрок B придерживается стратегии Q , приводит к тому, что выигрыш отклонив-
шегося игрока A может только уменьшиться;
0
правое неравенство – отклонение игрока B от оптимальной стратегии Q при усло-
0
вии, что игрок A придерживается стратегии P , приводит к тому, что выигрыш игрока A
может только возрасти, и значит, выигрыш игрока B – только уменьшиться.
Приведенное условие оптимальности равносильно тому, что 2
max min M A ( P, Q ) = M A ( P 0 , Q 0 ) = min max M A ( P, Q ) .
P Q Q P
Величина
v = M A (P0 , Q0 ) ,
определяемая последней формулой, называется ценой игры.
0 0
Набор ( P , Q , v) , состоящий из оптимальных смешанных стратегий игроков A и
B и цены игры, называется решением матричной игры.
Естественно, возникают два ключевых вопроса:
1) какие матричные игры имеют решение в смешанных стратегиях?
2) как найти решение матричной игры, если оно существует?
Ответы на эти вопросы дают следующие две теоремы.
1.3. Основная теорема теории матричных игр
Теорема 1 (Дж. фон Нейман). Для матричной игры с любой матрицей A величины
max min M A ( P, Q) , min max M A ( P, Q)
P Q Q P
существуют и равны между собой:
max min
Q
M A ( P, Q) = min
Q
max M A ( P, Q) .
P P
Более того, существует по крайней мере одна ситуация в смешанных стратегиях
( P , Q 0 ) , для которой выполняется соотношение
0
M A ( P 0 , Q 0 ) = max min M A ( P, Q ) = min max M A ( P, Q ) .
P Q Q P
Иными словами, любая матричная игра имеет решение в смешанных стратегиях.
Поиск этого решения опирается на следующие установленные факты.
1.4.Основные свойства оптимальных смешанных стратегий
Теорема 2. Пусть
P 0 = { p10 , p20 ,..., pm0 } и Q 0 = {q10 , q20 ,..., qn0 }
― оптимальные смешанные стратегии и v ― цена игры.
2
Экстремальные величины max min
Q
M A ( P, Q ) и min
Q
max M A ( P, Q) всегда существуют вследст-
P P
вие того, что функция M A ( P, Q ) является непрерывной на замкнутом множестве
m n
pi ≥ 0, ∑ pi = 1, qk ≥ 0, ∑ qk .
i =1 k =1
Страницы
- « первая
- ‹ предыдущая
- …
- 9
- 10
- 11
- 12
- 13
- …
- следующая ›
- последняя »
