Системный анализ в информационных технологиях. Громов Ю.Ю - 78 стр.

UptoLike

выбор управления v
i
любым игроком i зависит только от управления центра. Поэтому множество оптимальных реакций иг-
роков нижнего уровня можно представить в виде прямой суммы множеств оптимальных реакций каждого из игроков.
Справедлива следующая теорема.
Теорема 6. Решение двухуровневой игры Г
1
эквивалентно для центра решению двухуровневой игры Г
2
двух лиц, в
которой одним из игроков является центр, а вторымигрок с функцией выигрыша
=
Ii
ii
uHuH )v,()v,( , (3.56)
где )v...,,v,v(v
21 n
= .
Доказательство. В игре Г
2
множество стратегий центра A
0
есть U, а второго игрокаV = V
1
× V
2
×× V
n
. Для любого
значения управления u
U справедливо равенство
=
Ii
ii
VV
uHuH
ii
)v,(max)v,(max
vv
и, следовательно, множество оптимальных реакций игрока A
1
R
1
(u) в игре Г
2
представимо в виде
)(...)()()(
21
1
uRuRuRuR
n
×××= ,
где )v,(maxArg)(
v
ii
V
i
uHuR
ii
= .
Но поскольку множество оптимальных реакций игроков нижнего уровня в игре Г
1
есть также
)(...)()()(
21
uRuRuRuR
n
×
×
×
=
,
то R(u) = R
1
(u). Следовательно, множества оптимальных реакций игроков нижнего уровня в играх Г
1
и Г
2
совпадают. Учиты-
вая, что функции выигрыша центра в обеих играх одинаковы и R(u) = R
1
(u), получим, что множества оптимальных решений
центра в них также совпадают, а, следовательно, решения игр Г
1
и Г
2
эквивалентны.
Замечание. Теорема остается справедливой и для функций
λ=
Ii
iii
uHH )v,(
, где параметр λ
i
> 0.
Рассмотрим пример из области математической экономики [12], иллюстрирующий проблему установления рациональ-
ных цен на товары и ресурсы. В качестве модели используется веерная иерархическая система.
Пусть известен общий объем товаров Q, производимых промышленностью за фиксированный промежуток времени (Q
вектор с положительными компонентами). Все потребители товаров разбиты на n однородных групп, каждая из которых
имеет свою функцию полезности (функцию выигрыша) H
i
(v
i
), заданную на пространстве товаров, где вектор v
i
характеризу-
ет объем товаров, закупаемых i-й группой. Суммарный объем товаров, закупаемых всеми группами, ограничен векторной
величиной Q, т.е.
=
n
i
m
i
EQQ
1
,v
. (3.57)
Управление центра u = (p, s) заключается в выборе вектора цен на товары p = (p
1
, p
2
, …, p
n
) и установлении уровня до-
хода (заработной платы) каждой группы потребителей, т.е. общего количества денег s
i
, получаемого всеми потребителями i-
й группы за данный промежуток времени. Множество допустимых управлений i-й группы опишем следующим образом:
nispspV
i
iii
ii
...,,2,1},v,,0v|v{),( =>≤<= .
где <p, v
i
> – скалярное произведение векторов p и v
i
.
Оптимальные стратегии (управления) i-й группы образуют множество ее оптимальных реакций
)v(maxArg),(
),(v
i
i
spV
ii
HspR
ii
i
= .
При этом для всех ),(v
ii
i
spR должно выполняться условие (3.57). Для этого зададим множество допустимых управ-
лений центра следующим образом:
==
=
n
i
ii
ii
nispRQspspU
1
...,,2,1),,(vv,0,0|),(
.
Критерий эффективности (функцию выигрыша) центра зададим в виде
=
α=
n
i
i
ii
n
HH
1
21
0
)v()v...,,v,v( ,
где
i
α положительные константы.
Такой критерий является довольно естественным, так как представляет собой некоторый обобщенный показатель сред-
него уровня потребления.
Если множества R
i
(p, s
i
) состоят для всех значений (p, s) из единственного элемента
),(v
0
sp
i
, то задача выбора опти-