Математические методы принятия решений. Бодров В.И - 67 стр.

UptoLike

решения других лиц, ни вероятностные оценки их возможных решений, занимается математическая
наука "Теория игр".
Сами задачи оптимизации такого вида носят название игровых задач или задач теории игр.
В теории игр принята следующая терминология.
Лица, принимающие решения, называются игроками.
Целевые функции называются платежными функциями, и считается, что они показывают выигрыш
игрока. Так, платежная функция
1
Q (x
1
, , x
n
) показывает выигрыш первого игрока.
Множество возможных решений Х
i
каждого игрока называется множеством чистых стратегий i-го
игрока, а решение х
i
из множества чистых стратегий X
i
, x
i
X
i
называется чистой стратегией i-го игрока.
Таким образом, чистой стратегией является то, что раньше называлось решением (управлением).
Отрицательное значение платежной функции означает "проигрыш" игрока, например, если
1
Q (x, y) = 5, то это означает, что первый игрок выиграл 5 единиц, а если
1
Q (x, y) = –5, то первый игрок
проиграл 5 единиц. Целью первого игрока является максимизация выигрыша, т.е. функцию
1
Q (x, y) не-
обходимо максимизировать. Очевидно, что целью первого игрока могла бы быть минимизация функции
проигрыша
1
Q (x, y), которая равна функции выигрыша, взятой с обратным знаком
1
Q (x, y) = –
1
Q (x, y).
Следовательно,
1
Q
(x, y) = 5 означает, что первый игрок проиграл 5 единиц, а
1
Q
(x, y) = –5 означает, что
первый игрок выиграл 5 единиц.
Эти две задачи имеют, очевидно, право на существование, однако, в теории игр первый игрок все-
гда полагается выигрывающим, и платежная функция
1
Q (x, y) определяет его выигрыш. Проигрышу со-
ответствует отрицательное значение
1
Q (x, y).
Аналогичные замечания могут быть отнесены к платежной матрице
i
Q любого i-го игрока.
В теории игр используется такое понятие как смешанная стратегия,
являющаяся более сложной
конструкцией, использующая понятие чистой стратегии.
Пусть Хмножество чистых стратегий, а х
1
, х
2
, …, х
n
n чистых стратегий из этого множества.
Пусть игрок принимает решение использовать все эти чистые стратегии с разными вероятностями
ξ
1
, ξ
2
, , ξ
n
. При этом игрок выбирает (варьирует) не чистые стратегии х
1
, х
2
, …, х
n
они всегда заданы
(одинаковые), а частоту (вероятность) использования каждой из них.
В этом случае стратегией будет вектор вероятностей ξ = (ξ
1
, ξ
2
, , ξ
n
), игрок должен пытаться найти
такую стратегию (такое значение) ξ, при которой он получит максимальный успех.
Стратегия выбора вероятности ξ называется смешанной стратегией.
Рассмотрим следующий пример. Так, чистыми стратегиями является установка орудия на север, юг,
запад, восток. Смешанная стратегия ξ = (0,1; 0,5; 0,2; 0,2) означает, что 10 % времени орудие смотрит на
север, 50 % на юг и по 20 % времени оно повернуто на запад и восток. Если чистыми стратегиями яв-
ляются покупка сахара, муки, картофеля, то ξ = (0,5; 0,2; 0,3) означает, что деньги истрачены следую-
щим образом: 50 % на сахар, 20 % на муку, 30 % на картофель. Принятие чистой стратегии означает,
что покупатель принял решение истратить все деньги на один из этих продуктов.
Более сложные стратегии бывают в пошаговых (динамических играх), когда на каждом шаге оцени-
вается ситуация предыдущих решений. В общем случае стратегией называется набор правил, опреде-
ляющих ход игры. Которые приведут к конечному состоянию.
Если каждый из игроков выбрал стратегию, то совокупность этих стратегий называется ситуацией.
Пусть в игре двух игроков первый игрок выбрал чистую стратегию х, а второйчистую стратегию у,
тогда ситуацией будет вектор (х, у).
Ситуацией в смешанных стратегиях будет вектор (ξ, η), где ξ =
1
, , ξ
n
) – смешанная стратегия
первого игрока, η = (η
1
, , η
m
) – смешанная стратегия второго игрока, ξ
i
вероятность использования
чистой стратегии x
i
первым игроком, η
i
вероятность использования чистой стратегии y
i
вторым игро-
ком.
Если ситуация сформулирована, то говорят, что игра состоялась.
Оценка стратегии игрока проводится по гарантированному выигрышу, т.е. по значению минималь-
ного выигрыша для данной стратегии. Так, для первого игрока оценка стратегии х проводится по функ-
ции
),(min)(
~
11
yxQxQ
Yy
= , (6.1)
в случае применения чистой стратегии или по функции