Математические методы принятия решений. Бодров В.И - 51 стр.

UptoLike

Стадии процесса могут быть однородными и неоднородными. Процесс с однородными стадиями
представляет собой последовательное изменение состояния объекта во времени, он состоит из после-
довательности однотипных стадий.
Процесс с неоднородными стадиями состоит из разнородных стадий. Состояние отдельной стадии
характеризуется совокупностью величин, которые называются выходом или переменными состояния
стадии. Если выход стадии является входом для следующей стадии, то для последней совокупность вы-
ходных переменных предыдущей стадии определяет состояние входа.
Кроме входных и выходных переменных на каждой стадии определяется группа управляющих пе-
ременных (управление), а также предполагается известным математическое описание каждой стадии.
Рассматриваемый многостадийный процесс условно изображается схемой, изображенной на рис. 5.1.
1
y
0
u
1
2
ν
m-1 m
u
2
u
ν
u
m-1
u
m
y
1
y
2
y
ν
-1
y
ν
y
m-2
y
m-1
y
m
Рис. 5.1 Многостадийный процесс
Краеугольным камнем метода динамического программирования является принцип оптимальности:
оптимальная стратегия обладает таким свойством, что, каково бы ни было начальное состояние и на-
чальные решения, последующие решения должны приниматься, исходя из оптимальной стратегии с
учетом состояния, вытекающего из первого решения.
Использование принципа оптимальности является гарантией того, что решение, принимаемое на
каждой стадии, является наилучшим с точки зрения всего процесса в целом.
В динамическом программировании используется также принцип вложения, под которым понима-
ется рассмотрение исходной задачи с позиций более широкого класса задач (например, рассматривать
не 10, а m стадий). Это позволяет изучить целый класс задач, включая и исходную. Исходя из принципа
вложения, представляется возможным изучить как структуру, так и "чувствительность" решения.
5.2 МАТЕМАТИЧЕСКОЕ ОПИСАНИЕ.
ФУНКЦИОНАЛЬНОЕ УРАВНЕНИЕ БЕЛЛМАНА
Как уже говорилось, математическое описание процесса известно.
Пусть состояние системы на каждой стадии описывается уравнением
(
)
,,
1 νννν
=
uyfy (5.1)
где y
ν-1
, y
ν
переменные состояния ν – 1 и ν стадий соответственно, u
ν
управление на ν-й стадии.
Уравнение (5.1) связывает выходные переменные ν стадии с выходными переменными предыдущей
стадии y
ν-1
и управлением u
ν
, используемым на этой ν стадии.
На переменные состояния и управляющие воздействия могут быть наложены ограничения, выра-
жающиеся в виде равенств или неравенств
(
)
JjuuyyF
mmj
,1,0...,,,...,,
11
=
. (5.2)
Кроме того, используется запись
UuYy
νν
, (5.3)