Динамическое программирование. Романовская А.М - 8 стр.

UptoLike

Рубрика: 

7
Предполагается, что на каждом шаге
01
[ , ],tt
12
[ , ],tt
свой набор управлений.
После фиксированного числа
n
шагов развитие сис-
темы прекращается («система выключается»).
Набор состояний
01
, , , ,
n
(2)
через которые проходит динамическая система в процессе
развития, будем называть траекторией. Подчеркнем, что
начальное состояние
0
у всех траекторий одно и то же.
Динамические системы такого класса будем называть
управляемыми динамическими системами.
§2. Аддитивная целевая функция. Общая задача
динамического программирования
Пусть имеется управляемая динамическая система.
Предположим, что выбор той или иной траектории оцени-
вается показателем качества (доходом, затратами)
:S
).,,,(
21 n
uuuSS
Будем предполагать, что суммарный доход
равен
сумме доходов на каждом шаге:
,
21 n
fffS
(3)
где
k
f
доход на k-м шаге;
k
f
зависит от состояния в на-
чале k-го шага и выбранного на k-м шаге управления
:
k
u
).,(
1 kkkk
uff
(4)
n
k
u
1k
k
0
0
t
1k
t
k
t
n
t
t
Рисунок 1