ВУЗ:
Составители:
() ( ) ()
+=
−
=ι
∈
∈
ι
11
,2
1010
min,min
1
yQuyQyB
m
m
Uu
Uu
m
&&&
, (5.10)
где минимизация первого слагаемого Q
1
(y
0
, u
1
) проводится только по управлению u
1
, а второе миними-
зируется выбором управлений на всех стадиях, причем каждое слагаемое в (5.10) нельзя минимизиро-
вать в отдельности, так как они оба зависят от u
1
.
Минимизацию второго слагаемого в (5.10) можно рассматривать как задачу оптимизации (m – 1) ста-
дийного процесса с критерием оптимальности
(
)
11
yQ
m−
и оптимальной стратегией
()
опт
опт3опт21
...,,,
опт
mm
uuuu =
−
. Таким образом, можно записать, что
(
)
(
)
.min
1
,2
111
yQyB
m
m
Uu
m
=ι
−
∈
−
ι
=
(5.11)
Выражение (5.9) с учетом (5.11) может быть представлено в виде
(
)
(
)()
[
]
.,min
111010
1
yBuyQyB
m
Uu
m −
∈
+
=
(5.12)
Если математическое описание первой стадии
(
)
,,
1011
uyfy
=
то
(
)
(
)()
[]
[
]
1011010
,,min
1
uyfBuyQyB
m
Uu
m −
∈
+
=
. (5.13)
Последнее уравнение является математической формулировкой принципа оптимальности и называ-
ется рекуррентным соотношением Беллмана.
Для начала расчетов необходимо задать начальную функцию
f
0
(y
m
), которая может быть принята равной нулю, что естественным образом соответствует отсутствию
процесса за пределами последней стадии.
Уравнение (5.13) можно трактовать как оптимальные потери, причем
()
101
, uyQ – потери на первом
участке, а B
m–1
– оптимальные потери на всех последующих участках. Минимизируя сумму этих потерь,
необходимо найти правильное соотношение между ними.
5.3 ОБЩАЯ ПРОЦЕДУРА РЕШЕНИЯ ЗАДАЧ
МЕТОДОМ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ
Согласно общему подходу к решению задач методом динамического программирования определе-
ние оптимальных управлений начинается с последней стадии процесса, для которой рекуррентное соот-
ношение Беллмана с учетом, что B
0
(y
m
) = 0, записывается в виде
(
)
(
)
.,min
111 mmm
Uu
m
uyQyB
m
−
∈
−
=
(5.14)
Для этой стадии можно построить зависимость целевой функции Q
m
от управления u
m
для различ-
ных значений переменной состояния
y
m–1
(рис. 5.2).
Эта зависимость позволяет найти зависимость оптимального управления на последней стадии
опт
m
u
от входной переменной этой стадии y
m–1
(рис. 5.3).
Страницы
- « первая
- ‹ предыдущая
- …
- 51
- 52
- 53
- 54
- 55
- …
- следующая ›
- последняя »