Специальные разделы теории управления. Оптимальное управление динамическими системами. Громов Ю.Ю - 25 стр.

UptoLike

0,),...,,()(
00010000
>λλλλ=
T
n
tλ ,
что u
*
(t) минимизирует в каждый момент t функцию
),()(),(
000
ttthH
T
uhλu +λ=
по всем
m
Uu ,
где
x
x
λλ
λ=
)),((
)()()(
*
0
00
ttf
ttAt
T
T
&
.
Тогда управление u
*
(t) минимизирует на траекториях x
*
(t) системы (40), проходящих через
10
, xx , критерий качества
+=
1
0
)],(),([)]([
00
t
t
dtthtftJ uxu ,
если только ),(
0
tf x является однозначной выпуклой вниз функцией x для всех ],[
10
ttt
.
Замечание. Функция
),(
0
tf x называется выпуклой вниз по x при ],[
10
ttt
, если для всех
nn
RR xx ,
),(),()(
),(
00
0
tftf
tf
xxxx
x
x
+
.
Контрольные вопросы
1. Приведите формулировку принципа максимума.
2. Расскажите о следствиях принципа максимума.
3. Каким условием является принцип максимума?
Глава 5
НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ
ДЛЯ ОСНОВНОЙ ЗАДАЧИ СИНТЕЗА ЗАКОНА УПРАВЛЕНИЯ.
МЕТОД ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ
5.1. Задача синтеза оптимального закона управления
Для синтеза оптимального закона управления систем с обратной связью, оптимальных замкнутых контуров управления,
оптимальных законов наведения и т.д. более естественен другой подход, чем использованный при решении задач, описан-
ных в гл. 4, 9.
В отличие от уравнений ЭйлераЛагранжа и принципа максимума Понтрягина, использующих временное представле-
ние оптимального управления [в форме
u
*
= u(t)] для единичного объекта управления, этот подход рассматривает оптималь-
ное управление в форме закона
u
*
= v
*
(x, t) (координатное управление, управление в форме обратной связи) для множества
однородных объектов, отличающихся различными начальными состояниями.
С точки зрения механики, этот подход соответствует рассмотрению распространения «волн возбуждения» от некоторо-
го источника в неоднородной среде. Общность обоих подходов устанавливает проективная геометрия, с точки зрения кото-
рой траектория точки в фазовом пространстве может рассматриваться и как последовательность точек и как огибающая сво-
их касательных.
Последовательное применение описываемого подхода к задачам оптимального управления приводит для непрерывных
процессов к дифференциальному уравнению (нелинейному) в частных производных первого порядка типа уравнения Га-
мильтонаЯкоби [25 – 27].
Один из возможных способов получения этого уравнения состоит в использовании принципа оптимальности динамиче-
ского программирования. Динамическое программирование является довольно общим методом, разработанным для решения
общих задач многоэтапного выбора (т.е. задач, в которых результаты предыдущих операций можно использовать для управ-
ления ходом будущих операций).
5.2. Принцип оптимальности динамического программирования
Принцип оптимальности. В основе динамического программирования лежит сформулированный Р. Беллманом прин-
цип оптимальности: «Оптимальная политика обладает тем свойством, что каковы бы ни были начальное состояние и перво-
начально принятое решение, последующие решения должны составлять оптимальную политику относительно состояния,
получившегося в результате первоначально принятого решения» [19, 28]. Или, оптимальное управление не зависит от того,