ВУЗ:
Составители:
23
3. ПРИНЦИП ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ БЕЛЛМАНА
И ТЕОРИЯ УСТОЙЧИВОСТИ ЛЯПУНОВА
3.1. Принцип динамического программирования Беллмана
Для определения оптимального управления линейными динамическими
системами при решении задачи стабилизации могут быть применены различные
методы [3]. Это могут быть классические методы вариационного исчисления,
принцип оптимальности Беллмана [3], принцип максимума Понтрягина [2] и др.
Здесь остановимся на изложении принципа динамического
программирования
Беллмана, с помощью которого были решены ряд важных практических задач
оптимальной стабилизации движения объектов управления [3]. В основе метода
динамического программирования лежит принцип оптимальности,
сформулированный Р. Беллманом [7]. «Оптимальные стратегии управления
обладают тем свойством, что каково бы ни было начальное состояние системы и
управление в начальный момент, последующее управление должно быть
оптимальным в смысле заданного критерия относительно любого другого
состояния, которое могло бы явиться естественным следствием управления в
начальный момент». Этот принцип для динамических систем (1.1) и (1.8) может
быть сформулирован короче: любой отрезок оптимальной траектории есть тоже
оптимальная траектория. Последнее означает, что независимо от того, каким было
управление на начальном отрезке [
,tT
o
], последующее управление на отрезке [
,tT
]
должно обладать свойством оптимальности по выбранному критерию.
Следовательно, если ставится задача поиска оптимального управления на всем
отрезке [
,tT
o
], то управление u должно быть оптимальным в каждый момент
времени
t ∈[
,tT
o
]. Применение принципа оптимальности Беллмана для
динамических систем (1.1) и (1.8) приводит к необходимости решения некоторого
уравнения в частных производных – уравнения Беллмана относительно функции
v
вектора переменных состояния
x
(или y ). Данную функцию обычно называют
Страницы
- « первая
- ‹ предыдущая
- …
- 21
- 22
- 23
- 24
- 25
- …
- следующая ›
- последняя »