Автоматизация технологических процессов на основе гибких производственных систем. Пищухин А.М. - 88 стр.

UptoLike

Составители: 

+
+
=
)(
)()(
)(2
)(
)(
)(
)(
)(
)
,(
2
1
)
,(
min
)
,(
),
0
(
0
l
Tll
l
t
l
T
l
l
t
Uu
l
t
B
YY
YtS
trA
Y
YtS
t
YtS
k
tt
τ
τ
[
]
}
),,(
2
tuYlM
z
+
. (115)
Таким образом, оператор
Κ
(99) производной от условного
математического ожидания функционала, дважды дифференцируемого по Y и
один раз по t, имеет выражение
+
+
=Κ
)(
)()(
2
)(
)(
)(
2
1
)
,(
l
Tll
l
T
l
l
t
B
YY
S
trA
Y
S
t
S
YtS (116).
Граничное условие при решении функционального уравнения (115)
вытекает из формул (95) и (107)
. (117)
)],([)
,(
1
)(
k
l
tk
tYlMYtS =
Уравнение (115) является частным случаем (98), также носит название
уравнения Беллмана и доставляет необходимое условие оптимальности при
оптимальном векторе управления u. Уравнение (115) отличается от обычного
дифференциального уравнения наличием процедуры минимизации правой
части по вектору управления u. Это обстоятельство определяет следующую
процедуру его решения. Вектор и для каждого текущего момента времени
определяется путем минимизации правой части уравнения (115). При этом он
выражается через функцию S. Подставляя найденное выражение для и опять
в правую часть формулы (115), получаем уже обычное уравнение в частных
производных относительно функции S, в которое не входит u. Решив
полученное уравнение относительно функции S, следует оценить ее вид. Эта
функция доставляет решение для непрерывной системы только тогда, когда
является кусочно-гладкой по отношению к
Y, u, t.
Из изложенного в данном параграфе следует, что метод динамического
программирования применительно к непрерывным динамическим системам
приводит к необходимости решения своеобразного дифференциального
уравнения в частных производных при заданном конечном условии. Здесь
отсутствует двухточечная задача, которая характерна для принципа
88
  ∂S (t , Y€t (l ) )                  ∂S (t , Y€(l ) )  T       1  ∂ 2 S (t , Y€t (l ) ) €(l ) 
−                    = min                       t          €(l )
                                                              A + tr  (l ) (l )T B  +
       ∂t             u (τ )∈U 0           ∂ Y€(l )                2  ∂Y€ ∂Y€
                      τ ∈( t0 ,t k )                                                            

                                                                                        + M z [l 2 (Y , u , t )]}.     (115)

       Таким          образом,             оператор         Κ       (99)        производной              от      условного
математического ожидания функционала, дважды дифференцируемого по Y и
один раз по t, имеет выражение
                                                       T
                                           ∂S  ∂S  €(l ) 1     ∂2S              
                    ΚS (t , Y€t (l ) )   =   +  (l )  A + tr  (l ) (l )T B€(l )                                    (116).
                                           ∂t  ∂Y€       2  ∂Y€ ∂Y€             
       Граничное условие при решении функционального уравнения (115)
вытекает из формул (95) и (107)
                                                    S (t k , Y€t (l ) ) = M [l1 (Y , t k )] .                        (117)
       Уравнение (115) является частным случаем (98), также носит название
уравнения Беллмана и доставляет необходимое условие оптимальности при
оптимальном векторе управления u. Уравнение (115) отличается от обычного
дифференциального уравнения наличием процедуры минимизации правой
части по вектору управления u. Это обстоятельство определяет следующую
процедуру его решения. Вектор и для каждого текущего момента времени
определяется путем минимизации правой части уравнения (115). При этом он
выражается через функцию S. Подставляя найденное выражение для и опять
в правую часть формулы (115), получаем уже обычное уравнение в частных
производных относительно функции S, в которое не входит u. Решив
полученное уравнение относительно функции S, следует оценить ее вид. Эта
функция доставляет решение для непрерывной системы только тогда, когда
является кусочно-гладкой по отношению к Y, u, t.
       Из изложенного в данном параграфе следует, что метод динамического
программирования применительно к непрерывным динамическим системам
приводит к необходимости решения своеобразного дифференциального
уравнения в частных производных при заданном конечном условии. Здесь
отсутствует двухточечная задача, которая характерна для принципа
                                                              88