Автоматизация технологических процессов на основе гибких производственных систем. Пищухин А.М. - 83 стр.

UptoLike

Составители: 

Выражение
Κ
S при существовании соответствующего предела можно
рассматривать как производную от условного математического ожидания
функционала. Функциональное уравнение Беллмана (98) является общим со-
отношением, решающим поставленную задачу оптимизации функционала
(95) и определения оптимального управления.
Приведем доказательство этой теоремы, опираясь на доказательство,
полученное в /9/ для детерминированной задачи оптимизации.
Рассмотрим интервал времени
(t, t
k
), где t
0
t
t
k
. По определению
оптимальное управление на этом интервале доставляет минимум
функционалу
M
z
[I(t, Y, u, t
k
)]
S
. (100)
+=
k
)
k
t,t(
0
t
t
2k1z
U)(u
)l(
1
d),u,Y(l)t,Y(lMmin))t,y(
,t(
ττω
τ
τ
Пользуясь аддитивностью интегралов для интервалов времени
t t +
t
t
k
, перепишем формулу (100) в виде
[]
+
+=
+
+
k
)
k
t,t(
0
t
tt
2z
tt
t
2zk1z
U)(u
)l(
1
d),u,Y(lMd),u,Y(lM)t,Y(lMmin))t,y(
,t(S
τ
ττττω
τ
(101)
Применим сформулированный принцип оптимальности к выражению
(101). На основании этого принципа оптимальное управление
и для системы
на интервале
(t, t
k
) обладает следующим свойством: для любого момента
времени t +
t, заключенного в интервале t t +
t
t
k
, управление должно
быть оптимальным относительно состояния Y
t+t
независимо от значений,
которое оно принимало на предшествующем интервале
(t, t +
t). На
основании этого запишем
+++
=
+
))]tt,y(
,tt(S[Md),u,Y(lMmin))t,y(
,t(S
)l(
1z
tt
t
2z
U)(u
)l(
1
tt
)
k
t,t(
0
ωττω
τ
τ
(102)
где
83
        Выражение ΚS при существовании соответствующего предела можно
рассматривать как производную от условного математического ожидания
функционала. Функциональное уравнение Беллмана (98) является общим со-
отношением, решающим поставленную задачу оптимизации функционала
(95) и определения оптимального управления.
        Приведем доказательство этой теоремы, опираясь на доказательство,
полученное в /9/ для детерминированной задачи оптимизации.
        Рассмотрим интервал времени (t, tk), где t0 ≤ t ≤ tk. По определению
оптимальное                   управление                на этом интервале доставляет                     минимум
функционалу Mz[I(t, Y, u, tk)]
                                                                           tk
                                                                                                  
                                ω
                         S ( t , €1( l )(   y ,t )) = min M z l1( Y ,tk ) + ∫ l2 ( Y ,u ,τ )dτ   .      (100)
                                                     u ( τ )∈U 0 
                                                      τ ∈( t ,t k )         t                  

        Пользуясь                аддитивностью               интегралов         для     интервалов        времени
t ≤ t + ∆t ≤ tk, перепишем формулу (100) в виде
                                                           t + ∆t                       tk                   
S ( t ,ω€1( l ) (   y ,t )) = min M z [l1 ( Y ,t k )] + M z  ∫ l 2 ( Y ,u ,τ )dτ  + M z  ∫ l 2 ( Y ,u ,τ )dτ  
                             u ( τ )∈U 0 
                              τ ∈( t ,t k )                  t                          t + ∆t               
                                                                                                          (101)
        Применим сформулированный принцип оптимальности к выражению
(101). На основании этого принципа оптимальное управление и для системы
на интервале (t, tk) обладает следующим свойством: для любого момента
времени t + ∆t, заключенного в интервале t ≤ t + ∆t ≤ tk, управление должно
быть оптимальным относительно состояния Yt+∆t независимо от значений,
которое оно принимало на предшествующем интервале (t, t + ∆t). На
основании этого запишем
                                             t + ∆t                                                       
       ω
S ( t , €1( l ) (   y ,t )) = min M zt  ∫ l 2 ( Y ,u ,τ )dτ  + M zt [ S ( t + ∆t ,ω€1( l ) ( y ,t + ∆t ))] 
                             u ( τ )∈U 0                                                                      
                              τ ∈( t ,t k )    t            

                                                                                                         (102)
где

                                                                                                                    83