Автоматизация технологических процессов на основе гибких производственных систем. Пищухин А.М. - 82 стр.

UptoLike

Составители: 

В методе динамического программирования важную роль играет
функция Беллмана, связанная с условным математическим ожиданием
функционала потерь. Введем эту функцию на основании формулы
)],,,([{min)),(
,(
),(
)(
)(
1
0
kz
tt
Uu
l
tuYtIMtytS
k
=
τ
τ
ω
, (96)
где
. (97)
== dy)t,y(
)t,u,y,t(I]tt),(Z|I[M)]t,u,Y,t(I[M
)l(
1k0kz
ωττ
Функция
S представляет собой минимальное значение условного
математического ожидания функционала потерь
I(t, Y, u, t
к
) при наблюдении
вектора
Z(t), полученное на множестве всех допустимых управлений u(
τ
) в
интервале
(t, t
k
).
Метод динамического программирования применительно к
непрерывным динамическим системам, поведение которых описывается
стохастическими уравнениями при неточных измерениях фазовых
координат, содержится в следующей теореме.
Теорема 4.2. Для оптимального вектора управления, удовлетворяюще-го
ограничению
(95а), оптимального вектора состояния объекта,
описываемого стохастическими уравнениями
, и при наблюдении вектора Z(t)
в интервале (t
0
, t
k
) функционал
]tt),t(Z|)t,u,Y,t(I[M]I[MI
k0k0
'
00z0
==
τ
имеет минимальное значение, а функция S удовлетворяет функциональному
уравнению Беллмана
, (98)
0)]}t,u,Y(l[M))t,y(
,t(S{min
2z
)l(
1
)t,t(
U)(u
k0
0
=+
ωΚ
τ
τ
где
t
))t,y(
,t(S))]tt,y(
,tt(S[M
limS
)l(
1
)l(
1z
0t
ωω
Κ
++
=
. (99)
82
      В методе динамического программирования важную роль играет
функция Беллмана, связанная с условным математическим ожиданием
функционала потерь. Введем эту функцию на основании формулы

                                 S (t , ω€1( l ) ( y , t )) = min {M z [ I (t , Y , u, t k )] ,                      (96)
                                                         u (τ )∈U 0
                                                         τ ∈( t ,tk )

где
                                                                          ∞
  M z [ I ( t ,Y ,u ,t k )] = M [ I | Z ( τ ),t 0 ≤ τ ≤ t ] =             ∫ I ( t , y ,u ,t k ) ω€1
                                                                                                  (l )
                                                                                                         ( y ,t )dy . (97)
                                                                          −∞

      Функция S представляет собой минимальное значение условного
математического ожидания функционала потерь I(t, Y, u, tк) при наблюдении
вектора Z(t), полученное на множестве всех допустимых управлений u(τ) в
интервале (t, tk).
      Метод           динамического                      программирования                     применительно                   к
непрерывным динамическим системам, поведение которых описывается
стохастическими                  уравнениями                 при        неточных          измерениях              фазовых
координат, содержится в следующей теореме.
      Теорема 4.2. Для оптимального вектора управления, удовлетворяюще-го
ограничению             (95а),            оптимального                  вектора          состояния               объекта,
описываемого стохастическими уравнениями, и при наблюдении вектора Z(t)
в интервале (t0, tk) функционал
      I€0 = M z [ I 0 ] = M [ I 0' ( t0 ,Y ,u ,t k ) | Z ( t ),t0 ≤ τ ≤ t k ]
имеет минимальное значение, а функция S удовлетворяет функциональному
уравнению Беллмана
                   min { ΚS ( t ,ω€1( l ) ( y ,t )) + M z [ l 2 ( Y ,u ,t )]} = 0 ,                                  (98)
                 u ( τ )∈U 0
                 τ ∈( t0 ,tk )

где
                     M z [ S ( t + ∆t ,ω€1( l ) ( y ,t + ∆t ))] − S ( t ,ω€1( l ) ( y ,t ))
          ΚS = lim                                                                          .                        (99)
               ∆t →0                                  ∆t


                                                                                                                             82