ВУЗ:
Составители:
В методе динамического программирования важную роль играет
функция Беллмана, связанная с условным математическим ожиданием
функционала потерь. Введем эту функцию на основании формулы
)],,,([{min)),(
€
,(
),(
)(
)(
1
0
kz
tt
Uu
l
tuYtIMtytS
k
∈
∈
=
τ
τ
ω
, (96)
где
. (97)
∫
∞
∞−
=≤≤= dy)t,y(
€
)t,u,y,t(I]tt),(Z|I[M)]t,u,Y,t(I[M
)l(
1k0kz
ωττ
Функция
S представляет собой минимальное значение условного
математического ожидания функционала потерь
I(t, Y, u, t
к
) при наблюдении
вектора
Z(t), полученное на множестве всех допустимых управлений u(
τ
) в
интервале
(t, t
k
).
Метод динамического программирования применительно к
непрерывным динамическим системам, поведение которых описывается
стохастическими уравнениями при неточных измерениях фазовых
координат, содержится в следующей теореме.
Теорема 4.2. Для оптимального вектора управления, удовлетворяюще-го
ограничению
(95а), оптимального вектора состояния объекта,
описываемого стохастическими уравнениями
, и при наблюдении вектора Z(t)
в интервале (t
0
, t
k
) функционал
]tt),t(Z|)t,u,Y,t(I[M]I[MI
€
k0k0
'
00z0
≤≤==
τ
имеет минимальное значение, а функция S удовлетворяет функциональному
уравнению Беллмана
, (98)
0)]}t,u,Y(l[M))t,y(
€
,t(S{min
2z
)l(
1
)t,t(
U)(u
k0
0
=+
∈
∈
ωΚ
τ
τ
где
t
))t,y(
€
,t(S))]tt,y(
€
,tt(S[M
limS
)l(
1
)l(
1z
0t
∆
ω∆ω∆
Κ
∆
−++
=
→
. (99)
82
В методе динамического программирования важную роль играет функция Беллмана, связанная с условным математическим ожиданием функционала потерь. Введем эту функцию на основании формулы S (t , ω€1( l ) ( y , t )) = min {M z [ I (t , Y , u, t k )] , (96) u (τ )∈U 0 τ ∈( t ,tk ) где ∞ M z [ I ( t ,Y ,u ,t k )] = M [ I | Z ( τ ),t 0 ≤ τ ≤ t ] = ∫ I ( t , y ,u ,t k ) ω€1 (l ) ( y ,t )dy . (97) −∞ Функция S представляет собой минимальное значение условного математического ожидания функционала потерь I(t, Y, u, tк) при наблюдении вектора Z(t), полученное на множестве всех допустимых управлений u(τ) в интервале (t, tk). Метод динамического программирования применительно к непрерывным динамическим системам, поведение которых описывается стохастическими уравнениями при неточных измерениях фазовых координат, содержится в следующей теореме. Теорема 4.2. Для оптимального вектора управления, удовлетворяюще-го ограничению (95а), оптимального вектора состояния объекта, описываемого стохастическими уравнениями, и при наблюдении вектора Z(t) в интервале (t0, tk) функционал I€0 = M z [ I 0 ] = M [ I 0' ( t0 ,Y ,u ,t k ) | Z ( t ),t0 ≤ τ ≤ t k ] имеет минимальное значение, а функция S удовлетворяет функциональному уравнению Беллмана min { ΚS ( t ,ω€1( l ) ( y ,t )) + M z [ l 2 ( Y ,u ,t )]} = 0 , (98) u ( τ )∈U 0 τ ∈( t0 ,tk ) где M z [ S ( t + ∆t ,ω€1( l ) ( y ,t + ∆t ))] − S ( t ,ω€1( l ) ( y ,t )) ΚS = lim . (99) ∆t →0 ∆t 82
Страницы
- « первая
- ‹ предыдущая
- …
- 80
- 81
- 82
- 83
- 84
- …
- следующая ›
- последняя »