ВУЗ:
Составители:
B.2 Решение задачи управления
текущего момента t
i
. Для 0 ≤i<s≤N, со гласно принципу оптимальности,
имеем функциональное уравнение Беллмана
C
∗
N+1−i
(t
i
) = min
U(t
i
,t
s−1
)
E
(
s−1
P
j=i
1
2
h
x
T
(t
j+1
)V
x
(t
j+1
)x(t
j+1
) +
+ u
T
(t
j
)V
u
(t
j
)u(t
j
)
i
+ C
∗
N+1−s
(t
s
)
)
,
которое для пошаговой оптимизации, при s = i + 1, запишется в виде
C
∗
N+1−i
(t
i
) = min
u(t
i
)
E
(
1
2
h
x
T
(t
i+1
)V
x
(t
i+1
)x(t
i+1
) +
+ u
T
(t
i
)V
u
(t
i
)u(t
i
)
i
+ C
∗
N−i
(t
i+1
)
)
, (B.5)
где i = N, N − 1, . . . , 0 и C
∗
0
(t
N+1
) = 0.
Теорема B.1. Оптимальный закон ЛГК-управления для задачи стоха-
стического управления с критерием (B.4 ) разделяется на две части (часть I
и часть II), соединенные пос ледовательно (II вслед за I) и синтезируемые
независимо друг от друга:
I. Оптимальный линейный фильтр (Калмана), ФК
А. Для i = 0, 1, . . . , N ФК вычисляет экст раполяционные оценки ˆx(t
−
i+1
)
состояния x(t
i+1
), получаемые при экстраполяции отфильтрованных оценок
ˆx(t
+
i
) от момента t
i
к моменту t
i+1
в виде
ˆx(t
−
i+1
) = Φ(t
i+1
, t
i
)ˆx(t
+
i
) + B
d
(t
i
)u
∗
(t
i
)
с начальным значением ˆx(t
+
0
) = E {x(t
0
)} = ¯x
0
, и также их ковариации
P (t
−
i+1
) = Φ(t
i+1
, t
i
)P (t
+
i
)Φ
T
(t
i+1
, t
i
) + G
d
(t
i
)Q
d
(t
i
)G
T
(t
i
)
с начальным значением P (t
+
0
) = E
[x(t
0
) − ¯x
0
][x(t
0
) − ¯x
0
]
T
= P
0
.
B. Для i = 1, 2, . . . , N ФК вычисляет отфильтрованные оценки ˆx(t
+
i
),
обновленные по измерению z(t
i
) = z
i
с ковариацией R(t
i
) > 0 о шибок изме-
рений в момент t
i
, в виде
ˆx(t
+
i
) = ˆx(t
−
i
) + K
f
(t
i
)[z
i
− H(t
i
)ˆx(t
−
i
)]
с коэффициентом усиления фильтра
K
f
(t
i
) = P (t
−
i
)H
T
(t
i
)[H(t
i
)P (t
i
)H
T
(t
i
) + R(t
i
)]
−1
345
Страницы
- « первая
- ‹ предыдущая
- …
- 343
- 344
- 345
- 346
- 347
- …
- следующая ›
- последняя »
