Математическое моделирование в системах электроснабжения. Даценко В.А - 100 стр.

UptoLike

100
бы правилен в том случае, если оптимальное управление на каждом
шаге можно было бы выбирать независимо от управления на других, в
частности, последующих шагах. Иными словами, при выборе шагового
управления необходимо учитывать его последействия на будущих ша-
гах.
Очевидно, что это общее правило имеет исключение. Последний
шаг можно планировать без оглядки
на будущее. Управление на пос-
леднем шаге можно выбирать таким, чтобы оно приносило бы макси-
мальный выигрыш. Поэтому решение задачи методом динамического
программирования производится, начиная с последнего, k-го шага, т. е.
двигаясь от конца к началу [16]. Выбирать управление на k-м шаге мы
можем только в том
случае, если знаем, чем закончился выбор на пре-
дыдущем, (k-1)-м шаге. Поскольку мы этого не знаем, то задаемся раз-
личными предположениями на этот счет. Для каждого такого предпо-
ложения находим оптимальное управление на k -м шаге. Это уп-
равление следует считать не оптимальным, а условно-оптимальным, по-
скольку мы не
знаем, какое управление на (k-1)-м шаге действительно
выбрано. После этого мы переходим к выбору управления на предпо-
следнем, (k-1)-м шаге. Здесь мы также должны сделать предположение
о том, чем закончился (k-2)-й шаг, и для каждого из этих предположе-
ний определить управление на (k -1)-м шаге так, чтобы
выигрыш на
последних двух шагах был бы максимален, т. е.
min). или( max
1
+
ZZ
kk
Далее переходим к (k-2)-му шагу и т. д. Таким образом, на каждом
шаге ищется такое управление, которое обеспечивает оптимальное
продолжение процесса относительно достигнутого в данный момент со-
стояния. В результате мы получаем условно-оптимальное управление на
всех шагах.
Теперь, если мы, закончив определение условно-оптимального уп-
равления на первом шаге
, подошли к началу операции и знаем ее на-
чальное состояние
S
o
, мы можем начать движение от начала к концу.
Зная S
o
, мы найдем оптимальное управление на первом шаге и опреде-
лим состояние S
2
в начале второго шага. Далее находим оптимальное
управление на втором шаге и состояние
S
2
в начале третьего шага и т. д.
В конце концов
, мы найдем оптимальное управление всей операцией,
приводящее к Z
max
(или Z
min
). Таким образом, многошаговый процесс
проходится дважды:
- первый разот конца к началу (находятся условные опти-
мальные управления на каждом шаге и условный выигрыш на всех ша-
гах);