Составители:
Рубрика:
48
целевых функций каждого шага:
∑
=
−
→=
n
1k
k,1kk
extremum)xS(FF
;
3) выбор управления х
k
на каждом шаге зависит только от состоя-
ния системы к этому шагу S
k
, и не влияет на предшествующие шаги (нет
обратной связи);
4) состояние системы S
k
после каждого шага управления зависит
только от предшествующего состояния системы S
k-1
и этого управляюще-
го воздействия х
k
(отсутствие последействия) и может быть записано в
виде уравнения состояния: S
k
= f(S
k-1
, х
k
), k = 1, n;
5) на каждом шаге управление х
k
зависит от конечного числа управ-
ляющих переменных, а состояние системы S
k
зависит от конечного числа
параметров;
6) оптимальное управление представляет собой вектор X*, опре-
деляемый последовательностью оптимальных пошаговых управлений:
X* = (х
*
1
, х
*
2
, …, х
*
k
, …, х
*
n
), число которых и определяет количество ша-
гов задачи.
6.3. Принцип оптимальности и математическое описание
динамического процесса управления
В основе метода ДП лежит принцип оптимальности, впервые сфор-
мулированный в 1953 г. американским математиком Р. Э. Беллманом: ка-
ково бы ни было состояние системы в результате какого-либо числа ша-
гов, на ближайшем шаге
нужно выбирать управление так, чтобы оно в
совокупности с оптимальным управлением на всех последующих шагах
приводило к оптимальному выигрышу на всех оставшихся шагах, вклю-
чая выигрыш на данном шаге. При решении задачи на каждом шаге вы-
бирается управление, которое должно привести к оптимальному выиг-
рышу. Если считать все шаги независимыми,
тогда оптимальным управ-
лением будет то управление, которое обеспечит максимальный выигрыш
именно на данном шаге. Однако, например, при покупке новой техники
взамен устаревшей на ее приобретение затрачиваются определенные
средства, поэтому доход от ее эксплуатации в начале может быть не-
большой, а в следующие годы новая техника будет приносить больший
доход. И
наоборот, если принято решение оставить старую технику для
получения дохода в текущем году, то в дальнейшем это приведет к зна-
чительным убыткам. Этот пример демонстрирует следующий факт: в
многошаговых процессах управление на каждом конкретном шаге надо
выбирать с учетом его будущих воздействий на весь процесс.
Кроме того, при выборе управления
на данном шаге следует учиты-
вать возможные варианты состояния предыдущего шага. Например, при
определении количества средств, вкладываемых в предприятие в 1-м году,
n целевых функций каждого шага: F = ∑ Fk (S k −1, x k ) → extremum ; k =1 3) выбор управления хk на каждом шаге зависит только от состоя- ния системы к этому шагу Sk, и не влияет на предшествующие шаги (нет обратной связи); 4) состояние системы Sk после каждого шага управления зависит только от предшествующего состояния системы Sk-1 и этого управляюще- го воздействия хk (отсутствие последействия) и может быть записано в виде уравнения состояния: Sk = f(Sk-1, хk), k = 1, n; 5) на каждом шаге управление хk зависит от конечного числа управ- ляющих переменных, а состояние системы Sk зависит от конечного числа параметров; 6) оптимальное управление представляет собой вектор X*, опре- деляемый последовательностью оптимальных пошаговых управлений: X* = (х*1, х*2, …, х*k, …, х*n), число которых и определяет количество ша- гов задачи. 6.3. Принцип оптимальности и математическое описание динамического процесса управления В основе метода ДП лежит принцип оптимальности, впервые сфор- мулированный в 1953 г. американским математиком Р. Э. Беллманом: ка- ково бы ни было состояние системы в результате какого-либо числа ша- гов, на ближайшем шаге нужно выбирать управление так, чтобы оно в совокупности с оптимальным управлением на всех последующих шагах приводило к оптимальному выигрышу на всех оставшихся шагах, вклю- чая выигрыш на данном шаге. При решении задачи на каждом шаге вы- бирается управление, которое должно привести к оптимальному выиг- рышу. Если считать все шаги независимыми, тогда оптимальным управ- лением будет то управление, которое обеспечит максимальный выигрыш именно на данном шаге. Однако, например, при покупке новой техники взамен устаревшей на ее приобретение затрачиваются определенные средства, поэтому доход от ее эксплуатации в начале может быть не- большой, а в следующие годы новая техника будет приносить больший доход. И наоборот, если принято решение оставить старую технику для получения дохода в текущем году, то в дальнейшем это приведет к зна- чительным убыткам. Этот пример демонстрирует следующий факт: в многошаговых процессах управление на каждом конкретном шаге надо выбирать с учетом его будущих воздействий на весь процесс. Кроме того, при выборе управления на данном шаге следует учиты- вать возможные варианты состояния предыдущего шага. Например, при определении количества средств, вкладываемых в предприятие в 1-м году, 48
Страницы
- « первая
- ‹ предыдущая
- …
- 46
- 47
- 48
- 49
- 50
- …
- следующая ›
- последняя »