Системы линейных неравенств. Зоркальцев В.И - 49 стр.

UptoLike

49
.0),( = sxf (6)
Производная функции
f в данной точке является линейной функцией
от направления. Поэтому для выполнения условия (6) по всем
n
R
s
достаточно выполнения этого условия для какого-либо набора базисных
векторов в
n
R
. В частности, это может быть набор орт в
n
R
. Тогда
получаем широко известное необходимое и достаточное условие
оптимальности вектора
x
для задачи минимизации выпуклой
дифференцируемой функции:
0)( = xf (7)
Следует подчеркнуть важные различия условий оптимальности (5) и
(7). Условие (5) характеризует точку оптимума в терминах возможных
направлений: для того чтобы вектор
x
был оптимальным решением,
целевая функция не должна убывать по любому допустимому решению.
Этот критерий является наглядным, но не конструктивным, поскольку при
исследовании данной точки на оптимальность нельзя перебрать все
допустимые направления.
Критерий (7) является конструктивным. По нему непосредственно
можно установить оптимальность данного вектора.
При исследовании более сложных задач оптимизации с
ограничениями
также широко применяются оба типа критериев
оптимальностикак в терминах возможных направлений, так и в
терминах свойств функций в данной точке. При этом в качестве
возможных выступают только те направления, которые не выводят из
области допустимых решений. Построение конструктивных критериев,
обобщающих (7) на случай задач с ограничениями, осуществляется с
помощью использования множителей
Лагранжа этих ограничений.
Существуют разные способы введения и интерпретации множителей
Лагранжа. Ниже для задачи минимизации функции при линейных
ограничениях это будет сделано на основе свойств ортогональных
линейных подпространств.
Оптимизация на линейном подпространстве. Рассмотрим задачу
минимизации дифференцируемой выпуклой функции f на линейном
подпространстве S:
() min, .
f
xxS→∈ (8)
Она является непосредственным обобщением задачи (1). Оптимизация
на линейном подпространстве сводится к безусловной оптимизации в
пространстве меньшей (если не имеет место случай
n
R
S
) размерности.
Действительно, воспользуемся представлением пространства
S
как
области значений некоторой транспонированной матрицы
D
размерности
nk×
                           ∇f ( x), s = 0.                         (6)

    Производная функции f в данной точке является линейной функцией
от направления. Поэтому для выполнения условия (6) по всем s ∈ R n
достаточно выполнения этого условия для какого-либо набора базисных
векторов в R n . В частности, это может быть набор орт в R n . Тогда
получаем    широко известное необходимое и достаточное условие
оптимальности вектора x для задачи минимизации выпуклой
дифференцируемой функции:
                          ∇f ( x ) = 0                             (7)
     Следует подчеркнуть важные различия условий оптимальности (5) и
(7). Условие (5) характеризует точку оптимума в терминах возможных
направлений: для того чтобы вектор x был оптимальным решением,
целевая функция не должна убывать по любому допустимому решению.
Этот критерий является наглядным, но не конструктивным, поскольку при
исследовании данной точки на оптимальность нельзя перебрать все
допустимые направления.
     Критерий (7) является конструктивным. По нему непосредственно
можно установить оптимальность данного вектора.
     При исследовании более сложных задач оптимизации с
ограничениями также широко применяются оба типа критериев
оптимальности – как в терминах возможных направлений, так и в
терминах свойств функций в данной точке. При этом в качестве
возможных выступают только те направления, которые не выводят из
области допустимых решений. Построение конструктивных критериев,
обобщающих (7) на случай задач с ограничениями, осуществляется с
помощью использования множителей Лагранжа этих ограничений.
     Существуют разные способы введения и интерпретации множителей
Лагранжа. Ниже для задачи минимизации функции при линейных
ограничениях это будет сделано на основе свойств ортогональных
линейных подпространств.
     Оптимизация на линейном подпространстве. Рассмотрим задачу
минимизации дифференцируемой выпуклой функции f на линейном
подпространстве S:
                           f ( x) → min , x ∈ S .                  (8)
    Она является непосредственным обобщением задачи (1). Оптимизация
на линейном подпространстве сводится к безусловной оптимизации в
пространстве меньшей (если не имеет место случай S = R n ) размерности.
Действительно, воспользуемся представлением пространства S как
области значений некоторой транспонированной матрицы D размерности
n×k

                                    49