Выпуклые функции и их свойства. Горячев Л.В. - 3 стр.

UptoLike

Составители: 

Рубрика: 

3
Свойство выпуклости функции является фундаментальным в математике наряду с такими свой-
ствами как монотонность, непрерывность, дифференцируемость и т.д. Особенно широко оно исполь-
зуется в теории экстремальных задач. Поэтому студент, прослушавший курс "Методы оптимиза-
ции", должен твердо усвоить его и уметь применить при решении практических задач оптимизации.
В учебниках и учебных пособиях по курсу "методы оптимизации"изучению темы "Выпуклые
функции"отводится мало времени. По существу излагаются лишь определения и критерии выпук-
лости; алгебру выпуклых функций студент, по мнению авторов учебников, должен освоить само-
стоятельно в процессе решения примеров.
Однако по новой учебной программе практические занятия по методам оптимизации исключены
из числа обязательных. Это обуславливает необходимость подготовки руководства, призванного бо-
лее подробно познакомить студента со свойствами выпуклых функций и способствовать выработке
у него практических навыков по анализу на выпуклость функций в практических задачах оптими-
зации.
Этим целям и служат настоящие методические указания.
Определение и практические свойства выпуклых функций
Определение. Функция f (x), заданная на выпуклом множестве M R
n
, называется выпуклой,
если для любых x
1
,x
2
и числа α, 0 α 1 выполняется неравенство
f(αx
1
+(1 α)x
2
) αf(x
1
)+(1 α)f(x
2
)
Если равенство достигается только при α =0и α =1, то называется строго выпуклой.
Примерами строго выпуклой функции может служить функция:
1. y = l
x
2. y = x
2
3. y =sinx, x [π, 2π]
4. y =cosx, x [π/2, 3π/2]
По определению f(x) является выпуклой, если значение ее от выпуклой комбинации значений аргу-
мента x
1
и x
2
не больше, чем выпуклая комбинация значений f (x) при этих значениях аргумента.
Геометрически это означает, что хорда, соединяющая эти две точки (любые) графика функции,
лежит над дугой, концами которой являются эти точки.
Противоположным по смыслу выпуклости функции является понятие вогнутой функции.
Определение. Функция f(x), заданная на выпуклом множестве, называется вогнутой (строго
вогнутой), если g(x)=f(x) является выпуклой (строго выпуклой) функцией.
При решении практической задачи оптимизации необходимо предварительно исследовать саму
целевую функцию и функции, определяющие ограничения на выпуклость. От результатов этого
исследования зависит выбор метода численного решения. Часто для этих целей достаточно опре-
деления. Рассмотрим ряд простых примеров.
1. Функция y = x является выпуклой. Действительно, для любых x
1
,x
2
M имеем
y(λx
1
+(1 λ)x
2
)=λx
1
+(1 λ)x
2
≤
λx
1
+(1 λ)x
2
= λy(x
1
)+(1 λ)y(x
2
)
2. Квадратная форма y = x
T
Bx+ bx + c является выпуклой функцией, где B неотрицательно-
определенная матрица. Действительно, для любых x
1
,x
2
имеем
y(λx
1
+(1 λ)x
2
)=(λx
1
+(1 λ)x
2
)
T
B((λx
1
+(1 λ)x
2
)+
+b(λx
1
+(1 λ)x
2
)+c =(x
2
+ λ(x
1
x
2
))
T
B(x
2
+ λ(x
1
x
2
))+
+b(λx
1
+(1 λ)x
2
)+c = x
T
2
Bx
2
+ λ
2
(x
1
x
2
)
T
B(x
1
x
2
)+
+λx
T
2
B(x
1
x
2
)+λ(x
1
x
2
)
T
Bx
2
+ λbx
1
+(1 λ)bx
2
+ c
x
T
2
Bx
2
+ λ(x
1
x
2
)
T
B(x
1
x
2
)+λx
T
2
B(x
1
x
2
)+λ(x
1
x
2
)
T
Bx
2
+
                                                                                                3

   Свойство выпуклости функции является фундаментальным в математике наряду с такими свой-
ствами как монотонность, непрерывность, дифференцируемость и т.д. Особенно широко оно исполь-
зуется в теории экстремальных задач. Поэтому студент, прослушавший курс "Методы оптимиза-
ции", должен твердо усвоить его и уметь применить при решении практических задач оптимизации.
   В учебниках и учебных пособиях по курсу "методы оптимизации"изучению темы "Выпуклые
функции"отводится мало времени. По существу излагаются лишь определения и критерии выпук-
лости; алгебру выпуклых функций студент, по мнению авторов учебников, должен освоить само-
стоятельно в процессе решения примеров.
   Однако по новой учебной программе практические занятия по методам оптимизации исключены
из числа обязательных. Это обуславливает необходимость подготовки руководства, призванного бо-
лее подробно познакомить студента со свойствами выпуклых функций и способствовать выработке
у него практических навыков по анализу на выпуклость функций в практических задачах оптими-
зации.
   Этим целям и служат настоящие методические указания.

              Определение и практические свойства выпуклых функций
   Определение. Функция f (x), заданная на выпуклом множестве M ⊂ Rn , называется выпуклой,
если для любых x1 , x2 и числа α, 0 ≤ α ≤ 1 выполняется неравенство

                              f (αx1 + (1 − α)x2 ) ≤ αf (x1 ) + (1 − α)f (x2 )

Если равенство достигается только при α = 0 и α = 1, то называется строго выпуклой.
   Примерами строго выпуклой функции может служить функция:
  1. y = lx
  2. y = x2
  3. y = sin x, x ∈ [π, 2π]
  4. y = cos x, x ∈ [π/2, 3π/2]
По определению f (x) является выпуклой, если значение ее от выпуклой комбинации значений аргу-
мента x1 и x2 не больше, чем выпуклая комбинация значений f (x) при этих значениях аргумента.
Геометрически это означает, что хорда, соединяющая эти две точки (любые) графика функции,
лежит над дугой, концами которой являются эти точки.
   Противоположным по смыслу выпуклости функции является понятие вогнутой функции.
   Определение. Функция f (x), заданная на выпуклом множестве, называется вогнутой (строго
вогнутой), если g(x) = −f (x) является выпуклой (строго выпуклой) функцией.
   При решении практической задачи оптимизации необходимо предварительно исследовать саму
целевую функцию и функции, определяющие ограничения на выпуклость. От результатов этого
исследования зависит выбор метода численного решения. Часто для этих целей достаточно опре-
деления. Рассмотрим ряд простых примеров.
  1. Функция y = x является выпуклой. Действительно, для любых x1 , x2 ⊂ M имеем

                                  y(λx1 + (1 − λ)x2 ) = λx1 + (1 − λ)x2  ≤

                               ≤ λx1  + (1 − λ)x2  = λy(x1 ) + (1 − λ)y(x2 )

  2. Квадратная форма y = xT Bx + bx + c является выпуклой функцией, где B — неотрицательно-
     определенная матрица. Действительно, для любых x1 , x2 имеем
                       y(λx1 + (1 − λ)x2 ) = (λx1 + (1 − λ)x2 )T B((λx1 + (1 − λ)x2 )+
                    +b(λx1 + (1 − λ)x2 ) + c = (x2 + λ(x1 − x2 ))T B(x2 + λ(x1 − x2 ))+
                       +b(λx1 + (1 − λ)x2 ) + c = xT2 Bx2 + λ2 (x1 − x2 )T B(x1 − x2 )+
                       +λxT2 B(x1 − x2 ) + λ(x1 − x2 )T Bx2 + λbx1 + (1 − λ)bx2 + c ≤
                 ≤ xT2 Bx2 + λ(x1 − x2 )T B(x1 − x2 ) + λxT2 B(x1 − x2 ) + λ(x1 − x2 )T Bx2 +