Выпуклые функции и их свойства. Горячев Л.В. - 7 стр.

UptoLike

Составители: 

Рубрика: 

7
P (t)dt = α
h(x
1
,t)P (t)dt +(1 α)
h(x
2
,t)P (t)dt = αh(x
1
)+(1 α)h(x
2
)
Этот результат полезен при исследовании экстремальных задач с неопределенностью. Если P (t)
является плотностью распределения, то L(x) есть математическое ожидание функции h(x, t)
свою очередь может быть поставлена задача минимизации L(x).
Критерии выпуклости
Прежде чем приступить к решению задачи на экстремум, необходимо провести тщательный ана-
лиз целевой функции и ограничений, определяющих множество допустимых планов. Желательным
свойство рассматриваемых функций является их выпуклость. Обычно провести анализ, пользуясь
лишь определением выпуклой функции, затруднительно. Для этой цели необходимо привлекать
более тонкие свойства выпуклых функций.
Здесь следует отметить, что выпуклость функции по каждой переменной еще не позволяет сде-
лать вывод о выпуклости по совокупности переменных. Для подтверждения сказанного можно
привести следующий пример.
Пусть x R, ϕ(x, y)=x·y. Функция ϕ(x, y) является выпуклой по x при каждом фиксированном
y ивыпуклойпоy при каждом фиксированном x. Положим, x
α
= αx
1
+(1α)x
2
, y
α
= αy
1
+(1α)y
2
,
где 0 α 1. Для выпуклости ϕ(x, y) по совокупности переменных необходимо, чтобы для любых
x
1
,x
2
,y
1
,y
2
выполнялось неравенство ϕ(x
α
,y
α
) αϕ(x
1
,y
1
)+(1 α)ϕ(x
2
,y
2
). Имеем
F (α) ϕ(x
α
,y
α
) αϕ(x
1
,y
1
) (1 α)ϕ(x
2
,y
2
)=(αx
1
+(1 α)x
2
)+
+(αy
1
+(1 α)y
2
) αx
1
x
2
(1 α)x
2
y
2
= α(1 α)(y
1
y
2
)(x
2
x
1
)
Очевидно, что при α [0, 1], x
1
= x
2
, y
1
= y
2
, если sign(y
1
y
2
) = sign(x
2
x
1
)оF (α) > 0
тогда условие выпуклости не выполняется, то есть не является выпуклой функцией по совокупности
переменных.
К наибольшее широкоизвестным критериям выпуклости относится следующий.
Теорема. Пусть M непустое открытое выпуклое множество в R
n
, f(x) недифференцируемая
на M функция. Для того, чтобы функция f(x) была выпуклой, необходимо и достаточно, чтобы
при любых x, x
0
M выполнялось неравенство
f(x) f(x
0
) (f(x
0
),x x
0
)
Доказательство этой теоремы приводится в лекции. Очевиден геометрический смысл этой теоремы:
дифференцируемая функция является выпуклой тогда и только тогда, когда график ее целиком
лежит выше касательной гиперплоскости, проведенной в любой точке поверхности. Можно сказать
еще так: дифференцируемая функция является выпуклой тогда и только тогда, когда касательная
гиперплоскость, проведенная в любой точке к поверхности y = f(x), является опорной гиперплос-
костью к надграфику f(x).
Иногда рассматривается другая форма необходимого и достаточного условий выпуклости диф-
ференцируемой функции.
Теорема. Пусть M непустое открытое выпуклое множество в R
n
, f(x) дифференцируемая
на M функция. Для того, чтобы функция f(x) была выпуклой, необходимо и достаточно, чтобы
при любых x
1
,x
2
M выполнялось неравенство
[f(x
2
) −∇f(x
1
)]
T
(x
2
x
1
) 0
Для строгой выпуклости f(x) необходимо и достаточно, чтобы неравенство было строгим.
Доказательство. Пусть f(x) выпукла и x
1
,x
2
M, тогда по предыдущей лемме
f(x
1
) f(x
2
)+f(x
2
)(x
1
x
2
)
f(x
2
) f(x
1
)+f(x
1
)(x
2
x
1
)
Складывая эти неравенства, получаем [f(x
2
) −∇f(x
1
)]
T
(x
2
x
1
) 0. Обратное для x
1
,x
2
M .
По теореме о среднем значении
() f(x
2
) f(x
1
)=f(x)(x
2
x
1
),x= λx
1
+(1 λ)x
2
[0, 1]
                                                                                                            7
                                                          
            P (t)dt = α       h(x1 , t)P (t)dt + (1 − α)       h(x2 , t)P (t)dt = αh(x1 ) + (1 − α)h(x2 )

Этот результат полезен при исследовании экстремальных задач с неопределенностью. Если P (t)
является плотностью распределения, то L(x) есть математическое ожидание функции h(x, t). В
свою очередь может быть поставлена задача минимизации L(x).

                                      Критерии выпуклости
    Прежде чем приступить к решению задачи на экстремум, необходимо провести тщательный ана-
лиз целевой функции и ограничений, определяющих множество допустимых планов. Желательным
свойство рассматриваемых функций является их выпуклость. Обычно провести анализ, пользуясь
лишь определением выпуклой функции, затруднительно. Для этой цели необходимо привлекать
более тонкие свойства выпуклых функций.
    Здесь следует отметить, что выпуклость функции по каждой переменной еще не позволяет сде-
лать вывод о выпуклости по совокупности переменных. Для подтверждения сказанного можно
привести следующий пример.
    Пусть x ∈ R, ϕ(x, y) = x·y. Функция ϕ(x, y) является выпуклой по x при каждом фиксированном
y и выпуклой по y при каждом фиксированном x. Положим, xα = αx1 +(1−α)x2 , yα = αy1 +(1−α)y2 ,
где 0 ≤ α ≤ 1. Для выпуклости ϕ(x, y) по совокупности переменных необходимо, чтобы для любых
x1 , x2 , y1 , y2 выполнялось неравенство ϕ(xα , yα ) ≤ αϕ(x1 , y1 ) + (1 − α)ϕ(x2 , y2 ). Имеем
               F (α) ≡ ϕ(xα , yα ) − αϕ(x1 , y1 ) − (1 − α)ϕ(x2 , y2 ) = (αx1 + (1 − α)x2 )+
               +(αy1 + (1 − α)y2 ) − αx1 x2 − (1 − α)x2 y2 = α(1 − α)(y1 − y2 )(x2 − x1 )
Очевидно, что при α ∈ [0, 1], x1 = x2 , y1 = y2 , если sign(y1 − y2 ) = sign(x2 − x1 ), то F (α) > 0, а
тогда условие выпуклости не выполняется, то есть не является выпуклой функцией по совокупности
переменных.
   К наибольшее широкоизвестным критериям выпуклости относится следующий.
   Теорема. Пусть M — непустое открытое выпуклое множество в Rn , f (x) — недифференцируемая
на M функция. Для того, чтобы функция f (x) была выпуклой, необходимо и достаточно, чтобы
при любых x, x0 ∈ M выполнялось неравенство

                                        f (x) − f (x0 ) ≥ (∇f (x0 ), x − x0 )

Доказательство этой теоремы приводится в лекции. Очевиден геометрический смысл этой теоремы:
дифференцируемая функция является выпуклой тогда и только тогда, когда график ее целиком
лежит выше касательной гиперплоскости, проведенной в любой точке поверхности. Можно сказать
еще так: дифференцируемая функция является выпуклой тогда и только тогда, когда касательная
гиперплоскость, проведенная в любой точке к поверхности y = f (x), является опорной гиперплос-
костью к надграфику f (x).
   Иногда рассматривается другая форма необходимого и достаточного условий выпуклости диф-
ференцируемой функции.
   Теорема. Пусть M — непустое открытое выпуклое множество в Rn , f (x) — дифференцируемая
на M функция. Для того, чтобы функция f (x) была выпуклой, необходимо и достаточно, чтобы
при любых x1 , x2 ∈ M выполнялось неравенство

                                       [∇f (x2 ) − ∇f (x1 )]T (x2 − x1 ) ≥ 0

Для строгой выпуклости f (x) необходимо и достаточно, чтобы неравенство было строгим.
  Доказательство. Пусть f (x) выпукла и x1 , x2 ∈ M , тогда по предыдущей лемме
                                        f (x1 ) ≥ f (x2 ) + ∇f (x2 )(x1 − x2 )
                               f (x2 ) ≥ f (x1 ) + ∇f (x1 )(x2 − x1 )
Складывая эти неравенства, получаем [∇f (x2 ) − ∇f (x1 )]T (x2 − x1 ) ≥ 0. Обратное для x1 , x2 ∈ M .
По теореме о среднем значении

(∗)                f (x2 ) − f (x1 ) = ∇f (x)(x2 − x1 ), x = λx1 + (1 − λ)x2 , λ ∈ [0, 1]