Опукла функція однієї змінної
Опукла функція , або опукла вниз функція [ 1] — функція , яка визначена на опуклій множині лінійного простору, і задовольняє нерівності
f
(
λ λ -->
x
+
(
1
− − -->
λ λ -->
)
y
)
⩽ ⩽ -->
λ λ -->
f
(
x
)
+
(
1
− − -->
λ λ -->
)
f
(
y
)
,
∀ ∀ -->
λ λ -->
∈ ∈ -->
[
0
;
1
]
.
{\displaystyle f(\lambda x+(1-\lambda )y)\leqslant \lambda f(x)+(1-\lambda )f(y),\quad \forall \lambda \in [0;1].}
Нехай область визначення опуклої функції
f
(
x
)
{\displaystyle f(x)}
лежить в скінченновимірному просторі , тоді
f
(
x
)
{\displaystyle f(x)}
неперервна в будь-якій внутрішній точці цієї області.
Властивості опуклих функцій
Нехай
x
1
,
… … -->
,
x
n
{\displaystyle x_{1},\ldots ,x_{n}}
— будь-які точки із області визначення опуклої функції
f
(
x
)
{\displaystyle f(x)}
,
λ λ -->
1
,
… … -->
,
λ λ -->
n
{\displaystyle \lambda _{1},\ldots ,\lambda _{n}}
— невід'ємні числа, які в сумі дорівнюють
1
{\displaystyle 1}
. Тоді
f
(
∑ ∑ -->
i
=
1
n
λ λ -->
i
x
i
)
⩽ ⩽ -->
∑ ∑ -->
i
=
1
m
λ λ -->
i
f
(
x
i
)
{\displaystyle f\left(\sum _{i=1}^{n}\lambda _{i}x_{i}\right)\leqslant \sum _{i=1}^{m}\lambda _{i}f(x_{i})}
.
Якщо
f
(
x
)
{\displaystyle f(x)}
— двічі неперервно-диференційована опукла функція, то матриця її других похідних не від'ємно визначена.
Сильно опукла функція
Поняття сильно опуклої функції розширює та параметризує поняття строгої опуклості. Сильно опукла функція також є строго опуклою, але не навпаки.
Диференційовна функція f називається сильно опуклою з параметром m > 0 якщо для всіх точок x , y в її домені зберігається наступна нерівність:[ 2]
(
∇ ∇ -->
f
(
x
)
− − -->
∇ ∇ -->
f
(
y
)
)
T
(
x
− − -->
y
)
≥ ≥ -->
m
‖ ‖ -->
x
− − -->
y
‖ ‖ -->
2
2
{\displaystyle (\nabla f(x)-\nabla f(y))^{T}(x-y)\geq m\|x-y\|_{2}^{2}}
або більш загально,
⟨ ⟨ -->
∇ ∇ -->
f
(
x
)
− − -->
∇ ∇ -->
f
(
y
)
,
(
x
− − -->
y
)
⟩ ⟩ -->
≥ ≥ -->
m
‖ ‖ -->
x
− − -->
y
‖ ‖ -->
2
{\displaystyle \langle \nabla f(x)-\nabla f(y),(x-y)\rangle \geq m\|x-y\|^{2}}
де
‖ ‖ -->
⋅ ⋅ -->
‖ ‖ -->
{\displaystyle \|\cdot \|}
будь-яка норма .
Операції, що зберігають опуклість
Якщо f і g є опуклими функціями, тоді
m
(
x
)
=
max
{
f
(
x
)
,
g
(
x
)
}
{\displaystyle m(x)=\max\{f(x),g(x)\}}
і
h
(
x
)
=
f
(
x
)
+
g
(
x
)
{\displaystyle h(x)=f(x)+g(x)}
також опуклі.
Якщо f і g є опуклими функціями і g є неспадною, тоді
h
(
x
)
=
g
(
f
(
x
)
)
{\displaystyle h(x)=g(f(x))}
є опуклою. Наприклад, якщо f (x ) є опуклою, тоді
e
f
(
x
)
{\displaystyle e^{f(x)}}
, також опукла, тому що
e
x
{\displaystyle e^{x}}
є опуклою і монотонно висхідною.
Якщо f є угнутою і g є опуклою і невисхідною, тоді
h
(
x
)
=
g
(
f
(
x
)
)
{\displaystyle h(x)=g(f(x))}
є опуклою.
Опуклість незмінна при застосування афінного відображення: тобто, якщо f є опуклою із областю визначення
D
f
⊆ ⊆ -->
R
m
{\displaystyle D_{f}\subseteq \mathbf {R} ^{m}}
, тоді
g
(
x
)
=
f
(
A
x
+
b
)
{\displaystyle g(x)=f(Ax+b)}
також опукла, де
A
∈ ∈ -->
R
m
× × -->
n
,
b
∈ ∈ -->
R
m
{\displaystyle A\in \mathbf {R} ^{m\times n},b\in \mathbf {R} ^{m}}
з областю визначення
D
g
⊆ ⊆ -->
R
n
{\displaystyle D_{g}\subseteq \mathbf {R} ^{n}}
.
Якщо f (x , y ) є опуклою по x тоді
g
(
x
)
=
sup
y
∈ ∈ -->
C
f
(
x
,
y
)
{\displaystyle g(x)=\sup _{y\in C}f(x,y)}
є опуклою по x , якщо
g
(
x
)
>
− − -->
∞ ∞ -->
{\displaystyle g(x)>-\infty }
для якогось x , навіть якщо C не є опуклою множиною.
Якщо f (x ) є опуклою, тоді її перспектива
g
(
x
,
t
)
=
t
f
(
x
/
t
)
{\displaystyle g(x,t)=tf(x/t)}
(чия область визначення —
{
(
x
,
t
)
|
x
t
∈ ∈ -->
Dom
(
f
)
,
t
>
0
}
{\displaystyle \left\lbrace (x,t)|{\tfrac {x}{t}}\in {\text{Dom}}(f),t>0\right\rbrace }
) є опуклою.
Протилежна до опуклої функції функція є угнутою .
Якщо
f
(
x
)
{\displaystyle f(x)}
є опуклою дійснозначимою функцією, тоді
f
(
x
)
=
sup
n
(
a
n
x
+
b
n
)
{\displaystyle f(x)=\sup _{n}(a_{n}x+b_{n})}
для зліченного набору дійсних чисел
(
a
n
,
b
n
)
.
{\displaystyle (a_{n},b_{n}).}
Див. також
Примітки
Джерела інформації
Посилання