共轭函数是最优化问题中非常重要的概念,常用来在原问题和对偶问题之间进行转换。
本文从便于理解的角度对其进行介绍,并推导常见例子。
本文主要参考S. Boyd and L. Vandenberghe, Convex Optimization中3.3节。
定义
对于原函数f(x),x∈Df(x),x\in Df(x),x∈D,其共轭函数为:
f∗(y)=supx∈D(
其中,
对于标量:
特别注意,共轭函数的定义域要求对x∈Dx\in Dx∈D,
物理意义
对于共轭函数的每一个自变量y=yˉy=\bar{y}y=yˉ,其取值相当于一条直线与原函数之差的最大值:
f∗(yˉ)=supx∈D(l(x)−f(x))f^*(\bar y)=\sup_{x\in D}(l(x)-f(x))f∗(yˉ)=x∈Dsup(l(x)−f(x))
这条直线l(x)=
两条曲线之差随着xxx变化,其最大值可以对xxx求导得到:
∂(
即:曲线斜率与直线斜率相同处的xxx,能够得到最大值。
f∗(yˉ)=
举例
Negative entropy
原函数:f(x)=xlogx,x>0f(x)=x\log x, x>0f(x)=xlogx,x>0
原函数为增函数。
对于y<0y<0y<0,l(x)l(x)l(x)为减函数。则l(x)−f(x)l(x)-f(x)l(x)−f(x)为减函数,不超过其在零点取值。
对于y≥0y\geq 0y≥0,l(x)l(x)l(x)也是增函数
limx→∞l(x)/f(x)=limx→∞l′(x)/f′(x)=limx→∞y/(logx+x)=0\lim_{x\to \infty} l(x)/f(x)=\lim_{x \to \infty} l'(x)/f'(x)=\lim_{x\to \infty} y/(\log x + x)=0x→∞liml(x)/f(x)=x→∞liml′(x)/f′(x)=x→∞limy/(logx+x)=0
l(x)l(x)l(x)增速小于f(x)f(x)f(x)增速,故其差有界。
故,f∗(y)f^*(y)f∗(y)的定义域为y∈Ry\in Ry∈R。
找到最大值处xxx的表达式:
xy−xlogx∂x=0⇒x=ey−1\frac{xy - x\log x}{\partial x}=0 \Rightarrow x=e^{y-1}∂xxy−xlogx=0⇒x=ey−1
代入共轭函数:
f∗(y)=y⋅ey−1−ey−1(y−1)=ey−1f^*(y)=y\cdot e^{y-1}-e^{y-1}(y-1)=e^{y-1}f∗(y)=y⋅ey−1−ey−1(y−1)=ey−1