基本性质
定义
如果 是凸集,且对于任意的 和任意的 ,若有
则称函数 是凸的。
从几何意义上看,上述不等式意味着点 和点 之间的线段,即从 到 的弦,在函数 图像的上方。如果不等式中当 时 严格成立,则称函数 是严格凸的。
扩展值延伸
通常可以定义凸函数的定义域外的值为 ,从而将这个凸函数延伸至全空间 。我们定义凸函数 的扩展值延伸: 如下:
一阶条件
假设 可微(即其梯度 在开集 内处处存在),则函数 是凸函数的充要条件是 是凸集,且对于任意的 ,有
由此得出的仿射函数 即为函数 在点 附近的 Taylor 近似。上面的不等式表明,对于一个凸函数,其一阶 Taylor 近似实质上是原函数的一个全局下估计。反之,如果某个函数的一阶 Taylor 近似总是其全局下估计,那么这个函数是凸的。
同理,可以定义凹函数及其一阶条件。
二阶条件
现在假设函数 二阶可微(即对于开集 内的任意一点,它的 Hessian 矩阵或者二阶导数 存在),则函数 是凸函数的充要条件是,其 Hessian 矩阵是半正定矩阵,即对所有的 ,有
下水平集
函数 的 α-下水平集定义为
上境图
函数 的图像定义为
它是 空间的一个子集。
函数 的上镜图定义为
上镜图的概念很像是下水平集和函数图像二者的结合。从几何上看,上镜图即为在函数图像之上。
定义在 上的凸函数 的上镜图是 空间的一个凸集,其支撑超平面和一阶条件有着如下图所示的联系:
从图中可以直观地看到,凸函数 在点 处的一阶 Taylor 近似即为其上镜图在 处的支撑超平面。
Jensen 不等式及其扩展
基本不等式
有时也称作 Jensen 不等式。此不等式可以很方便地扩展至更多点的凸组合:如果函数 是凸函数,, 且 ,则下式成立
考虑凸集时,此不等式还可以扩展至无穷项和、积分以及期望。
例如,若在 上 且 ,则
再比如,设 是随机变量,若函数 是凸函数,则
我们不妨来回忆以下高中时期我们接触到的凸函数定义,如下
其实这就是由 Jensen 提出的最初的一个最简单的不等式。现在,我们可以称上述所有的不等式为 Jensen 不等式。