Lagrange 对偶函数
Lagrange 函数
考虑标准形式的优化问题
定义该问题的 Lagrange 函数 为
其中定义域 。 称为第 个不等式约束 对应的 Lagrange 乘子;类似地, 称为第 个等式约束 对应的 Lagrange 乘子。向量 和 称为对偶变量或者问题的 Lagrange 乘子向量。
Lagrange 对偶函数
定义 Lagrange 对偶函数 为 Lagrange 函数关于 取得的最小值:即对 ,,有
如果 Lagrange 函数关于 无下界,则对偶函数取值为 。因为对偶函数是一族关于 的仿射函数的逐点下确界,所以即使原问题不是凸的,对偶函数也是凹函数。
最优值的下界
对偶函数构成了原问题最优值 的下界:即对 有
几何意义
为了便于理解,我们考虑只有一个变量 并且只有一个不等式约束的简单情形。如下图所示:
图中表示的是对偶可行点给出的下界。粗的实线表示目标函数 ,下方的虚线表示约束函数 。可行集是图中两个红点之间的部分所在区间。细的点线表示一系列 Lagrange 函数 ,其中 。该问题的最优点是左边的红点所在位置,可以看到每个 Lagrange 函数的极小值均小于之。
通过线性逼近来理解
可以通过对集合 和 的示性函数进行线性逼近来理解 Lagrange 函数和其给出下界的性质。首先将原问题重新描述成一个无约束问题
其中, 是非正实数集的示性函数
类似地, 是集合 的示性函数。打一个形象的比喻,可以将函数 理解为我们对约束函数值 的一种恼怒或不满。类似地, 表达了我们对等式约束值 的不满。
如果我们用线性函数 替代函数 ,其中 ,用函数 替代 。那么,目标函数就变成了 Lagrange 函数 ,且对偶函数值是该问题的最优值。实际上,使用线性函数太“软”,没有示性函数“硬”。用线性函数去逼近示性函数是远远不够的,不过至少可以将线性函数看作是示性函数的一个下估计。
用“软”约束代替“硬”约束的思想在后文考虑内点法时会再次提到。
举例
线性方程组的最小二乘解
其中 ,说明这个问题共有 个等式约束。其 Lagrange 函数和对偶函数分别为
由于 是关于 的二次凸函数,可以通过求解如下最优性条件得到函数的最小值
因此,对偶函数为
它是一个二次凹函数,定义域为 。
Lagrange 对偶函数和共轭函数
共轭函数和 Lagrange 对偶函数紧密相关。下面的问题说明了一个简单的联系。
虽然这个问题没有什么挑战性,但是我们还是可以很容易地得到 Lagrange 函数为 ,则其对偶函数为
即,我们得到了结论