@dongxi
2017-08-13T20:11:10.000000Z
字数 4429
阅读 2426
数理统计
0未完成
本文主要是对机器学习领域中比较常见的一个数学工具拉格朗日对偶性进行简单的介绍与证明。
拉格朗日对偶性是一种寻找多元函数在其自变量受到一个或者多个条件约束时的极值的方法。这种方法可以将一个有个变量和个约束条件的最优化问题转换为一个解有个变量的方程组问题。
首先,定义一下我们的原问题:假设是定义在上的连续可微函数,有如下具有约束的最优化问题:
对于上述问题,我们可以引入广义拉格朗日函数:
接下来到了我们的重点部分,有些时候原始问题的形式,我们难以求解,我们可以对这些问题进行对称化。
定义关于和的函数:
原始问题和对偶问题并不是一定相等的,他们的关系有如下定理:
定理:若原始问题与对偶问题都有最优值,则:
对于任意的、和,我们有:
那么,原始问题的最优解不小于对偶问题的最优解,这是一个很有用的结论,但并不是我们想得到的。如果我们希望使用对偶问题去求解原始问题,那么就必须要求对偶问题的最优值和原始问题最优值相等才可以,那么在什么条件下才能使呢?这个条件就是所谓的条件。
当成立时,满足的条件被称为条件。我们来简单的推导一下条件,首先为了方便讨论我们对约束条件进行一定的简化:
对于这两种情况采用的解决方式是不同的,对于内部解的情况,实际上就是约束无效的情况,也就不会产生效果,有约束问题退化成了无约束问题,因此只需要满足且。而对于边界解时,束缚条件退化成了在之前我们提及到得模型,那么很显然会有,这里的是有意义的,以本题为例,我们希望最小化,而梯度(函数在点上升最快的方向)一般指向可行域内部,但是却指向的外部区域,所以,这项性质成为对偶可行性。
同时我们可以发现无论是内部解还是边界解,都会有成立,这项性质称为补松弛。整合上述两种情况,最佳解需要的四个条件为:定常方程式、原始可行性、对偶可行性和补松弛(三个性质待补充):
本篇博客基本上就算是初稿完成了,还是有很多地方说的不清不楚,不明不白的,这些部分等我看完线性代数的知识或者学习完《凸优化》再进行补充,应该也不会太晚,应该在今年之内。
参考
拉格朗日乘数
凸优化(八)——Lagrange对偶问题
简易解说拉格朗日对偶(Lagrange duality)
Karush-Kuhn-Tucker (KKT) 條件