拉格朗日乘子法和KKT是什么,怎么实际运用到计算中

2022-06-08   970 次阅读


前言

经常在各种方法的推导中见到拉格朗日乘子法,不懂的时候是一见一个怵。这里就对其进行一个解的理,以便看懂以及自己也用上

看到一个写拉格朗日乘子法和KKT条件的博客不错。可以点击这里查看

拉格朗日乘子法

拉格朗日乘子法(Lagrange multipliers)其实也就是一种寻找多元函数在一组约束下的极值的方法。是一种比较直观且简单的方法。公式如下:
image.png
其中f(x)是被求极值的函数,g(x)是约束条件,λ就是拉格朗日算子,是一个常数。实际工作的时候要求极值,就直接对该函数求导

通过引入拉格朗日乘子,可将有d个变量与k个约束条件的最优化问题转化为具有d+k个变量的无约束优化问题求解。也就是把各种变量和约束条件以一个更方便的方式组合到一起求解。

可能第一次见这句话还会有些看不懂,不知道他是怎么做到这一步的。我们下面来对其进行解释。

等式约束下的拉格朗日乘子法

下面抛出一个问题:
我们要求image.png的最小值,条件是在约束image.png下。

我们来尝试解决这个问题。
一般最朴素直观的解决方法就是将g(x)中x1,x2代入到f(x)里进行一个参数的替换。给替换参数后的f(x)求极值可解。
解法如下:
image.png
后证明X2不能为0.(字不好看轻喷。。)

对于只有两三种未知数的式子这种朴素的解法其实也还好解,但是如果我们的未知数一旦多了,复杂度则是指数型上升。。而且这种算法本身也不是特别的便利

那若使用可以应对更多未知数和约束条件的拉格朗日乘子法,这个问题要怎么解决呢?
我们首先知道,在一个等式约束中,函数的极值一定是在函数与约束的切线上的。有以上的任务画图如下
image.png
蓝色的结点就是二者交点。在交点上我们有f(x)的导数梯度与g(x)的导数梯度方向一定相同或相反。也就是说,若满足image.png那就是在交点上,也就是取了极值了(λ是变量,是常数)

而同时我们又有约束条件g(x)=0,所以也就得到了以下的式子
image.png

实际上,以上的式子做一点泛化就是在等式约束下的拉格朗日算子法了。泛化结果如下:
image.png

而我们正巧又发现,二式的最简单的原函数就是image.png,也就是我们对拉格朗日算子法的公式定义。上面展开的式子分别就是对这个式子对x和λ的偏导。

我们代入上述问题到式子中,则有解
image.png

与上面我们手算的结果一致!而我们做的计算量则因为对变量的求导大大减少了。
只需要一个L(x) = f(x)+λg(x)
这也应了前面我们对拉格朗日乘子法的定义,就是将有d个变量与k个约束条件的最优化问题转化为具有d+k个变量的无约束优化问题求解。

在不等式约束的情况下?

因为约束是不等式,所以与等式约束的最大区别就是,等式约束要求值在一条线上,不等式约束要求值在一个区域里。【但是若极值点在等式约束范围之外,还是切点上取极值】

既然是一个区域的约束,那当对一个函数求极值的约束是不等式时,则需要分情况讨论了。

一种是,极值点在不等式约束之内,则不需要不等式约束也可以找到极值点且不需要在切线上找。【λ=0{不需要g(x)},g(x)!=0{取极值点时}】
第二种是,极值点在不等式约束之外,取不到极值点。则需要再在边界上找极值点,那就等于等式约束了。【λ!=0{需要g(x)},g(x)=0{在边界上取极值}】

那么这两种情况同时满足时,就是λg(x)=0。有如下式子
image.png

这也就是KKT条件。
image.png

有不等式有等式约束的混合情况?

若碰到这种情况
image.png

其中g(x)是等式约束的集合,h(x)是不等式约束的集合。无论有多少个

我们则有拉格朗日定义如下:
image.png

也就是约束条件如下:
image.png

这个式子也就是KKT条件 (最优化条件,由Karush[1939],以及Kuhn和Tucker[1951]这三个发表所以叫KKT)。
满足这KKT条件的不一定是是局部(全局)最优点,可能是极大点或者是鞍点。但是局部(全局)最优解一定满足KKT条件。而且在KKT条件里面的一定有全局最优解。
若待优化函数是个凸函数,满足KKT条件也就一定是全局最优解.【学习凸函数优化的重要性。。】

最后一个混合情况的例题给出,请大家算算吧

image.png

Q.E.D.

知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议

无论在未来前做什么,未来都会普通的到来