拉格朗日乘子法和KKT条件

zoukankan html css js c++ java

拉格朗日乘子法和KKT条件

这里简单说一下拉格朗日乘子法的原理和insight.

等式约束

拉格朗日乘子法主要是用于解决有约束的优化问题. 比如最基本的等式约束
$\ s.t., g(x,y)=0maxf(x,y)s.t.,g(x,y)=0我们想求f ( x , y ) f(x,y)f(x,y)的最大值,本身这个三维函数是定义在实平面上的, 他有自己的极值和最值. 但是加上了约束之后,我们就不能在整个实平面上找极值最值了, 我们得在g ( x , y ) = 0 g(x,y)=0g(x,y)=0这条线上找f ( x , y ) f(x,y)f(x,y)的最值.$

一个observation是,如果我们令

如果我们要从 $(x_0,y_0)(x0,y0)处找到了极值f ( x 0 , y 0 ) = d 1 f(x_0,y_0)=d_1f(x0,y0)=d1. 这时可以看到, g ( x , y ) = 0 g(x,y)=0g(x,y)=0这条线是与f ( x , y ) = d 1 f(x,y)=d_1f(x,y)=d1这个等高线相切的, 这就意味着g ( x , y ) = 0 g(x,y)=0g(x,y)=0这条线在( x 0 , y 0 ) (x_0,y_0)(x0,y0)处的切线方向与f ( x , y ) = d 1 f(x,y)=d_1f(x,y)=d1这个等高线在( x 0 , y 0 ) (x_0,y_0)(x0,y0)处的切线方向共线(可能同向也可能反向), 即有:d f ( x , y ) d x ∣ ( x 0 , y 0 ) = λ d g ( x , y ) d x ∣ ( x 0 , y 0 ) d f ( x , y ) d y ∣ ( x 0 , y 0 ) = λ d g ( x , y ) d y ∣ ( x 0 , y 0 ) left.frac{df(x,y)}{dx} ight|_{(x_0,y_0)}=lambdaleft.frac{dg(x,y)}{dx} ight|_{(x_0,y_0)} \ left.frac{df(x,y)}{dy} ight|_{(x_0,y_0)}=lambdaleft.frac{dg(x,y)}{dy} ight|_{(x_0,y_0)}dxdf(x,y)∣∣∣∣(x0,y0)=λdxdg(x,y)∣∣∣∣(x0,y0)dydf(x,y)∣∣∣∣(x0,y0)=λdydg(x,y)∣∣∣∣(x0,y0)$

按照这个性质,我们不妨构造拉格朗日函数

一个简单的验证方法是求解这个无约束问题, 为了找极值, 我们会令
$\ frac{dmathcal{L}(x,y,lambda)}{dy}=frac{df(x,y)}{dy}-lambdafrac{dg(x,y)}{dy}=0 \ frac{dmathcal{L}(x,y,lambda)}{dlambda}=g(x,y)=0dxdL(x,y,λ)=dxdf(x,y)−λdxdg(x,y)=0dydL(x,y,λ)=dydf(x,y)−λdydg(x,y)=0dλdL(x,y,λ)=g(x,y)=0$

可以看到,其实求解这个新问题的过程就是在求解旧问题. 这三个方程中前两个其实就是 $(x_0,y_0)(x0,y0)处切线共线, 最后一个就是原问题的约束.$

Remark: 拉格朗日乘子法解出的是极值,并不是最值; 而且我们只知道他是极值,不知道是极大值还是极小值. 因此, 我们还需要带入一些具体的函数值才能确定哪个是最大值还是最小值.

不等式约束

不等式约束的一般情况如下. 遇到不同形式的问题, 我们可以通过加负号把问题转换为以下形式
$\ s.t., g(x,y)geq 0maxf(x,y)s.t.,g(x,y)≥0$

不等式约束和等式约束有啥区别尼?区别在于现在

如果最值取在

与之前不同的是, 此时我们对 $f(x_0,y_0)f(x0,y0)取到最大值; 且g ( x , y ) = 0 g(x,y)=0g(x,y)=0内部是g ( x , y ) > 0 g(x,y)>0g(x,y)>0, 外部是g ( x , y ) < 0 g(x,y)<0g(x,y)<0, 因此g ( x , y ) g(x,y)g(x,y)在极值点的梯度方向是朝内的(梯度方向是函数值增加最快的方向). 反观f ( x , y ) f(x,y)f(x,y), 由于f ( x 0 , y 0 ) f(x_0,y_0)f(x0,y0)是最大值点, 因此对于所有g ( x , y ) > 0 g(x,y)>0g(x,y)>0的区域 (曲线内), f ff的取值都不可能比f ( x 0 , y 0 ) f(x_0,y_0)f(x0,y0)大, 因此, 比f ( x 0 , y 0 ) f(x_0,y_0)f(x0,y0)大的值只可能在曲线外,因此梯度方向朝外.综上,在最大值点,原函数的梯度方向和约束函数的梯度方向一定是相反的! 因此max ⁡ L ( x , y , λ ) = f ( x , y ) − λ g ( x , y ) , λ ≤ 0 max mathcal{L}(x,y,lambda)=f(x,y)-lambda g(x,y), lambdaleq0maxL(x,y,λ)=f(x,y)−λg(x,y),λ≤0或max ⁡ L ( x , y , λ ) = f ( x , y ) + λ g ( x , y ) , λ ≥ 0 max mathcal{L}(x,y,lambda)=f(x,y)+lambda g(x,y), lambdageq0maxL(x,y,λ)=f(x,y)+λg(x,y),λ≥0$

好,现在我们反过来看最大值取在

为了融合两个情况,我们引入松弛互补条件（completeness and slackness condition) $\ s.t., g(x,y)geq 0, lambdageq0, lambda g(x,y)=0maxL(x,y,λ)=f(x,y)+λg(x,y)s.t.,g(x,y)≥0,λ≥0,λg(x,y)=0求解这个问题,我们需要d L ( x , y , λ ) d x = d f ( x , y ) d x + λ d g ( x , y ) d x = 0 d L ( x , y , λ ) d y = d f ( x , y ) d y + λ d g ( x , y ) d y = 0 λ g ( x , y ) = 0 frac{dmathcal{L}(x,y,lambda)}{dx}=frac{df(x,y)}{dx}+lambdafrac{dg(x,y)}{dx}=0 \ frac{dmathcal{L}(x,y,lambda)}{dy}=frac{df(x,y)}{dy}+lambdafrac{dg(x,y)}{dy}=0 \ lambda g(x,y)=0dxdL(x,y,λ)=dxdf(x,y)+λdxdg(x,y)=0dydL(x,y,λ)=dydf(x,y)+λdydg(x,y)=0λg(x,y)=0$

查看全文

相关阅读:
Git
vue
vue
echarts,dojo和兼容问题
 js数组对象以某一对象排序
 滚动条与图片移动
 vue
vue
vue页面组件化-父子组件传值
 phpquery笔记

原文地址：https://www.cnblogs.com/hyb221512/p/13758260.html

热门文章
js 数据结构学习之栈
 js
sharepoint
js
js
js
js
js
sharepoint
vue

拉格朗日乘子法和KKT条件

等式约束

不等式约束