murongxixi的凸优化笔记

zoukankan html css js c++ java

murongxixi的凸优化笔记
http://www.cnblogs.com/murongxixi/p/3598645.html

在前两节里已经涉及到集合的相对内部与闭包的概念，这一节我们深入研究它们的性质和计算，之后介绍凸函数的连续性以及函数闭包的概念。

设凸集(C)是(mathbb{R}^n)的非空子集，由命题1.1.2(4)知，其闭包(cl(C))是非空凸集，其内部(int(C))也是凸集，但是可能是空的((mathbb{R}^3)中的集合(S={ oldsymbol{x} in mathbb{R}^3 | x_1^2 + x_2^2 leq 1, x_3 = 1 })就是如此)，为此我们需要引入相对内部的定义。

集合(C)是非空凸集，若(oldsymbol{x} in C)且存在一个以(oldsymbol{x})为球心的开球(B(oldsymbol{x}, varepsilon))满足(B cap aff(C) subseteq C)，则称(oldsymbol{x})是(C)的相对内部点(relative interior point)，(C)的所有相对内部点的集合称作(C)的相对内部(relative interior)，记为(ri(C))。若(ri(X) = X)，则称集合(X)是相对开的，(cl(X))中不属于(ri(X))的点称为(X)的相对边界点(relative boundary point)，(C)的所有相对边界点的集合称作(C)的相对边界(relative boundary)。

我们约定单点集的相对内部就是它本身。继续考虑之前那个例子，可以发现虽然(int(S) = emptyset)，但(ri(S) = { oldsymbol{x} in mathbb{R}^3 | x_1^2 + x_2^2 < 1, x_3 = 1 })，已经不再是空集了。

命题1.3.1：集合(C)是非空凸集，若(oldsymbol{x} in ri(C))，(ar{oldsymbol{x}} in cl(C))，则连接(oldsymbol{x})和(ar{oldsymbol{x}})的线段上，除(ar{oldsymbol{x}})外的所有点都属于(ri(C))。

证明：参考右图，分两种情况：

若(ar{oldsymbol{x}} in C)，由于(oldsymbol{x} in ri(C))，故存在开球(S = {oldsymbol{z} | ||oldsymbol{z} - oldsymbol{x}|| < epsilon})使得(S cap aff(C) subseteq C)。对于任意(alpha in (0,1])，设(oldsymbol{x}_alpha = alpha oldsymbol{x} + (1 - alpha) ar{oldsymbol{x}})且(S_alpha = {oldsymbol{z} | ||oldsymbol{z} - oldsymbol{x}_alpha|| < alpha epsilon} )，于是(S_alpha cap aff(C))中的任意一点都可以看成(S cap aff(C))中某点与(ar{oldsymbol{x}})的凸组合，由(C)的凸性知(S_alpha cap aff(C) subseteq C)，故(oldsymbol{x}_alpha in ri(C))。

若(ar{oldsymbol{x}} ot in C)，由于(oldsymbol{x} in ri(C))，故存在开球(S = {oldsymbol{z} | ||oldsymbol{z} - oldsymbol{x}|| < epsilon})使得(S cap aff(C) subseteq C)。对于任意(alpha in (0,1])，设(oldsymbol{x}_alpha = alpha oldsymbol{x} + (1 - alpha) ar{oldsymbol{x}})，下面证明(oldsymbol{x}_alpha in ri(C))。考虑收敛于(ar{oldsymbol{x}})的序列({oldsymbol{x}_k} subseteq C)，设(oldsymbol{x}_{k,alpha} = alpha oldsymbol{x} + (1 - alpha) oldsymbol{x}_k)，显然({ oldsymbol{z} | ||oldsymbol{z} - oldsymbol{x}_{k,alpha} || < alpha epsilon} cap aff(C) subseteq C)。又(oldsymbol{x}_{k,alpha} ightarrow oldsymbol{x}_alpha)，故当(k)足够大时有egin{align*} { oldsymbol{z} | ||oldsymbol{z} - oldsymbol{x}_alpha || < alpha epsilon / 2} subseteq { oldsymbol{z} | ||oldsymbol{z} - oldsymbol{x}_{k,alpha} || < alpha epsilon } end{align*} 这意味着({ oldsymbol{z} | ||oldsymbol{z} - oldsymbol{x}_alpha || < alpha epsilon / 2} cap aff(C) subseteq C )，故(oldsymbol{x}_alpha in ri(C))。

直观看来，命题1.3.1很简单，但是证明叙述起来却挺麻烦，它的一个推论是如下命题，也是一个直观很简单证明起来很麻烦的命题。

命题1.3.2：集合(C)是非空凸集，则
1. (ri(C))是非空凸集且(aff(ri(C)) = aff(C))。
2. 若(aff(C))的维度为(m > 0)，那么存在(oldsymbol{x}_0, oldsymbol{x}_1, dots, oldsymbol{x}_m in ri(C))使得(oldsymbol{x}_1 - oldsymbol{x}_0, dots, oldsymbol{x}_m - oldsymbol{x}_0)张成平行于(aff(C))的子空间。
证明：
1. 由命题1.3.1知(ri(C))是凸的，下面证明其非空，不妨设(oldsymbol{0} in C)，否则可以将(C)平移使其包含(oldsymbol{0} )，这不影响结论，这样(aff(C))就是一个(m)维子空间了。
  如果(m = 0)，那么(C)和(aff(C))就是一个点，由于单点集的相对内部就是它本身，故此时(ri(C))非空。若(m > 0)，那么可以找到(m)个线性无关的向量(oldsymbol{z}_1, dots, oldsymbol{z}_m in C)张成了(aff(C))，即(oldsymbol{z}_1, dots, oldsymbol{z}_m)是(aff(C))的一组基。考虑集合egin{align*}X = left{ oldsymbol{x} | oldsymbol{x} = sum_{i=1}^m alpha_i oldsymbol{z}_i, sum_{i=1}^m alpha_i < 1, alpha > 0,i = 1, dots, m ight},end{align*}如右图所示，由于(C)的凸性，于是(X subseteq C)(可以将(X)中的所有元素视为(oldsymbol{z}_1, dots, oldsymbol{z}_m, oldsymbol{0} )的凸组合)。下面证明(X)是(aff(C))中的相对开集，对于(forall ar{oldsymbol{x}} in X)，设(oldsymbol{x} in aff(C))，那么有(ar{oldsymbol{x}} = oldsymbol{Z} ar{oldsymbol{alpha}})和(oldsymbol{x} = oldsymbol{Z} oldsymbol{alpha} )，其中(oldsymbol{Z} = [oldsymbol{z}_1, dots, oldsymbol{z}_m] in mathbb{R}^{n imes m})，(ar{oldsymbol{alpha}})和(oldsymbol{alpha})分别是唯一的(m)维向量((oldsymbol{z}_1, dots, oldsymbol{z}_m)是(aff(C))的一组基)。易知(oldsymbol{Z}^ op oldsymbol{Z})对称半正定，又(oldsymbol{Z})满秩，故(oldsymbol{Z}^ op oldsymbol{Z})正定，由Rayleigh's不等式知，存在(gamma geq lambda_{min}(oldsymbol{Z}^ op oldsymbol{Z}))满足 egin{align} label{equ: Rayleigh} || oldsymbol{x} - ar{oldsymbol{x}} ||^2 = (oldsymbol{alpha} - ar{oldsymbol{alpha}})^ op oldsymbol{Z}^ op oldsymbol{Z}^ op (oldsymbol{alpha} - ar{oldsymbol{alpha}}) geq gamma ||oldsymbol{alpha} - ar{oldsymbol{alpha}}||^2, end{align} 其中，(lambda_{min}(oldsymbol{Z}^ op oldsymbol{Z}))是(oldsymbol{Z}^ op oldsymbol{Z})的最小特征值。由于(ar{oldsymbol{x}} in X)，故(ar{oldsymbol{alpha}} in A)，其中 egin{align*}A = left{ (alpha_1, dots, alpha_m) | sum_{i=1}^m alpha_i < 1, alpha > 0,i = 1, dots, m ight}, end{align*}
  由式( ef{equ: Rayleigh})可知(|| oldsymbol{x} - ar{oldsymbol{x}} ||^2 ightarrow0)时有(|| oldsymbol{alpha} - ar{oldsymbol{alpha}} ||^2 ightarrow0)，即如果(oldsymbol{x})在以(ar{oldsymbol{x}})为球心的充分小的球里，则(oldsymbol{alpha} in A)，故(oldsymbol{x} in X)，这意味着存在一个以(ar{oldsymbol{x}})为球心的充分小的球(B)使得(B cap aff(C) in X)，由(ar{oldsymbol{x}})的任意性知(X)中的每个点都是(C)的相对内部点，故(ri(C)) 是非空。由(X)的构造过程易知(aff(X) = aff(C))，又(X subseteq ri(C))，故(aff(ri(C)) = aff(C))。
2. 由(a)中证明知(ri(C))非空，故至少存在(oldsymbol{x}_0 in ri(C))，将(C)平移(oldsymbol{x}_0)，即将(oldsymbol{x}_0)移到原点，新的集合为(C - oldsymbol{x}_0)，设(oldsymbol{z}_1, dots, oldsymbol{z}_m in C - oldsymbol{x}_0)且张成了(C - oldsymbol{x}_0)，(alpha in (0, 1))，因为(oldsymbol{0} in ri(C - oldsymbol{x}_0))，由命题1.3.1知，(alpha oldsymbol{z}_i in C - oldsymbol{x}_0, i = 1, dots, m)，这意味着(oldsymbol{x}_i = oldsymbol{x}_0 + alpha oldsymbol{z}_i in ri(C), i = 1, dots, m)且(oldsymbol{x}_1 - oldsymbol{x}_0, dots, oldsymbol{x}_m - oldsymbol{x}_0)张成了(aff(C))。
下面这个命题也是命题1.3.1的一个推论，直观来说，它陈述了这样一个显而易见的事实，如果一个点是某个非空凸集的相对内部点，那么以该点为端点且属于该凸集的任意线段在该点处延长一小段后都不会离开该凸集。

命题1.3.3：集合(C)是非空凸集，(oldsymbol{x} in ri(C))当且仅当对(forall ar{oldsymbol{x}} in C)，存在(gamma > 0)使得(oldsymbol{x} + gamma(oldsymbol{x} - ar{oldsymbol{x}}) in C)。

证明：一方面，若(oldsymbol{x} in ri(C))，由相对内部点的定义知对(forall ar{oldsymbol{x}} in C)，存在(gamma > 0)使得(oldsymbol{x} + gamma(oldsymbol{x} - ar{oldsymbol{x}}) in C)。

另一方面，若(oldsymbol{x})满足所给条件，设(ar{oldsymbol{x}} in ri(C))(由命题1.3.2知(ar{oldsymbol{x}}) 存在)，若(oldsymbol{x} = ar{oldsymbol{x}})，结论已成立，不妨设(oldsymbol{x} eq ar{oldsymbol{x}})，由所给条件，存在(gamma > 0) 使得(oldsymbol{y} = oldsymbol{x} + gamma(oldsymbol{x} - ar{oldsymbol{x}}) in C)，即(oldsymbol{x})在以(oldsymbol{y})和(ar{oldsymbol{x}})为端点的线段的内部，又(ar{oldsymbol{x}} in ri(C))，(oldsymbol{y} in C)，由命题1.3.1知(oldsymbol{x} in ri(C))。

今后我们将会看到，相对内部这个概念在凸优化和对偶理论里是无处不在的，下面这个命题就是一个例子。

命题1.3.4：集合(C)是(mathbb{R}^n)的非空凸子集，(f: X mapsto mathbb{R})是凹函数，设 egin{align*} X^* = left{ oldsymbol{x}^* in X | f(oldsymbol{x}^*) = inf_{oldsymbol{x} in X} f(oldsymbol{x}) ight}. end{align*}若(X^*)包含(X)的相对内部点，则(f)必是(X)上的常数函数，也即(X^* = X)。

证明：设(oldsymbol{x}^* in X^* cap ri(X))，(oldsymbol{x})是(X)中任意向量，由命题1.3.3知存在(gamma > 0)使得 egin{align*} hat{oldsymbol{x}} = oldsymbol{x}^* + gamma (oldsymbol{x}^* - oldsymbol{x}) in X end{align*} 又 egin{align*} oldsymbol{x}^* = frac{1}{gamma+1} hat{oldsymbol{x}} + frac{gamma}{gamma+1} oldsymbol{x} end{align*} 由(f)的凹性知 egin{align*} f(oldsymbol{x}^*) geq frac{1}{gamma+1} f(hat{oldsymbol{x}}) + frac{gamma}{gamma+1} f(oldsymbol{x}) end{align*} 由于(f(hat{oldsymbol{x}}) geq f(oldsymbol{x}^*))，(f(oldsymbol{x}) geq f(oldsymbol{x}^*))，代入上式可得 egin{align*} f(oldsymbol{x}^*) geq frac{1}{gamma+1} f(hat{oldsymbol{x}}) + frac{gamma}{gamma+1} f(oldsymbol{x}) geq frac{1}{gamma+1} f(oldsymbol{x}^*) + frac{gamma}{gamma+1} f(oldsymbol{x}^*) = f(oldsymbol{x}^*), end{align*} 故(f(oldsymbol{x}) = f(oldsymbol{x}^*))。

注意线性函数也是凹函数，因此由命题1.3.4可知，除非线性函数在整个可行域上为常数，否则只可能在可行域的相对边界取得极值。

为了今后处理问题方便，我们有必要建立起相对内部和闭包的运算法则，总结起来就是下面的5个命题。
1. 两个非空凸集有相同的闭包当且仅当它们有相同的相对内部(命题1.3.5)。
2. 在线性变换下，相对内部可以保持，闭包不一定能保持，保持的前提是该非空凸集有界(命题1.3.6)。
3. 在Cartesian积下，相对内部和闭包都可以保持；在向量加和下，相对内部可以保持，闭包不一定能保持，保持的前提是至少其中一个非空凸集有界(命题1.3.7)。
4. 在线性逆变换积下，相对内部和闭包都可以保持(命题1.3.8)。
5. 在集合交下，相对内部和闭包都不一定能保持，保持的前提是两个集合的相对内部的交集非空(命题1.3.9)。
命题1.3.5：集合(C)是非空凸集，那么
1. (cl(C) = cl(ri(C)))。
2. (ri(C) = ri(cl(C)))。
3. 设(ar{C})是另一个非空凸集，则如下3个条件等价：
证明：
1. 一方面，由(ri(C) subseteq C)易知有(cl(ri(C)) subseteq cl(C))。另一方面，设(ar{oldsymbol{x}} in cl(C))，对于(forall oldsymbol{x} in ri(C))(由命题1.3.2知(oldsymbol{x})存在)，若(oldsymbol{x} = ar{oldsymbol{x}})，结论已成立，不妨设(oldsymbol{x} eq ar{oldsymbol{x}})，由命题1.3.1知对于(forall alpha in (0, 1])有(alpha oldsymbol{x} + (1 - alpha)ar{oldsymbol{x}} in ri(C))，因此(ar{oldsymbol{x}})是序列( left{ frac{1}{k}oldsymbol{x} + (1 - frac{1}{k})ar{oldsymbol{x}} | k geq 1 ight})的极限，由于该序列属于(ri(C))，故(ar{oldsymbol{x}} in cl(ri(C)))，于是(cl(C) subseteq cl(ri(C)))。
2. 一方面，对于(forall oldsymbol{x} in ri(C))，存在以(oldsymbol{x})为球心的球(B)满足(B cap aff(C) subseteq C)，由命题1.2.1知(aff(C) = aff(cl(C)))，故(B cap aff(cl(C)) subseteq C subseteq cl(C))，这意味着(oldsymbol{x} in ri(cl(C)))，于是(ri(C) subseteq ri(cl(C)))。另一方面，设(oldsymbol{z} in ri(cl(C)))，由命题1.3.2知存在(oldsymbol{x} in ri(C))，若(oldsymbol{x} = oldsymbol{z})，结论已成立，不妨设(oldsymbol{x} eq oldsymbol{z})，由命题1.3.3知对于充分接近(0)的(gamma > 0)有(oldsymbol{y} = oldsymbol{z} + gamma(oldsymbol{z} - oldsymbol{x}) in cl(C))，那么(oldsymbol{z} = (1 - alpha) oldsymbol{x} + alpha oldsymbol{y})，其中(alpha = frac{1}{gamma + 1} in (0, 1))，由命题1.3.1知(oldsymbol{z} in ri(C))。
3. 先证前两者。一方面，若(ri(C) = ri(ar{C}))，由(1)知(cl(C) = cl(ri(C)) = cl(ri(ar{C})) = cl(ar{C})))。另一方面，若(cl(C) = cl(ri(ar{C})))，由(2)知(ri(C) = ri(cl(C)) = ri(cl(ar{C})) = ri(ar{C}))。
  再证前两者和第三者等价。一方面，由(ri(ar{C}) subseteq ar{C} subseteq cl(ar{C}))知(ri(C) subseteq ar{C} subseteq cl(C))。另一方面，若(ri(C) subseteq ar{C} subseteq cl(C))，取闭包知(cl(ri(C)) subseteq cl(ar{C}) subseteq cl(C))，由(1)知(cl(ri(C)) subseteq cl(ar{C}) subseteq cl(C) = cl(ri(C)))，故(cl(ar{C}) = cl(C))。
命题1.3.6：集合(C)是(mathbb{R}^n)的非空凸子集，矩阵(oldsymbol{A} in mathbb{R}^{m imes n})，那么
1. (oldsymbol{A} cdot ri(C) = ri(oldsymbol{A} cdot C))。
2. (oldsymbol{A} cdot cl(C) subseteq cl(oldsymbol{A} cdot C))，若(C)有界，则(oldsymbol{A} cdot cl(C) = cl(oldsymbol{A} cdot C))。
证明：
查看全文

相关阅读:
【转】Linux平台上用C++实现多线程互斥锁
 【转】用C++实现多线程Mutex锁（Win32）
【转】ACM国内外OJ网站大集合
 【转】常用 blas 函数
 浏览器插件检查
 自定义事件
 JavaScript对象继承方式与优缺点
 如何页面减少重绘回流
 CSS3特效（3）——环形进度条
 CSS3特效（2）——文字特效

原文地址：https://www.cnblogs.com/xiaoxuesheng993/p/8819087.html