zoukankan      html  css  js  c++  java
  • Hermite 矩阵的特征值不等式

    将要学习

    关于 Hermite 矩阵的特征值不等式. Weyl 定理 以及推论.


    Weyl 定理

    Hermann Weyl 的如下定理是大量不等式的基础,这些不等式要么涉及两个 Hermite 矩阵之和,要么与加边的 Hermite 矩阵有关.
     
      定理1(Weyl):(A,B in M_n) 是 Hermite 矩阵,又设 (A,B) 以及 (A+B) 各自的特征值分别是 ({lambda_i(A)}_{i=1}^n, {lambda_i(B)}_{i=1}^n) 以及 ({lambda_i(A+B)}_{i=1}^n), 它们每一个都按照递增次序排列. 那么,对每一个 (i=1,cdots,n) 就有
    egin{align} label{e1}
    lambda_i(A+B) leqslant lambda_{i+j}(A) + lambda_{n-j} (B) , quad j=0,1,cdots, n-i
    end{align}
    其中的等式对某一对 (i,j) 成立,当且仅当存在一个非零向量 (x),使得 (Ax=lambda_{i+j}(A)x), (Bx=lambda_{n-j}(B)x) 以及 ((A+B)x=lambda_i(A+B)x). 又对每一个 (i=1,cdots,n)
    egin{align} label{e2}
    lambda_{i-j+1}(A)+lambda_j(B) leqslant lambda_i(A+B), quad j=1,cdots ,i
    end{align}
    其中和等式对某一对 (i,j) 成立,当且仅当存在一个非零向量 (x),使得 (Ax=lambda_{i-j+1}(A)x), (Bx=lambda_j(B)x) 以及 ((A+B)x=lambda_i(A+B)x). 如果 (B) 没有公共的特征向量,那么定理中的两个不等式都是严格不等式.
     
      证明:(x_1,cdots,x_n)(y_1,cdots,y_n) 以及 (z_1,cdots,z_n) 分别是 (A)(B) 以及 (A+B) 的标准正交的特征向量组,使得对每一个 (i=1,cdots,n) 都有 (Ax_i=lambda_i(A)x_i)(By_i=lambda_i(B)y_i) 以及 ((A+B)z_i=lambda_i(A+B)z_i). 对给定的 (i in {1,cdots,n}) 以及任意的 (j in {0,cdots,n-i}), 设 (S_1 =mathrm{span} {x_1,cdots,x_{i+j}})(S_2 =mathrm{span} {y_1,cdots,y_{n-j}})(S_3 =mathrm{span} {z_i,cdots,z_n}). 那么
    egin{align}
    mathrm{dim}S_1 + mathrm{dim}S_2 + mathrm{dim}S_3 = (i+j) +(n-j) + (n-i+1) = 2n+1
    end{align}
    所以有子空间的交引理知,存在一个单位向量 (x in S_1 cap S_2 cap S_3). 借助Rayleigh 商定理三次就得到两个不等式
    egin{align}
    lambda_i(A+B) leqslant x^*(A+B)x = x^*Ax + x^*Bx leqslant lambda_{i+j}(A) + lambda_{n-j}(B)
    end{align}
    第一个不等式由 (x in S_3) 得出,而第二个不等式则分别由 (x in S_1) 以及 (x in S_3) 得出. ( ef{e1} ) 中关于等式成立情形的命题由 Rayleigh 商定理中单位向量 (x) 成立等式的情形以及下诸不等式推出:(x^*Ax leqslant lambda_{i+j}(A))(x in S_1)(x^*Bx leqslant lambda_{n-j}(B))(x in S_2) 以及 $ lambda_i(A+B) leqslant x^*(A+B)x(,)x in S_3$.
    不等式 ( ef{e2}) 以及它们的等式成立的情形可通过将 ( ef{e1}) 应用于 (-A,-B) 以及 (-(A+B)) 得出:
    egin{align}
    -lambda_{n-i+1}(A+B) =lambda_i(-A-B) leqslant lambda_{i+j}(-A) + lambda_{n-j}(-B) = -lambda_{n-i-j+1}(A) -lambda_{j+1}(B)
    end{align}
    如果我们令 (i'=n-i+1) 以及 (j'=j+1), 则上一个不等式就变成
    egin{align}
    lambda_{i'}(A+B) geqslant lambda_{i'-j'+1}(A) + lambda_{j'}(B), quad j'=1,cdots, i'
    end{align}
    这就是 ( ef{e2}).
    如果 (A)(B) 没有公共的特征向量,那么 ( ef{e1}) 和 ( ef{e2}) 中等式成立的必要条件就不可能满足.
     
    Weyl 定理描述了一个 Hermite 矩阵 (A) 的特征值如果受到另一个 Hermite 矩阵 (B) 加性的扰动可能会发生什么. 关于扰动矩阵 (B) 的各种不同的条件会导致出现 ( ef{e1}) 和 ( ef{e2}) 的各种特例的不等式.

    重要推论

    接下来讲述的推论中,特征值仍是递增排序. 下面给个小例子,以便引出推论. 设 (B in M_n) 是 Hermite 矩阵. 如果 (B) 恰好有 (pi) 个正的特征值,而且恰好有 ( u) 个负特征值,则 (lambda_{n-pi}(B) leqslant 0) 以及 (lambda_{ u+1}(B) geqslant 0), 其中的等式当且仅当 (n>pi + u), 也即当且仅当 (B) 是奇异矩阵时成立.
     
      推论1:(A,Bin M_n) 是 Hermite 矩阵. 如果 (B) 恰好有 (pi) 个正的特征值,而且恰好有 ( u) 个负的特征值,那么
    egin{align} label{e11}
    lambda_i(A+B) leqslant lambda_{i+pi}(A),quad i=1,cdots,n-pi
    end{align}
    其中等式对某个 (i) 成立,当且仅当 (B) 是奇异的且存在非零向量 (x), 使得 (Ax=lambda_{i+pi}(A) x)(Bx=0) 以及 ((A+B)x=lambda _i(A+B)x). 我们还有
    egin{align} label{e12}
    lambda_{i- u}(A) leqslant lambda_i(A+B),quad i= u +1,cdots, n
    end{align}
    其中等式对某个 (i) 成立,当且仅当 (B) 是奇异的且存在一个非零向量 (x), 使得 (Ax=lambda_{i- u}(A) x)(Bx=0) 以及 ((A+B)x=lambda _i(A+B)x). 如果 ( ef{e11}) 中 (B) 是非奇异的或者式 ( ef{e12}) 中对 (A) 的每一个特征向量都有 (Bx eq 0), 则上述两个不等式都是严格不等式.
     
    对上述推论,再举个特例,设 (B in M_n) 是 Hermite 矩阵. 如果 (B) 是奇异的,且 (mathrm{rank}\,B=r),由于 (B) 是 Hermite 矩阵,则其可以酉对角化,所以 (B) 的非零特征值的个数肯定等于 (r), 则 (lambda_{n-r} (B) leqslant 0) 以及 (lambda_{r+1} geqslant 0)(在上个推论中令 (A=0) 也可得到同样的结果.)
     
      推论2:(A,Bin M_n) 是 Hermite 矩阵. 假设 (B) 是奇异的,且 (mathrm{rank}\,B=r),那么
    egin{align} label{e13}
    lambda_i(A+B) leqslant lambda_{i+r}(A),quad i=1,cdots,n-r
    end{align}
    其中等式对某个 (i) 成立,当且仅当 (lambda_{n-r}(B) = 0),且存在一个非零向量 (x),使得 (Ax=lambda_{i+r}(A)x)(Bx=0) 以及 ((A+B)x=lambda_i(A+B)x). 又有
    egin{align} label{e14}
    lambda_{i-r}(A) leqslant lambda_i(A+B),quad i=r+1,cdots,n
    end{align}
    其中等式对某个 (i) 成立,当且仅当 (lambda_{i+1}(B)=0),且存在一个非零向量 (x),使得 (Ax=lambda_{i-r}(A)x)(Bx=0) 以及 ((A+B)x=lambda _i(A+B)x). 如果 (A) 的每个特征向量 (x) 都有 (Bx eq 0), 则上述两个不等式都是严格不等式.
     
    (B in M_n) 是 Hermite 矩阵. 如果 (B) 恰有一个正的特征值且恰有一个负的特征值,则 (lambda_2(B) geqslant 0)(lambda_{n-1}(B) leqslant 0),其中的等式当且仅当 (n>2) 时成立.
     
      推论3:(A,Bin M_n) 是 Hermite 矩阵. 假设 (B) 恰有一个正的特征值且恰有一个负的特征值,那么
    egin{align}
    & lambda_1(A+B) leqslant lambda_2(A) otag \ label{e8}
    & lambda_{i-1}(A) leqslant lambda_i(A+B) leqslant lambda_{i+1}(A), quad i=2,cdots, n-1 \
    & lambda_{n-1}(A) leqslant lambda_n(A+B) otag
    end{align}
    等式对 (pi = u =1) 成立,例如, (lambda_i(A+B) = lambda_{i+1}(A)) 当且仅当 (n>2) 且存在一个非零向量 (x),使得 (Ax=lambda_{i+1}(A)x)(Bx=0) 以及 ((A+B)x=lambda_i(A+B)x) 时成立. 如果 (n=2) 或者对 (A) 的每个特征向量 (x)(Bx eq 0),那么上述三个不等式都是严格的不等式.
     
    假设 (z in mathbb{C}^n) 是非零的且 (n geqslant 2). 则 (zz^*) 的秩为 (1) 且只有一个正的特征值,所以 (lambda_{n-1}(zz^*)=0=lambda_1(zz^*)).
    下面的推论称为关于 Hermite 矩阵的秩 (1)-Hermite 摄动的交错定理.
     
      推论4:(n geqslant 2)(A in M_n) 是 Hermite 矩阵,又设 (z in mathbb{C}^n) 是非零向量. 那么
    egin{align}
    & lambda_i(A) leqslant lambda_i(A+zz^*) leqslant lambda_{i+1}(A),quad i=1,cdots,n-1 \
    & lambda_n(A) leqslant lambda_n (A+zz^*) otag
    end{align}
    上式中的等式对 (pi=1) 以及 ( u =0) 成立,例如,(lambda_i(A+zz^*) = lambda_{i+1}(A)) 当且仅当存在一个非零向量 (x),使得 (Ax=lambda_{i+1}(A)x)(z^*x=0) 以及 ((A+zz^*)x=lambda_i(A+zz^*)x). 又有
    egin{align}
    & lambda_1(A-zz^*) leqslant lambda_1(A) \
    & lambda_{i-1}(A) leqslant lambda_i (A-zz^*) leqslant lambda_i(A),quad i=2,cdots,n otag
    end{align}
    上式中的等式对 (pi=0) 以及 ( u =1) 成立. 如果 (A) 没有特征向量与 (z) 正交,那么上边每一个不等式都是严格的不等式.
     
    (B in M_n) 是半正定的,则 (lambda_1(B)=0) 当且仅当 (B) 是奇异的.
    下面的推论称为单调定理.
     
      推论5:(A,B in M_n) 是 Hermite 矩阵,并假设 (B) 是半正定的. 那么
    egin{align}
    lambda_i(A) leqslant lambda_i(A+B),quad i=1,cdots,n
    end{align}
    其中等式对某个 (i) 成立,当且仅当 (B) 是奇异的,且存在一个非零向量 (x),使得 (Ax=lambda_i(A)x)(Bx=0) 以及 ((A+B)x=lambda_i(A+B)x). 又如果 (B) 是正定的,那么
    egin{align}
    lambda_i(A) < lambda_i(A+B),quad i=1,cdots,n
    end{align}
     
    设给定 (y in mathbb{C}^n) 以及 (a in mathbb{R}),又设 (mathcal{K} = egin{bmatrix} 0_n & y \ y^* & a end{bmatrix} in M_{n+1}). 由加边矩阵的行列式的 Cauchy 展开式 (mathrm{det} egin{bmatrix} A & x \ y^T & a end{bmatrix} =a\,mathrm{det} \,A -y^T(mathrm{adj}\,A)x) 得:(mathcal{K}) 的特征值是 ((a pm sqrt{a^2+4y^*y})/2) 再加上 (n-1) 个为零的特征值. 如果 (y eq 0),推出结论:(mathcal{K}) 恰好有一个正的特征值,也恰好有一个负的特征值.
     
    Weyl 不等式以及它们的推论考虑的是 Hermite 矩阵的加性 Hermite 摄动. 从 Hermite 矩阵中取出一个主子矩阵,或者通过对它加边作成一个更大的 Hermite 矩阵,都会出现加性的特征值不等式. 下面的结果是关于加边的 Hermite 矩阵的 Cauchy 交错定理,有时它也称为分离定理.
     
      定理2(Cauchy):(B in M_n) 是 Hermite 矩阵,设给定 (y in mathbb{C}^n) 以及 (a in mathbb{R}),又设 (A = egin{bmatrix} B & y \ y^* & a end{bmatrix} in M_{n+1}). 那么
    egin{align} label{e18}
    lambda_1(A) leqslant lambda_1(B) leqslant lambda_2(A) leqslant cdots leqslant lambda_n(A) leqslant lambda_n(B) leqslant lambda_{n+1}(A)
    end{align}
    其中 (lambda_i(A)=lambda_i(B)) 成立的充分必要条件是:存在一个非零的 (z in mathbb{C}^n),使得 (Bz=lambda_i(B)z)(y^*z=0),以及 (Bz=lambda_i(A)z)(lambda_i(B)=lambda_{i+1}(A)) 成立的充分必要条件是:存在一个非零的 (z in mathbb{C}^n),使得 (Bz=lambda_i(B)z)(y^*z=0),以及 (Bz=lambda_{i+1}(A)z). 如果 (B) 没有与 (y) 正交的特征向量,则上式中的每一个不等式都是严格不等式.
     
      证明: 如果我们用 (A+mu I_{n+1}) 代替 (A)(这就用 (B+mu I) 代替了 (B)),那么结论中有序排列中的特征值的交错性不变. 于是,不失一般性,可以假设 (B)(A) 是正定的. 考虑 Hermite 矩阵 $mathcal{H} =egin{bmatrix} B & 0 \ 0 & 0_1 end{bmatrix} $ 以及 $mathcal{K}= egin{bmatrix} 0_n & y \ y^* & a end{bmatrix} $,对它们有 (A=mathcal{H}+mathcal{K}). (mathcal{H}=Boplus [0]) 的有序排列的特征值是 (lambda_1(mathcal{H})=0 < lambda_1(B)=lambda_2(mathcal{H}) leqslant lambda_2(B) = lambda_3(mathcal{H}) leqslant cdots),即对所有 (i=1,cdots,n) 都有 (lambda_{i+1}(mathcal{H}) = lambda_i(B)). 由于 $mathcal{K} $ 恰好有一个正的特征值和一个负的特征值,故而不等式 ( ef{e8}) 确保
    egin{align} label{e19}
    lambda_i(A) = lambda_{i}(mathcal{H} + mathcal{K}) leqslant lambda_{i+1}(mathcal{H}) = lambda_i(B), quad i=1,cdots,n
    end{align}
    对一个给定的 (i),( ef{e19}) 中等式成立的必要与充分条件表述在推论 3 中:存在一个非零的 (x in mathbb{C}^{n+1}),使得 (mathcal{H}x = lambda_{i+1}(mathcal{H})x)(mathcal{K}x=0)(Ax=lambda_i(A)x). 如果我们用 (z in mathbb{C}^n) 来分划 $x= egin{bmatrix} z \ xi end{bmatrix} $ 并利用恒等式 (lambda_{i+1}(mathcal{H}) = lambda_i(B)),计算揭示这些条件对于以下结论是等价的:存在一个非零的 (z in mathbb{C}^n),使得 (Bz=lambda_i(B)z)(y^*z=0),以及 (Bz=lambda_i(A)z). 特别地,如果 (B) 没有与 (y) 正交的特征向量,那么就不存在 (i),使得必要条件 (z eq 0)(Bz=lambda_i(B)z) 以及 (y^*z=0) 能得到满足.
    (i=1,cdots,n),不等式 (lambda_i(B) leqslant lambda_{i+1}(A)) 可以通过将 ( ef{e19}) 应用于 (-A) 得到:
    egin{align} label{e20}
    -lambda_{(n+1)-i+1}(A) = lambda_i(-A) leqslant lambda_i(-B) = -lambda_{n-i+1}(B)
    end{align}
    如果置 (i'=n-i+1),我们就对 (i'=1,cdots,n) 得到等价的不等式 (lambda_{i'+1}(A) geqslant lambda_{i'}(B)). ( ef{e20}) 中等式出现的情形再次由推论 3 得出.
     
    我们已经讨论了特征值交错定理的两个例子:如果一个给定的 Hermite 矩阵或者通过增加一个秩 1 的 Hermite 矩阵或者通过加边来加以修改,那么新旧特征值必定是交错的. 下面不加证明的给出这些定理的逆.
     
      定理3:(lambda_1,cdots, lambda_n) 以及 (mu_1,cdots, mu_n) 是满足交错不等式
    egin{align}
    lambda_1 leqslant mu_1 leqslant lambda_2 leqslant mu_2 leqslant cdots leqslant lambda_n leqslant mu_n
    end{align}
    的实数. 设 (Lambda= mathrm{diag} {lambda_1,cdots, lambda_n}). 那么存在一个实向量 (z in mathbb{R}^n), 使得 (Lambda+zz^*) 的特征值是 (mu_1,cdots,mu_n).
     
     


    应该知道什么

    • Weyl 定理:$lambda_i(A+B) leqslant lambda_{i+j}(A) + lambda_{n-j} (B) $ 与 (lambda_{i-j+1}(A)+lambda_j(B) leqslant lambda_i(A+B))
    • Hermite 矩阵非零特征值的个数等于其秩的大小
    • 假设 (z in mathbb{C}^n) 是非零的且 (n geqslant 2). 则 (zz^*) 的秩为 (1) 且只有一个正的特征值
    • 如果一个给定的 Hermite 矩阵或者通过增加一个秩 1 的 Hermite 矩阵或者通过加边来加以修改,那么新旧特征值必定是交错的.
  • 相关阅读:
    数组下标索引的循环原来可以这样写
    移位运算>>与>>>
    java调用redis的多种方式与心得
    $.ajax传输js数组,spring接收异常
    div背景css样式笔记
    js监听网页页面滑动滚动事件,实现导航栏自动显示或隐藏
    设置系统时区
    安装与配置文本编辑器vim
    添加阿里云数据源
    spring controller获取web前端post数据乱码解决
  • 原文地址:https://www.cnblogs.com/zhoukui/p/8031380.html
Copyright © 2011-2022 走看看