zoukankan      html  css  js  c++  java
  • 么正矩阵(酉矩阵)


    本文的阅读等级:中级

    一实(或复) 正交矩阵(orthogonal matrix) Q 是一个实(或复) 方阵满足

    Q^TQ=QQ^T=I

    Q^{-1}=Q^T 写出 n	imes n 阶实正交矩阵的行向量(column vector) 表达, Q=egin{bmatrix}  mathbf{q}_1&cdots&mathbf{q}_n  end{bmatrix} ,则 (Q^TQ)_{ij}=mathbf{q}_i^Tmathbf{q}_j=(I)_{ij} ,矩阵乘积 Q^TQ (i,j) 元等于 mathbf{q}_i mathbf{q}_j 的内积。 因此, mathbf{q}_i^Tmathbf{q}_j=delta_{ij}=0 i
eq j mathbf{q}_i^Tmathbf{q}_j=delta_{ij}=1 i=j 换句话说,实正交矩阵 Q 的行向量 {mathbf{q}_1,ldots,mathbf{q}_n} 是向量空间 mathbb{R}^n 的一组单范正交基底(orthonormal basis),单范表示归一, mathbf{q}_i 是单位向量,正交意味 mathbf{q}_i 垂直 mathbf{q}_j 不过,复正交矩阵的行向量并非 mathbb{C}^n 的一个单范正交集,因为两个复向量 mathbf{x} mathbf{y} 的内积定义为 mathbf{x}^astmathbf{y}=overline{mathbf{x}}^Tmathbf{y} (见“ 内积的定义 ”)。 如欲将实正交矩阵推广至复矩阵,将转置改为共轭转置。 一么正矩阵(酉矩阵,unitary matrix) U 是一个复方阵满足

    U^ast U=UU^ast=I

    U^{-1}=U^ast 同样地,设 U=egin{bmatrix}  mathbf{u}_1&cdots&mathbf{u}_n  end{bmatrix} ,则 (U^ast U)_{ij}=mathbf{u}_i^astmathbf{u}_j=(I)_{ij} 么正矩阵的行向量 {mathbf{u}_1,ldots,mathbf{u}_n} 是向量空间 mathbb{C}^n 的一组单范正交基底。 例如,

    U=egin{bmatrix}  displaystylefrac{1+i}{2}&displaystylefrac{1+i}{2}\[0.8em]    displaystylefrac{1-i}{2}&displaystylefrac{-1+i}{2}    end{bmatrix}

    其中 i=sqrt{-1} 因为 (U^ast)^ast=U ,若 U 是一么正矩阵,则 U^ast 也是么正矩阵。 所以,么正矩阵 U 的共轭列向量(row vector) 构成 mathbb{C}^n 的一个单范正交集(事实上, U 的列向量即构成单范正交集,因为 overline{U}^ast\,overline{U}=overline{U}\,overline{U}^ast=I overline{U} 也是么正矩阵)。 类似地,实正交矩阵 Q 的列向量构成 mathbb{R}^n 的一个单范正交集。 在一般情况下,么正矩阵与复正交矩阵是不同的,但实么正矩阵与实正交矩阵是相同的。 所以,么正矩阵的所有性质皆可套用于实正交矩阵。


    么正矩阵出现于许多矩阵分解式,举两个例子。 第一是矩阵三角化的Schur 定理:任一方阵 A 可分解为 A=UTU^ast ,其中 U 是一么正矩阵, T 是上三角矩阵(见“ 矩阵三角化的Schur定理 ”)。 第二是正规矩阵(normal matrix) 的么正对角化(unitarily diagonalizable):若 A 为一正规矩阵, A^ast A=AA^ast ,则存在一么正矩阵 U 使得 A=ULambda U^ast ,其中 Lambda 为一对角矩阵(见“ 特殊矩阵(2):正规矩阵 ”)。 事实上,可么正对角化是正规矩阵的一个充要条件。


    以下令 U 为一 n	imes n 阶么正矩阵,所有的性质都是由定义式得来。


    性质1 .向量的长度不因么正变换而改变,即每一 mathbf{x}inmathbb{C}^n

    Vert Umathbf{x}Vert=Vertmathbf{x}Vert

    性质1说明么正变换是一个保长((length-preserving) 变换。使用定义式,

    Vert Umathbf{x}Vert^2=(Umathbf{x})^{ast}(Umathbf{x})=mathbf{x}^{ast}U^{ast}Umathbf{x}=mathbf{x}^{ast}Imathbf{x}=mathbf{x}^astmathbf{x}=Vertmathbf{x}Vert^2

    反过来说,若所有向量 mathbf{x}inmathbb{C}^n 都满足 Vert Umathbf{x}Vert=Vertmathbf{x}Vert ,平方后整理可得 mathbf{x}^ast (U^ast U-I)mathbf{x}=0 ,可知 (U^ast U-I)mathbf{x}=mathbf{0} ,并推得 U^ast U-I=0 所以,保长是么正矩阵的一个充要条件。


    性质2 .两向量的内积不因么正变换而改变,即任何 mathbf{x},mathbf{y}inmathbb{C}^n

    (Umathbf{x})^ast(Umathbf{y})=mathbf{x}^astmathbf{y}

    性质2说明么正变换具有内积不变性。 使用定义式,

    (Umathbf{x})^{ast}(Umathbf{y})=mathbf{x}^{ast}U^{ast}Umathbf{y}=mathbf{x}^{ast}Imathbf{y}=mathbf{x}^{ast}mathbf{y}

    将上式的 mathbf{y} 替换为 mathbf{x} ,性质2可推得性质1。 所以,内积不变性是么正矩阵的另一个充要条件。


    性质3 .么正矩阵的特征值之绝对值为 1

    假设 Umathbf{x}=lambdamathbf{x} ,等号两边同时取向量长度。 利用性质1,等号左边为 Vert Umathbf{x}Vert=Vertmathbf{x}Vert ,但等号右边为 Vertlambdamathbf{x}Vert=vertlambdavert cdotVertmathbf{x}Vert ,所以 vertlambdavert=1 ,换句话说,么正矩阵的特征值可表示为 lambda=e^{i	heta}


    性质4 .么正矩阵 U 可么正对角化, U=VDV^ast ,其中 V 是一么正矩阵, D=hbox{diag}(lambda_1,ldots,lambda_n)

    么正矩阵 U 满足 U^ast U=UU^ast ,因此属于正规矩阵家族,本身也可被么正对角化。 下面介绍 U 对应相异特征值的特征向量互为正交的一个证明。 假设非零向量 mathbf{x} mathbf{y} 使得 Umathbf{x}=lambda_1mathbf{x} Umathbf{y}=lambda_2mathbf{y} ,且 lambda_1
eqlambda_2 使用性质2,

    mathbf{x}^{ast}mathbf{y}=(Umathbf{x})^{ast}(Umathbf{y})=(lambda_1mathbf{x})^{ast}(lambda_2mathbf{y})=(overline{lambda_1}lambda_2)(mathbf{x}^{ast}mathbf{y})

    比较等号两边,推得 overline{lambda_1}lambda_2=1 mathbf{x}^{ast}mathbf{y}=0 使用性质三,令 lambda_1=e^{i	heta_1} ,则 overline{lambda_1}lambda_1=e^{-i	heta_1}e^{i	heta_1}=1 但已知 lambda_1 不等于 lambda_2 ,推论 overline{lambda_1}lambda_2
eq 1 ,证明 mathbf{x} 正交于 mathbf{y}


    性质5 .么正矩阵 U 的行列式为 vertdet Uvert=1

    根据性质3, U 的特征值满足 vertlambda_ivert=1 行列式等于特征值之积,故 vertdet Uvert=vert lambda_1cdotslambda_nvert=vertlambda_1vertcdotsvertlambda_nvert=1 另一个作法计算

    det(U^ast U)=(det overline{U^T})(det U)=(overline{det U^T})(det U)=(overline{det U})(det U)=vertdet Uvert^2

    det(U^ast U)=det I=1 ,所以 vertdet Uvert=1


    对于一实正交矩阵 Q det Q 为实数,由性质5可知 det Q=pm 1 据此,实正交矩阵可以区分为两类:若 det Q=1 ,则 Q 称为适当的(proper) 的正交矩阵;若 det Q=-1 ,则 Q 称为不适当的正交矩阵。 R(	heta) 是平面上逆时针旋转角为 	heta 的旋转矩阵, F(phi) 是平面上以 egin{bmatrix}  cosphi\  sinphi  end{bmatrix} 为镜射轴指向的镜射矩阵,公式如下(见“ 几何变换矩阵的设计 ”):

    R(	heta)=left[!!egin{array}{cr}  sin	heta&-cos	heta\  cos	heta&sin	heta  end{array}!!
ight],~~F(phi)=left[!!egin{array}{cr}  cos 2phi&sin 2phi\  sin 2phi&-cos 2phi  end{array}!!
ight]

    因为 det R(	heta)=cos^2	heta+sin^2	heta=1 ,平面旋转是适当的正交矩阵。 另一方面, det F(phi)=-(cos^2 2phi+sin^2 2phi)=-1 ,平面镜射是不适当的正交矩阵(见“ 旋转与镜射 ”)。 平面旋转与镜射是保长变换,提示我们这两种矩阵是实正交矩阵。


    最后补充一个么正矩阵的充分条件:假设 n	imes n 阶矩阵 A 的特征值 lambda 满足 vertlambdavert=1 若每一 mathbf{x}inmathbb{C}^n 使得 Vert Amathbf{x}VertleVertmathbf{x}Vert ,则 A 是一个么正矩阵(见“ 每周问题July 6, 2015 ”)。 注解提供两个证明:第一个证明使用奇异值分解[1] ,第二个证明使用矩阵三角化的Schur定理[2]


    注解
    [1] 令 A 的特征值为 lambda_1,ldots,lambda_n ,奇异值为 sigma_1,ldots,sigma_nge 0 给定的不等式等价于

    displaystyle  Vert AVert_2=max_{Vertmathbf{x}Vert
eqmathbf{0}}frac{Vert Amathbf{x}Vert}{Vertmathbf{x}Vert}=sigma_{max}le 1

    其中 sigma_{max}=max_{1le ile n}sigma_i A 的奇异值分解为 A=USigma V^ast ,其中 Sigma=	ext{diag}(sigma_1,ldots,sigma_n) U^ast U=V^ast V=I 使用恒等式 det(A^ast A)=vertdet Avert^2 ,又 det(A^ast A)=det(Sigma^astSigma)=sigma_1^2cdotssigma_n^2 det A=lambda_1cdotslambda_n ,推得 sigma_1cdotssigma_n=vert lambda_1cdotslambda_nvert=vertlambda_1vertcdotsvertlambda_nvert=1 sigma_{max}le 1 ,可知 sigma_1=cdots=sigma_n=1 因此, A=USigma V^ast=UIV^ast=UV^ast ,即知 A^ast A=VU^ast UV^ast=I ,证明 A 是一么正矩阵。

    [2] 根据Schur 定理,写出 A=UTU^ast ,其中 U 是么正矩阵, T=[t_{ij}] 是上三角矩阵,主对角元为 A 的特征值 lambda_1,ldots,lambda_n ,每一 vertlambda_ivert=1 考虑 mathbf{x}=Umathbf{e}_n ,其中 mathbf{e}_n=(0,ldots,0,1)^T 是第 n 个标准单位向量,则 Vertmathbf{x}Vert=Vert Umathbf{e}_nVert=(mathbf{e}_n^ast U^ast Umathbf{e}_n)^{1/2}=1 我们得到

    displaystyle  Vert Amathbf{x}Vert=Vert UTU^ast Umathbf{e}_nVert=Vert UTmathbf{e}_nVert=Vert Tmathbf{e}_nVert=left(vert t_{1n}vert^2+cdots+vert t_{n-1,n}vert^2+vertlambda_nvert^2
ight)^{1/2}

    对于单位向量 mathbf{x} ,给定条件等价于 Vert Amathbf{x}Vertle 1 ,再有 vertlambda_nvert=1 ,使得 t_{in}=0 1le ile n-1 套用归纳法,重复上述步骤令 mathbf{x}=Umathbf{e}_j j=n-1,n-2,ldots,2 ,可推论 T 是一个对角矩阵满足 T^ast T=I (因为 overline{lambda_i}lambda_i=vertlambda_ivert^2=1 )。 所以,

    A^ast A=UT^ast U^ast UTU^ast=UT^ast TU^ast=UU^ast =I

    相关阅读:
  • 相关阅读:
    写给刚接触Active Directory的朋友(转)
    vim中缩进的设置以及将tab转换成空格
    Ubuntu12.04 更新源
    实验三电子公文传输系统1个人贡献
    20191325实验四 Web服务器1socket编程
    20191325学习笔记10
    OpenEuler 中C与汇编的混合编程
    20191325第十三章学习笔记
    20191323第十四章学习笔记
    http 三次握手 四次挥手,面试题
  • 原文地址:https://www.cnblogs.com/sddai/p/6034114.html
Copyright © 2011-2022 走看看