1.设$A$为2阶正定矩阵,$0<left|overrightarrowalpha ight|leq1$,则有$$frac{left(alpha^TAalpha ight)left(alpha^TA^{‐1}alpha ight)}{alpha^Talpha}leqfrac{displaystyleleft(lambda_1+lambda_2 ight)^2}{4lambda_1lambda_2},其中lambda_1 , lambda_2是A特征值$$
证明:由条件知,存在正交矩阵$T$使$T^TAT=egin{pmatrix}lambda_1&0\0&lambda_2end{pmatrix},;;;;;;lambda_i>0,i=1,2$
令$T^Talpha=egin{pmatrix}y_1\y_2end{pmatrix}$,则$$egin{array}{l}frac{left(alpha^TAalpha
ight)left(alpha^TA^{‐1}alpha
ight)}{alpha^Talpha}=frac{(lambda_1y_1^2+lambda_2y_2^2)(lambda_1^{‐1}y_1^2+lambda_2^{‐1}y_2^2)}{y_1^2+y_2^2}=frac{y_1^4+y_2^4+left(frac{lambda_2}{lambda_1}+frac{lambda_1}{lambda_2}
ight)y_1^2y_2^2}{y_1^2+y_2^2}=frac{(y_1^2+y_2^2)^2-2y_1^2y_2^2+left(frac{lambda_2}{lambda_1}+frac{lambda_1}{lambda_2}
ight)y_1^2y_2^2}{y_1^2+y_2^2}\=y_1^2+y_2^2+frac{left(sqrt{frac{lambda_2}{lambda_1}}-sqrt{frac{lambda_1}{lambda_2}}
ight)^2y_1^2y_2^2}{y_1^2+y_2^2}=(y_1^2+y_2^2)left[1+frac{left(sqrt{frac{lambda_2}{lambda_1}}-sqrt{frac{lambda_1}{lambda_2}}
ight)^2y_1^2y_2^2}{(y_1^2+y_2^2)^2}
ight]leq1+frac{left(sqrt{frac{lambda_2}{lambda_1}}-sqrt{frac{lambda_1}{lambda_2}}
ight)^2y_1^2y_2^2}{(y_1^2+y_2^2)^2}end{array}$$
因为$y_1^2+y_2^2geq2vert y_1y_2vert,故frac12geqfrac{vert y_1y_2vert}{y_1^2+y_2^2},即frac14geqfrac{y_1^2y_2^2}{(y_1^2+y_2^2)^2}$,$$Rightarrow frac{left(alpha^TAalpha
ight)left(alpha^TA^{‐1}alpha
ight)}{alpha^Talpha}leq1+frac14left(sqrt{frac{lambda_2}{lambda_1}}-sqrt{frac{lambda_1}{lambda_2}}
ight)^2=frac{displaystyleleft(lambda_1+lambda_2
ight)^2}{4lambda_1lambda_2}$$
更进一步,可以得到更强的不等式
2.设$A$为$n(ngeq 2)$阶正定矩阵,$0<left|overrightarrowalpha
ight|leq1$,则有$$frac{left(alpha^TAalpha
ight)left(alpha^TA^{‐1}alpha
ight)}{alpha^Talpha}leqfrac{displaystyle(n-1)left(lambda_1+lambda_2
ight)^2}{2nlambda_1lambda_2},其中lambda_1 , lambda_2分别是A最小及最大特征值$$
证明:由条件知,存在正交矩阵$T$使$T^TAT=egin{pmatrix}lambda_1&&0\&ddots&\0&&lambda_mend{pmatrix},;lambda_i>0,i=1,2,cdots,n$,不妨设$lambda_1leqlambda_2leqcdotsleqlambda_n$。
令$T^Talpha=egin{pmatrix}y_1\vdots\y_nend{pmatrix}$,有$$frac{left(alpha^TAalpha
ight)left(alpha^TA^{‐1}alpha
ight)}{alpha^Talpha}=frac{(alpha^TT)(T^TAT)(T^Talpha)(alpha^TT)(T^TA^{‐1}T)(T^Talpha)}{(alpha^TT)(T^Talpha)}=frac{(lambda_1y_1^2+cdots+lambda_ny_n^2)(lambda_1^{‐1}y_1^2+cdots+lambda_n^{‐1}y_n^2)}{y_1^2+cdots+y_n^2}$$
令$ riangle=y_1^2+cdots+y_n^2$,$$则原式=frac{displaystylesum_{i=1}^ny_i^4+sum_{1leq i<jleq n}left(frac{displaystylelambda_i}{displaystylelambda_j}+frac{displaystylelambda_j}{displaystylelambda_i}
ight)y_i^2y_j^2} riangle=frac{ riangle^2+{displaystylesum_{1leq i<jleq n}}left(sqrt{frac{lambda_i}{lambda_j}}-sqrt{frac{lambda_j}{lambda_i}}
ight)^2y_i^2y_j^2} riangle$$
由$$left(sqrt{frac{lambda_1}{lambda_n}}-sqrt{frac{lambda_n}{lambda_1}}
ight)^2-left(sqrt{frac{lambda_i}{lambda_j}}-sqrt{frac{lambda_j}{lambda_i}}
ight)^2=frac{lambda_1^2+lambda_n^2}{lambda_1lambda_n}-frac{lambda_i^2+lambda_j^2}{lambda_ilambda_j}=frac{(lambda_nlambda_j-lambda_ilambda_1)(lambda_ilambda_n-lambda_1lambda_j)}{lambda_1lambda_nlambda_ilambda_j}$$
因为$lambda_nlambda_j-lambda_ilambda_1 geq 0 ,lambda_ilambda_n-lambda_1lambda_j geq 0$,则$left(sqrt{frac{lambda_1}{lambda_n}}-sqrt{frac{lambda_n}{lambda_1}}
ight)^2 geq left(sqrt{frac{lambda_i}{lambda_j}}-sqrt{frac{lambda_j}{lambda_i}}
ight)^2$
$$Rightarrow 原式leq riangle+frac{({displaystylesum_{1leq i<jleq n}}y_i^2y_j^2)left(sqrt{frac{lambda_1}{lambda_n}}-sqrt{frac{lambda_n}{lambda_1}}
ight)^2} riangle= riangleleft[1+frac{({displaystylesum_{1leq i<jleq n}}y_i^2y_j^2)left(sqrt{frac{lambda_1}{lambda_n}}-sqrt{frac{lambda_n}{lambda_1}}
ight)^2}{ riangle^2}
ight]$$
由$$ riangle^2=(y_1^2+cdots+y_n^2)^2=y_1^4+cdots+y_n^4+2sum_{1leq i<jleq n}y_i^2y_j^2$$
$$=left(frac{y_1^2}{sqrt{n-1}}-frac{y_2^2}{sqrt{n-1}}
ight)^2+cdots+left(frac{y_1^2}{sqrt{n-1}}-frac{y_n^2}{sqrt{n-1}}
ight)^2+cdots+left(frac{y_{n-1}^2}{sqrt{n-1}}-frac{y_n^2}{sqrt{n-1}}
ight)^2+frac2{n-1}sum_{1leq i<jleq n}y_i^2y_j^2+2sum_{1leq i<jleq n}y_i^2y_j^2geqfrac{2n}{n-1}sum_{1leq i<jleq n}y_i^2y_j^2$$
$$Rightarrow frac{n-1}{2n}geqfrac1{ riangle^2}sum_{1leq i<jleq n}y_i^2y_j^2,且因为 riangleleq1$$
$Rightarrow 原式leq1+frac{n-1}{2n}left(sqrt{frac{lambda_1}{lambda_n}}-sqrt{frac{lambda_n}{lambda_1}}
ight)^2=frac{(n-1)lambda_1^2+2lambda_1lambda_n+(n-1)lambda_n^2}{2nlambda_1lambda_n}\leqfrac{(n-1)lambda_1^2+2(n-1)lambda_1lambda_n+(n-1)lambda_n^2}{2nlambda_1lambda_n}=frac{(n-1)(lambda_1+lambda_n)^2}{2nlambda_1lambda_n}$
若当—谢瓦莱(Jordan-Chevalley)分解定理证明
引理1:已知$g_1(x),g_2(x),cdots,g_k(x)$两两互素,$r_1(x),r_2(x),cdots,r_k(x)$为$k$个非零多项式,并且$partial(r_i(x))<partial(g_i(x));;(i=1,2,cdots,k)$,求存在一个多项式$f(x)$,被$g_i(x)除余式是r_i(x)$
证明:令$G_i(x)=g_1(x)cdots g_{i-1}(x)g_{i+1}(x) cdots g_k(x)$,因为$g_1(x),g_2(x),cdots,g_k(x)$两两互素
$Rightarrow(g_i(x),G_i(x))=1 Rightarrow 存在u_i(x)g_i(x)+v_i(x)G_i(x)=1$
$Rightarrow u_i(x)g_i(x)r_i(x)+v_i(x)G_i(x)r_i(x)=r_i(x) Rightarrow v_i(x)G_i(x)r_i(x)=r_i(x)-u_i(x)g_i(x)r_i(x)$,所以$g_1(x),cdots ,g_{i-1}(x),g_{i+1}(x), cdots ,g_k(x)都整除v_i(x)G_i(x)r_i(x) ,而g_i(x)除v(x)G_i(x)r_i(x) 余r_i(x),取$
$$f(x)=sum_{i=1}^kv_i(x)G_i(x)r_i(x)=v_1(x)G_1(x)r_1(x)+cdots+v_k(x)G_k(x)r_k(x) $$
$Rightarrow g_i(x)除f(x)余式r_i(x)$
引理2:已知$A,B$都是$n$级方阵,$AB=BA$,且$A,B$均可对角化,证明$A,B$可以同时对角化。
证明:由于$A$可对角化。所以存在可逆矩阵$P$使得$P^{-1}AP=diag{lambda_1E_1,lambda_2E_2,cdots,lambda_sE_s}$,其中$lambda_1,lambda_2,cdots,lambda_s是A所有互异的特征值,E_1,E_2,cdots,E_s分别是r_1,r_2,cdots,r_s级单位矩阵$,且$r_1+r_2+cdots+r_s=n$,由$AB=BA得P^{-1}BPP^{-1}AP=P^{-1}APP^{-1}BP$
$Rightarrow P^{-1}BP=diag{B_1,B_2,cdots,B_s},B_1,B_2,cdots,B_s分别是r_1,r_2,cdots,r_s级方阵$
由$B$可对角化,所以$P^{-1}BP$可以对角化 $Rightarrow B_1,B_2,cdots,B_s可以对角化$
$$Rightarrow 对任意的i=1,2,cdots ,s,存在可逆矩阵Q_i使得Q_i^{-1}B_iQ_i为对角矩阵。$$
取$Q=diag{Q_1,Q_2,cdots,Q_s},则Q^{-1}P^{-1}BPQ=diag{Q_1^{-1}B_1Q_1,Q_2^{-1}B_2Q_2,cdots,Q_s^{-1}B_sQ_s}为对角矩阵$
$$Rightarrow 取T=PQ,有T^{-1}BT,T^{-1}BT同时为对角矩阵。$$
(来自复旦大学高代教材的证明过程)
若当—谢瓦莱(Jordan-Chevalley)分解定理:设A是$n$阶复矩阵,则$A$可分解为$A=B+C$,其中$B,C$适合下面的条件:
(1)$B$是一个可对角化的矩阵
(2)$C$是一个幂零矩阵
(3)$BC=CB$
(4)$B,C$均可表示为$A$的多项式
不仅如此,上述满足条件(1)——(3)分解是唯一的。
证明:先对$A$的若当标准形$J$证明结论,
设$A$的全体不同特征值为$lambda_1,lambda_2,cdots,lambda_s,且J=egin{pmatrix}J_1&&&\&J_2&&\&&ddots&\&&&J_send{pmatrix},其中J_i是属于特征值lambda_i的根子空间对应的块,其阶设为m_i.$显然,对每个$i$均有$J_i=M_i+N_i,其中M_i=lambda_iI是对角阵,N_i是一个幂零矩阵。又M_iN_i=N_iM_i。$
$令M=egin{pmatrix}M_1&&&\&M_2&&\&&ddots&\&&&M_Send{pmatrix},N=egin{pmatrix}N_1&&&\&N_2&&\&&ddots&\&&&N_Send{pmatrix},$
则$J=M+N,MN=NM,M是对角阵,N是幂零矩阵。$
因为$(J_i-lambda_i I)^{m_i} =0$,所以$J_i$适合多项式$(lambda-lambda_i)^{m_i}$.而$lambda_i互不相同$,因此多项式$(lambda-lambda_1)^{m_1},(lambda-lambda_2)^{m_2},cdots ,(lambda-lambda_s)^{m_s}$两两互素。由引理1,存在多项式$g(lambda)$满足条件:
$$g(lambda)=h_i(lambda)(lambda-lambda_i)^{m_i}+lambda_i,对所有的i=1,2,cdots ,s成立(这里h_i(lambda)也是多项式)。$$
代入$J_i$得到$$g(J_i)=h_i(J_i)(J_i-lambda_i I)^{m_i}+lambda_i I=lambda_i I=M_i$$
于是$$g(J)=egin{pmatrix}g(J_1)&&&\&g(J_2)&&\&&ddots&\&&&g(J_s)end{pmatrix}=egin{pmatrix}M_1&&&\&M_2&&\&&ddots&\&&&M_send{pmatrix}=M.$$
又因为$N=J-M=J-g(J),$所以$N$也是$J$的多项式。
现考虑一般情况:设$P^{-1}AP=J,则A=PJP^{-1}=P(M+N)P^{-1}$
令$B=PMP^{-1},C=PNP^{-1},则B是可对角化矩阵,而C是幂零矩阵,又g(A)=g(PJP^{-1})=Pg(J)P^{-1}=PMP^{-1}=B$
又易证明$BC=CB(ecause MN=NMRightarrow PMP^{-1}PNP^{-1}=PNP^{-1}PMP^{-1}),C=A-g(A)$
(注意方法)最后证明唯一性,假设$A$有另一满足条件的分解$A=B_1+C_1,则B_1-B=C_1-C。由B_1C_1=C_1B_1不难验证AB_1=B_1A , AC_1=C_1A (注:在A=B_1+C_1右乘B_1,得AB_1=B_1B_1+C_1B_1=B_1B_1+B_1C_1=B_1A ,同理AC_1=C_1A).$
因为$B=g(A),故BB_1=B_1B 。同理CC_1=C_1C 。设C^r =0,C_1^t =0 ,用二项式定理知道(C_1-C)^{r+t}=0 。于是$
$$(B_1-B)^{r+t}=(C_1-C)^{r+t}=0.$$
因为$BB_1=B_1B$,他们都是可对角化的矩阵,由引理2知道它们可以同时对角化,即存在可逆阵$Q$,使得$Q^{-1}BQ和Q^{-1}B_1Q$都是对角阵。注意到$$(Q^{-1}BQ-Q^{-1}B_1Q)^{r+t}=lbrack Q^{-1}(B-B_1)Q
brack^{r+t}=Q^{-1}(B-B_1)^{r+t}Q=0,$$
两个对角阵之差依旧是对角阵,这个差的幂要等于零矩阵,这两个矩阵必相等,由此即得$B=B_1,于是C=C_1.证毕 square$
一道似乎不好下手的高代题
一道似乎不好下手的高代题
此题是我发在论坛里面的一个问题,在论坛好友jiangjun7116的指导下,现在把过程完整的总结分享给大家。
设$A$为$n$阶实对称正定矩阵,$eta_1,eta_2,cdots ,eta_n in mathbb{R}^n$是$n$个关于$A$共轭的非零列向量,即$eta_i
eq 0(i=1,2,cdots,n)$,且$eta_i ^TAeta_j=0 (i
eq j;i,j=1,2,cdots,n)$,证明:$$A=sum_{i=1}^nfrac{Aeta_ieta_i^TA}{eta_i^TAeta_i}和A^{-1}=sum_{i=1}^nfrac{eta_ieta_i^T}{eta_i^TAeta_i}$$
证明:根据题目注意到$$sum_{i=1}^nfrac{Aeta_ieta_i^TA}{eta_i^TAeta_i}eta_j=Aeta_j ,sum_{i=1}^nfrac{eta_ieta_i^T}{eta_i^TAeta_i}Aeta_j=eta_j$$
$$(因为i
eq j时eta_i ^TAeta_j=0,所以累加里面只有i=j那一项不等于0)$$
下证$eta_1,eta_2,cdots ,eta_n是一组基,即eta_1,eta_2,cdots ,eta_n是线性无关的$
假设存在一组实数$k_1,k_2,cdots ,k_n使得k_1eta_1+k_2eta_2+cdots +k_neta_n=0,式子两边左乘eta_i^TA,$
$可以得出k_ieta_i^TAeta_i=0,然而A是实对称的正定矩阵且eta_i
eq 0,可以得出k_i=0(i=1,2,cdots ,n)$
$所以eta_1,eta_2,cdots ,eta_n是一组线性无关的向量组$
$$Rightarrow (sum_{i=1}^nfrac{Aeta_ieta_i^TA}{eta_i^TAeta_i}-A)X=0, (sum_{i=1}^nfrac{eta_ieta_i^T}{eta_i^TAeta_i}A-E)X=0有n个线性无关的解$$
$$Rightarrow sum_{i=1}^nfrac{Aeta_ieta_i^TA}{eta_i^TAeta_i}-A=0, sum_{i=1}^nfrac{eta_ieta_i^T}{eta_i^TAeta_i}A-E=0$$
$$即 sum_{i=1}^nfrac{Aeta_ieta_i^TA}{eta_i^TAeta_i}=A, sum_{i=1}^nfrac{eta_ieta_i^T}{eta_i^TAeta_i}A=E Rightarrow sum_{i=1}^nfrac{eta_ieta_i^T}{eta_i^TAeta_i}=A^{-1}$$
“许多问题解决之后都会一阵暗爽,这可能就是我喜欢数学的原因吧!”
周不通问题:
一个方阵总相似于它自己的转置。那么,方阵总合同于自己的转置吗?
即:对于任意方阵A,证明存在可逆方阵P,使得 P'AP=A'。
容易证明,对于A=E+B,B反对称,是对的。猜想一般情形也对。
各位看看。