Jordan 标准型的应用是高等代数教学中的难点, 也是考试中的热点, 其中应用最广泛的技巧, 应该是所谓的三段论法: 即若矩阵问题的条件和结论在相似关系下不改变, 则可以先证明结论对 Jordan 块成立; 再证明对 Jordan 标准型成立; 最后证明对一般的矩阵也成立. 如下例题是运用三段论法证明矩阵问题的典型例子.
例题 (高代白皮书的例 7.44) 设 $B$ 为 $n$ 阶非异复方阵, 证明: 对任意的正整数 $m$, 存在 $n$ 阶复方阵 $A$, 使得 $A^m=B$.
证明 设 $P$ 为非异阵, 使得 $P^{-1}BP=J=mathrm{diag}{J_{r_1}(lambda_1),J_{r_2}(lambda_2),cdots,J_{r_k}(lambda_k)}$ 为 $B$ 的 Jordan 标准型. 由于 $B$ 非异, 故 $B$ 的所有特征值都非零.
第一步 对 $B$ 的任一 Jordan 块 $J_{r_i}(lambda_i)$, 取定 $lambda_i$ 的某个 $m$ 次方根 $mu_i$, 即 $mu_i^m=lambda_i$. 我们利用测试矩阵的技巧, 即采用 Jordan 块 $J_{r_i}(mu_i)$ 作为 $m$ 次方根的测试. 注意到 $$J_{r_i}(mu_i)^m=egin{pmatrix} lambda_i & mmu_i^{m-1} & * & cdots & * \ & lambda_i & mmu_i^{m-1} & cdots & * \ & & ddots & ddots & vdots \ & & & ddots & mmu_i^{m-1} \ & & & & lambda_i \ end{pmatrix}$$ 是一个上三角阵, 其特征值全为 $lambda_i$. 由于 $mmu_i^{m-1} eq 0$, 故特征值 $lambda_i$ 的几何重数等于 $r_i-r(J_{r_i}(mu_i)^m-lambda_iI_{r_i})=1$, 于是 $J_{r_i}(mu_i)^m$ 只有一个 Jordan 块, 从而 $J_{r_i}(mu_i)^m$ 相似于 $J_{r_i}(lambda_i)$, 即存在非异阵 $Q_i$, 使得 $J_{r_i}(lambda_i)=Q_i^{-1}J_{r_i}(mu_i)^mQ_i=(Q_i^{-1}J_{r_i}(mu_i)Q_i)^m$.
第二步 令 $C=mathrm{diag}{Q_1^{-1}J_{r_1}(mu_1)Q_1,Q_2^{-1}J_{r_2}(mu_2)Q_2,cdots,Q_k^{-1}J_{r_k}(mu_k)Q_k}$, 则有 $J=C^m$.
第三步 因此, $B=PJP^{-1}=PC^mP^{-1}=(PCP^{-1})^m$, 令 $A=PCP^{-1}$, 则有 $B=A^m$. $Box$
运用三段论法和测试矩阵这两种技巧的更多例题,请读者参考高代白皮书的第 7.2.8 节或高代习题课教学视频中的"Jordan 标准型的应用"这一讲. 下面是复旦大学数学学院 19 级高等代数 II 期中考试第七大题, 我们将给出两种证法, 分别是应用上述例题的证明过程 (由王丽莉博士后提供) 以及运用测试矩阵的技巧, 但这里是将广义 Jordan 块作为测试矩阵.
第七大题 设 $a,b$ 都是实数, 其中 $b eq 0$, 证明: 对任意的正整数 $m$, 存在 4 阶实方阵 $A$, 使得 $$A^m=B=egin{pmatrix} a & b & 2 & 0 \ -b & a & 2 & 0 \ 0 & 0 & a & b \ 0 & 0 & -b & a \ end{pmatrix}.$$
证明 显然, $B$ 的特征多项式 $f(lambda)=((lambda-a)^2+b^2)^2$. 我们可用三种方法求出 $B$ 的 Jordan 标准型 (参考高代白皮书的第 7.2.6 节). 第一种方法是计算行列式因子: $$lambda I_4-B=egin{pmatrix} lambda-a & -b & -2 & 0 \ b & lambda-a & -2 & 0 \ 0 & 0 & lambda-a & -b \ 0 & 0 & b & lambda-a end{pmatrix},$$ 经计算可知 $$(lambda I_4-B)egin{pmatrix} 1 & 2 & 3 \ 1 & 2 & 4 \ end{pmatrix}=-b((lambda-a)^2+b^2),\,\,(lambda I_4-B)egin{pmatrix} 1 & 2 & 3 \ 2 & 3 & 4 \ end{pmatrix}=-2b(lambda-a+b).$$ 显然这两个 3 阶子式互素, 故 3 阶行列式因子 $D_3(lambda)=1$, 于是 $B$ 的行列式因子组和不变因子组均为 $1,1,1,((lambda-a)^2+b^2)^2$, 从而初等因子组为 $(lambda-a-bmathrm{i})^2$, $(lambda-a+bmathrm{i})^2$, 因此 $B$ 的 Jordan 标准型 $J=mathrm{diag}{J_2(a+bmathrm{i}),J_2(a-bmathrm{i})}$. 第二种方法是计算极小多项式: 由于 $B$ 是实方阵, 故其极小多项式 $m(lambda)$ 是实系数多项式, 又 $m(lambda)$ 整除 $f(lambda)$, 从而只能是 $m(lambda)=(lambda-a)^2+b^2$ 或 $m(lambda)=((lambda-a)^2+b^2)^2$. 通过简单的计算可知 $B$ 不适合多项式 $(lambda-a)^2+b^2$, 于是 $m(lambda)=f(lambda)=((lambda-a)^2+b^2)^2$, 剩余的讨论同第一种方法. 第三种方法是计算特征值的几何重数: $B$ 的全体特征值为 $a+bmathrm{i}$ (2 重), $a-bmathrm{i}$ (2 重), 通过简单的计算可知 $r(B-(a+bmathrm{i})I_4)=3$ 以及 $r(B-(a-bmathrm{i})I_4)=3$, 于是 $apm bmathrm{i}$ 的几何重数都等于 1, 从而分别只有一个 2 阶 Jordan 块, 因此 $B$ 的 Jordan 标准型 $J=mathrm{diag}{J_2(a+bmathrm{i}),J_2(a-bmathrm{i})}$.
下面给出两种证法. 第一种证法是构造性证明, 其想法就是把上述例题的证明过程精细化 (注意不能直接引用上述例题的结论, 因为那里的 $A$ 不一定是实方阵); 第二种证法是存在性证明, 其思路就是利用广义 Jordan 块来做测试矩阵.
证法一 设 $lambda_1=a+bmathrm{i}$, 则 $overline{lambda}_1=a-bmathrm{i}$. 我们先来确定过渡矩阵 $P$. 设 $alpha_1,alpha_2$ 是 $B$ 关于特征值 $lambda_1$ 的特征向量和广义特征向量, 即满足 $$(1)quad Balpha_1=lambda_1alpha_1,\,\,Balpha_2=alpha_1+lambda_1alpha_2.$$ 注意到 $B$ 是实方阵, 将 (1) 式取共轭后可得 $$(2)quad Boverline{alpha}_1=overline{lambda}_1overline{alpha}_1,\,\,Boverline{alpha}_2=overline{alpha}_1+overline{lambda}_1overline{alpha}_2.$$ 由于 ${alpha_1,alpha_2}$ 构成了根子空间 $R(lambda_1)$ 的一组基, 容易验证 $overline{alpha}_1,overline{alpha}_2$ 在复数域上线性无关, 再由 (2) 式可知 ${overline{alpha}_1,overline{alpha}_2}$ 构成了根子空间 $R(overline{lambda}_1)$ 的一组基. 由于 $mathbb{C}^4=R(lambda_1)oplus R(overline{lambda}_1)$, 故 ${alpha_1,alpha_2,overline{alpha}_1,overline{alpha}_2}$ 是 $mathbb{C}^4$ 的一组基. 令 $P=(alpha_1,alpha_2,overline{alpha}_1,overline{alpha}_2)$, 则 $P$ 是非异阵, 使得 $$P^{-1}BP=J=mathrm{diag}{J_2(lambda_1),J_2(overline{lambda}_1)}.$$ 由于 Jordan 块是 2 阶的, 故不需要引入测试矩阵, 直接通过简单的计算就能得到其 $m$ 次方根. 设 $mu_1$ 是 $lambda_1$ 的 $m$ 次方根, 即满足 $mu_1^m=lambda_1$ (取定一个即可). 令 $$K_2(mu_1)=egin{pmatrix} mu_1 & dfrac{1}{m}mu_1^{1-m} \ 0 & mu_1 \ end{pmatrix},$$ 则 $K_2(mu_1)$ 是 $J_2(lambda_1)$ 的 $m$ 次方根, 即满足 $K_2(mu_1)^m=J_2(lambda_1)$. 同理 $K_2(overline{mu}_1)^m=J_2(overline{lambda}_1)$. 令 $C=mathrm{diag}{K_2(mu_1),K_2(overline{mu}_1)}$, 则 $C^m=mathrm{diag}{J_2(lambda_1),J_2(overline{lambda}_1)}=J$. 令 $A=PCP^{-1}$, 则 $$A^m=(PCP^{-1})^m=PC^mP^{-1}=PJP^{-1}=B,$$ 即 $A$ 是 $B$ 的 $m$ 次方根. 最后, 我们还需验证 $A$ 的确是实方阵. 令 $T=egin{pmatrix} O & I_2 \ I_2 & O \ end{pmatrix}$, 则容易验证 $T=T'=T^{-1}$, $overline{P}=PT$ 且 $Toverline{C}T=C$. 于是 $$overline{A}=overline{PCP^{-1}}=overline{P}overline{C}overline{P}^{-1}=PToverline{C}T^{-1}P^{-1}=PCP^{-1}=A,$$ 即 $A$ 是实方阵.
证法二 取 $a+bmathrm{i}$ 的 $m$ 次方根 $c+dmathrm{i}$ ($c,dinmathbb{R}$), 即满足 $(c+dmathrm{i})^m=a+bmathrm{i}$ (取定一个即可). 构造实方阵 (取法不唯一): $$C=egin{pmatrix} c & d & 2 & 0 \ -d & c & 2 & 0 \ 0 & 0 & c & d \ 0 & 0 & -d & c \ end{pmatrix},\,\,hbox{或}\,\,C=egin{pmatrix} c & d & 1 & 0 \ -d & c & 0 & 1 \ 0 & 0 & c & d \ 0 & 0 & -d & c \ end{pmatrix},\,\,hbox{或}\,\,C=egin{pmatrix} c & d & 0 & 0 \ -d & c & 1 & 0 \ 0 & 0 & c & d \ 0 & 0 & -d & c \ end{pmatrix}.$$ 注意到 $d eq 0$, 则由开始处完全类似的讨论可知, $C$ 的 Jordan 标准型为 $mathrm{diag}{J_2(c+dmathrm{i}),J_2(c-dmathrm{i})}$. 由高代白皮书的例 7.35 可知, $J_2(cpm dmathrm{i})^m$ 的 Jordan 标准型为 $J_2(apm bmathrm{i})$, 从而 $C^m$ 的 Jordan 标准型为 $mathrm{diag}{J_2(a+bmathrm{i}),J_2(a-bmathrm{i})}$, 于是 $B$ 与 $C^m$ 有相同的 Jordan 标准型, 故它们在复数域上相似. 然而 $B$ 与 $C^m$ 都是实矩阵, 故由高代教材的推论 7.3.4 (矩阵相似在基域扩张下的不变性) 可知, 它们在实数域上也相似, 即存在非异阵 $Pin M_4(mathbb{R})$, 使得 $B=P^{-1}C^mP=(P^{-1}CP)^m$. 令 $A=P^{-1}CP$, 则 $A$ 为实方阵, 满足 $A^m=B$. $Box$
接下去我们给出三个推广, 第一个推广是: 实数域上的两类广义 Jordan 块都存在 $m$ 次方根. 事实上, 第七大题证法二中测试矩阵 $C$ 的后两种取法就是实数域上的两类广义 Jordan 块 (参考高代白皮书第 366 页).
推广 1 设 $a,b$ 都是实数, 其中 $b eq 0$. 设 $S=egin{pmatrix} a & b \ -b & a \ end{pmatrix}$, $T=I_2$ 或 $T=egin{pmatrix} 0 & 0 \ 1 & 0 \ end{pmatrix}$. 证明: 对任意的正整数 $m$, 存在 $2n$ 阶实方阵 $A$, 使得 $$A^m=J_n(a,b)=egin{pmatrix} S & T & & & \ & S & T & & \ & & ddots & ddots & \ & & & ddots & T \ & & & & S \ end{pmatrix}.$$
证明 取 $a+bmathrm{i}$ 的 $m$ 次方根 $c+dmathrm{i}$ ($c,dinmathbb{R}$), 即满足 $(c+dmathrm{i})^m=a+bmathrm{i}$ (取定一个即可). 设 $R=egin{pmatrix} c & d \ -d & c \ end{pmatrix}$, 令 $$J_n(c,d)=egin{pmatrix} R & T & & & \ & R & T & & \ & & ddots & ddots & \ & & & ddots & T \ & & & & R \ end{pmatrix}.$$ 根据高代白皮书的例 7.68 (实数域上的广义 Jordan 标准型理论) 的证明过程可知, $J_n(a,b)$ 的不变因子组为 $1,cdots,1,((lambda-a)^2+b^2)^n$, 从而 $J_n(a,b)$ 在复数域上的初等因子为 $(lambda-a-bmathrm{i})^n$, $(lambda-a+bmathrm{i})^n$, 于是 $J_n(a,b)$ 的 Jordan 标准型为 $mathrm{diag}{J_n(a+bmathrm{i}),J_n(a-bmathrm{i})}$. 同理由 $d eq 0$ 可知, $J_n(c,d)$ 的 Jordan 标准型为 $mathrm{diag}{J_n(c+dmathrm{i}),J_n(c-dmathrm{i})}$. 由高代白皮书的例 7.35 可知, $J_n(cpm dmathrm{i})^m$ 的 Jordan 标准型为 $J_n(apm bmathrm{i})$, 从而 $J_n(c,d)^m$ 的 Jordan 标准型为 $mathrm{diag}{J_n(a+bmathrm{i}),J_n(a-bmathrm{i})}$, 于是 $J_n(a,b)$ 与 $J_n(c,d)^m$ 有相同的 Jordan 标准型, 故它们在复数域上相似. 然而 $J_n(a,b)$ 与 $J_n(c,d)^m$ 都是实矩阵, 故由高代教材的推论 7.3.4 (矩阵相似在基域扩张下的不变性) 可知, 它们在实数域上也相似, 即存在非异阵 $Pin M_{2n}(mathbb{R})$, 使得 $J_n(a,b)=P^{-1}J_n(c,d)^mP=(P^{-1}J_n(c,d)P)^m$. 令 $A=P^{-1}J_n(c,d)P$, 则 $A$ 为实方阵, 满足 $A^m=B$. $Box$
注 我们也可以利用与第七大题证法一类似的讨论来证明推广 1, 请感兴趣的读者自行完成相关的细节.
第二个是第七大题的推广.
推广 2 设 $a,b$ 都是实数, 其中 $b eq 0$, 设 $S=egin{pmatrix} a & b \ -b & a \ end{pmatrix}$. 证明: 对任意的正整数 $m$, 存在 $2n$ 阶实方阵 $A$, 使得 $$A^m=B=egin{pmatrix} S & * & * & cdots & * \ & S & * & cdots & * \ & & ddots & ddots & vdots \ & & & ddots & * \ & & & & S \ end{pmatrix}.$$
证明 显然, $B$ 的特征多项式 $f(lambda)=((lambda-a)^2+b^2)^n$, 故不妨设 $B$ 在实数域上的初等因子组为 $((lambda-a)^2+b^2)^{r_1}$, $((lambda-a)^2+b^2)^{r_2}$, $cdots$, $((lambda-a)^2+b^2)^{r_k}$. 由实数域上的广义 Jordan 标准型理论 (高代白皮书的例 7.68) 可知, 存在非异阵 $Pin M_{2n}(mathbb{R})$, 使得 $$P^{-1}BP=mathrm{diag}{J_{r_1}(a,b),J_{r_2}(a,b),cdots,J_{r_k}(a,b)}.$$ 再由推广 1 可知, 存在 $C_iin M_{2r_i}(mathbb{R})$, 使得 $J_{r_i}(a,b)=C_i^m$. 令 $C=mathrm{diag}{C_1,C_2,cdots,C_k}$, 则有 $P^{-1}BP=C^m$, 从而 $B=PC^mP^{-1}=(PCP^{-1})^m$. 令 $A=PCP^{-1}$, 则 $A$ 为实方阵, 满足 $A^m=B$. $Box$
第三个是一开始的例题 (高代白皮书的例 7.44) 在实数域上的推广.
推广 3 设 $B$ 为 $n$ 阶非异实方阵, $m$ 为正整数, 满足: 对 $B$ 的任一实特征值 $lambda_i$, 都存在实数 $mu_i$, 使得 $mu_i^m=lambda_i$. 证明: 存在 $n$ 阶实方阵 $A$, 使得 $A^m=B$.
注 以下三种情形均可使条件得到满足:
(i) $B$ 只有虚特征值, 没有实特征值;
(ii) $m$ 是奇数;
(iii) 当 $m$ 是偶数时, $B$ 的所有实特征值都是正实数.
证明 设 $B$ 在实数域上的初等因子组为 $(lambda-lambda_1)^{r_1}$, $cdots$, $(lambda-lambda_k)^{r_k}$, $((lambda-a_1)^2+b_1^2)^{s_1}$, $cdots$, $((lambda-a_l)^2+b_l^2)^{s_l}$, 其中 $lambda_1,cdots,lambda_k$, $a_1,b_1,cdots,a_l,b_l$ 都是实数, $b_1,cdots,b_l$ 都非零. 由实数域上的广义 Jordan 标准型理论 (高代白皮书的例 7.68) 可知, 存在非异阵 $Pin M_n(mathbb{R})$, 使得 $$P^{-1}BP=mathrm{diag}{J_{r_1}(lambda_1),cdots,J_{r_k}(lambda_k),J_{s_1}(a_1,b_1),cdots,J_{s_l}(a_l,b_l)}.$$ 由题目条件, 对任一实特征值 $lambda_i$, 都存在实数 $mu_i$, 使得 $mu_i^m=lambda_i\,(1leq ileq k)$. 由一开始的例题第一步的讨论可知, $J_{r_i}(mu_i)^m$ 相似于 $J_{r_i}(lambda_i)$, 但它们都是实矩阵, 故在实数域上相似, 于是存在非异实方阵 $Q_i$, 使得 $J_{r_i}(lambda_i)=Q_i^{-1}J_{r_i}(mu_i)^mQ_i=(Q_i^{-1}J_{r_i}(mu_i)Q_i)^m$. 令 $B_i=Q_i^{-1}J_{r_i}(mu_i)Q_i$, 则 $B_i$ 为实方阵, 满足 $J_{r_i}(lambda_i)=B_i^m\,(1leq ileq k)$. 再由推广 1 可知, 存在实方阵 $C_j$, 满足 $J_{s_j}(a_j,b_j)=C_j^m\,(1leq jleq l)$. 令 $C=mathrm{diag}{B_1,cdots,B_k,C_1,cdots,C_l}$, 则 $C$ 为实方阵, 满足 $P^{-1}BP=C^m$, 从而 $B=PC^mP^{-1}=(PCP^{-1})^m$. 令 $A=PCP^{-1}$, 则 $A$ 为实方阵, 满足 $A^m=B$. $Box$
注 如果 $B$ 有负的实特征值, 那么其 $m$ 次方根的存在性会变得比较复杂. 例如, $B=-I_2$ 有平方根 $A=pmegin{pmatrix} 0 & 1 \ -1 & 0 \ end{pmatrix}$, 但 $B=mathrm{diag}{J_2(-1),J_3(-1)}$ 却没有平方根. 请感兴趣的读者自行证明后面那个断言.
参考文献
[1] 高代教材: 姚慕生, 吴泉水, 谢启鸿 编著, 高等代数学 (第三版), 复旦大学出版社, 2014.
[2] 高代白皮书: 姚慕生, 谢启鸿 编著, 学习方法指导书: 高等代数 (第三版), 复旦大学出版社, 2015.
[3] 谢启鸿, 复旦大学高等代数习题课教学视频, https://www.bilibili.com/video/av90771191/