16 级高代 II 思考题九 设 $V$ 是数域 $mathbb{K}$ 上的 $n$ 维线性空间, $varphi$ 是 $V$ 上的线性变换, $f(lambda),m(lambda)$ 分别是 $varphi$ 的特征多项式和极小多项式. 设 $f(lambda)=m(lambda)=P_1(lambda)^{r_1}P_2(lambda)^{r_2}cdots P_k(lambda)^{r_k}$, 其中 $P_1(lambda),P_2(lambda),cdots,P_k(lambda)$ 是 $mathbb{K}$ 上互异的首一不可约多项式, $r_igeq 1$, 试求 $V$ 的所有 $varphi$-不变子空间.
解法一 利用发展起来的循环子空间理论, 请参考教学论文 [1] 的例 2.
为了阐述接下去的几种解法, 我们先做一个化简, 把问题归结到一个初等因子的情形.
设 $V_i=mathrm{Ker\,}P_i(varphi)^{r_i}$, $f_i(lambda),m_i(lambda)$ 分别是 $varphi|_{V_i}$ 的特征多项式和极小多项式, 则由高代白皮书的例 7.21 可得, $V=V_1oplus V_2opluscdotsoplus V_k$, 且 $f_i(lambda)=m_i(lambda)=P_i(lambda)^{r_i}$.
引理 1 任取 $V$ 的 $varphi$-不变子空间 $U$, 则 $U=U_1oplus U_2opluscdotsoplus U_k$, 其中 $U_i$ 是 $V_i$ 的 $varphi$-不变子空间.
引理 1 的证明 令 $U_i=Ucap V_i$, 则 $U_i$ 是 $V_i$ 的 $varphi$-不变子空间. 由 $V_i$ 的和是直和易证 $U_i$ 的和也是直和. 一方面, $U_1+U_2+cdots+U_ksubseteq U$ 是显然的. 另一方面, 任取 $uin U$, 设 $u=v_1+v_2+cdots+v_k$, 其中 $v_iin V_i$, 我们只要证明 $v_iin U_i$, 就能得到 $Usubseteq U_1+U_2+cdots+U_k$, 从而 $U=U_1+U_2+cdots+U_k=U_1oplus U_2opluscdotsoplus U_k$. 注意到 $P_i(lambda)^{r_i}$ 是两两互素的多项式, 由中国剩余定理可知, 存在多项式 $g(lambda),q_i(lambda)$, 使得 $$g(lambda)=P_1(lambda)^{r_1}q_1(lambda)+1,\,\,\,\,g(lambda)=P_i(lambda)^{r_i}q_i(lambda),\,\,igeq 2,$$ 于是 $$g(varphi)(u)=(q_1(varphi)P_1(varphi)^{r_1}+I_V)(v_1)+sum_{i=2}^kq_i(varphi)P_i(varphi)^{r_i}(v_i)=v_1,$$ 即 $v_1=g(varphi)(u)in U$, 从而 $v_1in U_1$. 同理可证其他情形. $Box$
以下我们不妨假设 $varphi$ 的特征多项式 $f(lambda)$ 和极小多项式 $m(lambda)$ 满足 $f(lambda)=m(lambda)=P(lambda)^r$, 其中 $P(lambda)=lambda^d+a_1lambda^{d-1}+cdots+a_{d-1}lambda+a_d$ 是 $mathbb{K}$ 上的 $d$ 次首一不可约多项式, $rgeq 1$.
任取 $V$ 的非零 $varphi$-不变子空间 $U$, 容易验证限制变换 $varphi|_U$ 的特征多项式是 $varphi$ 的特征多项式的因式, 故可设 $varphi|_U$ 的特征多项式为 $P(lambda)^s$, 其中 $1leq sleq r$. 由 Cayley-Hamilton 定理可知, $Usubseteqmathrm{Ker\,}P(varphi)^s$. 注意到 $dim U=deg P(lambda)^s=sd$, 如果我们能证明 $$(*)qquaddimmathrm{Ker\,}P(varphi)^s=sd\,\, ext{对任意的}\,\,1leq sleq r\,\, ext{都成立},$$ 那么 $U=mathrm{Ker\,}P(varphi)^s$, 从而 $V$ 的所有 $varphi$-不变子空间就是 ${mathrm{Ker\,}P(varphi)^s,\,\,0leq sleq r}$, 共有 $r+1$ 个.
解法二 (由王雨程同学提供) 令 $K_i=mathrm{Ker\,}P(varphi)^i$, 则 $K_i$ 是 $varphi$-不变子空间, 若设 $varphi|_{K_i}$ 的特征多项式为 $P(lambda)^{t_i}$, 则 $dim K_i=deg P(lambda)^{t_i}=t_id$. 注意到 $0=K_0subseteq K_1subseteq K_2subseteqcdotssubseteq K_r=V$, 并且 $K_1 eq 0$ (否则, $P(varphi)$ 为同构, 这与 $P(varphi)^r=0$ 矛盾), 于是有不等式 $1leq t_1leq t_2leqcdotsleq t_r=r$. 我们断言 $t_i<t_{i+1}$ 对任意的 $1leq i<r$ 都成立. 用反证法, 若存在 $1leq j<r$, 使得 $t_j=t_{j+1}$, 则由高代白皮书的例 4.32 完全类似的讨论可得 $K_j=K_{j+1}=cdots=K_r=V$, 于是 $varphi$ 适合多项式 $P(lambda)^j$, 这与 $varphi$ 的极小多项式 $m(lambda)=P(lambda)^r$ 矛盾. 由上述断言即得 $t_i=i\,(1leq ileq r)$ 成立, $(*)$ 式得证. $Box$
我们也可以把 $varphi|_{K_i}$ 的极小多项式先求出来, 下面的引理是 16 级高代 II 期中考试第六大题.
引理 2 设 $W$ 是非零 $varphi$-不变子空间, 则 $varphi|_W$ 的极小多项式等于其特征多项式.
引理 2 的证明 取 $W$ 的一组基, 并延拓为 $V$ 的一组基, 则 $varphi$ 在这组基下的表示矩阵为 $M=egin{pmatrix} A & C \ 0 & B end{pmatrix}$. 已知 $M$ 的极小多项式等于其特征多项式, 我们只要证明 $A$ 的极小多项式也等于其特征多项式即可. 由于极小多项式在基域扩张下不改变 (参考教学论文 [2]), 所以我们可以把涉及到的矩阵都看成复矩阵来处理. 用反证法, 若 $A$ 的极小多项式不等于其特征多项式, 那么必存在 $A$ 的特征值 $lambda_0$, 使得属于它的 Jordan 块至少有两个, 从而 $lambda_0$ 至少有两个线性无关的特征向量. 把这些特征向量延拓一下, 可以得到 $lambda_0$ 作为 $M$ 的特征值, 它至少有两个线性无关的特征向量, 从而至少有两个 Jordan 块, 但这与 $M$ 的极小多项式等于其特征多项式相矛盾. $Box$
解法三 (由冯雅颂同学提供) 令 $K_s=mathrm{Ker\,}P(varphi)^s$, 则 $varphi|_{K_s}$ 适合多项式 $P(lambda)^s$, 从而其极小多项式整除 $P(lambda)^s$. 由引理 2 可知, $varphi|_{K_s}$ 的极小多项式等于其特征多项式, 于是其特征多项式的次数小于等于 $deg P(lambda)^s=sd$, 从而 $sd=dim Uleqdim K_sleq sd$, 故 $U=K_s$. $Box$
设 $varphi$ 在某组基下的表示矩阵为 $A$, 则由线性变换的维数公式可知 $dimmathrm{Ker\,}P(varphi)^s=n-r(P(A)^s)$. 下面的解法四根据矩阵的秩在基域扩张下的不变性 (参考教学论文 [2]), 利用 $A$ 的 Jordan 标准型来计算 $P(A)^s$ 的秩, 而解法五则利用数域 $mathbb{K}$ 上 $A$ 的第一类广义 Jordan 标准型来计算 $P(A)^s$ 的秩.
解法四 由假设 $A$ 的特征多项式 $f(lambda)$ 和极小多项式 $m(lambda)$ 满足 $$f(lambda)=m(lambda)=P(lambda)^r=(lambda-lambda_1)^r(lambda-lambda_2)^rcdots(lambda-lambda_d)^r,$$ 其中 $lambda_1,lambda_2,cdots,lambda_d$ 是 $P(lambda)$ 的 $d$ 个不同的复数根, 于是 $A$ 的 Jordan 标准型为 $J=mathrm{diag}{J_r(lambda_1),J_r(lambda_2),cdots,J_r(lambda_d)}$, 从而 $P(J)^s=(J-lambda_1I)^s(J-lambda_2I)^scdots(J-lambda_dI)^s$. 由简单的计算可得 $r(P(A)^s)=r(P(J)^s)=(r-s)d=n-sd$, 从而 $dimmathrm{Ker\,}P(varphi)^s=sd$. $Box$
解法五 (由徐钰伦同学提供) 由高代白皮书的例 7.67 可知, $A$ 的第一类广义 Jordan 标准型为 $$J=J_r(P(lambda))=egin{pmatrix} F(P(lambda)) & I & & & \ & F(P(lambda)) & I & & \ & & ddots & ddots & \ & & & ddots & I \ & & & & F(P(lambda)) end{pmatrix},$$ 其中 $F(P(lambda))$ 是对应于 $P(lambda)$ 的有理块, $I$ 是单位阵. 根据通常的 Jordan 块带入多项式的计算可知, $P(J)^s$ 是一个上三角矩阵, 上 $i$ 次分块对角线上的元素均为 $dfrac{1}{i!}(P(lambda)^s)^{(i)}|_{lambda=F(P(lambda))}$, $0leq ileq r-1$. 注意到 $F=F(P(lambda))$ 适合其特征多项式 $P(lambda)$, 并由 $P(lambda)$ 不可约可知 $(P(lambda),P'(lambda))=1$, 从而 $P'(F)$ 为可逆阵. 于是由简单的计算可知, 当 $0leq i<s$ 时, $P(J)^s$ 的上 $i$ 次分块对角线上的元素全为零, 而 $P(J)^s$ 的上 $s$ 次分块对角线上的元素全为 $P'(F)^s$, 这是一个非异阵, 从而 $r(P(A)^s)=r(P(J)^s)=(r-s)d=n-sd$, 从而 $dimmathrm{Ker\,}P(varphi)^s=sd$. $Box$
利用数域 $mathbb{K}$ 上 $varphi$ 的第二类广义 Jordan 标准型, 我们可以给出最后两种解法, 它们分别对应于博文《Jordan 块的几何》中 Part B 的两种方法. 我们惊奇的发现, 第一类广义 Jordan 块继承了通常 Jordan 块在矩阵运算中的便利, 而第二类广义 Jordan 块则继承了通常 Jordan 块在循环空间框架下的几何意义.
由高代白皮书的例 7.67 可知, 存在 $V$ 的一组基 ${e_{1,1},e_{1,2},cdots,e_{1,d};e_{2,1},e_{2,2},cdots,e_{2,d};cdots;e_{r,1},e_{r,2},cdots,e_{r,d}}$, 使得 $varphi$ 在这组基下的表示矩阵为第二类广义 Jordan 标准型 $$J=widetilde{J}_r(P(lambda))=egin{pmatrix} F(P(lambda)) & C & & & \ & F(P(lambda)) & C & & \ & & ddots & ddots & \ & & & ddots & C \ & & & & F(P(lambda)) end{pmatrix},$$ 其中 $C$ 是左下角元素为 1, 其余元素为 0 的矩阵. 为了表达式的统一性, 约定 $e_{0,j}=0\,(1leq jleq d)$, 则有 $$varphi(e_{i,d})=e_{i,d-1}-a_1e_{i,d},\,\,varphi(e_{i,d-1})=e_{i,d-2}-a_2e_{i,d},\,\,cdots,\ varphi(e_{i,2})=e_{i,1}-a_{d-1}e_{2,d},\,\,varphi(e_{i,1})=e_{i-1,d}-a_de_{i,d},\,\,1leq ileq r.$$ 整理后可得 $$e_{i,d-1}=(varphi+a_1I_V)(e_{i,d}),\,\,e_{i,d-2}=(varphi^2+a_1varphi+a_2I_V)(e_{i,d}),\,\,cdots,\ e_{i,1}=(varphi^{d-1}+a_1varphi^{d-2}+cdots+a_{d-1}I_V)(e_{i,d}),\,\,e_{i-1,d}=P(varphi)(e_{i,d}),\,\,1leq ileq r.qquad (**)$$
令 $V_i=L(e_{i,1},e_{i,2},cdots,e_{i,d})$, 则 $V=V_1oplus V_2opluscdotsoplus V_r$. 根据上面的关系式 $(**)$ 可知, 在 $V_i$ 中, $e_{i,d}$ 可通过 $varphi$ 的次数小于 $n$ 的多项式映到每一个基向量 $e_{i,j}\,(1leq jleq d)$, 并且 $e_{i,d}$ 可通过 $P(varphi)$ 映到 $e_{i-1,d}$, 进一步还有 $P(varphi)(e_{i,j})=e_{i-1,j}$, 从而 $P(varphi)^i(e_{i,j})=0\,(1leq ileq r,\,1leq jleq d)$.
解法六 (由何陶然同学和颜匡萱同学提供) 由上面的关系式易证 $mathrm{Ker\,}P(varphi)^s=V_1oplus V_2opluscdotsoplus V_s$, 特别的, $dimmathrm{Ker\,}P(varphi)^s=sd$, 从而 $(*)$ 式得证. 进一步, 每一个 $mathrm{Ker\,}P(varphi)^s\,(1leq sleq r)$ 都是一个循环子空间, 其循环向量是 $e_{s,d}$, 它的极小多项式是 $P(lambda)^s$. $Box$
解法七 任取 $V$ 的非零 $varphi$-不变子空间 $U$, 令 $$s=max{\,i\,|\,u=u_1+u_2+cdots+u_i,\,\, ext{其中}\,uin U,\,u_jin V_j\,(1leq jleq i)\, ext{且}\,u_i eq 0},$$ 则 $Usubseteq V_1oplus V_2opluscdotsoplus V_s$. 反之, 可取到 $uin U$, $u=u_1+u_2+cdots+u_s$, 其中 $u_jin V_j\,(1leq jleq s)$ 且 $u_s eq 0$. 由上面的关系式可知, 存在不能被 $P(lambda)$ 整除的多项式 $g(lambda)$, 使得 $u=g(varphi)(e_{s,d})$. 由于 $(g(lambda),P(lambda)^s)=1$, 故存在 $u(lambda),v(lambda)$, 使得 $g(lambda)u(lambda)+P(lambda)^sv(lambda)=1$. 上式代入 $lambda=varphi$ 并作用在 $e_{s,d}$ 上可得 $$e_{s,d}=u(varphi)g(varphi)(e_{s,d})+v(varphi)P(varphi)^s(e_{s,d})=u(varphi)(u)in U,$$ 于是 $U=V_1oplus V_2opluscdotsoplus V_s=mathrm{Ker\,}P(varphi)^s$. $Box$
综合以上证明, $V$ 的任一 $varphi$-不变子空间 $U$ 必为 $mathrm{Ker\,}(P_1(varphi)^{s_1}P_2(varphi)^{s_2}cdots P_k(varphi)^{s_k})$ 的形式, 其中 $0leq s_ileq r_i\,(1leq ileq k)$, 这样的 $varphi$-不变子空间一共有 $(r_1+1)(r_2+1)cdots(r_k+1)$ 个. $Box$
参考文献
[1] 谢启鸿, 循环子空间的进一步应用, 大学数学, 2017, 33(1), 17–25.
[2] 谢启鸿, 高等代数中若干概念在基域扩张下的不变性, 大学数学, 2015, 31(6), 50–55.