第3章 平面系统的相图
有了上一章的线性叠加原理后,我们现在来计算任一平面系统的通解。粗看,似乎有无穷多不同的情形要讨论,但我们将看到,最简形式的几个例子就几乎涵盖了我们在高维情形将要遇到的所有解的类型。
3.1 不同实特征值
考虑系统$oldsymbol X'=oldsymbol {AX}$,假设$oldsymbol A$有两个实特征值$lambda_1<lambda_2$。先暂时假设$lambda_i e 0$,此时有如下三种情形:
[(1)lambda_1<0<lambda_2;;;;(2)lambda_1<lambda_2<0;;;;(3)0<lambda_1<lambda_2.]
我们先对每种情形给出一个典型例子,随后我们将看到任何属于这三类的系统都可以类似地处理。
例 (鞍点)首先考虑简单的系统$oldsymbol X'=oldsymbol {AX}$,其中
[oldsymbol A=left( egin{array}{l}
lambda_1 & 0 \
0 &lambda_2
end{array}
ight),]
并且$lambda_1<0<lambda_2$。该系统可以分解成两个不相关联的一阶方程
[egin{array}{l}x'= {lambda _1}x\y'= {lambda _2}y.end{array}]
对应于$lambda_1$的一个特征向量是(1,0),对应于$lambda_2$的一个特征向量是(0,1)。从而方程的通解为
[oldsymbol X(t) = alpha {e^{{lambda _1}t}}left( egin{array}{l}1\0end{array} ight) + eta {e^{{lambda _2}t}}left( egin{array}{l}0\1end{array} ight).]
由于$lambda_1<0$,位于$x$轴上形如$alpha e^{lambda_1t}(1,0)$的直线解在$t o infty$时趋于(0,0)。这个坐标轴称为稳定线。由于$lambda_2>0$,位于$y$轴上解$eta e^{lambda_2t}(0,1)$在$t o infty$时,远离(0,0)。这个坐标轴称为不稳定线。由于在$t$增加时,$oldsymbol X(t)$与$(0,eta e^{lambda_2t})$越来越近,因而在$t o infty$时,其它的解$(alpha,eta e 0)$都将沿不稳定线趋于$infty$。而在负向时,这些解都将沿稳定线趋于$infty$。
我们在图3.1中作出了该系统的相图。所谓一个系统的相图就是指一个系统的一些有代表意义的解曲线在相平面$mathbb R^2$上的图像。系统的这种平衡点(特征值满足$lambda_1<0<lambda_2$)称为鞍点。
我们来看这种类型的一个稍微复杂一点的例子。考虑系统$oldsymbol X'=oldsymbol {AX}$,其中
[ oldsymbol A=left(
egin{array}{cc}
1&3\
1&-1\
end{array}
ight). ]
在第2章我们已经知道$oldsymbol A$的特征值为$pm 2$。对应于$lambda = 2$的特征向量是(3,1),而对应于$lambda = -2$的特征向量是(1,-1)。于是应有由形如
[oldsymbol X_1(t)=alpha e^{2t} left( egin{array}{cc}3\1 end{array} ight),]
的直线解构成不稳定线,当$t o infty$时,这些解都将远离原点。形如
[oldsymbol X_2(t)=eta e^{-2t} left( egin{array}{cc}1\-1 end{array} ight),]
的直线解则构成了稳定线,当$t o infty$时,这些解都将趋于原点。根据线性叠加原理,其它的解都具有形式
[oldsymbol X(t)=alpha e^{2t} left( egin{array}{cc}3\1 end{array} ight) + eta e^{-2t} left( egin{array}{cc}1\-1 end{array} ight)]
注意,如果$alpha e 0$,则当$t o infty$时,我们有
[oldsymbol X(t) sim alpha e^{2t} left( egin{array}{cc}3\1 end{array} ight) = oldsymbol X_1(t),]
而如果$eta e 0$,则当$t o -infty$时,我们有
[oldsymbol X(t) sim eta e^{-2t} left( egin{array}{cc}1\-1 end{array} ight) = oldsymbol X_2(t).]
于是当时间增加时,系统的典型解都将接近$oldsymbol X_1(t)$,而当时间减少时,它们将趋于$oldsymbol X_2(t)$。如图3.2所示,这与上一例子相似。
一般地,当$oldsymbol A$具有一正一负的特征值时,我们都可以找到的稳定线和不稳定线,其上的解分别趋于或远离原点,而其它解在$t o infty$时趋于不稳定线,在$t o -infty$时趋于稳定线。
例 (汇点)现在考虑$oldsymbol X'=oldsymbol {AX}$,其中
[oldsymbol A=left( egin{array}{l}
lambda_1 & 0 \
0 &lambda_2
end{array}
ight),]
但是$lambda_1<lambda_2<0$。和前面一样,我们可以找到两个直线解,从而得到通解
[oldsymbol X(t) = alpha {e^{{lambda _1}t}}left( egin{array}{l}1\0end{array} ight) + eta {e^{{lambda _2}t}}left( egin{array}{l}0\1end{array} ight).]
与鞍点情形不同,此时所有解在$t o infty$时都趋于(0,0)。现在要问:它们以怎样的方式趋于原点?我们来计算一个解的斜率$ ext dy/ ext dx$(假设$eta e 0$)。记
[egin{array}{cc} x(t)=alpha e^{lambda_1t}\y(t)=eta e^{lambda_2t}. end{array}]
于是,
[frac{ ext dy}{ ext dx} = frac{ ext dy/ ext dt}{ ext dx/ ext dt} = frac{lambda_2 eta e^{lambda_2t}}{lambda_1 alpha e^{lambda_1t}} = frac{lambda_2 eta}{lambda_1 alpha} e^{(lambda_2-lambda_1)t}.]
因为$lambda_2 - lambda_1 > 0$,从而这些斜率趋于$pm infty$(假设$eta e 0$)。于是,这些解将切于$y$轴趋于原点。
由于$lambda_1<lambda_2<0$,我们称$lambda_1$为强特征值,$lambda_2$为弱特征值(绝对值大的为强特征值,因为无论是增大或是减小,绝对值大的指数对应的解变化得更快),之所以如此称呼是解的$x$坐标趋于0比其$y$坐标趋于0要快得多(从图上看,感觉似乎$y$坐标趋于0比其$x$坐标趋于0要快,事实上,在靠近原点处,任意一条解曲线,$x$坐标的绝对值总是小于$y$坐标的绝对值,因此可以说明$x$坐标趋于0比其$y$坐标趋于0要快得多)。这就解释了为什么当解趋于原点时(除了$lambda_1$特征向量所对应的直线上的解),这些解会朝弱特征值所对应的解直线聚集(就像流水一样,总往低地势(弱特征值)聚集)。
图3.3a给出了该系统的相图。此时平衡点称为汇点。
例 (源点)当矩阵
[oldsymbol A=left( egin{array}{l}
lambda_1 & 0 \
0 &lambda_2
end{array}
ight),]
满足$0<lambda_1<lambda_2$时,对应的向量场可以看成是上一例子的负向量场。其通解相图是一样的,只是所有的解都沿着相同的路线远离(0,0)(见图3.3b)。
现在,可能有人会说我们所展示的例子过于简单。现在看来的确如此,但是随后我们将看到,任何具有不同实特征值的微分方程系统都可以通过坐标变换化成这种特殊形式。
最后,当有一个特征值等于0时,情况会有些特别。我们已经知道,此时有一条直线上的点全都是平衡点。如果另一个特征值$lambda$非零,则$lambda$的符号决定了其它的解是趋于这些平衡点还是远离这些平衡点。
3.2 复特征值
有时,特征多项式的根会是复数,与实情形类似,我们称这些根为复特征根。当矩阵$oldsymbol A$有复特征根时,我们不再有直线解,然而,通过利用一些复数及复函数的技巧,我们仍然可以像以前一样得到通解。在下面的例子中,我们将看到一般的过程是怎样的。
例 (中心)考虑系统$oldsymbol X'=oldsymbol {AX}$,其中
[oldsymbol A=left( egin{array}{cc}
0&eta \
-eta & 0
end{array}
ight),]
并且$eta e 0$。其特征方程为$lambda^2 + eta ^2 = 0$,于是特征值为虚数$pm ieta$。如果不担心可能出现的复向量,我们可以像以前一样去寻找与$lambda = ieta$相对应的特征向量。这需要求解方程组
[left( egin{array}{cc} - ext ieta &eta \ - eta & - ext ieta end{array} ight)left( egin{array}{cc}x\yend{array} ight) = left( egin{array}{cc}0\0end{array} ight).]
由于第二个方程是多余的,上述方程组等价于$ ext ieta x = eta y$。于是得到一个复特征向量(1,i),从而函数
[oldsymbol X(t) = {e^{ ext ieta t}}left( egin{array}{cc}1\ ext iend{array} ight)]
为$oldsymbol X'=oldsymbol {AX}$相应的复解。
通常,对一个实微分方程系统得到一个复解不是太合适,但我们可以通过欧拉公式
[e^{ ext i eta t} = cos eta t + ext i sin eta t]
来克服这一点。利用欧拉公式,可将解写成
[oldsymbol X(t) = left( egin{array}{cc}coseta t + ext i sin eta t\ ext i(cos eta t + ext i sin eta t) end{array} ight) =left( egin{array}{cc}coseta t + ext i sin eta t\ -sin eta t + ext i cos eta t end{array} ight). ]
将$oldsymbol X(t)$的实部和虚部分开,可以写得更好些
[oldsymbol X(t) = oldsymbol R_{ ext {Re}}(t) + ext i oldsymbol X_{ ext {Im}}(x),]
其中
[oldsymbol R_{ ext {Re}}(t) = left( egin{array}{cc} cos eta t \ -sin eta t end{array} ight),oldsymbol R_{ ext {Im}}(t) = left( egin{array}{cc} sin eta t \ cos eta t end{array} ight).]
我们发现$oldsymbol R_{ ext {Re}}(t)$和$oldsymbol R_{ ext {Im}}(t)$都是原系统的(实)解。进一步,由于
[oldsymbol X_{ ext {Re}}(0) = left( egin{array}{l}1\0end{array} ight),oldsymbol X_{ ext {Im}}(0) = left( egin{array}{l}0\1end{array} ight),]
它们的线性组合
[oldsymbol X(t) = c_1oldsymbol R_{ ext {Re}}(t) + c_2 oldsymbol X_{ ext {Im}}(x)]
就给出了任一初值问题的一个解,其中$c_1$和$c_2$是任意常数。
我们断言上式也是方程的通解。有些人会觉得,另一个特征根$lambda = - ext i eta$也会得到两个不相关的实解,可以证明,它们与另一个特征根所求得的实解是一样的。
可以看到,所有的这些解都是周期为$2pi /eta$的周期函数,事实上,从系统的相图可以看出,所有的解都在以原点为中心的圆周上。当$eta >0$时,解沿圆周顺时针旋转,而当$eta <0$时则逆时针旋转(见图3.4)。这种类型的系统称为一个中心。
例 (螺线汇点和螺线源点)一般地,考虑系统$oldsymbol X'=oldsymbol {AX}$,其中
[oldsymbol A=left( egin{array}{cc}
alpha &eta \
-eta & alpha
end{array}
ight),]
并且$alpha,eta e 0$。其特征多项式为$lambda^2 -2alpha lambda + alpha^2 + eta^2$,特征值为$lambda = alpha pm ext ieta$。与$alpha + ext ieta $相对应的一个特征向量由方程
[(alpha -( alpha + ext ieta))x + eta y = 0]
所确定。从而(1,i)仍然是一个特征向量,由此可得如下复解
[oldsymbol X(t) = {e^{(alpha + ext ieta )t}}left( egin{array}{l}1\ ext iend{array} ight) = {e^{alpha t}}left( egin{array}{l}cos eta t\ - sin eta tend{array} ight) + ext i{e^{alpha t}}left( egin{array}{l}sin eta t\cos eta tend{array} ight) = {oldsymbol X_{{mathop{ m Re} olimits} }}(t) + ext i{oldsymbol X_{{mathop{ m Im} olimits} }}(t).]
与刚才一样,$oldsymbol X_{ ext {Re}}(t) + ext i oldsymbol X_{ ext {Im}}(t)$ 都是系统的实解,并且它们的初值条件是线性无关的。这样我们就得到了通解
[oldsymbol X(t) =c_1 e^{alpha t} left( egin{array}{l} cos eta t \ -sin eta t end{array} ight) +c_2 e^{alpha t} left( egin{array}{l} sin eta t \ cos eta t end{array} ight).]
如果没有$e^{alpha t}$这一项,这些解将周期地缠绕在以原点为中心的圆周上,而多了$e^{alpha t}$这一项将使得解要么盘旋地进入原点(当$alpha<0$时),要么盘旋地离开原点(当$alpha>0$时)。此时平衡点分别称为螺线汇点或螺线源点(见图3.5)。
3.3 重特征值
现在剩下要讨论的情形就是$oldsymbol A$有重的实特征值情形。它的一个简单形式就是$oldsymbol A$为对角矩阵
[oldsymbol A = left( egin{array}{cc} lambda & 0 \ 0 & lambda end{array} ight).]
$oldsymbol A$的两个特征值都是$lambda$。此时,对任给的$oldsymbol V in mathbb R^2$,
[oldsymbol {AV} = lambda oldsymbol V,]
因而任何非零向量都是特征向量。于是任何解都可以写成
[oldsymbol X(t) = alpha e^{lambda t}oldsymbol V.]
每一个解都在通过原点的直线上,要么趋于原点(当$lambda<0$时),要么远离原点(当$lambda>0$时)。因而,这是一种容易的情形。
更有趣的情形是
[oldsymbol A = left( egin{array}{cc} lambda & 1 \ 0 & lambda end{array} ight).]
的情形。此时两个特征值仍然都等于$lambda$。但此时只有一个线性无关的特征向量(1,0)。从而其对应的直线解为
[oldsymbol X_1(t) = alpha e^{lambda t} left( egin{array}{l} 1\ 0 end{array} ight).]
为了找到其它的解,我们将系统写成
[egin{array} x'(t) = lambda x + y \ y' = lambda y. end{array}]
当$y e 0$时,则有
[y(t) = eta e^{lambda t}.]
这是关于$x(t)$的一个非自治一阶微分方程。可能会有人猜测解的形式为$e^{lambda t}$,但是其非自治项也是这种形式的。可能你们在微积分课程上已经知道,最好假设解的可能形式为
[x(t) = alpha e^{lambda t} + mu te^{lambda t},]
其中$alpha, mu$为常数。这种技巧通常称为“待定系数法”。将上式代入微分方程可得$mu = eta$,而$alpha$则是任意的。从而系统的解可以写成
[alpha e^{lambda t}left( egin{array}{l}1\0 end{array} ight) + eta e^{lambda t} left( egin{array}{l}t\1 end{array} ight).]
这事实上就是系统的通解。如果$lambda <0$,在$t o infty$时,所有的解都趋于(0,0)。而当$lambda >0$时,所有的解都远离(0,0),见图3.6。事实上,解都是沿特征向量(1,0)的方向趋于或远离原点的。
3.4 坐标变换
在前三节,除去相图的不同外,我们实际上只处理了以下三种类型的矩阵
[left( egin{array}{cc} lambda & 0 \ 0 & mu end{array} ight), left( egin{array}{cc} alpha & eta \ -eta & alpha end{array} ight),left( egin{array}{cc} lambda & 1 \ 0 & lambda end{array} ight),]
其中在第一种情形$lambda$可能等于$mu$(以上三种情形对应:(1)两个不等实根;(2)一对共轭复根;(3)两个相等实根)。
任何这种形式的$2 imes 2$矩阵称为标准型。这种形式的系统似乎相当特别,但事实并非如此。任给线性系统$oldsymbol X'=oldsymbol {AX}$,我们总可以通过“坐标变换”,使得新系统的系数矩阵成为标准型,从而变得容易求解。下面我们就来做这件事。
$mathbb R^2$上的一个线性映射(或线性变换)是指一个如下形式的函数$T:mathbb R^2 o mathbb R^2$:
[oldsymbol T left( egin{array}{l}x\y end{array} ight) = left( egin{array}{l}ax+by\cx+dy end{array} ight). ]
也就是说,$oldsymbol T$的作用就是用$2 imes 2$矩阵
[left( egin{array}{cc} a&b\c&d end{array} ight)]
去乘以任一向量。因而我们认为线性映射和它对应的矩阵是可以互换使用的,从而也写成
[oldsymbol T = left( egin{array}{cc} a&b\c&d end{array} ight)]
现在假设$oldsymbol T$是可逆的,我们来考虑系统
[oldsymbol Y' = (oldsymbol {T^{-1}AT}) oldsymbol Y,]
(而不是线性系统$oldsymbol X'=oldsymbol {AX}$)。可见,如果$oldsymbol Y(t)$是新系统的一个解,则$oldsymbol X(t) = oldsymbol {TY}(t)$就是$oldsymbol X'=oldsymbol {AX}$的一个解(代入验证即可)。
也就是说,线性映射$oldsymbol T$将$oldsymbol Y' = (oldsymbol {T^{-1}AT}) oldsymbol Y$的解变换成了$oldsymbol X'=oldsymbol {AX}$的解。反过来,$oldsymbol T^{-1}$则将$oldsymbol X'=oldsymbol {AX}$的解变成了$oldsymbol Y' = (oldsymbol {T^{-1}AT}) oldsymbol Y$的解。
从而$T$可以看成是一个坐标变换,它将一个给定的线性系统变成另外一个系数矩阵不同的线性系统。我们希望的是,对一给定系统,找到一个线性映射$oldsymbol T$,使得经过变换得到的系统$oldsymbol Y' = (oldsymbol {T^{-1}AT}) oldsymbol Y$的容易求解。你们也许可以猜到,我们总可以找到一个线性映射(以特征向量为列向量组成$oldsymbol T$)将一个给定的线性系统变成标准型中的一个。
总结:坐标变换也可以看作变量代换,如果对于非标准型的$oldsymbol X'=oldsymbol {AX}$系统,可以先求出两个线性无关的特征向量(如果存在的话),以这两个线性无关的特征向量组成坐标变换矩阵$oldsymbol T$,$oldsymbol {T^{-1}AT}$即变换为标准型矩阵。从非标准矩阵本身求解得到坐标变换矩阵,然后将自身标准化,目的就是这么简单。