第7章 非线性系统
在本章,我们开始研究非线性微分方程。对于系统(常系数)系统,我们总可以找到任一初值问题的显式解,对于非线性系统,这种情况相当少见。事实上,一些基本性质,例如解的存在唯一性,在线性情形下是显然的,而在非线性情形则不再成立。我们将看到,有些非线性系统甚至对任何初值问题都无解。另一方面,有些系统却有无穷多个不同解。而且即使找到这样系统的一个解,它也不一定对所有时刻有定义。例如,解有可能在有限时间就趋于$infty$。随之而来,问题就产生了:例如,当系统的初始条件发生哪怕一点微小变化时,将会发生什么?相应的解会连续变化吗?所有的这些问题对线性系统都是清楚的,而对非线性系统则未必。这意味着非线性微分方程的基本理论要比线性的复杂得多。
实际中产生的大部分非线性系统都是“好的”,也就是说,它们具有解的存在唯一性,当初始条件改变时,解也会随之而连续变化,其它的“自然”性质也将发生变化。这样,我们就得面临一个选择:给定一个非线性系统,我们要么简单地向前进行,寄希望(或者去验证)在每一种特定情形,系统解的行为都很好;在此刻停下来,花些时间来阐述一些必要的假设,以保证给定的非线性系统解的行为很好。
7.1 动力系统
大多数的非线性微分方程系统不可能解析地求解。原因之一就是,我们没有足够多具有特定名称的函数来写出这些系统的显式解。同样困难的是,我们将看到,高维系统可能产生混沌行为,这种性质使得即使知道了显式解,也不会对我们理解系统的整体行为有什么实质性的帮助(为什么呢?)。于是,为了理解这些系统,我们被迫去寻找另外的办法,这就是在动力系统领域出现的各种技巧。我们将综合应用分析的、几何的以及拓扑的技巧来得到有关这些方程解的行为的严格结果。
动力系统是一种描述一个给定空间$S$中所有点随时间旅程的方法。空间$S$可以看成是,比如,某个物理系统的状态空间。数学上,$S$可能是欧几里得空间,也可能是欧几里得空间的一个开子集(为什么要强调是开呢?),或一些其它空间,如$mathbb R^3$中的曲面。当我们考虑力学中产生的动力系统时,空间$S$将是系统所有可能的位置和速度。为了简单起见,我们将始终假设空间$S$就是欧几里得空间$mathbb R^n$,但在某些情形,重要的动力行为只局限在$mathbb R^n$的一个特定子集上。
给定一个初始位置$oldsymbol X in mathbb R^n$,$mathbb R^n$上的一个动力系统会告诉我们$oldsymbol X$在1个单位时间后在哪里,2个单位时间在哪里,等等。我们将$oldsymbol X$的这些新位置记为$oldsymbol X_1,oldsymbol X_2,$等等。在零时刻,$oldsymbol X$的位置为$oldsymbol X_0$。在零时刻前一个单位时刻,$oldsymbol X$的位置为$oldsymbol X_{-1}$,一般地,$oldsymbol X$的“轨线”由$oldsymbol X_t$给出。如果只是在整数时间值测量位置$oldsymbol X_t$,我们就得到一个离散动力系统的例子,我们将在第15章研究离散动力系统。如果在连续时间$t in mathbb R$测量位置$oldsymbol X_t$,我们就得到一个连续动力系统。如果系统以一种连续可微的方式依赖于时间,我们就得到一个光滑动力系统。这是在微分方程系统研究中产生的三种主要类型的动力系统。
将$t$带到$oldsymbol X_t$的函数要么是得到$mathbb R^n$中的一列点,要么是得到$mathbb R^n$中的一条曲线,无论哪种情形,它都记录了当时间从$-infty$跑到$infty$时,$oldsymbol X$的生活历史。动力系统的不同分支需要对$oldsymbol X_t$怎样依赖于$t$作不同的假设。例如,遍历理论需要假设这样的函数保持$mathbb R^n$上的一个测度不变;拓扑动力系统则只需假设$oldsymbol X_t$是连续变化的。在微分方程情形,我们通常假设$oldsymbol X_t$是连续可微的(这三种分支的特点和研究重点是什么呢?)。对每个时刻$t$,我们都可以定义映射$phi_t:mathbb R^n o mathbb R^n$,它将$oldsymbol X$映到$oldsymbol X_t$(就像Markov链一样,从某一时刻,转移到另一时刻)。由于我们可将$oldsymbol X_t$理解成随时间变化的一个状态,期望$phi_t$是以$phi_{-t}$为逆就是很自然的事(相当于一条路,能从点$a$走到点$b$,自然,沿同一条路,可以从$b$走到点$a$)。同样地,$phi_0$必定就是恒等函数$phi_0(oldsymbol X) = oldsymbol X$,而$phi_t(phi_s(oldsymbol X)) = phi_{t+x}(oldsymbol X)$也是一个自然的条件。我们将所有的这些都正式地陈述在下面的定义中。
定义 $mathbb R^n$上的一个光滑动力系统是指这样的一个连续可微函数$phi:mathbb R imes mathbb R^n o mathbb R^n$,其中$phi(t,oldsymbol X) = phi_t(oldsymbol X)$满足下面的两条:
(1)$phi_0:mathbb R^n o mathbb R^n$为恒等函数:$phi_0(oldsymbol X_0) = oldsymbol X_0$;
(2)对所有的$t,sin mathbb R$,复合函数$phi_t circ phi_s = phi_{t+s}$。
回忆一下,一个函数是连续可微的,如果在整个定义域上,它的所有偏导数都存在并且连续。习惯上,一个连续可微函数是指一个$C^1$函数;如果函数是$k$次连续可微的,它就称为一个$C^k$函数。注意,上面的定义蕴涵着,对于每一个$t,phi_t:mathbb R^n o mathbb R^n$都是$C^1$的,而且有$C^1$的逆$phi_{-t}$。
例 对于一阶微分方程$x' = ax$,函数$phi_t(x_0) = x_0 exp (at)$给出了这个方程的所有解,而且也定义了$mathbb R$上的一个光滑动力系统。
例 令$oldsymbol A$为一$n imes n$矩阵。则函数$phi_t(oldsymbol X_0) = exp (toldsymbol A)oldsymbol X_0$就定义了$mathbb R^n$上的一个光滑动力系统。显然,$phi_0 = exp (0) = oldsymbol I$,而且在上一章中已经看到:
[phi_{t+s} = exp ((t+s)oldsymbol A) = (exp (t oldsymbol A))(exp (soldsymbol A)) = phi_t ○ phi_s.]
可以看出,上面两个例子都是与微分方程系统$oldsymbol X' = oldsymbol {AX}$紧密相关的。一般地,从每个光滑动力系统都可以如下得到$mathbb R^n$上的一个向量场(可以通过以上两例验证):给定$phi_t$,令
[oldsymbol F(oldsymbol X) = frac{ ext d}{ ext d t}Bigg|_{t=0} phi_t(oldsymbol X).]
于是,$phi_t$恰好就是与$oldsymbol X' = oldsymbol F(oldsymbol X)$的流相应的时间$t$映射。
反过来,如果微分方程$oldsymbol X' = oldsymbol F(oldsymbol X)$的流对所有的时间,其时间$t$映射都有良好的定义,而且是连续可微的,则这个微分方程就生成了一个光滑动力系统。很遗憾,事情并不总是如此。(需要什么条件呢?见前面光滑动力系统的定义!)
7.2 存在唯一性定理
我们现在转到微分方程的基本定理——存在唯一性定理。考虑微分方程系统
[oldsymbol X' = oldsymbol F(oldsymbol X).]
其中$oldsymbol F:mathbb R^n o mathbb R^n$。此系统的一个解是指定义在某一区间$J subset R$上的函数$oldsymbol X:J o mathbb R^n$,使得对所有的$t in J$,都有
[oldsymbol X'(t) = oldsymbol F(oldsymbol X(t)).]
几何上,$oldsymbol X(t)$是$mathbb R^n$中的一条曲线,对于所有的$t in J$,切向量$oldsymbol X'(t)$都存在并且等于$oldsymbol F(oldsymbol X(t))$。像前面几章一样,我们认为这个向量的基点位于$oldsymbol X(t)$,于是映射$oldsymbol F:mathbb R^n o mathbb R^n$就定义了$mathbb R^n$上的一个向量场。解$oldsymbol X:J o mathbb R^n$的一个初始条件或一个初值是指形如$oldsymbol X(t_0) = oldsymbol X_0$的一个规定,其中$t_0 in J,oldsymbol X_0 in mathbb R^n$。为了简单,我们通常取$t_0 = 0$。微分方程的一个主要问题就是寻找任一初值问题的解,即对每个$oldsymbol X_0 in mathbb R^n$,确定系统的解使得它满足初始条件$oldsymbol X(0) = oldsymbol X_0$。
很遗憾,非线性微分方程对某些初始条件可能会没有解(会不会有无穷多个解呢?可能会!)。
例 考虑下面简单的一阶微分方程
egin{equation}
x’=left{ egin{array}{cl}
1 & extrm{if }x<0\
-1 & extrm{if }xge0.end{array}
ight.
end{equation}
$mathbb R$上的这个向量场在$x ge 0$时指向左边,而在$x <0$时指向右边。因此,没有解满足初始条件$x(0) = 0$。事实上,如果有这样的一个解,由于$x'(0) = -1$,它在初始时一定是递减的,但是,对所有取负的$x$,解又必须是递增的,这不可能发生。进一步,还可注意到,任何一个解都不可能对所有时间都有定义(对所有时间都有定义有什么特别意义呢?)。例如,当$x_0 > 0$时,过点$x_0$的解为$x(t) = x_0 -t$,但根据刚才同样的理由,这个解只在$-infty < t < x_0$时有意义(因为若$t ge x_0$,其导数应该为1,而不是-1)。
这个例子中的问题在于向量场在0处并不连续;只要向量场在某点出现间断,我们就可能面对相邻的向量却指向“相反”的方向,这样就使得解在这些坏点处中断。
对于非线性微分方程,除了解的存在性问题之外,我们还会碰到,某些方程对于同一个初值问题可能会有许多不同的解。
例(本例没看懂!!) 考虑微分方程
[x' = 3x^{frac{2}{3}}.]
恒等于零的函数$u:mathbb R o mathbb R,u(t) equiv 0$显然是满足初始条件$u(0) = 0$的一个解,而$u_0(t) = t^3$也是满足这个初始条件的一个解(是解吗?)。进一步,对任意的$ au > 0$,由下式给出的函数
[u_ au (t) = left{egin{align} &0 & ext {if}&t le au \& t- au)^3 & ext{if}&t> au,end{align} ight.]
也是满足初始条件$u_ au(0) = 0$的解。然而,这个例子中的微分方程在$x_0=0$处是连续的,现在的问题在于$3x^{2/3}$在这点处不可微。
从这两个例子中可以清楚地看到,为了保证解的存在唯一性,必须要对函数$oldsymbol F$加上某些条件。在第一个例子中,$oldsymbol F$在问题点0处不连续,而在第二个例子中,$oldsymbol F$在0处不可微。这表明$oldsymbol F$连续可微的假设可能就足以保证解的存在且唯一,这点我们随后就会看到。幸运的是,应用中产生的不连续可微的微分方程还是很少的,因而,对于给定的初始条件,不存在解或解不唯一的理解是相当例外的。
下面就是常微分方程的基本局部定理。
存在唯一性定理 考虑初值问题
[oldsymbol X' = oldsymbol F(oldsymbol X),oldsymbol X(t_0) = oldsymbol X_0,]
其中$oldsymbol X_0 in mathbb R^n$。假设$oldsymbol F:mathbb R^n o mathbb R^n$是$C^1$的,则,首先该初值问题有一个解,其次,只有一个这样的解。更准确地说,存在$a>0$,以及该微分方程满足初始条件$oldsymbol X(t_0) = oldsymbol X_0$的唯一解
[oldsymbol X:(t_0-a,t_0+a) o mathbb R^n.]
该定理的重要证明见第17章。但在这里,我们可以从直观上来理解这个结论,如果向量场$oldsymbol F$是$C^1$的,则意味着它比较光滑,而不会有急拐弯的点,这说明按照它的指示,我们在短时间内可以较好地预测未来的线路,而且由于$C^1$的限制,使得在极短的时间内,发展趋势是唯一的。
因而我们总可以假设唯一解定义在一个最大的时间区间上。然而这并不能保证$oldsymbol X(t)$对所有时刻都有定义,不管$oldsymbol F(oldsymbol X)$是多么“好”。
例 考虑$mathbb R$上的微分方程
[x'=1+x^2.]
这个方程以函数$x(t)= an (t+c)$作为它的解,其中$c$为一常数。由于当$t o -c pm pi/2$时,$x(t) o pm infty$,这个函数不能延拓到区间
[-c-frac{pi}{2}<t<-c+frac{pi}{2}]
之外。
这个例子很有代表性,因为我们有
定理 假设$U subset mathbb R^n$为一开集(看作状态空间的范围),并假设$oldsymbol F:U o mathbb R^n$(看作一种映射关系,或状态转移函数)是$C^1$的。令$oldsymbol X' = oldsymbol F(oldsymbol X)$的一个定义在最大开区间$J = (alpha,eta) subset mathbb R$上的解,其中$eta < infty$。则对任意的有界闭集$K subset U$(可以这么理解:只有闭集,才有“固定”的边界,才能确定可以超越),总存在某个$t in (alpha,eta)$使得$oldsymbol X(t) otin K$。
这个定理断言,如果解$oldsymbol X(t)$不能延拓到一个更大的时间区间,则这个解就会离开$U$中的任何有界闭集。这意味着,当$t o eta$时,$oldsymbol X(t)$可以任意接近$U$的边界。同样的结果在$t o alpha$时也成立。(理解为:解无法横向发展,只能竖着增长!)
7.3 解的连续依赖性
为了使得解的存在唯一性定理在各种物理(甚至是数学)意义下都有意义,还需要加上解$oldsymbol X(t)$对初始条件$oldsymbol X(0($的连续依赖性质。下面的定理给出了这个性质的准确陈述。
定理 考虑微分方程$oldsymbol X' = oldsymbol F(oldsymbol X)$,其中$oldsymbol F:mathbb R^n o mathbb R^n$是$C^1$的。假设$oldsymbol X(t)$是该方程的一个解,其在闭区间$[t_0,t_1]$上有定义,而且$oldsymbol X(t_0) = oldsymbol X_0$。则存在$oldsymbol X_0$的领域$U subset mathbb R^n$以及常数$K$使得,如果$oldsymbol Y_0 in U$,则存在定义在$[t_0,t_1]$上唯一的解$oldsymbol Y(t)$满足$oldsymbol Y(t_0) = oldsymbol Y_0$。而且,对所有的$t in [t_0,t_1],oldsymbol Y(t)$满足
[|oldsymbol Y(t) - oldsymbol X(t)| le K|oldsymbol Y_0 - oldsymbol X_0|exp (K(t - t_0)).]
这个结果表明,如果两个解$oldsymbol X(t)$和$oldsymbol Y(t)$出发时很接近,则在$t$靠近$t_0$时,它们一直很接近。虽然这两个解可能分开,但它们分开(但绝对不会交叉!)的速度不会超过指数增长速度。特别地,由于上面不等式的右端依赖于$oldsymbol Y_0 - oldsymbol X_0$,当假设它很小时,我人就得到:
推论 (对初始条件的连续依赖性) 记$phi(t,oldsymbol X)$为系统$oldsymbol X' = oldsymbol F(oldsymbol X)$的流,其中$oldsymbol F$为$C^1$的。则$phi$为$oldsymbol X$的连续函数。
例 令$k > 0$,我们知道系统
[oldsymbol X' = egin{pmatrix} -1 & 0\0&kend{pmatrix}oldsymbol X]
满足$oldsymbol X(0) = (-1,0)$的解为
[oldsymbol X(t) = (-e^{-t},0).]
对任一$eta e 0$,记$oldsymbol Y_eta(t)$为满足$oldsymbol Y_eta(0) = (-1,eta)$的解。则
[oldsymbol Y_eta(t) = (-e^{-t},eta e^{kt}).]
根据上面的定理,我们有
[left| {{oldsymbol Y_eta }(t) - oldsymbol X(t)} ight| = left| {eta {e^{kt}} - 0} ight| = left| {eta - 0} ight|{e^{kt}} = left| {{oldsymbol Y_eta }(0) - oldsymbol X(0)} ight|{e^{kappa t}}.]
这些解$oldsymbol Y_eta$的确会与$oldsymbol X(t)$分开(见图7.1),但它们至多以指数速度分开。而且,对于任何固定的时间$t$,当$eta o 0$时,$oldsymbol Y_eta (t) o oldsymbol X(t).$
微分方程常常依赖于参数。例如,调和振子方程依赖于参数$b$(阻尼系数)和$k$(弹性系数)。那么,一个自然的问题就是:这些方程的解如何依赖于这些参数呢?在前面的情形,只要系统是以连续可微的方式依赖于这些参数,则解就连续地依赖于这些参数。
定理 (参数的连续依赖性)令$oldsymbol X'=oldsymbol F_a(oldsymbol X)$为一个微分方程系统,其中$oldsymbol F_a$对$oldsymbol X$和$a$都连续可微。则这个系统的流也连续依赖于$a$。
7.4 变分方程
考虑自治系统$oldsymbol X'=oldsymbol F_a(oldsymbol X)$,其中$oldsymbol F$像通常一样假设为$C^1$的。该系统的流$phi(t,oldsymbol X)$同时为$t$和$oldsymbol F$的函数。由上节的结果可知,$phi$对变量$oldsymbol X$连续(即对初值连续依赖)。由于$t o phi(t,oldsymbol X)$就是过$oldsymbol X$的解曲线,我们还知道$phi$对变量$t$可微。事实上,$phi$对变量$oldsymbol X$也是可微的(我们将在第17章给出其证明):
定理 (流的可微性) 考虑系统$oldsymbol X'=oldsymbol F(oldsymbol X)$,其中$oldsymbol F$为$C^1$的。则系统的流$phi(t,oldsymbol X)$为一$C^1$函数,即$partial phi / partial t$和$partial phi / partial oldsymbol X$都存在,且对$t$和$oldsymbol X$连续(即偏导数是连续的)。
注意,一旦知道了过$oldsymbol X_0$的解,则对任何$t$,我们总能够算出$partial phi / partial t$,事实上,我们有
[frac{{partial phi }}{{partial t}}(t,{oldsymbol X_0}) =oldsymbol F(phi (t,{oldsymbol X_0})).]
另外,我们还有
[frac{{partial phi }}{{partial oldsymbol X}}(t,{oldsymbol X_0}) =oldsymbol D_{phi_t}(oldsymbol X_0),]
其中$oldsymbol D_{phi_t}$为函数$oldsymbol X o phi_t(oldsymbol X)$的雅可比。然而,为了计算$partial phi / partial oldsymbol X$,除了要知道过$oldsymbol X_0$的解,因为需要计算$phi_t$的各个分量的偏导数,我们似乎还要知道所有经过附近初始位置的解(导数的定义是基于因变量与自变量变化之比,因此要求在所求点的领域内保证函数有确定的值,对应到这里,应该就是要求知道经过附近初始位置的解)。但是,通过引入沿过$oldsymbol X_0$的解的变分方程,我们可以克服这个困难。
为了实现这一点,需要先对非自治微分方程作简短讨论。令$oldsymbol A(t)$为一族连续依赖于$t$的$n imes n$矩阵。系统
[oldsymbol X' = oldsymbol A(t) oldsymbol X]
为一个线性非自治系统。对这种类型的方程,有如下的存在唯一性定理:
定理 令$oldsymbol A(t)$为定义在$t in [alpha,eta]$上的$n imes n$矩阵的一个连续族。则初值问题
[oldsymbol X' = oldsymbol A(t) oldsymbol X, ;; oldsymbol X(t_0) = oldsymbol X_0]
具有唯一解,而且解在整个区间$[alpha,eta]$上都有定义。
注意,这个定理有一些新的东西:并不需要假设右端是$t$的$C^1$函数。$oldsymbol A(t)$的连续性就足以保证解的存在唯一性。另外,线性非自治微分方程的解满足线性叠加原理,即如果$oldsymbol Y(t),oldsymbol Z(t)$是这样一个系统的两个解,则对任意的常数$alpha,eta,alphaoldsymbol Y(t) + eta oldsymbol Z(t)$也是它的解。
现在,我们再回到自治非线性系统$oldsymbol X'=oldsymbol F(oldsymbol X)$。令$oldsymbol X(t)$为该系统的一个特解,假设在某个区间$J = [alpha,eta]$上对$t$有定义。固定$t_0 in J$,记$oldsymbol X(t_0) = oldsymbol X_0$。对每个$t in J$,令
[oldsymbol A(t) = oldsymbol {DF}_{oldsymbol X(t)},]
其中$oldsymbol {DF}_{oldsymbol X(t)}$代表$oldsymbol F$在点$oldsymbol X(t) in mathbb R^n$处的雅可比矩阵(这一思路其实就是非线性系统线性化的过程)。由于$oldsymbol F$为$C^1$的,$oldsymbol A(t) = oldsymbol {DF}_{oldsymbol X(t)}$是一族连续的$n imes n$矩阵。考虑非自治线性方程
[oldsymbol U' = oldsymbol A(t)oldsymbol U.]
该方程称为沿解$oldsymbol X(t)$的变分方程。由上一个定理可知,对所有的初始条件$oldsymbol U(t_0) = oldsymbol U_0$,该变分方程都有一个定义在整个$J$上的解。
这个方程的意义在于:如果$oldsymbol U(t)$为变分方程满足$oldsymbol U(t_0) = oldsymbol U_0$的解,则只要$oldsymbol U_0$充分小,函数
[t o oldsymbol X(t) + oldsymbol U(t)]
就是原来自治方程满足初始条件$oldsymbol Y(t_0) = oldsymbol X_0 + oldsymbol U_0$的解$oldsymbol Y(t)$的一个好的逼近。这就是下面结果的内容。
命题 考虑系统$oldsymbol X'=oldsymbol F(oldsymbol X)$,其中$oldsymbol F$为$C^1$的。假设
(1)$oldsymbol X(t)$为$oldsymbol X'=oldsymbol F(oldsymbol X)$的一个解,对所有的$t in [alpha,eta]$都有定义,且$oldsymbol X(t_0) = oldsymbol X_0$;
(2)$oldsymbol U(t)$为沿$oldsymbol X(t)$的变分方程的解,且$oldsymbol U(t_0) = oldsymbol U_0$;
(3)$oldsymbol Y(t)$为$oldsymbol X'=oldsymbol F(oldsymbol X)$的解,且$oldsymbol Y(t_0) = oldsymbol X_0 + oldsymbol U_0$。
则
[mathop {lim }limits_{{oldsymbol U_0} o 0} frac{{left| {oldsymbol Y(t) - (oldsymbol x(t) +oldsymbol U(t))} ight|}}{{left| {{oldsymbol U_0}} ight|}}]
对于$t in [alpha,eta]$一致收敛到0。
严格来说就是,对任意的$epsilon > 0$,存在$delta > 0$使得当$|oldsymbol U_0| le delta$时,对据有的$t in [alpha,eta]$都有
[|oldsymbol Y(t) - (oldsymbol X(t) + oldsymbol U(t)))| le epsilon |U_0.|]
从而,当$oldsymbol U_0 o 0$时,曲线$t o oldsymbol X(t) + oldsymbol U(t)$将越来越逼近$oldsymbol Y(t)$。在许多应用中,人们直接用从变分方程得到的解$oldsymbol X(t) + oldsymbol U(t)$来代替原来的解$oldsymbol Y(t)$;由线性叠加原理,$oldsymbol U(t)$线性地依赖于$oldsymbol U_0$,这将会带来很大的方便。
任给非线性微分方程系统$oldsymbol X'=oldsymbol F(oldsymbol X)$,如果$oldsymbol X_0$为它的一个平衡点,则我们就可以考虑沿这个解的变分方程。但此时,$oldsymbol {DF_X}_0$是一个常值矩阵$oldsymbol A$,从而变分变分方程$oldsymbol U' = oldsymbol {AU}$为一个自治的线性系统。这个系统称为在$oldsymbol X_0$处的线性化系统。我们知道线性化系统的流为$exp (toldsymbol A)oldsymbol U_0$,于是,上面的命题就表明,在平衡点附近,一个非线性系统的相图与它的线性化系统的相图是相似的。在下一章,我们要将“相似”这一说法更准确化。
利用上一命题,假设知道了解$oldsymbol X(t)$,现在就可以如下来计算$partial phi /partial oldsymbol X$:
定理 设$oldsymbol X'=oldsymbol F(oldsymbol X)$为一个微分方程系统,其中$oldsymbol F$为$C^1$的。令$oldsymbol X(t)$为该系统满足初始条件$oldsymbol X(0) = oldsymbol X_0$的解,它在$t in [alpha,eta]$上有定义;再令$oldsymbol (t,oldsymbol U_0)$为沿$oldsymbol X(t)$的变分方程满足$oldsymbol U(0,oldsymbol U_0$的解。则
[oldsymbol D_{phi_t}(oldsymbol X_0)oldsymbol U_0 = oldsymbol U(t,oldsymbol U_0),]
即$partial phi /partial oldsymbol X$在$oldsymbol U_0$上的作用可由从$oldsymbol U_0$出发求解相应的变分方程给出(为什么要求解上式呢?)。
证明 根据上一命题,对所有的$t in [alpha,eta]$,我们有
[{oldsymbol D_{{phi _t}}}({oldsymbol X_0}){oldsymbol U_0} = mathop {lim }limits_{h o infty } frac{{{phi _t}({oldsymbol X_0} + h{oldsymbol U_0}) - {phi _t}({oldsymbol X_0})}}{h} = mathop {lim }limits_{h o infty } frac{{oldsymbol U(t,h{oldsymbol U_0})}}{h} =oldsymbol U(t,{oldsymbol U_0}).]
[此证明还不是很理解!]
例 作为这些想法的一个说明,我们来考虑微分方程$oldsymbol x' = x^2$。简单的积分表明,满足初始条件$x(0) = x_0$的解为
[x(t) = frac{-x_0}{x_0t -1}.]
于是,我们有
[frac {partial phi}{partial x}(t,x_0) = frac{1}{(x_0t-1)^2}.]
[上式对应于$oldsymbol D_{phi_t}(oldsymbol X_0)$]另一方面,沿$x(t)$的变分方程为
[u' = 2x(t)u = frac{{ - 2{x_0}}}{{{x_0}t - 1}}u.]
该方程满足初始条件$u(0) = u_0$的解为
[u(t) = {u_0}{left( {frac{1}{{{x_0}t - 1}}} ight)^2},]
[上式对应于$oldsymbol U(t,oldsymbol U_0)$]这正与我们期望的一样。
本定理的作用是显然的:直接求解$frac {partial phi}{partial x}(t,x_0)$有困难,可以通过求解变分方程的解$oldsymbol U(t,oldsymbol U_0)$,而前者作用于$oldsymbol U_0$的结果就是后者。