#Math285

引言与基本概念 (Introduction and Basic Concepts)

1. 系统定义 (System Definition) (Slide 4)

2. 学习动机与实例 (Motivation and Examples) (Slides 5-8)

基础理论回顾 (Review of Fundamental Theory)

初值问题 (Initial Value Problem - IVP)

齐次系统的解结构 (Solution Structure of Homogeneous Systems)

基本矩阵与非齐次系统解 (Fundamental Matrix and Solution of Inhomogeneous Systems)

矩阵指数 (Matrix Exponential) - 时间无关情形的特性

计算矩阵指数 $e^{At}$ (Computing the Matrix Exponential $e^{At}$) (Slides 11-29, 58-64, 65-72)

A. 基于对角化 (Based on Diagonalization)

当矩阵 $A$ 有 $n$ 个线性独立的特征向量时(特征方程有 $n$ 个不同根),矩阵 $A$ 可以对角化

A1. $A$ 是对角矩阵 (A is a Diagonal Matrix)

A2. $A$ 可对角化 (A is Diagonalizable)

B. 基于广义特征向量和若尔当标准型 (Generalized Eigenvectors and Jordan Canonical Form) - 当 $A$ 不可对角化时

当矩阵 $A$ 的某些特征值的代数重数 (algebraic multiplicity) 大于其几何重数 (geometric multiplicity) 时,$A$ 没有 $n$ 个线性无关的特征向量,因此不可对角化。

核心思想:

  1. 找到一个可逆矩阵 $S$,其列由 $A$ 的广义特征向量构成,使得 $A$ 可以被转换为其若尔当标准型 $J$:$A = SJS^{-1}$ (或者 $S^{-1}AS = J$)。
  2. 利用这个分解,计算 $e^{At} = S e^{Jt} S^{-1}$。
  3. 计算 $e^{Jt}$ 相对容易,因为 $J$ 是一个分块对角矩阵,每个块是一个若尔当块。

步骤详解: 1. 找到 $A$ 的特征值 (Eigenvalues) 及其代数重数 (Algebraic Multiplicities)

2. 为每个特征值 $\lambda_k$ 找到广义特征向量并构成若尔当链 (Jordan Chains)

这是最关键且可能最复杂的一步。对于每个特征值 $\lambda_k$ (代数重数为 $m_k$):

  1. 计算普通特征向量: 求解 $(A - \lambda_k I)\mathbf{v} = \mathbf{0}$ 找到所有线性无关的特征向量。其解空间的维数是 $\lambda_k$ 的几何重数 (geometric multiplicity) $g_k$。
  2. 寻找广义特征向量: 广义特征向量 $\mathbf{v}$ 满足 $(A - \lambda_k I)^p \mathbf{v} = \mathbf{0}$ 对于某个正整数 $p \le m_k$,但 $(A - \lambda_k I)^{p-1} \mathbf{v} \neq \mathbf{0}$。
  3. 构造若尔当链: 一个与特征值 $\lambda_k$ 相关的长度为 $p$ 的若尔当链是一组向量 ${\mathbf{v}_1, \mathbf{v}_2, \dots, \mathbf{v}_p}$,满足:

    如何找到这些链 (一种常见策略,”自上而下”): a. 确定最长链的长度 $p_{\max}$:它是最小的整数使得 $\ker((A-\lambda_k I)^{p_{\max}}) = G_{\lambda_k}$ (通常 $p_{\max}$ 是使得 $\dim \ker((A-\lambda_k I)^{p_{\max}})$ 首次达到 $m_k$ 的那个幂次,或者更准确地说,是使得 $\dim \ker((A-\lambda_k I)^j)$ 不再增加的最小 $j$)。 b. 选择一个向量 $\mathbf{v}{p{\max}}$ 使得 $\mathbf{v}{p{\max}} \in \ker((A-\lambda_k I)^{p_{\max}})$ 但 $\mathbf{v}{p{\max}} \notin \ker((A-\lambda_k I)^{p_{\max}-1})$。 c. 然后依次计算链中的其他向量: $\mathbf{v}{p{\max}-1} = (A - \lambda_k I)\mathbf{v}{p{\max}}$ $\mathbf{v}{p{\max}-2} = (A - \lambda_k I)\mathbf{v}{p{\max}-1}$ … $\mathbf{v}1 = (A - \lambda_k I)\mathbf{v}_2$ d. 如果这个链中的 $p{\max}$ 个向量还没有张成整个 $G_{\lambda_k}$ (即 $p_{\max} < m_k$ 或者几何重数 $g_k > 1$),你需要在已找到链的张成空间的补空间中,针对次长链或其他同样长度的链重复此过程。 - 例如,如果有 $g_k$ 个若尔当块,你就需要找到 $g_k$ 个这样的链的生成元,它们共同生成的链向量集合将构成 $G_{\lambda_k}$ 的一组基。 - 确定若尔当块的结构(多少个块,每个块多大)可以通过分析核空间的维数序列 $d_j = \dim \ker((A-\lambda_k I)^j)$ 来得到。大小为 $j$ 的块的数量是 $2d_j - d_{j-1} - d_{j+1}$。

3. 构造矩阵 $S$ 和若尔当标准型 $J$

  1. 构造 $S$: 矩阵 $S$ 的列由所有若尔当链中的广义特征向量组成。
  2. 构造 $J$: $J$ 是一个分块对角矩阵: $$ J = \begin{pmatrix} J_1 & & \\ & J_2 & & \\ & & \ddots & \\ & & & J_s \end{pmatrix} $$ 其中每个 $J_i$ 是一个若尔当块,对应于 $S$ 中的一个若尔当链。 如果一个链是 ${\mathbf{v}_1, \dots, \mathbf{v}_p}$ (对应特征值 $\lambda_k$),则对应的若尔当块是一个 $p \times p$ 矩阵: $$ J_i = \begin{pmatrix} \lambda_k & 1 & 0 & \cdots & 0
    0 & \lambda_k & 1 & \cdots & 0
    \vdots & \ddots & \ddots & \ddots & \vdots
    0 & \cdots & 0 & \lambda_k & 1
    0 & \cdots & \cdots & 0 & \lambda_k \end{pmatrix} $$ (主对角线上是特征值 $\lambda_k$,紧邻主对角线上方的是 1,其他位置是 0)。 $J$ 中若尔当块的顺序和大小必须与 $S$ 中广义特征向量链的排列方式一致,以满足 $AS = SJ$。

4. 计算 $S^{-1}$

5. 计算 $e^{Jt}$

由于 $J$ 是分块对角矩阵,所以 $e^{Jt}$ 也是一个分块对角矩阵: $$ e^{Jt} = \begin{pmatrix} e^{J_1 t} & & \\ & e^{J_2 t} & & \\ & & \ddots & \\ & & & e^{J_s t} \end{pmatrix} $$ 现在我们需要计算每个若尔当块的指数 $e^{J_i t}$。 令 $J_i = \lambda_k I_p + N_p$,其中 $I_p$ 是 $p \times p$ 单位矩阵,$N_p$ 是一个 $p \times p$ 的幂零矩阵 (nilpotent matrix),其主对角线上方元素为 1,其余为 0 (例如,$N_3 = \begin{pmatrix} 0&1&0 \\ 0&0&1 \\ 0&0&0 \end{pmatrix}$)。$N_p^p = \mathbf{0}$。 由于 $\lambda_k I_p$ 和 $N_p$ 可交换,所以: $$ e^{J_i t} = e^{(\lambda_k I_p + N_p)t} = e^{\lambda_k I_p t} e^{N_p t} = e^{\lambda_k t} I_p \cdot e^{N_p t} = e^{\lambda_k t} e^{N_p t} $$ 而幂零矩阵的指数可以用其泰勒级数的有限项计算: $$ e^{N_p t} = I_p + (N_p t) + \frac{(N_p t)^2}{2!} + \dots + \frac{(N_p t)^{p-1}}{(p-1)!} $$ (因为 $N_p^j = \mathbf{0}$ 对于 $j \ge p$)

例如:

以此类推,可以得到任意大小若尔当块的指数。

6. 计算 $e^{At} = S e^{Jt} S^{-1}$

B1. 理论基础 (Theoretical Foundation)

B2. 应用与计算 (Application and Computation) (Slides 37-57, 59)

C. 基于Cayley-Hamilton定理或最小多项式 (Based on Cayley-Hamilton Theorem or Minimal Polynomial)

总结

核心目标:将 $e^{At}$ 表示为 $e^{At} = c_0(t)I + c_1(t)A + \dots + c_{d-1}(t)A^{d-1}$,并求解系数函数 $c_k(t)$。

步骤 1: 确定零化多项式 $a(X)$及其次数 $d$

步骤 2: 写出 $e^{At}$ 的多项式形式

步骤 3: 确定系数函数 $c_k(t)$ 满足的标量 ODE

步骤 4: 求解每个系数函数 $c_k(t)$

步骤 5: 代入并组合得到 $e^{At}$

理论

这种方法提供了一种不直接计算特征向量或若尔当型就能得到 $e^{At}$ 的途径。

第四部分:时变系数系统 (Time-Dependent Coefficient Systems) (Slide 73)