#Math285

General Summary

  1. 问题重述与算子不动点: 将一阶常微分方程的初值问题 (Initial Value Problem, IVP) 转化为等价的积分方程形式,并认识到求解 IVP 等价于寻找某个特定算子 (Operator)不动点 (Fixed Point)
  2. 高阶方程降阶: 将 $n$ 阶常微分方程转化为一个等价的一阶常微分方程组,从而可以将存在唯一性的讨论统一到一阶系统上。
  3. (选学) 牛顿迭代法 (Newton’s Method): 作为求解方程根 (可以看作一种不动点问题) 的经典方法,牛顿迭代法的思想和收敛性分析为我们理解后续的不动点定理提供了重要的类比和启发。
  4. 度量空间 (Metric Spaces): 引入度量空间的概念,这是讨论函数之间“距离”和收敛性的数学框架。
  5. 巴拿赫不动点定理 (Banach’s Fixed-Point Theorem): 这是证明存在唯一性定理的核心数学工具,它保证了在特定条件下,“压缩映射”拥有唯一的不动点。
  6. 矩阵范数 (Matrix Norms): 推广了向量的“长度”概念到矩阵,为后续在线性化分析和估计中度量矩阵“大小”提供工具。

问题重述与算子不动点 (Problem Restatement & Fixed Points of Operators)

微分积分转化

$$ 其中 $f: D \to \mathbb{R}$ 是定义在开集 $D \subseteq \mathbb{R}^2$ 上的连续函数, $(t_0, y_0) \in D$。 如果函数 $\phi: I \to \mathbb{R}$ 是这个 IVP 的解,并且其图像 $G_\phi = {(t, \phi(t)); t \in I}$ 包含在 $D$ 内,那么对 $\phi’(s) = f(s, \phi(s))$ 两边从 $t_0$ 到 $t$ 积分,可以得到等价的积分方程 (Integral Equation, IE):

$$

1
\phi(t) = y_0 + \int_{t_0}^t f(s, \phi(s)) ds \quad \forall t \in I \quad \text{(IE)}

$$

反之,满足此积分方程且图像在 $D$ 内的连续函数 $\phi(t)$ (根据微积分基本定理,如果 $f$ 连续,$\phi(t)$ 必可微) 也必然满足 $y’ = f(t, y)$ 和 $y(t_0) = y_0$。

引入算子

1. 含义 (Meaning): 什么是算子 T?

$$

1
2
3
这里的 $T$ 是一个**映射 (Map)** 或者说**变换 (Transformation)**。它的特殊之处在于:
*   它的**输入 (Input)** 不是一个数字或向量,而是一个**函数** $\psi$ (这个函数需要是定义在某个包含 $t_0$ 的区间 $I$ 上的连续函数,并且其图像要落在 $f$ 的定义域 $D$ 内)。
*   它的**输出 (Output)** 也是一个**函数** $(T\psi)$ (这个新函数也是定义在 $t$ 上的)。

2. 目的 (Purpose): 为什么要引入算子 T?

引入算子 $T$ 的主要目的有以下几点:

$$ \phi = T\phi

$$

1
这立刻就揭示了问题的本质:**我们寻找的解 $\phi$ 正是算子 $T$ 的一个不动点 (Fixed Point)**。不动点的意思就是,经过 $T$ 这个变换之后,它保持不变。

总结:

引入算子 $T$ 的目的是将求解微分方程初值问题这个看似复杂的问题,转化为一个在函数空间中寻找不动点的抽象问题。这样做的好处是:

  1. 简化了问题的表述 ($\phi = T\phi$)
  2. 使得我们可以应用强大的不动点理论 (特别是巴拿赫不动点定理) 来证明解的存在性和唯一性
  3. 构造解的近似序列 (如皮卡迭代) 提供了理论基础和方法

高阶方程降阶 (Order Reduction)

$$ 初始条件为 $y(t_0) = y_0, y’(t_0) = y_1, \dots, y^{(n-1)}(t_0) = y_{n-1}$。 其中 $f: D \to \mathbb{R}$ 是定义在开集 $D \subseteq \mathbb{R}^{n+1}$ 上的连续函数, $(t_0, y_0, \dots, y_{n-1}) \in D$。

$$

1
\mathbf{y}(t) = \begin{pmatrix} y(t) \\\ y'(t) \\\ \vdots \\\ y^{(n-1)}(t) \end{pmatrix} = \begin{pmatrix} y_0(t) \\\ y_1(t) \\\ \vdots \\\ y_{n-1}(t) \end{pmatrix}

$$

1
(这里用 $y_0, y_1, ...$ 表示向量的分量函数,不要与初始值混淆)。

$$

1

$$ \mathbf{f}(t, \mathbf{y}) = \begin{pmatrix} y_1 \\ y_2 \\ \vdots \\ y_{n-1} \\ f(t, y_0, y_1, \dots, y_{n-1}) \end{pmatrix}

$$

1
2
3
4
(注意 $\mathbf{f}$ 的定义,它的前 $n-1$ 个分量直接取自输入向量 $\mathbf{y}$ 的第 2 到第 $n$ 个分量,最后一个分量才是由原方程的 $f$ 给出)。
这样,原 $n$ 阶方程就等价于以下的一阶**向量形式 (vectorial form)** 的 ODE 系统:
\$\$
\mathbf{y}' = \mathbf{f}(t, \mathbf{y})

$$ 初始条件为 $\mathbf{y}(t_0) = \mathbf{y}^0 = (y_0, y_1, \dots, y_{n-1})^T$。

$$

1
\mathbf{y}' = \begin{pmatrix} y_0' \\\ y_1' \end{pmatrix} = \begin{pmatrix} y_1 \\\ -y_0 \end{pmatrix} = \mathbf{f}(t, \mathbf{y})

$$

1
这里 $\mathbf{f}(t, \mathbf{y}) = \begin{pmatrix} y_1 \\\ -y_0 \end{pmatrix}$。

牛顿迭代法 (Newton’s Method)

一维情况分析

多维情况

度量空间 (Metric Spaces)

定义

Example

Analysis on Metric Spaces

Complete Metric Spaces

完备性检验

正式定义 (Formal Definition):

一个度量空间 $(X, d)$ 被称为 完备的 (Complete),如果 $X$ 中的 每一个柯西序列 (Cauchy Sequence)收敛 (Converge) 到 $X$ 中的一个点。

要理解这个定义,我们需要拆解两个关键概念:

  1. 柯西序列 (Cauchy Sequence):
  2. 收敛到 $X$ 中的一个点 (Converge to a Point in $X$):

如何判断一个度量空间 $(X, d)$ 是否完备?

判断方法主要有两种思路:证明它是完备的,或者证明它不是完备的。

A. 证明 $(X, d)$ 是完备的 (Proving Completeness):

  1. 直接使用定义:
  2. 利用已知完备空间:

B. 证明 $(X, d)$ 不是完备的 (Disproving Completeness):

经典例子:

  1. 完备的例子:
  2. 不完备的例子:

完备性例子

好的,我们来详细梳理一下 Slides 中提到的关于度量空间 (Metric Spaces) 的一些具体的正例 (Examples)反例 (Counterexamples),并解释它们各自说明了什么重要概念或特性。

A. 标准且重要的度量空间实例

  1. 欧氏空间 (Euclidean Space) ($\mathbb{R}^n, d_E$) (Slide 27, Ex 1):
  2. $\mathbb{R}^n$ 上的其他度量 ($d_1, d_\infty$):
  3. 连续函数空间 ($C([a,b]), d_\infty$):
  4. 希尔伯特立方 ($l^2$):
  5. 离散度量空间 (Discrete Metric Space):

B. 说明特定概念的反例 (Counterexamples) / 特殊情况

  1. 完备性的反例 (Incompleteness):
  2. 波尔查诺 - 魏尔斯特拉斯性质失效的反例 (Failure of B-W):
  3. 拓扑等价但度量不等价 (Topologically Equivalent but Metrically Different):

巴拿赫不动点定理 (Banach’s Fixed-Point Theorem)

压缩映射

$$

1
2
常数 $C$ 称为**压缩常数 (Contraction Constant)**。
压缩映射会使得任意两点在映射后的距离**严格**缩小 (按比例 $C$)。

检验关键点

对于定义在单一区间上的一维连续函数,我们只需要验证:

定理

$$ d(x_n, x^*) \le \frac{C^n}{1-C} d(x_1, x_0) \quad (\text{先验估计, a priori estimate})

$$ $$ d(x_n, x^*) \le \frac{C}{1-C} d(x_n, x_{n-1}) \quad (\text{后验估计, a posteriori estimate}) $$

Matrix Norm 矩阵范数

矩阵范数是向量范数 (Vector Norm) 概念到矩阵上的推广。我们不仅想衡量向量的大小,也想衡量矩阵的“大小”或其作为线性变换的“强度”。

常见矩阵范数

$$

1
\|A\| = \sup_{\mathbf{x} \ne \mathbf{0}} \frac{\|A\mathbf{x}\|_v}{\|\mathbf{x}\|_v} = \sup_{\|\mathbf{x}\|_v = 1} \|A\mathbf{x}\|_v

$$

1
2
*   **几何意义:** $\|A\|$ 表示线性变换 $A$ 能将单位向量 (在 $\|\cdot\|_v$ 意义下) 拉伸的最大倍数。
*   **重要性质:** 由向量范数诱导出的矩阵范数**自动满足**次可乘性 (如果作用空间和目标空间的向量范数相同,对于方阵来说)。并且,它们还满足与向量范数的**相容性 (Compatibility):** $\|A\mathbf{x}\|_v \le \|A\| \|\mathbf{x}\|_v$。

$$

1
2.  **谱范数 / 2- 范数 ($p=2$):** 由向量 $l_2$- 范数 (欧氏范数) 诱导。

$$ |A|2 = \sqrt{\lambda{\max}(A^*A)} = \sigma_{\max}(A) \quad (\text{A 的最大奇异值 Max singular value})

$$

1
2
3
4
    其中 $A^*$ 是 $A$ 的共轭转置 (对实矩阵即为转置 $A^T$),$\lambda_{\max}$ 表示最大特征值。
3.  **行和范数 / $\infty$-范数 ($p=\infty$):** 由向量 $l_\infty$-范数 (最大范数) 诱导。
    \$\$
    \|A\|\_\infty = \max\_{1 \le i \le n} \sum\_{j=1}^n |a\_{ij}| \quad \(\text{最大行绝对值和 Max row sum})

$$

$$

1
    \|A\|\_F = \sqrt{\sum\_{i=1}^m \sum\_{j=1}^n |a\_{ij}|^2} = \sqrt{\text{trace}\(A^\*A)}

$$

1
    *   **特点:** 它就像把 $m \times n$ 矩阵看成 $mn$ 维向量后的欧氏范数。计算简单。它满足次可乘性,但它**不是**由任何向量 $l_p$-范数诱导产生的 (除了 $n=1$ 或 $m=1$ 的平凡情况)。

谱半径与谱范数

1. 谱半径 (Spectral Radius) - $\rho(A)$

$$

1
2
其中 $\sigma(A)$ 是 $A$ 的特征值集合 (谱)。
*   ***技术比喻:*** 想象所有特征值在复平面上的点,谱半径就是这些点到原点距离的最大值,也就是包含所有特征值的最小圆盘的半径。

2. 谱范数 (Spectral Norm) - $|A|_2$

$$ |A|2 = \sup{\mathbf{x} \ne \mathbf{0}} \frac{|A\mathbf{x}|2}{|\mathbf{x}|_2} = \sup{|\mathbf{x}|_2 = 1} |A\mathbf{x}|_2

$$

1
*   ***技术比喻:*** 它衡量了线性变换 $A$ 对向量的欧氏长度的最大“拉伸”因子。

$$

1
其中 $\lambda_{\max}(A^*A)$ 是半正定矩阵 $A^*A$ 的最大特征值。

总结对比 (Summary Comparison):

特性 (Feature) 谱半径 (Spectral Radius) $\rho(A)$ 谱范数 (Spectral Norm) $|A|_2$    
定义基于 (Based on) 特征值 (Eigenvalues) 奇异值 (Singular Values) / $l_2$-norm 诱导    
定义域 (Applies to) 方阵 (Square matrices) $A \in \mathbb{K}^{n \times n}$ 任意矩阵 (Any matrix) $A \in \mathbb{K}^{m \times n}$    
是否范数 (Is a Norm?) 否 (No) 是 (Yes)    
关键关系 (Relation) $\rho(A) \le |A|_2$ (一般) $|A|_2 = \rho(A)$ 当 $A$ 是正规矩阵时    
主要用途 (Main Use) 迭代收敛性 ($A^k \to 0 \iff \rho(A) < 1$) 最大拉伸因子, 条件数, SVD, 提供收敛的充分条件 ($|A|_2 < 1$)