第1章 · 欧氏空间与线性映射基础

1.1 向量、范数与内积

初等微积分主要研究定义在实数轴 $\mathbb{R}$ 上的函数。在多元情形,函数的定义域和值域变为高维空间。本节建立 $\mathbb{R}^n$ 的基本代数与几何结构,它们是后续所有概念的基石。

1.1.1 $\mathbb{R}^n$ 作为向量空间

定义 1.1.1($n$ 维欧氏空间)

设 $n$ 为正整数。集合

$$\mathbb{R}^n = \{(x^1, x^2, \dots, x^n) \mid x^i \in \mathbb{R} \text{ 对于 } i = 1, \dots, n\}$$

称为$n$ 维欧氏空间。其元素称为向量。我们通常用粗体小写字母 $\boldsymbol{x}$ 表示向量,用普通小写字母 $x^i$ 表示其分量。

当 $n = 1$ 时,$\mathbb{R}^1$ 即为实数轴 $\mathbb{R}$;$n = 2$ 时为平面;$n = 3$ 时为通常的立体空间。

旁白:记号的用意

本书用上标 $x^i$ 表示向量的第 $i$ 个分量,而非幂次。这样做的理由将在微分几何部分显现:上下标区分了向量的"逆变"与"协变"性质。初读时,只需将 $x^i$ 视为第 $i$ 个坐标即可。

定义 1.1.2(向量加法与标量乘法)

对于 $\boldsymbol{x} = (x^1, \dots, x^n)$,$\boldsymbol{y} = (y^1, \dots, y^n) \in \mathbb{R}^n$ 及 $a \in \mathbb{R}$,定义

$$\boldsymbol{x} + \boldsymbol{y} = (x^1 + y^1, \dots, x^n + y^n),$$
$$a\boldsymbol{x} = (a x^1, \dots, a x^n).$$

容易验证,上述运算满足向量空间的八条公理(结合律、交换律、零元、负元等)。因此 $\mathbb{R}^n$ 是一个实数域上的向量空间,维数为 $n$。

旁白:类型标注

向量加法是映射 $\mathbb{R}^n \times \mathbb{R}^n \to \mathbb{R}^n$。

标量乘法是映射 $\mathbb{R} \times \mathbb{R}^n \to \mathbb{R}^n$。

定义 1.1.3(标准基)

向量

$$\boldsymbol{e}_1 = (1, 0, 0, \dots, 0), \quad \boldsymbol{e}_2 = (0, 1, 0, \dots, 0), \quad \dots, \quad \boldsymbol{e}_n = (0, \dots, 0, 1)$$

构成 $\mathbb{R}^n$ 的一组基,称为标准基。任何向量 $\boldsymbol{x} = (x^1, \dots, x^n)$ 可唯一表示为

$$\boldsymbol{x} = \sum_{i=1}^n x^i \boldsymbol{e}_i.$$

1.1.2 范数与距离

在一维情形,绝对值 $|x|$ 度量了点到原点的距离,也度量了向量的"长度"。在高维中,我们有如下推广。

定义 1.1.4(范数)

向量 $\boldsymbol{x} = (x^1, \dots, x^n) \in \mathbb{R}^n$ 的范数(或长度)定义为

$$\|\boldsymbol{x}\| = \sqrt{(x^1)^2 + (x^2)^2 + \dots + (x^n)^2}.$$

当 $n = 1$ 时,$\|\boldsymbol{x}\| = |x^1|$,即通常的绝对值。

旁白:类型标注

$\|\cdot\| : \mathbb{R}^n \to [0, \infty)$,它将向量映射为一个非负实数。

定理 1.1.5(范数的基本性质)

设 $\boldsymbol{x}, \boldsymbol{y} \in \mathbb{R}^n$,$a \in \mathbb{R}$。则:

  1. $\|\boldsymbol{x}\| \ge 0$,且 $\|\boldsymbol{x}\| = 0$ 当且仅当 $\boldsymbol{x} = \boldsymbol{0}$。
  2. $\|a\boldsymbol{x}\| = |a| \|\boldsymbol{x}\|$。
  3. 三角不等式:$\|\boldsymbol{x} + \boldsymbol{y}\| \le \|\boldsymbol{x}\| + \|\boldsymbol{y}\|$。
证明

性质1与2由定义直接可得。性质3需要用到1.1.3节将引入的内积与柯西–施瓦茨不等式,其证明见定理1.1.9之后。

定义 1.1.6(距离)

两点 $\boldsymbol{x}, \boldsymbol{y} \in \mathbb{R}^n$ 之间的欧氏距离定义为

$$d(\boldsymbol{x}, \boldsymbol{y}) = \|\boldsymbol{x} - \boldsymbol{y}\|.$$

三角不等式立即给出

$$d(\boldsymbol{x}, \boldsymbol{z}) \le d(\boldsymbol{x}, \boldsymbol{y}) + d(\boldsymbol{y}, \boldsymbol{z}),$$

即"两点之间直线最短"。

1.1.3 内积

范数来源于一种更基本的代数结构——内积。内积不仅给出长度,还能刻画角度与正交性。

定义 1.1.7(标准内积)

对于 $\boldsymbol{x} = (x^1, \dots, x^n)$,$\boldsymbol{y} = (y^1, \dots, y^n) \in \mathbb{R}^n$,定义它们的内积

$$\langle \boldsymbol{x}, \boldsymbol{y} \rangle = \sum_{i=1}^n x^i y^i.$$

内积有时也记作 $\boldsymbol{x} \cdot \boldsymbol{y}$,称为点积

旁白:类型标注

$\langle\cdot, \cdot\rangle : \mathbb{R}^n \times \mathbb{R}^n \to \mathbb{R}$,它是一个双线性函数(关于两个变量分别线性)。

定理 1.1.8(内积的基本性质)

设 $\boldsymbol{x}, \boldsymbol{x}_1, \boldsymbol{x}_2, \boldsymbol{y}, \boldsymbol{y}_1, \boldsymbol{y}_2 \in \mathbb{R}^n$,$a \in \mathbb{R}$。则:

  1. 对称性:$\langle \boldsymbol{x}, \boldsymbol{y} \rangle = \langle \boldsymbol{y}, \boldsymbol{x} \rangle$。
  2. 双线性性
    $$\langle a\boldsymbol{x}, \boldsymbol{y} \rangle = a\langle \boldsymbol{x}, \boldsymbol{y} \rangle,$$
    $$\langle \boldsymbol{x}_1 + \boldsymbol{x}_2, \boldsymbol{y} \rangle = \langle \boldsymbol{x}_1, \boldsymbol{y} \rangle + \langle \boldsymbol{x}_2, \boldsymbol{y} \rangle,$$
    以及关于第二个变量的相应等式(由对称性自动成立)。
  3. 正定性:$\langle \boldsymbol{x}, \boldsymbol{x} \rangle \ge 0$,且 $\langle \boldsymbol{x}, \boldsymbol{x} \rangle = 0$ 当且仅当 $\boldsymbol{x} = \boldsymbol{0}$。
证明

所有性质均可由定义直接验证。以双线性性第一条为例:

$$\langle a\boldsymbol{x}, \boldsymbol{y} \rangle = \sum_{i=1}^n (a x^i) y^i = a \sum_{i=1}^n x^i y^i = a \langle \boldsymbol{x}, \boldsymbol{y} \rangle.$$

其余留作练习。

定理 1.1.9(柯西–施瓦茨不等式)

对于任意 $\boldsymbol{x}, \boldsymbol{y} \in \mathbb{R}^n$,有

$$|\langle \boldsymbol{x}, \boldsymbol{y} \rangle| \le \|\boldsymbol{x}\| \|\boldsymbol{y}\|.$$

等号成立当且仅当 $\boldsymbol{x}$ 与 $\boldsymbol{y}$ 线性相关(即其中之一是另一个的标量倍数)。

证明

若 $\boldsymbol{y} = \boldsymbol{0}$,不等式两边均为零,显然成立。设 $\boldsymbol{y} \neq \boldsymbol{0}$,对任意 $t \in \mathbb{R}$,考虑函数

$$f(t) = \|\boldsymbol{x} - t\boldsymbol{y}\|^2 = \langle \boldsymbol{x} - t\boldsymbol{y}, \boldsymbol{x} - t\boldsymbol{y} \rangle = \|\boldsymbol{x}\|^2 - 2t\langle \boldsymbol{x}, \boldsymbol{y} \rangle + t^2\|\boldsymbol{y}\|^2.$$

由正定性,$f(t) \ge 0$ 对所有 $t$ 成立。这是一个关于 $t$ 的二次函数且开口向上,其判别式必须非正:

$$\Delta = 4\langle \boldsymbol{x}, \boldsymbol{y} \rangle^2 - 4\|\boldsymbol{x}\|^2\|\boldsymbol{y}\|^2 \le 0.$$

整理即得 $|\langle \boldsymbol{x}, \boldsymbol{y} \rangle| \le \|\boldsymbol{x}\| \|\boldsymbol{y}\|$。等号成立当且仅当判别式为零,此时存在唯一的 $t$ 使得 $f(t) = 0$,即 $\boldsymbol{x} = t\boldsymbol{y}$,两者线性相关。

有了柯西–施瓦茨不等式,我们便可以完成定理1.1.5中三角不等式的证明:

$$\|\boldsymbol{x} + \boldsymbol{y}\|^2 = \|\boldsymbol{x}\|^2 + 2\langle \boldsymbol{x}, \boldsymbol{y} \rangle + \|\boldsymbol{y}\|^2 \le \|\boldsymbol{x}\|^2 + 2\|\boldsymbol{x}\|\|\boldsymbol{y}\| + \|\boldsymbol{y}\|^2 = (\|\boldsymbol{x}\| + \|\boldsymbol{y}\|)^2,$$

两边开平方即得 $\|\boldsymbol{x} + \boldsymbol{y}\| \le \|\boldsymbol{x}\| + \|\boldsymbol{y}\|$。

内积与范数的关系由定义直接给出:

$$\|\boldsymbol{x}\| = \sqrt{\langle \boldsymbol{x}, \boldsymbol{x} \rangle}.$$
定义 1.1.10(夹角与正交)

对于非零向量 $\boldsymbol{x}, \boldsymbol{y} \in \mathbb{R}^n$,由柯西–施瓦茨不等式可知

$$-1 \le \frac{\langle \boldsymbol{x}, \boldsymbol{y} \rangle}{\|\boldsymbol{x}\| \|\boldsymbol{y}\|} \le 1.$$

因此存在唯一的 $\theta \in [0, \pi]$ 满足

$$\cos \theta = \frac{\langle \boldsymbol{x}, \boldsymbol{y} \rangle}{\|\boldsymbol{x}\| \|\boldsymbol{y}\|}.$$

称 $\theta$ 为向量 $\boldsymbol{x}$ 与 $\boldsymbol{y}$ 的夹角。特别地,若 $\langle \boldsymbol{x}, \boldsymbol{y} \rangle = 0$,则称 $\boldsymbol{x}$ 与 $\boldsymbol{y}$ 正交(或垂直),记作 $\boldsymbol{x} \perp \boldsymbol{y}$。零向量与任何向量正交。

旁白:内积与正交

正交概念依赖于内积的选择。本书在 $\mathbb{R}^n$ 中始终使用标准内积,但在后续章节我们会看到,同一个向量空间可以配备不同的内积,从而产生不同的正交关系。

例 1.1.11(标准基的正交性)

标准基向量 $\boldsymbol{e}_1, \dots, \boldsymbol{e}_n$ 满足

$$\langle \boldsymbol{e}_i, \boldsymbol{e}_j \rangle = \delta_{ij} = \begin{cases} 1, & i = j, \\ 0, & i \neq j. \end{cases}$$

即它们是两两正交的单位向量。这样的基称为标准正交基

1.1.4 $\mathbb{R}^n$ 中的极限与开球

多元微积分中许多概念(极限、连续、可微)依赖于"接近"的精确描述。这通过范数来实现。

定义 1.1.12(开球与闭球)

设 $\boldsymbol{a} \in \mathbb{R}^n$,$r > 0$。集合

$$B(\boldsymbol{a}, r) = \{\boldsymbol{x} \in \mathbb{R}^n \mid \|\boldsymbol{x} - \boldsymbol{a}\| < r\}$$

称为以 $\boldsymbol{a}$ 为中心、$r$ 为半径的开球。集合

$$\overline{B}(\boldsymbol{a}, r) = \{\boldsymbol{x} \in \mathbb{R}^n \mid \|\boldsymbol{x} - \boldsymbol{a}\| \le r\}$$

称为以 $\boldsymbol{a}$ 为中心、$r$ 为半径的闭球

当 $n = 1$ 时,开球即为开区间 $(a-r, a+r)$,闭球为闭区间 $[a-r, a+r]$。当 $n = 2$ 时,开球是圆的内部(不含边界);当 $n = 3$ 时,开球是球体的内部。

定义 1.1.13(点列极限)

设 $\{\boldsymbol{x}_k\}_{k=1}^\infty$ 是 $\mathbb{R}^n$ 中的点列,$\boldsymbol{a} \in \mathbb{R}^n$。若对于任意 $\varepsilon > 0$,存在正整数 $N$,使得当 $k > N$ 时,$\|\boldsymbol{x}_k - \boldsymbol{a}\| < \varepsilon$,则称 $\{\boldsymbol{x}_k\}$ 收敛于 $\boldsymbol{a}$,记作

$$\lim_{k \to \infty} \boldsymbol{x}_k = \boldsymbol{a} \quad \text{或} \quad \boldsymbol{x}_k \to \boldsymbol{a}.$$
旁白:类型辨析

$\{\boldsymbol{x}_k\}$ 是一个点列,每个 $\boldsymbol{x}_k$ 是一个向量。

$\boldsymbol{a}$ 是一个向量。收敛的定义使用了范数,这与一维时用绝对值完全类似。

命题 1.1.14(分量收敛准则)

设 $\boldsymbol{x}_k = (x_k^1, \dots, x_k^n)$,$\boldsymbol{a} = (a^1, \dots, a^n)$。则 $\boldsymbol{x}_k \to \boldsymbol{a}$ 当且仅当对每个 $i = 1, \dots, n$,有 $x_k^i \to a^i$(作为实数序列收敛)。

证明

利用不等式

$$|x_k^i - a^i| \le \|\boldsymbol{x}_k - \boldsymbol{a}\| = \sqrt{\sum_{j=1}^n (x_k^j - a^j)^2} \le \sum_{j=1}^n |x_k^j - a^j|.$$

若 $\boldsymbol{x}_k \to \boldsymbol{a}$,则对任意 $\varepsilon > 0$,存在 $N$ 使当 $k > N$ 时 $\|\boldsymbol{x}_k - \boldsymbol{a}\| < \varepsilon$。于是 $|x_k^i - a^i| \le \|\boldsymbol{x}_k - \boldsymbol{a}\| < \varepsilon$,故 $x_k^i \to a^i$。

反之,若每个分量收敛,则对任意 $\varepsilon > 0$,存在 $N_i$ 使当 $k > N_i$ 时 $|x_k^i - a^i| < \varepsilon/n$。取 $N = \max\{N_1, \dots, N_n\}$,则当 $k > N$ 时,

$$\|\boldsymbol{x}_k - \boldsymbol{a}\| \le \sum_{i=1}^n |x_k^i - a^i| < n \cdot \frac{\varepsilon}{n} = \varepsilon,$$

因此 $\boldsymbol{x}_k \to \boldsymbol{a}$。

此命题意味着 $\mathbb{R}^n$ 中的收敛本质上是 $n$ 个独立的一维收敛问题,这是 $\mathbb{R}^n$ 上分析学的重要便利之处。

练习 1.1

【计算验证型】
  1. 设 $\boldsymbol{x} = (2, -1, 3)$,$\boldsymbol{y} = (0, 4, -2)$。计算 $\|\boldsymbol{x}\|$,$\|\boldsymbol{y}\|$,$\langle \boldsymbol{x}, \boldsymbol{y} \rangle$,以及 $\boldsymbol{x}$ 与 $\boldsymbol{y}$ 的夹角。
  2. 证明极化恒等式:
    $$\langle \boldsymbol{x}, \boldsymbol{y} \rangle = \frac{\|\boldsymbol{x} + \boldsymbol{y}\|^2 - \|\boldsymbol{x} - \boldsymbol{y}\|^2}{4}.$$
    并利用此恒等式说明:如果知道所有向量的长度,就能唯一确定任意两个向量的内积。
  3. 证明平行四边形法则:
    $$\|\boldsymbol{x} + \boldsymbol{y}\|^2 + \|\boldsymbol{x} - \boldsymbol{y}\|^2 = 2(\|\boldsymbol{x}\|^2 + \|\boldsymbol{y}\|^2).$$
    并画图解释这一名称的由来。
  4. 设 $\boldsymbol{x}, \boldsymbol{y} \in \mathbb{R}^n$ 正交,证明勾股定理:
    $$\|\boldsymbol{x} + \boldsymbol{y}\|^2 = \|\boldsymbol{x}\|^2 + \|\boldsymbol{y}\|^2.$$
  5. 完成命题1.1.14的详细证明(填补不等式中间的估计细节)。
  6. 证明定理1.1.8中关于第二个变量的双线性性(利用对称性从第一个变量的双线性性推出)。
【概念辨析型】
  1. 判断下列命题的真伪,并给出理由或反例:
    • (a) 若 $\|\boldsymbol{x}\| = \|\boldsymbol{y}\|$,则 $\boldsymbol{x} = \boldsymbol{y}$ 或 $\boldsymbol{x} = -\boldsymbol{y}$。
    • (b) 若 $\langle \boldsymbol{x}, \boldsymbol{y} \rangle = 0$,则 $\|\boldsymbol{x} + \boldsymbol{y}\|^2 = \|\boldsymbol{x}\|^2 + \|\boldsymbol{y}\|^2$。
    • (c) 在 $\mathbb{R}^2$ 中,存在非零向量 $\boldsymbol{x}, \boldsymbol{y}$ 使得 $\|\boldsymbol{x} + \boldsymbol{y}\| = \|\boldsymbol{x} - \boldsymbol{y}\|$。正交吗?
    • (d) 点列 $\{\boldsymbol{x}_k\}$ 收敛于 $\boldsymbol{a}$ 当且仅当序列 $\{\|\boldsymbol{x}_k - \boldsymbol{a}\|\}$ 收敛于 $0$。
  2. "距离"与"范数"的关系类似于一维中"绝对值"与"距离"的关系。请详细说明这一类比,并指出在 $\mathbb{R}^n$ 中,范数能否由距离唯一确定?(提示:考虑极化恒等式是否成立。)
  3. 在 $\mathbb{R}^n$ 中,我们定义了标准内积 $\langle \boldsymbol{x}, \boldsymbol{y} \rangle = \sum x^i y^i$。如果把内积换成另一个满足定理1.1.8的函数,它还能给出相同的范数吗?试给出一个异于标准内积的双线性、对称、正定的函数,并计算在此内积下 $\boldsymbol{e}_1$ 和 $\boldsymbol{e}_2$ 的夹角。