第1章 · 欧氏空间与线性映射基础
1.1 向量、范数与内积
初等微积分主要研究定义在实数轴 $\mathbb{R}$ 上的函数。在多元情形,函数的定义域和值域变为高维空间。本节建立 $\mathbb{R}^n$ 的基本代数与几何结构,它们是后续所有概念的基石。
1.1.1 $\mathbb{R}^n$ 作为向量空间
设 $n$ 为正整数。集合
称为$n$ 维欧氏空间。其元素称为点或向量。我们通常用粗体小写字母 $\boldsymbol{x}$ 表示向量,用普通小写字母 $x^i$ 表示其分量。
当 $n = 1$ 时,$\mathbb{R}^1$ 即为实数轴 $\mathbb{R}$;$n = 2$ 时为平面;$n = 3$ 时为通常的立体空间。
本书用上标 $x^i$ 表示向量的第 $i$ 个分量,而非幂次。这样做的理由将在微分几何部分显现:上下标区分了向量的"逆变"与"协变"性质。初读时,只需将 $x^i$ 视为第 $i$ 个坐标即可。
对于 $\boldsymbol{x} = (x^1, \dots, x^n)$,$\boldsymbol{y} = (y^1, \dots, y^n) \in \mathbb{R}^n$ 及 $a \in \mathbb{R}$,定义
容易验证,上述运算满足向量空间的八条公理(结合律、交换律、零元、负元等)。因此 $\mathbb{R}^n$ 是一个实数域上的向量空间,维数为 $n$。
向量加法是映射 $\mathbb{R}^n \times \mathbb{R}^n \to \mathbb{R}^n$。
标量乘法是映射 $\mathbb{R} \times \mathbb{R}^n \to \mathbb{R}^n$。
向量
构成 $\mathbb{R}^n$ 的一组基,称为标准基。任何向量 $\boldsymbol{x} = (x^1, \dots, x^n)$ 可唯一表示为
1.1.2 范数与距离
在一维情形,绝对值 $|x|$ 度量了点到原点的距离,也度量了向量的"长度"。在高维中,我们有如下推广。
向量 $\boldsymbol{x} = (x^1, \dots, x^n) \in \mathbb{R}^n$ 的范数(或长度)定义为
当 $n = 1$ 时,$\|\boldsymbol{x}\| = |x^1|$,即通常的绝对值。
$\|\cdot\| : \mathbb{R}^n \to [0, \infty)$,它将向量映射为一个非负实数。
设 $\boldsymbol{x}, \boldsymbol{y} \in \mathbb{R}^n$,$a \in \mathbb{R}$。则:
- $\|\boldsymbol{x}\| \ge 0$,且 $\|\boldsymbol{x}\| = 0$ 当且仅当 $\boldsymbol{x} = \boldsymbol{0}$。
- $\|a\boldsymbol{x}\| = |a| \|\boldsymbol{x}\|$。
- 三角不等式:$\|\boldsymbol{x} + \boldsymbol{y}\| \le \|\boldsymbol{x}\| + \|\boldsymbol{y}\|$。
性质1与2由定义直接可得。性质3需要用到1.1.3节将引入的内积与柯西–施瓦茨不等式,其证明见定理1.1.9之后。 ∎
两点 $\boldsymbol{x}, \boldsymbol{y} \in \mathbb{R}^n$ 之间的欧氏距离定义为
三角不等式立即给出
即"两点之间直线最短"。
1.1.3 内积
范数来源于一种更基本的代数结构——内积。内积不仅给出长度,还能刻画角度与正交性。
对于 $\boldsymbol{x} = (x^1, \dots, x^n)$,$\boldsymbol{y} = (y^1, \dots, y^n) \in \mathbb{R}^n$,定义它们的内积为
内积有时也记作 $\boldsymbol{x} \cdot \boldsymbol{y}$,称为点积。
$\langle\cdot, \cdot\rangle : \mathbb{R}^n \times \mathbb{R}^n \to \mathbb{R}$,它是一个双线性函数(关于两个变量分别线性)。
设 $\boldsymbol{x}, \boldsymbol{x}_1, \boldsymbol{x}_2, \boldsymbol{y}, \boldsymbol{y}_1, \boldsymbol{y}_2 \in \mathbb{R}^n$,$a \in \mathbb{R}$。则:
- 对称性:$\langle \boldsymbol{x}, \boldsymbol{y} \rangle = \langle \boldsymbol{y}, \boldsymbol{x} \rangle$。
- 双线性性:
$$\langle a\boldsymbol{x}, \boldsymbol{y} \rangle = a\langle \boldsymbol{x}, \boldsymbol{y} \rangle,$$$$\langle \boldsymbol{x}_1 + \boldsymbol{x}_2, \boldsymbol{y} \rangle = \langle \boldsymbol{x}_1, \boldsymbol{y} \rangle + \langle \boldsymbol{x}_2, \boldsymbol{y} \rangle,$$以及关于第二个变量的相应等式(由对称性自动成立)。
- 正定性:$\langle \boldsymbol{x}, \boldsymbol{x} \rangle \ge 0$,且 $\langle \boldsymbol{x}, \boldsymbol{x} \rangle = 0$ 当且仅当 $\boldsymbol{x} = \boldsymbol{0}$。
所有性质均可由定义直接验证。以双线性性第一条为例:
其余留作练习。 ∎
对于任意 $\boldsymbol{x}, \boldsymbol{y} \in \mathbb{R}^n$,有
等号成立当且仅当 $\boldsymbol{x}$ 与 $\boldsymbol{y}$ 线性相关(即其中之一是另一个的标量倍数)。
若 $\boldsymbol{y} = \boldsymbol{0}$,不等式两边均为零,显然成立。设 $\boldsymbol{y} \neq \boldsymbol{0}$,对任意 $t \in \mathbb{R}$,考虑函数
由正定性,$f(t) \ge 0$ 对所有 $t$ 成立。这是一个关于 $t$ 的二次函数且开口向上,其判别式必须非正:
整理即得 $|\langle \boldsymbol{x}, \boldsymbol{y} \rangle| \le \|\boldsymbol{x}\| \|\boldsymbol{y}\|$。等号成立当且仅当判别式为零,此时存在唯一的 $t$ 使得 $f(t) = 0$,即 $\boldsymbol{x} = t\boldsymbol{y}$,两者线性相关。 ∎
有了柯西–施瓦茨不等式,我们便可以完成定理1.1.5中三角不等式的证明:
两边开平方即得 $\|\boldsymbol{x} + \boldsymbol{y}\| \le \|\boldsymbol{x}\| + \|\boldsymbol{y}\|$。
内积与范数的关系由定义直接给出:
对于非零向量 $\boldsymbol{x}, \boldsymbol{y} \in \mathbb{R}^n$,由柯西–施瓦茨不等式可知
因此存在唯一的 $\theta \in [0, \pi]$ 满足
称 $\theta$ 为向量 $\boldsymbol{x}$ 与 $\boldsymbol{y}$ 的夹角。特别地,若 $\langle \boldsymbol{x}, \boldsymbol{y} \rangle = 0$,则称 $\boldsymbol{x}$ 与 $\boldsymbol{y}$ 正交(或垂直),记作 $\boldsymbol{x} \perp \boldsymbol{y}$。零向量与任何向量正交。
正交概念依赖于内积的选择。本书在 $\mathbb{R}^n$ 中始终使用标准内积,但在后续章节我们会看到,同一个向量空间可以配备不同的内积,从而产生不同的正交关系。
标准基向量 $\boldsymbol{e}_1, \dots, \boldsymbol{e}_n$ 满足
即它们是两两正交的单位向量。这样的基称为标准正交基。
1.1.4 $\mathbb{R}^n$ 中的极限与开球
多元微积分中许多概念(极限、连续、可微)依赖于"接近"的精确描述。这通过范数来实现。
设 $\boldsymbol{a} \in \mathbb{R}^n$,$r > 0$。集合
称为以 $\boldsymbol{a}$ 为中心、$r$ 为半径的开球。集合
称为以 $\boldsymbol{a}$ 为中心、$r$ 为半径的闭球。
当 $n = 1$ 时,开球即为开区间 $(a-r, a+r)$,闭球为闭区间 $[a-r, a+r]$。当 $n = 2$ 时,开球是圆的内部(不含边界);当 $n = 3$ 时,开球是球体的内部。
设 $\{\boldsymbol{x}_k\}_{k=1}^\infty$ 是 $\mathbb{R}^n$ 中的点列,$\boldsymbol{a} \in \mathbb{R}^n$。若对于任意 $\varepsilon > 0$,存在正整数 $N$,使得当 $k > N$ 时,$\|\boldsymbol{x}_k - \boldsymbol{a}\| < \varepsilon$,则称 $\{\boldsymbol{x}_k\}$ 收敛于 $\boldsymbol{a}$,记作
$\{\boldsymbol{x}_k\}$ 是一个点列,每个 $\boldsymbol{x}_k$ 是一个向量。
$\boldsymbol{a}$ 是一个向量。收敛的定义使用了范数,这与一维时用绝对值完全类似。
设 $\boldsymbol{x}_k = (x_k^1, \dots, x_k^n)$,$\boldsymbol{a} = (a^1, \dots, a^n)$。则 $\boldsymbol{x}_k \to \boldsymbol{a}$ 当且仅当对每个 $i = 1, \dots, n$,有 $x_k^i \to a^i$(作为实数序列收敛)。
利用不等式
若 $\boldsymbol{x}_k \to \boldsymbol{a}$,则对任意 $\varepsilon > 0$,存在 $N$ 使当 $k > N$ 时 $\|\boldsymbol{x}_k - \boldsymbol{a}\| < \varepsilon$。于是 $|x_k^i - a^i| \le \|\boldsymbol{x}_k - \boldsymbol{a}\| < \varepsilon$,故 $x_k^i \to a^i$。
反之,若每个分量收敛,则对任意 $\varepsilon > 0$,存在 $N_i$ 使当 $k > N_i$ 时 $|x_k^i - a^i| < \varepsilon/n$。取 $N = \max\{N_1, \dots, N_n\}$,则当 $k > N$ 时,
因此 $\boldsymbol{x}_k \to \boldsymbol{a}$。 ∎
此命题意味着 $\mathbb{R}^n$ 中的收敛本质上是 $n$ 个独立的一维收敛问题,这是 $\mathbb{R}^n$ 上分析学的重要便利之处。
练习 1.1
- 设 $\boldsymbol{x} = (2, -1, 3)$,$\boldsymbol{y} = (0, 4, -2)$。计算 $\|\boldsymbol{x}\|$,$\|\boldsymbol{y}\|$,$\langle \boldsymbol{x}, \boldsymbol{y} \rangle$,以及 $\boldsymbol{x}$ 与 $\boldsymbol{y}$ 的夹角。
- 证明极化恒等式:
$$\langle \boldsymbol{x}, \boldsymbol{y} \rangle = \frac{\|\boldsymbol{x} + \boldsymbol{y}\|^2 - \|\boldsymbol{x} - \boldsymbol{y}\|^2}{4}.$$并利用此恒等式说明:如果知道所有向量的长度,就能唯一确定任意两个向量的内积。
- 证明平行四边形法则:
$$\|\boldsymbol{x} + \boldsymbol{y}\|^2 + \|\boldsymbol{x} - \boldsymbol{y}\|^2 = 2(\|\boldsymbol{x}\|^2 + \|\boldsymbol{y}\|^2).$$并画图解释这一名称的由来。
- 设 $\boldsymbol{x}, \boldsymbol{y} \in \mathbb{R}^n$ 正交,证明勾股定理:
$$\|\boldsymbol{x} + \boldsymbol{y}\|^2 = \|\boldsymbol{x}\|^2 + \|\boldsymbol{y}\|^2.$$
- 完成命题1.1.14的详细证明(填补不等式中间的估计细节)。
- 证明定理1.1.8中关于第二个变量的双线性性(利用对称性从第一个变量的双线性性推出)。
- 判断下列命题的真伪,并给出理由或反例:
- (a) 若 $\|\boldsymbol{x}\| = \|\boldsymbol{y}\|$,则 $\boldsymbol{x} = \boldsymbol{y}$ 或 $\boldsymbol{x} = -\boldsymbol{y}$。
- (b) 若 $\langle \boldsymbol{x}, \boldsymbol{y} \rangle = 0$,则 $\|\boldsymbol{x} + \boldsymbol{y}\|^2 = \|\boldsymbol{x}\|^2 + \|\boldsymbol{y}\|^2$。
- (c) 在 $\mathbb{R}^2$ 中,存在非零向量 $\boldsymbol{x}, \boldsymbol{y}$ 使得 $\|\boldsymbol{x} + \boldsymbol{y}\| = \|\boldsymbol{x} - \boldsymbol{y}\|$。正交吗?
- (d) 点列 $\{\boldsymbol{x}_k\}$ 收敛于 $\boldsymbol{a}$ 当且仅当序列 $\{\|\boldsymbol{x}_k - \boldsymbol{a}\|\}$ 收敛于 $0$。
- "距离"与"范数"的关系类似于一维中"绝对值"与"距离"的关系。请详细说明这一类比,并指出在 $\mathbb{R}^n$ 中,范数能否由距离唯一确定?(提示:考虑极化恒等式是否成立。)
- 在 $\mathbb{R}^n$ 中,我们定义了标准内积 $\langle \boldsymbol{x}, \boldsymbol{y} \rangle = \sum x^i y^i$。如果把内积换成另一个满足定理1.1.8的函数,它还能给出相同的范数吗?试给出一个异于标准内积的双线性、对称、正定的函数,并计算在此内积下 $\boldsymbol{e}_1$ 和 $\boldsymbol{e}_2$ 的夹角。