第一部分
欧氏空间上的微分学
本部分导言
初等微积分用一句话概括,就是"变化率与累积量"。在一元函数 $f: \mathbb{R} \to \mathbb{R}$ 中,导数 $f'(a)$ 是一个数。这个数包含了两条信息:函数在 $a$ 附近是上升还是下降,以及上升或下降的速率。
当我们进入多元函数的领域——函数的定义域不再是一条直线,而是一个平面、一个空间,乃至一个 $n$ 维欧氏空间——一个数就不够了。原因很简单:在 $\mathbb{R}^n$ 中,我们不是只能沿着一个方向移动,而是可以沿着无穷多个方向移动。函数在不同方向上的变化率,通常各不相同。
这迫使我们重新思考:导数,究竟是什么?
本部分的回答是:导数是一个线性映射。
这个回答需要一些解释。在一元情形,我们可以把"数 $f'(a)$"重新理解为"乘以 $f'(a)$ 这个线性映射":它接受一个输入的微小位移 $h$,输出一个输出的微小位移 $f'(a)h$。这个映射是线性的——输入翻倍,输出翻倍;输入相加,输出相加。
在多元情形,这个线性映射不再能用一个数来刻画,而需要用矩阵——雅可比矩阵。$Df(\boldsymbol{a})$ 接受一个输入的微小位移 $\boldsymbol{h}$(它是一个向量),输出一个输出的微小位移(它也是一个向量)。线性性质依然成立:$Df(\boldsymbol{a})(\boldsymbol{h}_1 + \boldsymbol{h}_2) = Df(\boldsymbol{a})(\boldsymbol{h}_1) + Df(\boldsymbol{a})(\boldsymbol{h}_2)$,$Df(\boldsymbol{a})(c\boldsymbol{h}) = c Df(\boldsymbol{a})(\boldsymbol{h})$。
初等微积分问:"导数值是多少?"
本书问:"导数是哪个线性映射?"
这个视角的转变有一个深刻的结果:它让链式法则变得几乎"显然"。
在初等微积分中,链式法则 $(g \circ f)'(a) = g'(f(a)) \cdot f'(a)$ 是一条需要记忆和练习的规则。但在新视角下,它只是如下代数事实的体现:函数复合的导数,是各个函数导数的复合。用符号写出来:
右边的 $\circ$ 是线性映射的复合——本质上就是矩阵乘法。
如果再多一层复合呢?设 $f: \mathbb{R}^n \to \mathbb{R}^m$,$g: \mathbb{R}^m \to \mathbb{R}^p$,$h: \mathbb{R}^p \to \mathbb{R}^q$,考虑三重复合 $h \circ g \circ f$。按照初等微积分的做法,我们需要分两步套用链式法则,每一步都要仔细核对代入点。但在新视角下,结果呈现出一种清晰的模式:
无论复合多少层,求导就是把每一层的导数——每个都是一个线性映射——按复合的相反顺序乘起来。这个模式不需要死记硬背,它自动地从"导数 = 最佳线性近似"这个定义中流出。
把"复合"变成"乘法"——这是现代数学中反复出现的主题。
求导运算 $D$ 将函数的复合"翻译"为线性映射的复合。
在后续章节中,我们还会看到外微分 $d$、拉回 $f^*$ 等算子,它们都以类似的方式将一种结构"翻译"为另一种结构。
本部分的两章正是围绕这一核心思想展开的。
第1章 建立必要的线性代数基础。我们假定读者已经熟悉矩阵运算,因此本章的重点不是"如何做矩阵乘法",而是将线性映射作为一个独立的数学对象来理解。特别重要的是算子范数的概念——它精确地度量一个线性映射能将向量"拉伸"多少倍。这个工具在证明可微性、链式法则、反函数定理时不可或缺。本章也引入了欧氏空间中开集、闭集、紧集等拓扑概念,它们为后续的连续性、可积性讨论提供了语言。
第2章 将"导数 = 线性映射"这个定义贯彻到底。我们从一维情形出发,将定义自然推广到高维,然后系统性地重新推导读者在初等微积分中熟悉的规则——链式法则、乘积法则、隐函数求导——在新视角下,它们不再是孤立的技巧,而是同一棵树上的分支。本章还将初步展现"内积依赖"与"内积独立"概念的区分:梯度 $\nabla f$ 依赖于欧氏空间的内积,而导数 $Df$ 不依赖——这一区分在第4章引入微分形式时将变得至关重要。
在你开始阅读之前,有一个小小的提醒。你可能发现自己需要反复回到定义,追问:"这个对象属于哪个空间?它接受什么输入?它产生什么输出?"这正是我们希望培养的习惯。在初等微积分中,几乎一切都在 $\mathbb{R}$ 中进行,这种区分不那么重要。但在多元微积分和后续的流形理论中,同一个名词(例如"微分")可能指向不同类型的数学对象,混淆的代价很高。本部分引入的类型标注习惯——用旁白框明确定义每个对象的定义域和值域——将帮助你从一开始就建立起清晰的思维框架。
准备好了吗?我们从 $\mathbb{R}^n$ 的距离与角度开始,踏上征途。