第2章 · 多元函数的导数
2.3 偏导数与可微性
在 §2.1 中,我们定义了导数 $Df(\boldsymbol{a})$ 为满足一定极限条件的线性映射,并指出如果 $f$ 在 $\boldsymbol{a}$ 处可微,则所有偏导数 $D_j f^i(\boldsymbol{a})$ 存在,且雅可比矩阵 $f'(\boldsymbol{a})$ 正是 $Df(\boldsymbol{a})$ 在标准基下的矩阵。本节将更系统地讨论偏导数、高阶混合偏导数以及它们与可微性的关系。核心结论是:偏导数存在且连续 $\Rightarrow$ 可微。这个充分条件极大地方便了实际判断。
2.3.1 偏导数的定义与计算
设 $f: \mathbb{R}^n \to \mathbb{R}^m$。对分量函数 $f^i$ 和自变量下标 $j$,偏导数 $D_j f^i(\boldsymbol{a})$ 的定义已在 §2.1 中给出:它是将除第 $j$ 个变量以外的所有变量固定时的一元函数在 $a^j$ 处的导数。形式地,
当 $f$ 的值域是 $\mathbb{R}$(即 $m=1$)时,常省略上标,记作 $D_j f(\boldsymbol{a})$ 或 $\frac{\partial f}{\partial x^j}(\boldsymbol{a})$。
在计算偏导数时,只需将其余变量视作常数,应用一元函数的求导法则即可。
设 $f: \mathbb{R}^3 \to \mathbb{R}^2$,$f(x,y,z) = (x^2 y, e^{yz})$。则
雅可比矩阵为
单独一个偏导数的存在只告诉我们沿坐标轴方向的变化信息,对函数在其它方向的行为没有任何约束。因此,偏导数都存在并不保证函数连续,更不保证可微。这正是本节后半部分要详细讨论的。
用开集语言重新表述偏导数的存在性会更清晰。设 $f: \mathbb{R}^n \to \mathbb{R}$。若偏导数 $D_j f(\boldsymbol{a})$ 存在,这意味着存在某个包含 $\boldsymbol{a}$ 的开集 $U$,函数 $f$ 在 $U$ 上有定义,且限制在通过 $\boldsymbol{a}$ 且平行于第 $j$ 个坐标轴的直线与 $U$ 的交集上,一元函数 $t \mapsto f(a^1, \dots, a^{j-1}, t, a^{j+1}, \dots, a^n)$ 在 $t = a^j$ 处可导。当 $f$ 在开集 $U$ 上的每一点都具有所有偏导数时,我们说 $f$ 在 $U$ 上有偏导数。
2.3.2 高阶偏导数与混合偏导数
如果偏导数 $D_j f^i$ 本身又关于某个变量可偏导,就得到二阶偏导数。对 $m=1$ 的标量值函数,常用记号
注意下标的顺序:$D_{k,j} f$ 表示先对 $x^j$ 求偏导,再对 $x^k$ 求偏导。很多教材采用相反的约定,本书始终使用"从右向左"的顺序,与函数复合的顺序一致。
当 $k \neq j$ 时,$D_{k,j} f$ 和 $D_{j,k} f$ 称为混合偏导数。一个自然的问题是:求导顺序是否可以交换?在一元微积分中,这等价于问:函数 $f$ 在一点附近是否满足 $\frac{\partial^2 f}{\partial x \partial y} = \frac{\partial^2 f}{\partial y \partial x}$。
答案是否定的——混合偏导数可能不同,但若它们连续,则必定相等。这就是克莱罗定理(也称施瓦茨定理)。为了给这个定理一个完整的证明,我们需要引入一个在微分学中反复出现的重要工具——差分。
差分的概念
设 $g: \mathbb{R} \to \mathbb{R}$ 是一元函数。在研究 $g$ 的变化时,我们经常需要考虑形如 $g(b) - g(a)$ 的表达式。当我们同时改变多个自变量时,自然需要考虑"逐个方向依次改变"所产生的累积效果。这就引出了多元差分。
对二元函数 $f: \mathbb{R}^2 \to \mathbb{R}$ 和点 $(x,y)$,以及增量 $h, k \in \mathbb{R}$,定义双重差分
这个表达式衡量了同时改变两个自变量相对于分别单独改变所产生的"交互效应"。如果 $f$ 是线性的(形如 $ax + by + c$),则 $\Delta(h,k) = 0$。更一般地,中值定理能将双重差分与混合偏导数联系起来:如果 $f$ 在相关区域内有二阶偏导数,则存在中间点使得
同时也可以通过不同的分解顺序得到 $\Delta(h,k) = h k \, D_{1,2} f(\xi', \eta')$。这正是证明混合偏导数相等定理的核心技巧——让差分分别用两种求导顺序表示,然后比较结果。
一元中值定理说 $g(b) - g(a) = g'(c)(b-a)$。多元差分 $\Delta(h,k)$ 是对 $f$ 依次在 $x$ 方向和 $y$ 方向应用中值定理的结果。若对 $f(x+h, y+k) - f(x+h, y)$ 这个关于 $y$ 的差分应用中值定理,则得到含有 $D_2 f$ 的表达式;再对这个表达式关于 $x$ 应用中值定理,便得到含有 $D_{1,2} f$ 的表达式。交换顺序则得到 $D_{2,1} f$。
设 $f: \mathbb{R}^n \to \mathbb{R}$ 在包含 $\boldsymbol{a}$ 的某个开集 $U$ 上具有二阶偏导数 $D_{i,j} f$ 和 $D_{j,i} f$,且它们在 $\boldsymbol{a}$ 处都连续。则
为简化记号,取 $n=2$,$\boldsymbol{a} = (x,y)$,$i=1$,$j=2$。一般情形完全类似。设 $f$ 在包含 $(x,y)$ 的开集 $U$ 上有二阶偏导数,且 $D_{1,2} f$ 和 $D_{2,1} f$ 在 $(x,y)$ 处连续。
因为 $U$ 是开集,存在某个 $r>0$ 使得开球 $B((x,y), r) \subset U$。取实数 $h, k \neq 0$ 满足 $\|(h,k)\| < r$,则以 $(x,y)$ 和 $(x+h, y+k)$ 为对角顶点的矩形完全包含在开球内,从而包含在 $U$ 内。
考虑双重差分
第一步:用两种顺序表示 $\Delta(h,k)$。
先将 $\Delta(h,k)$ 重新分组:
对固定的 $h$,定义一元函数 $g(t) = f(x+h, t) - f(x, t)$,其中 $t$ 在 $y$ 与 $y+k$ 之间取值。由于 $D_2 f$ 在 $U$ 上存在,且在包含该矩形区域内每一点均可偏导,故 $g$ 在 $[y, y+k]$ 上可导,且
由一元中值定理,存在 $c$ 在 $y$ 与 $y+k$ 之间,使得
而 $g(y+k) - g(y) = \Delta(h,k)$。现在对 $D_2 f(\cdot, c)$ 这个关于第一个变量的函数应用中值定理:因为 $D_1(D_2 f) = D_{1,2} f$ 在 $U$ 上存在,存在 $d$ 在 $x$ 与 $x+h$ 之间,使得
这里需要保证点 $(d, c)$ 仍在 $U$ 内。因为 $d$ 在 $x$ 与 $x+h$ 之间,$c$ 在 $y$ 与 $y+k$ 之间,而整个矩形包含在开球 $B((x,y), r) \subset U$ 中,且开球是凸集(球中任意两点连线全部在球内),所以 $(d, c)$ 确实在 $U$ 中。因此,上述中值定理的应用合法。
从而
另一方面,将 $\Delta(h,k)$ 换一种方式分组:
完全对称的论证(先对第一个变量应用中值定理,再对第二个变量应用中值定理)给出存在 $d'$ 在 $x$ 与 $x+h$ 之间,$c'$ 在 $y$ 与 $y+k$ 之间,使得
同样,点 $(d', c')$ 落在矩形内,从而在 $U$ 中。
第二步:利用连续性取极限。
由于 $h, k \neq 0$,从 (1) 和 (2) 可得
现在令 $(h,k) \to (0,0)$。由中值点的构造,当 $h \to 0$ 时 $d \to x$ 且 $d' \to x$;当 $k \to 0$ 时 $c \to y$ 且 $c' \to y$。因此当 $(h,k) \to (0,0)$ 时,$(d,c) \to (x,y)$ 且 $(d',c') \to (x,y)$。
由于 $D_{1,2} f$ 和 $D_{2,1} f$ 都在 $(x,y)$ 处连续,我们有
而这两个极限分别是等式 $D_{1,2} f(d, c) = D_{2,1} f(d', c')$ 两边的极限,因此它们必须相等:
这就完成了证明。 ∎
这个证明的精髓在于双重差分 $\Delta(h,k)$。它的巧妙之处在于:通过两种不同的分组方式,将同一个量分别与 $D_{1,2} f$ 和 $D_{2,1} f$ 联系起来。中值定理提供了等式 $D_{1,2} f(d, c) = D_{2,1} f(d', c')$,而连续性则允许我们在极限下将这个等式"传递"到目标点 $(x,y)$。证明中多次使用了开集 $U$ 的性质:开球的存在性保证了矩形完全在 $U$ 内,而开球的凸性又保证了中值定理的中间点始终在 $U$ 内,从而函数及其偏导数有定义。
存在这样的函数,其二阶混合偏导数在某点都存在但不相等,这时它们必然在该点不连续。经典反例见练习 2.3 第 4 题。因此定理 2.3.2 的结论虽强,前提(连续性)也确实是必需的。
对于具有直至 $r$ 阶连续偏导数的函数,我们称其为 $C^r$ 函数。若所有阶的偏导数都连续,则称为 $C^\infty$ 函数(光滑函数)。对于 $C^2$ 函数,定理 2.3.2 保证了混合偏导数可以任意交换顺序。
2.3.3 偏导数连续蕴含可微
我们已经知道,可微性严格强于偏导数的存在性。然而,验证一个函数是否满足原始定义中的极限等式通常较繁琐。以下定理提供了一个易于检查的充分条件:如果所有偏导数在某个开集内存在且在某点连续,则函数在该点可微。这极大简化了大多数初等函数的可微性判断。
设 $f: \mathbb{R}^n \to \mathbb{R}^m$。若存在包含 $\boldsymbol{a}$ 的开集 $U$,使得对每个 $i, j$,偏导数 $D_j f^i$ 在 $U$ 上存在,且在 $\boldsymbol{a}$ 处连续,则 $f$ 在 $\boldsymbol{a}$ 处可微。
"存在包含 $\boldsymbol{a}$ 的开集 $U$" 是用开集语言表达"在 $\boldsymbol{a}$ 的某个邻域内"的精确说法。这与 §1.3 中定义连续性、可微性时的语言完全一致:我们需要偏导数在 $\boldsymbol{a}$ 附近都有定义(而不仅仅在 $\boldsymbol{a}$ 处存在),才能在证明中使用中值定理。此外,开集的凸性(通过开球)保证了中值定理的中间点始终在定义域内。
只需考虑 $m=1$ 的情形(因为向量值函数的可微性等价于每个分量可微)。设 $f: \mathbb{R}^n \to \mathbb{R}$ 满足条件。我们的目标是证明线性映射 $T(\boldsymbol{h}) = \sum_{j=1}^n D_j f(\boldsymbol{a}) h^j$ 满足定义 2.1.1。
由条件,存在开集 $U$ 包含 $\boldsymbol{a}$,使得所有偏导数在 $U$ 上存在且在 $\boldsymbol{a}$ 处连续。因为 $U$ 是开集,存在 $r>0$ 使得开球 $B(\boldsymbol{a}, r) \subset U$。以下取 $\boldsymbol{h}$ 满足 $\|\boldsymbol{h}\| < r$,则 $\boldsymbol{a}+\boldsymbol{h} \in B(\boldsymbol{a}, r) \subset U$。
将增量 $f(\boldsymbol{a}+\boldsymbol{h}) - f(\boldsymbol{a})$ 沿坐标方向逐次分解。为简化记号,以 $n=2$ 为例写出核心步骤;一般情形完全类似。
设 $\boldsymbol{a} = (a,b)$,$\boldsymbol{h} = (h,k)$ 满足 $\|(h,k)\| < r$。考虑
这是证明中最关键的一步——将二维变化分解为沿两个坐标轴方向的两次一维变化之和。这种逐方向分解的技巧将在多元分析中反复出现。
对第一个方括号内的差,将 $y$ 视为变量,$x=a+h$ 固定。因为 $D_2 f$ 在 $U$ 上存在,函数 $y \mapsto f(a+h, y)$ 在 $b$ 与 $b+k$ 之间可导。由一元中值定理,存在 $\theta_1 \in (0,1)$ 使得
这里点 $(a+h, b+\theta_1 k)$ 落在连接 $(a+h, b)$ 与 $(a+h, b+k)$ 的线段上,该线段包含在开球 $B(\boldsymbol{a}, r)$ 内(开球是凸集),从而在 $U$ 内。因此中值定理合法。
对第二个方括号,将 $x$ 视为变量,$y=b$ 固定。由一元中值定理,存在 $\theta_2 \in (0,1)$ 使得
类似地,点 $(a+\theta_2 h, b)$ 也包含在开球内,从而在 $U$ 内。
于是
我们的候选线性映射为 $T(h,k) = h D_1 f(a,b) + k D_2 f(a,b)$。因此误差为
两边除以 $\|\boldsymbol{h}\| = \sqrt{h^2 + k^2}$,并注意 $|h| \le \|\boldsymbol{h}\|, |k| \le \|\boldsymbol{h}\|$,得
至此,可微性的误差被分解为两部分的绝对值之和。第一部分是 $D_1 f$ 在点 $(a+\theta_2 h, b)$ 的值与它在 $(a,b)$ 的值的差;第二部分是 $D_2 f$ 在点 $(a+h, b+\theta_1 k)$ 的值与它在 $(a,b)$ 的值的差。由于中值定理的中间点随着 $\boldsymbol{h} \to \boldsymbol{0}$ 而趋近于 $(a,b)$,偏导数的连续性恰好保证了这两部分都趋于零。
当 $\boldsymbol{h} \to \boldsymbol{0}$ 时,$(a+\theta_2 h, b) \to (a,b)$,$(a+h, b+\theta_1 k) \to (a,b)$。由于 $D_1 f$ 和 $D_2 f$ 都在 $(a,b)$ 处连续,右边两项均趋于 $0$。这就证明了
即 $f$ 在 $\boldsymbol{a}$ 处可微,且导数为 $T$。
对于一般的 $n$,可将增量分解为 $n$ 项:
每一项是沿第 $j$ 个坐标方向的一维变化,应用中值定理即得含有 $D_j f$ 的表达式。为保证中值定理的中间点始终在 $U$ 内,仍然需要开球 $B(\boldsymbol{a}, r)$ 的凸性。结合各偏导数在 $\boldsymbol{a}$ 处的连续性,误差估计完全类似。 ∎
上述证明的本质是:将多元函数的增量用逐个方向的一元中值定理分解,从而将整体变化表示为各偏导数在某中间点处的值乘上相应增量。连续性保证了这些中间点处的偏导数与 $\boldsymbol{a}$ 处的偏导数足够接近,从而误差可控。这种"坐标方向分解 + 中值定理 + 连续性"的组合方法在多元分析中十分常用。开集框架在此处起到了两个作用:一是通过开球的存在性为所有操作提供一个"安全区域";二是通过开球的凸性确保中值定理的中间点始终落在这个安全区域内。
若 $f$ 在开集 $U \subset \mathbb{R}^n$ 上所有偏导数存在且连续(此时称 $f$ 在 $U$ 上是 $C^1$ 的),则 $f$ 在 $U$ 上可微,且导数映射 $\boldsymbol{x} \mapsto Df(\boldsymbol{x})$ 连续。
这个推论表明,对于绝大多数由初等函数通过四则运算和复合得到的多元函数,只要偏导数在定义域内连续,就可以放心地使用链式法则等求导工具,而不必每次都回到原始定义。
2.3.4 反例与边界情形
为了加深对可微性严格强于偏导数存在的认识,我们列出三个典型的反例。
函数 $f: \mathbb{R}^2 \to \mathbb{R}$ 定义为
在原点的两个偏导数都存在且为零(因为沿两坐标轴函数恒为零)。但 $f$ 在原点不连续:沿直线 $y = mx$ 逼近时,极限值为 $\frac{m}{1+m^2}$,随 $m$ 不同而变化。因此 $f$ 在原点不可微。
在 §2.1 中我们曾提到函数 $f(x,y) = \frac{x^2 y}{x^4 + y^2}$(原点补充为 0)。该函数在原点的所有方向导数都存在(且为零),但在原点不可微,甚至不连续:沿抛物线 $y = x^2$ 逼近原点时,函数值恒为 $1/2$,并不趋于 0。这说明即使有全部方向导数的信息,仍不足以推出可微性。
定理 2.3.3 的逆命题不成立。一个可微函数的偏导数未必连续。例如
是一元可微但导数不连续的例子。在多元情形,可以构造
该函数在原点可微(因为 $|f(x,y)| \le x^2 + y^2$,误差估计见练习 2.3 第 6 题),但偏导数在原点附近振荡,不连续。
这些反例提醒我们:可微性是介于"偏导数存在"和"偏导数连续"之间的一个严格中间性质。在实际使用中,我们通常遇到的是偏导数连续的良好函数,因此定理 2.3.3 已经覆盖了绝大多数情形。
练习 2.3
- 设 $f: \mathbb{R}^3 \to \mathbb{R}^2$,$f(x,y,z) = (x^2 + y^2 + z^2, e^{x+y+z})$。写出雅可比矩阵,并指出哪些偏导数在 $\mathbb{R}^3$ 上连续。
- 设 $f(x,y) = \begin{cases} \dfrac{x^3 + y^3}{x^2 + y^2}, & (x,y) \neq (0,0), \\ 0, & (0,0). \end{cases}$
- (a) 计算偏导数 $D_1 f(x,y), D_2 f(x,y)$(当 $(x,y) \neq (0,0)$)以及在原点的偏导数。
- (b) 验证这些偏导数在原点是否连续?
- (c) $f$ 在原点是否可微?若可微,给出 $Df(0,0)$。
- 设 $f(x,y) = xy^2 + y \sin x$。验证它满足定理 2.3.3 的条件,从而可微。
- (混合偏导数不等例)定义
$$f(x,y) = \begin{cases} \dfrac{xy(x^2 - y^2)}{x^2 + y^2}, & (x,y) \neq (0,0), \\[1em] 0, & (x,y) = (0,0). \end{cases}$$证明 $D_{1,2}f(0,0) \neq D_{2,1}f(0,0)$,并解释为什么这并不与定理 2.3.2 矛盾。
- 判断下列命题的真伪,并给出理由或反例:
- (a) 若 $f$ 在 $\boldsymbol{a}$ 处所有偏导数存在,则 $f$ 在 $\boldsymbol{a}$ 处连续。
- (b) 若 $f$ 在 $\boldsymbol{a}$ 处可微,则 $f$ 的所有偏导数在 $\boldsymbol{a}$ 处连续。
- (c) 若 $f$ 在开集 $U$ 上所有偏导数存在且有界,则 $f$ 在 $U$ 上连续。
- (d) 若 $f, g: \mathbb{R}^n \to \mathbb{R}$ 可微,则 $D(fg) = f Dg + g Df$。
- 设 $f: \mathbb{R}^2 \to \mathbb{R}$ 满足 $|f(x,y)| \le x^2 + y^2$。证明 $f$ 在 $(0,0)$ 处可微,并求 $Df(0,0)$。
- (定理 2.3.3 的证明推广)补全当 $n$ 为任意正整数时定理 2.3.3 的证明,写出一般情况下的差分分解与误差估计。注意在每一步中如何利用开球的凸性保证中值定理的中间点仍在定义域内。
- 详细证明例 2.3.6 中的函数 $f(x,y) = \frac{x^2 y}{x^4 + y^2}$(原点补充为 0)在原点所有方向导数存在,但不可微(甚至不连续)。提示:沿抛物线 $y = x^2$ 考虑极限。