导数
导数
设函数 f:Rn→Rm,x∈intdomf。如果存在矩阵 Df(x)∈Rm×n,满足
z∈domf,z=x,z→xlim∥z−x∥2∥f(z)−f(x)−Df(x)(z−x)∥2=0则称函数 f 可微,并称 Df(x) 为 f 在 x 处的导数(或 Jacobian 矩阵)。
我们将 z 的仿射函数
f(x)+Df(x)(z−x)称为 f 在 x 处(或附近)的一次逼近。当 z 接近 x 时,该仿射函数非常接近 f。
Df(x) 可以通过计算偏导数的方式求得:
Df(x)ij=∂xj∂fi(x),i=1,⋯,m,j=1,⋯,n梯度
∇f(x)=Df(x)⊤梯度是一个列向量,它的分量是 f 的偏导数。
∇f(x)i=∂xi∂f(x),i=1,⋯,n链式规则
设复合函数 h(x)=g(f(x)),则
∇h(x)=g′(f(x))f(x)=∇g(f(x))⊤f(x)仿射函数
设仿射函数 g(x)=f(Ax+b),其中 f:Rn→Rm,A∈Rn×p,b∈Rn,则 g:Rp→Rm。当 f 是实函数时(即 m=1),仿射函数 g 的梯度公式为:
∇g(x)=A⊤∇f(Ax+b)
仿射
从 Rn 到 Rm 的映射 x→Ax+b 称为仿射变换。当 m=1 时,称上述仿射变换为仿射函数。若仿射函数的 b=0,则称之为线性函数。
方向导数
设 f:Rn→Rm,x,v∈Rn。定义函数 f~=f(x+tv)。(粗略地说,f~ 是将 f 限制在直线 {x+tv∣t∈R} 上的函数。)则
Df~(t)=f~′(t)=∇f(x+tv)⊤v并称标量 f~′(0) 为函数 f 在 x 处沿方向 v 的方向导数。
二阶导数
设函数 f:Rn→R,x∈intdomf。那么 f 在 x 处的二阶导数(或 Hessian 矩阵)为
∇2f(x)ij=∂xi∂xj∂2f(x),i=1,⋯,n,j=1,⋯,n函数 f 在(或接近)x 处以 z 为变量的二次逼近为
f(z)=f(x)+∇f(x)⊤(z−x)+21(z−x)⊤∇2f(x)(z−x)二阶导数的链式规则
标量复合函数
设 f:Rn→R,g:R→R,h(x)=g(f(x))。我们有
∇2h(x)=g′(f(x))∇2f(x)+g′′(f(x))∇f(x)∇f(x)⊤复合仿射函数
设 f:Rn→R,A∈Rn×m,b∈Rn,定义 g:Rm→R 为 g(x)=f(Ax+b)。我们有
∇2g(x)=A⊤∇2f(Ax+b)A