Jacobian和Hessian,线性变换和极值
Jacobian-Hessian
FirstSecond-PartialDerivative
matrix
linear-map
index
Jacobian矩阵,一阶偏导,和线性变换
向量函数y=F(x) (x∈Rn, y∈Rm) 关于自变量x∈Rn的一阶偏导定义为:
∂F∂x=def⎡⎣⎢⎢⎢⎢⎢⎢∂F1∂x1⋮∂Fm∂x1...⋮...∂F1∂xn⋮∂Fm∂xn⎤⎦⎥⎥⎥⎥⎥⎥=defJ.
矩阵J叫做Jacobian矩阵,以纪念德国数学家Jacobi (1804-1851).
实际上,从x∈Rn到y∈Rm的线性变换的矩阵表示Jm×n,就是向量函数y=Jx的一阶偏导:
∂(Jx)∂x=J.
Hessian矩阵,二阶偏导,和极值
实值函数y=f(x)关于自变量x∈Rn的二阶偏导定义为:
∂2f∂x2=def⎡⎣⎢⎢⎢⎢⎢⎢⎢∂2f∂x21⋮∂2f∂xn∂x1...⋮...∂2f∂x1∂xn⋮∂2f∂x2n⎤⎦⎥⎥⎥⎥⎥⎥⎥=defH≡∇2f.
矩阵H叫做Hessian矩阵,以纪念德国数学家Hesse (1811-1974). 由欧拉定理(1734年)可知,矩阵H是对称的。
Hessian矩阵的正定性,可用于判断二次型f(x)=12(x−x0)⊺H(x0)(x−x0)+∇f(x0)(x−x0)+f(x0)的局部极值性。而矩阵的正定性,又与该矩阵的特征值紧密相关。