@mShuaiZhao
2020-04-21T11:07:05.000000Z
字数 6104
阅读 527
Matrix
2017.12
推荐阅读
[1] https://atmos.washington.edu/~dennis/MatrixCalculus.pdf
[2] https://en.wikipedia.org/wiki/Matrix_calculus#Relation_to_other_derivatives
[3] Matrix Cookbook
常规的运算和线性代数中常用的一样。
止于实数矩阵的范畴,不讨论复矩阵。 假设矩阵都是普通的矩阵。
所有提及的向量,都是指列向量。
vec operator
将矩阵向量化,按照列连接起来。
Kronecker product
Kronecker delta function
采用wiki里面所说的Numerator layout的形式,e.g. 一个标量对列向量求导最后得到一个行向量。
矩阵求导,由于水平有限,对于其形式仍有困惑。
矩阵求导遵循的基本规则
对于向量而言
六种基本的形式
这里主要参考wiki
矩阵对标量(scalar)求导
标量对一个列向量求导
标量对列向量中的元素分别求导。
标量对矩阵求导相同。
列向量对列向量求导
推论1
推论2
向量积对列向量求导
本质上是标量对列向量求导,所以最后是列向量的形式。
利用分量的方法可以看出是满足分部积分的方式的
推论1
与无关,与相关
推论2
与无关
Propositions
1
2
记忆要点:实质上都是scalar-matrix的形式,最后得到的结果要和矩阵的维度一样。
3
4
矩阵的迹求导
矩阵的迹就是矩阵对角线元素的和
First Order
1
2
Second Order
更多式子查书可得。
矩阵的逆求导
可以通过邮件 1696144426@qq.com 联系作者。