已阅读5页,还剩5页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
转载矩阵求导公式【转】 (2011-11-15 11:03:34)转载标签:转载原文地址:矩阵求导公式【转】作者:三寅今天推导公式,发现居然有对矩阵的求导,狂汗-完全不会。不过还好网上有人总结了。吼吼,赶紧搬过来收藏备份。基本公式:Y = A * X - DY/DX = AY = X * A - DY/DX = AY = A * X * B - DY/DX = A * BY = A * X * B - DY/DX = B * A1. 矩阵Y对标量x求导:相当于每个元素求导数后转置一下,注意MN矩阵求导后变成NM了Y = y(ij) - dY/dx = dy(ji)/dx2. 标量y对列向量X求导:注意与上面不同,这次括号内是求偏导,不转置,对N1向量求导后还是N1向量y = f(x1,x2,.,xn) - dy/dX = (Dy/Dx1,Dy/Dx2,.,Dy/Dxn)3. 行向量Y对列向量X求导:注意1M向量对N1向量求导后是NM矩阵。将Y的每一列对X求偏导,将各列构成一个矩阵。重要结论:dX/dX = Id(AX)/dX = A4. 列向量Y对行向量X求导:转化为行向量Y对列向量X的导数,然后转置。注意M1向量对1N向量求导结果为MN矩阵。dY/dX = (dY/dX)5. 向量积对列向量X求导运算法则:注意与标量求导有点不同。d(UV)/dX = (dU/dX)V + U(dV/dX)d(UV)/dX = (dU/dX)V + (dV/dX)U重要结论:d(XA)/dX = (dX/dX)A + (dA/dX)X = IA + 0X = Ad(AX)/dX = (d(XA)/dX) = (A) = Ad(XAX)/dX = (dX/dX)AX + (d(AX)/dX)X = AX + AX6. 矩阵Y对列向量X求导:将Y对X的每一个分量求偏导,构成一个超向量。注意该向量的每一个元素都是一个矩阵。7. 矩阵积对列向量求导法则:d(uV)/dX = (du/dX)V + u(dV/dX)d(UV)/dX = (dU/dX)V + U(dV/dX)重要结论:d(XA)/dX = (dX/dX)A + X(dA/dX) = IA + X0 = A8. 标量y对矩阵X的导数:类似标量y对列向量X的导数,把y对每个X的元素求偏导,不用转置。dy/dX = Dy/Dx(ij) 重要结论:y = UXV = u(i)x(ij)v(j) 于是 dy/dX = u(i)v(j) = UVy = UXXU 则 dy/dX = 2XUUy = (XU-V)(XU-V) 则 dy/dX = d(UXXU - 2VXU + VV)/dX = 2XUU - 2VU + 0 = 2(XU-V)U9. 矩阵Y对矩阵X的导数:将Y的每个元素对X求导,然后排在一起形成超级矩阵。10.乘积的导数d(f*g)/dx=(df/dx)g+(dg/dx)f结论d(xAx)=(d(x)/dx)Ax+(d(Ax)/dx)(x)=Ax+Ax(注意:是表示两次转置)比较详细点的如下:/blog/static/145880136201051113615571//wangwen926/blog/item/eb189bf6b0fb702b720eec94.html其他参考:Contents Notation Derivatives of Linear Products Derivatives of Quadratic ProductsNotation d/dx(y)is a vector whose(i)element isdy(i)/dx d/dx(y) is a vector whose(i)element isdy/dx(i) d/dx(yT) is a matrix whose(i,j)element isdy(j)/dx(i) d/dx(Y) is a matrix whose(i,j)element isdy(i,j)/dx d/dX(y) is a matrix whose(i,j)element isdy/dx(i,j)Note that the Hermitian transpose is not used because complex conjugates are not analytic.In the expressions below matrices and vectorsA,B,Cdo not depend onX.Derivatives of Linear Products d/dx(AYB)=A*d/dx(Y) *B d/dx(Ay)=A*d/dx(y) d/dx(xTA)=A d/dx(xT)=I d/dx(xTa)= d/dx(aTx) =a d/dX(aTXb) =abT d/dX(aTXa) =d/dX(aTXTa) =aaT d/dX(aTXTb) =baT d/dx(YZ)=Y*d/dx(Z) +d/dx(Y)* ZDerivatives of Quadratic Products d/dx(Ax+b)TC(Dx+e) =ATC(Dx+e)+DTCT(Ax+b) d/dx(xTCx) = (C+CT)x C: symmetric:d/dx(xTCx) = 2Cx d/dx(xTx) = 2x d/dx(Ax+b)T(Dx+e) =AT(Dx+e)+DT(Ax+b) d/dx(Ax+b)T(Ax+b) = 2AT(Ax+b) C: symmetric:d/dx(Ax+b)TC(Ax+b) = 2ATC(Ax+b) d/dX(aTXTXb) =X(abT+ baT) d/dX(aTXTXa) = 2XaaT d/dX(aTXTCXb) =CTXabT+ CXbaT d/dX(aTXTCXa) =(C + CT)XaaT C:Symmetricd/dX(aTXTCXa) =2CXaaT d/dX(Xa+b)TC(Xa+b) = (C+CT)(Xa+b)aTDerivatives of Cubic Products d/dx(xTAxxT) = (A+AT)xxT+xTAxIDerivatives of Inverses d/dx(Y-1) =-Y-1d/dx(Y)Y-1Derivative of TraceNote: matrix dimensions must result in ann*nargument for tr(). d/dX(tr(X) =I d/dX(tr(Xk) =k(Xk-1)T d/dX(tr(AXk) =SUMr=0:k-1(XrAXk-r-1)T d/dX(tr(AX-1B) =-(X-1BAX-1)T d/dX(tr(AX-1) =d/dX(tr(X-1A) =-X-TATX-T d/dX(tr(ATXBT) =d/dX(tr(BXTA) =AB d/dX(tr(XAT) =d/dX(tr(ATX) =d/dX(tr(XTA) =d/dX(tr(AXT)= A d/dX(tr(AXBXT) =ATXBT+AXB d/dX(tr(XAXT) =X(A+AT) d/dX(tr(XTAX) =XT(A+AT) d/dX(tr(AXTX) =(A+AT)X d/dX(tr(AXBX) =ATXTBT+BTXTAT C:symmetricd/dX(tr(XTCX)-1A) =d/dX(tr(A (XTCX)-1) =-(CX(XTCX)-1)(A+AT)(XTCX)-1 B,C:symmetricd/dX(tr(XTCX)-1(XTBX) =d/dX(tr( (XTBX)(XTCX)-1) =-2(CX(XTCX)-1)XTBX(XTCX)-1+ 2BX(XTCX)-1Derivative of DeterminantNote: matrix dimensions must result in ann*nargument for det(). d/dX(det(X) =d/dX(det(XT) = det(X)*X-T d/dX(det(AXB) = det(AXB)*X-T d/dX(ln(det(AXB) =X-T d/dX(det(Xk) =k*det(Xk)*X-T d/dX(ln(det(Xk) =kX-T Reald/dX(det(XTCX) = det(XTCX)*(C+CT)X(XTCX)-1 C:Real,Symmetricd/dX(det(XTCX) = 2det(XTCX)* CX(XTCX)-1 C:Real,Symmetriccd/dX(ln(det(XTCX) = 2CX(XTCX)-1JacobianIfyis a function ofx, thendyT/dxis the Jacobian matrix ofywith respect tox.Its determinant, |dyT/dx|, is theJacobianofywith respect toxand represents the ratio of the hyper-volumesdyanddx. The Jacobian occurs when changing variables in an integration: Integral(f(y)dy)=Integral(f(y(x) |dyT/dx| dx).Hessian matrixIf f is a function ofxthen the symmetric matrix d2f/dx2=d/dxT(df/dx) is theHessianmatrix of f(x). A value ofxfor which df/dx=0corresponds to a minimum, maximum or saddle point according to whether the Hessian is positive definite, negative definite or indefinite. d2/dx2(aTx) = 0 d2/dx2(Ax+b)TC(Dx+e) =ATCD+DTCTA d2/dx2(xTCx) =C+CT d2/dx2(xTx) = 2I d2/dx2(Ax+b)T(Dx+e) =ATD+DTA d2/dx2(Ax+b)T(Ax+b) = 2ATA C: symmetric:d2/dx2(Ax+b)TC(Ax+b) = 2ATCAhttp:/www.psi.toronto
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025-2030智慧消防行业市场全面分析及趋势走向与投资策略研究报告
- 2025-2030智慧消防员装备技术标准体系构建观察与投资计划
- 绍兴市中医院产科专科护士技能考核
- 景德镇市人民医院护理单元运营管理考核
- 南平市人民医院检验科住院医师培训考核
- 南昌市中医院肺段切除术精准操作考核
- 衢州市人民医院耳鼻喉科病房管理考核
- 2025企业委托代理合同模板
- 2025全球知名品牌授权合同范本
- 数字化转型人才策略-第16篇-洞察与解读
- 2025广东广州市增城区调任公务员16人考试参考题库及答案解析
- 2025-2026学年期中测试卷人教版九年级数学上册
- GB/T 16150-2025农药筛析试验方法
- 国寿股权投资有限公司笔试题库
- 2025中国人寿养老笔试题库
- 国开电大2025秋《形势与政策》大作业参考答案
- 2025网格员招聘笔试必考题库(含答案)
- 2025年心血管内科心脏介入治疗技能考核答案及解析
- 第7章-牧草形态特征
- 五年级下册心理健康教育教案
- 江苏省五年一贯制专转本《C语言程序设计》模拟试卷试题四(晓庄)
评论
0/150
提交评论