相对熵(KL散度)_第1页
相对熵(KL散度)_第2页
相对熵(KL散度)_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、相对熵(KL散度)概述在信息论中,相对熵等价于两个概率分布信息熵的差值,若其中一个概率分布为真实分布,另一个为理论(拟合)分布,则此时相对熵等于交叉熵与真实分布信息熵之差,表示使用理论分布拟合真实分布时所产生的信息损耗。NNDKL(hq=pxiogj-pxipgj上面的pX)为真实事件的概率分布,qX)为理论拟合出来的该事件的概率分布。公式的字面含义:前半部分是拟合分布下事件信息量与真实事件概率乘积的累加,后半部分即真实分布下的信息熵如何理解前半部分?前半部分即为交叉熵,交叉熵的定义为HXp,q)=xpXx)lqoXxg)=-xpXx)lqoXxDKLXp|q)亦可写为:DKLXllqH(qH

2、(xpx)lqoxg)-x-pXg)lpXgxpx)lXopXgg)qgxpx)pg在信息论中,交叉熵可认为是对预测分布q(x)用真实分布p(x)来进行编码时所需要的信息量大小。举个例子,需传输长度为8的字符串,字符串中仅有abed四个字母,其中a字母出现的真实概率为1/8,b字母出现的真实概率为1/8,c字母出现的真实概率为2/8,d字母出现的真实概率为4/8。1假设我们知道每个字母出现的真实概率,那么a、b均需要3比特,e需要2比特,d需要1比特分别进行编码才能相互区分,故每个字母编码长度的期望值=1/8*3+1/8*3+2/8*2+1/2*1=1.75,该1.75即为信息熵值。但假设预测

3、的结果是a、b、c、d字母出现的概率均为1/4,根据预测的结果分别对a、b、c、d字母进行二进制编码,a、b、c、d均需2比特编码才能相互区分,故每个字母编码长度的期望值=(1/8+1/8+2/8+4/8)*2=2,该2即为交叉熵值。DKL(p|q)=2-1.7=50.25性质2.1正定性拟合出来的概率分布无非两种情况,一种和真实概率分布近乎一致,一种和真实概率分布相当不同。若拟合出来的概率分布和真实分布一致,Dkl。若拟合出来的概率分布与真实分布不同,在公式1下Dkl(稍后证明)。这个性质很关键,因为它正是深度学习梯度下降法需要的特性。假设神经网络拟合近乎完美,那么它就不再梯度下降,而不完美

4、则因为它大于0而继续下降。结论:KL散度取值范围0,8,两个分布一样取到02.2非对称性但它有不好的地方,就是它是不对称的。举个例子,比如随机变量XP取值为1,2,3时的概率分别为0.1,0.4,0.5,随机变量YQ取值为1,2,3时的概率分别为0.4,0.2,0.4,则:DP|QDQ|PDP|QDQ|P可见用P来拟合Q和用Q来拟合P的相对熵不一样,但他们的距离一样。也就是说,相对熵的大小和距离没有一一对应关系。这点蛮头疼的,因为一般我们希望距离越远下降越快,而相对熵取不同分布为参考在同等距离情况下下降的速度不一样。不对称的性质来源于公式的前半部分,前半部分采用的是真实分布的概率进行乘积,所以

5、以不同的概率分布作为真实分布得到的相对熵亦不同。既然如此,为什么很多人用相对熵衍生出来的交叉熵作为损失函数来训练神经网络而不直接用距离相关的均方差呢?(以后讲)2.3不满足三角不等式DKL(llqDKLPrDklrq不同角度解读KL散度3.1统计学意义上的KL散度在统计学意义上来说,KL散度可以用来衡量两个分布之间的差异程度。若两者差异越小,KL散度越小,反之亦反。当两分布一致时,其KL散度为0。正是因为其可以衡量两个分布之间的差异,所以在VAE、EM、GAN中均有使用到KL散度。3.2信息论角度的KL散度KL散度在信息论中的专业术语为相对熵。其可理解为编码系统对信息进行编码时所需要的平均附加

6、信息量。其中信息量的单位随着计算公式中log变化。log底数为2:单位为比特(bit)log底数为e:单位为奈特(nat)正定性证明这里证明Dkl。4.1法一注意在一般情况下神经网络中默认log以e为底,这样算出来的香农信息量虽然不是最小的可用于完整表示事件的比特数,但对于信息熵的含义来说其实只要底数大于1,都能用来表达信息熵大小。要证DKLpq/即证/又nqx.NL()pxi故i1X.logpx.logpXpXlogqxiqx.N一()px.px.log当且仅当x时等号成立qx.(_N()px.()(1px.-1=.=1px.-qx.4.2法二可以证明凸函数f(x)满足:我们可以使用Jensen不等式在凸函数中的命题,若对于任意

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论