模式识别随机向量的概率.ppt_第1页
模式识别随机向量的概率.ppt_第2页
模式识别随机向量的概率.ppt_第3页
模式识别随机向量的概率.ppt_第4页
模式识别随机向量的概率.ppt_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

复习1 随机向量的概率,这一章复习一些概率和随机变量/向量的概念,这些对于后面的学习是很重要的,一. 事件的概率,令A、B、C 表示事件,这些事件的概率是0,1间的实数,记为PrA、PrB、PrC 必然事件的概率是1 不可能事件的概率是0 对任意事件A, (对立事件),A和B同时发生的概率,如果A1,A2,AM是两两互斥的完备事件组,则,二. 概率分布和密度函数 1. 单个随机向量的分布和密度函数,令X是一个随机向量,它的每一分量都是一个随机变量。 令 是X的一个取值,其中 都是固定的实数值,则事件:,的概率是 的函数。这个函数称为随机向量x的分布函数。定义为:,由上面分布函数的定义,显然有:,概率密度函数定义为分布函数对所有分量的导数:,概率分布函数和密度函数之间还满足如下的积分关系:,由上式和前面的式子,还有:,对于事件: 有:,下面看看在某一点的小邻域的概率:,上式近似成立的条件是: 要充分小,以使 的变化较小,这意味着,在 点的概率密度正比于随机向量 落在附近的小邻域内的概率。密度函数越大,这个概率越大 。 但 等于 的概率为0。(连续时) 容许奇异时,也有可能,2.随机向量的联合分布和密度函数,令X和Y是随机向量,可以把前面定义的对单个随机向量的分布和密度函数的概念推广到X和Y的联合概率分布和密度函数上去。 实际上,单个随机向量是它的各个分量的联合,只要再扩展到Y就行了,令 是一个随机向量, , 是 的一个实现。 则随机向量 和 的联合分布函数定义为联合事件 的概率:,的联合密度函数定义为:,和,上式的一个等价关系是:,由定义,下面的等式成立:,(a),(b),(c),(d),由(b),有下式:,(c)和(d)意味着: x和y的概率密度可以通过对x和y的联合概率密度的积分得到:,以上两式得到的称为X和Y的边缘密度函数。,联合分布的随机向量x、y的另一个重要关系是:,在 附近,同时 在 附近小区域内的概率近似等于 和小区域体积,的积,例1:一个两维随机向量和一个一维随机变量的联合密度函数:,求事件 的概率和边缘密度: ,,解:1.,注意:不要忘记积分区间,2. 边缘密度为:,在上面的计算中,要注意积分的上下限。,密度函数 也可以用对分布函数 求导而得到,3. 随机向量和事件的联合分布和密度函数,一个随机向量 和一个事件A的联合分布函数定义为:,它是 的函数,联合密度函数定义为:,根据定义,下面的关系成立:,事件 的联合概率为:,如果A1,A2,AM是两两互斥的完备事件集,则边缘分布函数:,边缘密度函数为:,三. 条件概率和贝叶斯规则,1. 事件的条件概率 令A、B是两个随机事件,B发生后A发生的条件概率为:,如果 ,则称A和B是统计独立的。这时由(1)式有:,(1),2. 条件分布和密度函数,由(1)式的基本形式,可以推导出下面的几种条件分布和密度函数。下面的公式推导和无条件概率分布与密度函数相似,不再多讲。 (1)以一个事件为条件的分布和密度函数 若A是事件 ,B是另一个事件,则,上式两边微分,可得到密度函数,(2) 以随机向量为条件的一个事件的概率 令A是任一事件,B是事件,则 在小区域内,A发生的概率为:,(3) 随机向量的条件密度函数,令A是事件 , B是事件 则由前面的定义和公式有:,在 发生后 的条件密度定义为:,当A和B对所有的 和 的值是独立的时,, 因此有:,3. 贝叶斯公式,由于事件A和B的联合概率等于事件B和A的联合概率,所以由条件概率公式有:,(1),上式称为Bayes公式。是概率和统计中非常重要的一个公式。通过适当定义事件A和B,贝叶斯公式可以有不同的形式。例如:,(1)如果B是事件 则贝叶斯公式的形式为:,(2),如果 是两两互斥且完备的事件组A1,A2,AM中的一个事件,则 (最优模式分类),(2),(3),(3)如果B是事件 ,A是 事件,则贝叶斯公式的形式为:,(4),由边缘密度的定义,还可写为下式:,(5),上面的几种贝叶斯公式对统计模式识别都是非常重要的,如(5)式, 称为先验概率,随机向量X和Y间有某种关系,在X发生后Y的密度函数是对先验概率的一种改善,称为后验概率。,又如(3)式是一个最佳模式分类规则。 是事件 类的先验概率,而 则是 的后验概率。,例:一个两维随机向量的密度函数为:,另一随机向量X,它和Y有关,其条件密度函数为:,求联合密度 ,并计算后验密度,解:1. 联合密度为:,后验概率为:,注意:1. 积分限要注意。 2. 上式没有显式解,要用数值方法求解。,3. 如果Y的先验密度是,则有显式解,是一多元高斯密度,四. 数学期望,一个随机向量X的期望(或称均值)是一个常数向量M,定义为,上式是一个向量形式, 的第 个分量为:,上式对所有的 , 的分量积分,有:,是边缘密度。,对于随机向量的积的期望,将在复习2中讨论。对于随机向量的各个分量,则和随机变量的定义一样:,性质: 1. 随机向量或变量和的期望等于期望的和; 2. 相互独立的随机变量和的方差等于方差的和,下面考虑只取离散值的随机变量。它没有概率密度函数(除非使用奇异函数)。 则期望 :,若 是一随机变量,它取离散值 , 1,2,M。M也可能是无穷的,,方差:,均值和方差是随机变量分布的重要参数。均值分布或密度的中心点,方差则表示了离中心点的分散程度。(分布和密度函数完全刻画了随机向量,而期望和方差刻画了它的主要特征。),五. 小结,这一章复习了随机事件和随机向量的概率,复习了,统计独立、贝叶斯公式(由条件概率)、随机向量和变量的均值、方差。,应该理解这些定义、概念,理解一些公式推导的思路、思想。 理解分布函数、密度函数和事件概率间的关系。 理解联合概率和条件概率间的区别。 理解独立性及其对概率、分布和密度函数的影响。 掌握Bayes公式的各种形式。,第二章 统计决策理论,最小错误率贝叶斯决策 最小风险贝叶斯决策 NeymanPearson决策(在限定一类错误率的条件下,使另一类错误率最小的两类决策问题) 最小最大决策 序贯决策(Sequential Decision),关于统计学的一个笑话:,有一个从没带过小孩的统计学家,因为妻子出门勉强答应照看三个年幼好动的孩子。妻子回家时,他交出一张纸条,写道: “擦眼泪11次;系鞋带15次;给每个孩子吹玩具气球各5次,累计15次;每个气球的平均寿命10秒钟;警告孩子不要横穿马路26次;孩子坚持要穿马路26次;我还要再过这样的星期六0次”。 统计学真的是这样呆板吗?仅仅收集数据,整理分析,累加平均,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论