第六章贝叶斯信念网络_第1页
第六章贝叶斯信念网络_第2页
第六章贝叶斯信念网络_第3页
第六章贝叶斯信念网络_第4页
第六章贝叶斯信念网络_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2020/7/4,1,BayesClassifier贝叶斯分类,2020/7/4,2,一、何谓贝叶斯分类?,数据挖掘中以贝叶斯定理为基础,用于分类的技术有朴素贝叶斯分类和贝叶斯信念网络两种。朴素贝叶斯分类假定一个属性值对给定类的影响独立于其他属性的值,即在属性间不存在依赖关系,也因此称为“朴素的”。贝叶斯信念网络也可以用于分类,它是图形模型。它优于朴素贝叶斯,它能够处理属性子集间有依赖关系的分类。它采用监督式的学习方式。,2020/7/4,3,二、基本知识,1、事件概率联合概率(jointprobability)表示A事件和B事件同时发生的概率,P(AB)。边际概率(marginalproba

2、bility)在A和B的样本空间中,只看A或B的概率,称之边际概率。条件概率(conditionalprobability)在发生A的条件下,发生B的概率,称为P(B|A)。,2020/7/4,4,联合概率:P(男性,赞成)=P(A1B1)=40/200=0.2边际概率:P(赞成)=P(B1)=P(A1B1)+P(A2B1)=0.25条件概率:P(赞成|男性)=P(B1|A1)=P(A1B1)/P(A1)=0.25,举例:,2020/7/4,5,2、乘法法则(Multiplicativerule),3、独立事件,设事件和事件满足以下条件:则称与为独立事件。,2020/7/4,6,三、贝叶斯定理

3、,表示先验概率(Priorprobability)。表示后验概率(Posterioriprobability),先验概率是由以往的数据分析得到的。根据样本数据得到更多的信息后,对其重新修正,即是后验概率。,2020/7/4,7,例:旅客搭乘飞机必须经电子仪器检查是否身上携带金属物品。如果携带金属,仪器会发出声音的概率是97%,但身上无金属物品仪器会发出声音的概率是5%。已知一般乘客身上带有金属物品的概率是30%,若某旅客经过仪器检查时发出声音,请问他身上有金属物品的概率是多少?,解:设C1=“有金属物”,X=“仪器会发声”,则,2020/7/4,8,四、朴素贝叶斯分类的工作过程,2020/7/

4、4,9,2020/7/4,10,2020/7/4,11,2020/7/4,12,2020/7/4,13,五、朴素贝氏分类的实例,办信用卡意愿:,类属性,2020/7/4,14,解:首先根据训练样本计算各属性相对于不同分类结果的条件概率:P(办卡)=7/10P(不办卡)=3/10P(女性|办卡)=5/7P(女性|不办卡)=1/3P(年龄=3145|办卡)=3/7P(年龄=3145|不办卡)=1/3P(学生=否|办卡)=5/7P(学生=否|不办卡)=0/3P(收入=中|办卡)=2/7P(收入=中|不办卡)=2/3,判断:X=(女性,年龄介于3145之间,不具学生身份,收入中等)会不会办理信用卡。,

5、2020/7/4,15,其次,再应用朴素贝氏分类器进行类别预测:计算P(办卡)P(女性|办卡)P(年龄3145|办卡)P(不是学生|办卡)P(收入中|办卡)=15/3430.044P(不办卡)P(女性|不办卡)P(年龄3145|不办卡)P(不是学生|不办卡)P(收入中等|不办卡)=00.0440,2020/7/4,16,训练样本中对于(女性,年龄介于3145之间,不具学生身份,收入中等)的个人,按照朴素贝叶斯分类会将其分到办信用卡一类中。办卡的概率是(0.044)/(0.044+0)=1(正规化分类的结果P(会)/(P(会)+P(不会)。,2020/7/4,17,贝叶斯分类的优缺点:,优点:计

6、算速度最快的演算法;规则清楚易懂;独立事件的假设,大多数问题上不至于发生太大偏误;缺点:仅适用于类别变量;仅能应用于分类问题;假设变量间为独立互不影响,因此使用时需要谨慎分析变量间的相关性。,2020/7/4,18,六、贝叶斯信念网络,朴素贝叶斯分类假定类条件独立,即给定样本的类标号,属性的值相互条件独立。但在实践中,变量之间的依赖可能存在。贝叶斯信念网络说明联合条件概率分布,它允许在变量的子集间定义类条件独立性。它提供一种因果关系的图形。,2020/7/4,19,例如,得肺癌受其家族肺癌史的影响,也受是否吸烟的影响。,有向无环图,条件概率图,概率依赖,双亲或直接前驱,后继,非后继,独立,节点

7、:随机变量,2020/7/4,20,一个简单的例子,由左图给出,它对下雨(R)引起草地变湿(W)建模。天下雨的可能性为,并且下雨时草地变湿的可能性为;也许的时间雨下得不长,不足以让我们真正认为草地被淋湿了。在这个例子中,随机变量是二元的:真或假。存在的可能性草地变湿而实际上并没有下雨,例如,使用喷水器时。,2020/7/4,21,可以看到三个值就可以完全指定P(R,W)的联合分布。如果P(R)=0.4,则P(R)=0.6。类似地,而这是一个因果图,解释草地变湿的主要原因是下雨。我们可以颠倒因果关系并且做出诊断。例如,已知草地是湿的,则下过雨的概率可以计算如下:,2020/7/4,22,2020

8、/7/4,23,现在,假设我们想把喷水器()作为草地变湿的另一个原因,如下图所示。,节点有两个父节点和,因此它的概率是这两个值上的条件概率。我们可以计算喷水器开着草地会湿的概率。这是一个因果(预测)推理:,2020/7/4,24,=0.1,2020/7/4,25,给定草地是湿的,我们能够计算喷水器开着的概率。这是一个诊断推理。,2020/7/4,26,知道草是湿的增加了喷水器开着的可能。现在让我们假设下过雨,我们有:注意,这个值比小。这叫作解释远离explainingaway;给定已知下过雨,则喷水器导致湿草地的可能性降低了。已知草地是湿的,下雨和喷水器成为相互依赖的。,2020/7/4,27

9、,某水文站内装有一个小型的警报系统,与该警报是否拉响相关的因素有:洪水到来、地震发生,同时该系统还肩负着安全警报的功能,当水文站发生入室盗窃时,警报同样也会拉响。而洪水的到来与降雨情况有关,地震的发生会反映在地震监测仪的报告中。同时,入室盗窃也会带来地震监测仪的扰动。在水文站以往的数据库中,关于以上这些因素都能找到详细的记录。那么如何从这些数据中挖掘出有用的信息,来帮助工作人员进行决策呢?,七、贝叶斯信念网络应用实例:警报分析(马克威分析系统),2020/7/4,28,1、有向无环图,2020/7/4,29,2、条件概率表,先验概率,2020/7/4,30,条件概率表,2020/7/4,31,

10、3、推理,(1)当“警报拉响降雨地震、入室盗窃、洪水”:假设某时刻警报突然拉响了,且此时正在下雨,值班人员要判断此时发生地震、盗窃和洪水的概率分别是多少,以便采取相应的措施加以应对。首先,设置警报和降雨为已知节点,观察值分别为拉响和降雨;并且指定地震、入室盗窃和洪水为目标节点。然后计算各种情况发生的后验概率。,2020/7/4,32,已知变量的状态观察值,地震,入室盗窃,洪水,2020/7/4,33,(2)当“警报拉响降雨地震监测仪信号弱地震、入室盗窃、洪水”:假设,同样在下雨天,警报突然拉响,如果此时值班人员还注意到了地震监测仪的状态处于弱信号的范围,那么到底地震、入室盗窃、洪水中哪个发生呢?解决的办法是设定:降雨节点处于降雨状态,警报节点处于拉响状态,地震监测仪处于弱状态;目标节点仍旧是地震、入室盗窃和洪水。然后,计算后验概率。,2020/7/4,34,已知变量的状态观察值,地震,洪水,入室盗窃,2020/7/4,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论