版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
朴素贝叶斯算法
NaïveBayes朴素贝叶斯算法
NaïveBayes知识回顾贝叶斯知识知识回顾贝叶斯知识1.样本空间的划分1.样本空间的划分2.全概率公式全概率公式2.全概率公式全概率公式图示证明化整为零各个击破图示证明化整为零说明
全概率公式的主要用途在于它可以将一个复杂事件的概率计算问题,分解为若干个简单事件的概率计算问题,最后应用概率的可加性求出最终结果.说明全概率公式的主要用途在于它可以将一个复杂事件的概称此为贝叶斯公式.
3.贝叶斯公式称此为贝叶斯公式.3.贝叶斯公式证明条件概率的概念乘法定理:证明条件概率的概念乘法定理:由以往的数据分析得到的概率,叫做先验概率.而在得到信息之后再重新加以修正的概率叫做后验概率.先验概率与后验概率由以往的数据分析得到的概率,叫做先验概率.而在得到信息之后简介贝叶斯定理分类算法概念朴素贝叶斯算法朴素贝叶斯算法原理朴素贝叶斯算法流程算法实例购买电脑实例总结算法优缺点算法相关扩展简介贝叶斯定理分类算法概念朴素贝叶斯算法朴素贝叶斯算法原理朴简单的说,贝叶斯定理是基于假设的先验概率、给定假设下观察到不同数据的概率,提供了一种计算后验概率的方法。在人工智能领域,贝叶斯方法是一种非常具有代表性的不确定性知识表示和推理方法。贝叶斯理论简单的说,贝叶斯定理是基于假设的先验概率、给定假设下观察到不11贝叶斯定理:P(A)是A的先验概率或边缘概率。之所以称为“先验”是因为它不考虑任何B方面的因素。P(A|B)是已知B发生后A的条件概率,也由于得自B的取值而被称作A的后验概率。P(B|A)是已知A发生后B的条件概率,也由于得自A的取值而被称作B的后验概率。P(B)是B的先验概率或边缘概率,也作标准化常量(normalizedconstant).贝叶斯定理:P(A)是A的先验概率或边缘概率。之所以称为“先贝叶斯定理:贝叶斯定理:关于贝叶斯分类:对于贝叶斯网络分类器,若某一待分类的样本D,其分类特征值为,则样本D属于类别yi的概率P(C=yi|X1=x1,X2=x2,...,Xn=xn),(i=1,2,...,m)应满足下式:而由贝叶斯公式:其中,P(C=ci)可由领域专家的经验得到,而P(X=x|C=ci)和P(X=x)的计算则较困难。关于贝叶斯分类:对于贝叶斯网络分类器,若某一待分类的样本D,朴素贝叶斯算法原理:
朴素贝叶斯算法原理:
朴素贝叶斯算法原理:
朴素贝叶斯算法原理:
朴素贝叶斯算法原理:
朴素贝叶斯算法原理:
朴素贝叶斯算法原理:
朴素贝叶斯算法原理:
朴素贝叶斯算法原理:
朴素贝叶斯算法原理:
贝叶斯算法处理流程:贝叶斯算法处理流程:贝叶斯算法的处理流程:第一阶段——准备阶段:
该阶段为朴素贝叶斯分类做必要的准备。主要是依据具体情况确定特征属性,并且对特征属性进行适当划分。然后就是对一部分待分类项进行人工划分,以确定训练样本。
这一阶段的输入是所有的待分类项,输出时特征属性和训练样本。分类器的质量很大程度上依赖于特征属性及其划分以及训练样本的质量。贝叶斯算法的处理流程:第一阶段——准备阶段:贝叶斯算法处理流程:第二阶段——分类器训练阶段:
主要工作是计算每个类别在训练样本中出现频率以及每个特征属性划分对每个类别的条件概率估计。输入是特征属性和训练样本,输出是分类器。第三阶段——应用阶段:这个阶段的任务是使用分类器对待分类项进行分类,其输入是分类器和待分类项,输出是待分类项与类别的映射关系。
贝叶斯算法处理流程:第二阶段——分类器训练阶段:购买电脑实例:购买电脑实例:购买电脑实例:
购买电脑实例:
购买电脑实例:(2)计算每个特征属性对于每个类别的条件概率:P(age<=“30”|buys_computer=“yes”)=2/9=0.222P(income<=“medium”|buys_computer=“yes”)=4/9=0.444P(student<=“yes”|buys_computer=“yes”)=6/9=0.667P(credit_rating<=“fair”|buys_computer=“yes”)=6/9=0.667P(age<=“30”|buys_computer=“no”)=3/5=0.600P(income<=“medium”|buys_computer=“no”)=2/5=0.400P(student<=“yes”|buys_computer=“no”)=1/5=0.2P(credit_rating<=“fair”|buys_computer=“no”)=2/5=0.400购买电脑实例:(2)计算每个特征属性对于每个类别的条件概率:购买电脑实例:
购买电脑实例:
购买电脑实例:P(X|buys_computer=“no”)P(buys_computer=“no”)=0.019×0.357=0.007
因此,对于样本X,朴素贝叶斯分类预测buys_computer=”yes”特别要注意的是:朴素贝叶斯的核心在于它假设向量的所有分量之间是独立的。购买电脑实例:P(X|buys_computer=“总结朴素贝叶斯算法的优点:a.算法逻辑简单,易于实现;b.分类过程中时空开销小;c.算法稳定,对于不同的数据特点其分类性能差别不大,健壮性比较好。总结朴素贝叶斯算法的优点:总结那么“贝叶斯分类法的效率如何呢?”
该分类法与决策树和神经网络分类法的各种比较试验表明,在某些领域,贝叶斯分类法足以与它们相媲美。理论上讲,与其他所有分类算法相比,贝叶斯分类具有最小的错误率,然而,实践中并非总是如此。这是因为对其使用的假定(如类条件独立性)的不正确性,以及缺乏可用的概率数据造成的。
贝叶斯分类法还可以用来为不直接使用贝叶斯定理的其他分类法提供理论判定。例如,在某些假定下,可以证明:与朴素贝叶斯分类法一样,许多神经网络和曲线拟合算法输出的最大的后验假定。总结那么“贝叶斯分类法的效率如何呢?”对比决策树分类整棵决策树就对应着一组析取表达式规则。对比决策树分类整棵决策树就对应着一组析取表达式规则。总结:
总结:
扩展:
扩展:
扩展:对于第二个问题:朴素贝叶斯算法是在假定各个特征属性相互独立的情况下提出来,这在现实生活中是很难实现的,所以针对这个问题人们做了大量工作解决这个缺点。
(1)如果特征属性之间是有联系的,并且是一个有向无环图,可以采用另一个相关的贝叶斯分类算法——贝叶斯网络。在此不再介绍。
(2)除了贝叶斯网络还有kononenko提出的semi-naïvebayesian算法,称为半朴素贝叶斯算法,扩展:对于第二个问题:朴素贝叶斯算法是在假定各个特征属性相互扩展:该算法就是将特征相关的属性分成一组,然后假设不同组中的属性是相互独立的,同一组中的属性是相互关联的。(3)还有一种具有树
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 烟雾病患者的护理效果评价
- 神经外科患者的深静脉置管护理与维护
- 2026年数控5轴车铣复合一次装夹完成车铣钻攻
- 直肠癌患者的护理新方向
- 2026年国有企业绿色低碳转型与ESG体系建设指南
- 2026年长三角轨道交通一体化运营公司组建方案
- 土地增值税纳税申报实务的操作程序
- 2026年网络安全培训资料
- 流感疫情下的心理健康管理
- 安宁护理:促进环境安宁与和谐
- 部编版语文四年级下册第三单元教材解读大单元集体备课
- 2024年广东省中学生生物学联赛试题解析(word)及答案(扫描版)
- 校园安全教育关乎每个孩子的生命
- 产品供货方案、售后服务方案
- GJB9001C-2017国军标标准培训讲义
- 某铝合金窗热工性能计算书
- 级自制书119本13黑今天穿什么
- 安全文明专项施工方案
- 01厨房组织人员管理篇
- 冀教版八年级生物下册昆虫的生殖和发育同步练习(含答案)
- GB/T 11337-2004平面度误差检测
评论
0/150
提交评论