




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、模式识别第三讲-统计决策理论22.1 引言 PR中的分类问题是根据识别对象特征的观测值,将其分到相应的类别中去。 统计决策理论是模式分类的主要理论和工具。 这一章要讨论:最小错误率贝叶斯决策最小风险贝叶斯决策北京工业大学计算机学院32.2 贝叶斯决策贝叶斯决策 问题:假定要识别的物理对象x有d个特征,x1,x2,xd,记作x= x1,x2,xdT,所有的特征向量构成了d维特征空间。假定这些待识别的对象来自c个类别,i,i=1,2,c,并且每个类别出现的先验概率Pi和类条件概率密度p(x|i) ,i=1,2,c已知。北京工业大学计算机学院4 如果观察到一个样本 ,那么把 分到哪一类去才是合理的呢
2、? Tdxxxx ,21x 这是这一章要解决的问题。 北京工业大学计算机学院5一. 最小错误率贝叶斯决策 在模式分类问题中,人们希望尽量减小分类的错误。 不可能不犯错误,因为样本是随机的 我们希望所使用的分类规则,能使错误率达到最小。 北京工业大学计算机学院6 以细胞识别为例: 细胞切片的显微图像经过一定的预处理后,抽取出d个特征。每一细胞可用一个d维的特征向量x x表示。希望根据x x的值分到正常类1或异常类2中去。 假定可以得到Pr1、Pr2 (Pr 1+ Pr 2=1) ,和p(x x| |1)、p(x x| |2) 。 如果只有先验概率,那么合理的选择是把x x分到Pr1、Pr2大的一
3、类中去。一般由于Pr1Pr2,这样就把所有的细胞分到了正常的一类。失去了意义。北京工业大学计算机学院7 如果有细胞的观测信息,那么可以改进决策的方法。为了简单起见,假定x x是一维的特征(如胞核的总光强度)。p(x x| |1)和p(x x| |2)已知: 利用贝叶斯公式: 21iiriiriirPpPpPxxx)|(1xp)|(2xp北京工业大学计算机学院8 得到的Pri| |x x 称为状态(正常、异常)的后验概率。上述的贝叶斯公式,通过观测到的x,把先验概率转换为后验概率。 这时,基于错误率最小的贝叶斯决策规则为: xx2211PPrr 后面要证明这个决策规则是错误率最小的。 北京工业大
4、学计算机学院9 上面的贝叶斯决策规则还可以表示成以下几种形式: 若 ,则 xx,jrjirPP21maxix 若 ,则 jjrjiirpPpPxx,21maxix北京工业大学计算机学院10 称为似然比 若 ,则 21x 1221PPpplrrxxx xl 2121xxxxPPpplhrrlnlnlnln则 :21x4) 取 的负对数,有 北京工业大学计算机学院11例例1 1:某一地区的统计资料,Pr1(正常),Pr2(异常),有一待识别细胞,其观测值为x x,从类条件概率密度曲线上查出,p(x x| |1,p(x x| |2。 解:解:利用贝叶斯公式,有 180209011.xpPr04040
5、1022.xpPr 81800401801801.xPr1820818012.xPr 应把x x归为1类,不是完全正确,但错误率最小。 北京工业大学计算机学院12例例2:假定一维测量(特征)值y的类条件密度函数为: 而且Pr1= Pr2。画出两类的概率密度曲线并求分类规则。 2412 21yeyp21022 21yeyp解:解:北京工业大学计算机学院13似然比检验 121210242 2 eeylyy上式两边取对数,再乘以2,有 0104212 2 yy721y 原因是Pr1= Pr2,且分布形式相同,又对称,只是均值有区别 分界点在两均值的中点 y= =7,可以由 确定。 2211PypPy
6、prr , 构成一个判别函数。 iriPyp2 1,i北京工业大学计算机学院14 下面证明上述基于最小错误率的贝叶斯规则是错误率最小的。 证明:证明:错误率是对所有x x的平均错误率Pre xxxdpePePrr 两类时的条件错误概率为: xxxxxxx212121 PPPPPPePrrrrrrr当当北京工业大学计算机学院15 对每个x,因为决策为后验概率最大的类别, Pre|x为最小。因此错误率 最小。 xxxdpePePrr北京工业大学计算机学院16 对于多类情况,最小错误率决策规则为: 若 ,则 xxjrcjirPP, 2 1maxix或若 则 jjrcjiirpPpPxx, 2 1ma
7、xix cjPgjrj, 2 1 xx 称为判别函数(discriminant function)。 北京工业大学计算机学院17二. 最小风险贝叶斯决策 在实际工作中,有时仅考虑错误率最小是不够的。 地震预报生了,要遭受损失。预报为无震,但地震发没有发生;,要付出代价,但地震预报为有震,要作准备 要引入比错误率更广泛的概念风险、损失。 。,耽误早期诊断和治疗将异常划为正常,漏诊恐慌;人增加精神负担,造成将正常划为异常,给病 细胞识别 北京工业大学计算机学院18 要考虑行动的后果、行动的风险。 采取的决定称为决策或行动。决策可以为分到某一个类别, 或“拒绝”等。假设一共有m个决策。 每个决策或行
8、动都有一定的代价或损失。 损失函数 表示真实状态为 ,采取行动为 时的损失。 iajia,j北京工业大学计算机学院19 对于给定的x x,采取决策 时的条件损失或条件风险为: iamiPaaRcjjrjii, 2 1 1xx 如果在采取每一决策时,其条件风险都最小,则对所有的x x作决策时,其平均(期望风险)也最小。称为最小风险的贝叶斯决策。 对所有的x x,采取决策 ,风险的期望值为: xa xxxxdpaRR 称为平均风险或期望风险北京工业大学计算机学院20 最小风险的贝叶斯决策规则: 若 ,则采取 。xx21imikaRminaR, ka北京工业大学计算机学院21 对于实际问题,最小风险
9、的贝叶斯决策可按如下步骤进行: 根据Prj,p(x|j),j=1,2,c,以及给出的x,计算后验概率 cjPpPpPciirijrjjr, 2 1 1xxx 计算条件风险 miPaaRcjjrjii, 2 1 1xx即 若 ,则采用决策 。 从得到的m个条件风险中,选最小的。 xximikaRminaR, 2 1ka北京工业大学计算机学院22例例3 3:仍以例1中的细胞为例 ,Pr1=0.9,Pr2=0.1, p(x x| |1)=0.2,p(x x| |2)=0.4 , =0, =6, =1, =0。 11122122解:解:由例1的计算,有81801.x Pr18202.x Pr而 092
10、118206 2121211.xxxjrjrjPPaR818081801 2112122.xxxjrjrjPPaR北京工业大学计算机学院23 和例1正好相反。因为考虑到了损失。 损失函数 的确定要针对具体情况,具体领域。 jia, x x被划分为异常。 xx21aRaR北京工业大学计算机学院24三. 最小错误率决策和最小风险决策间的关系 前者是后者的特例。 如果损失函数 (不考虑“拒绝”),这样定义的损失函数称为01损失函数。 cjijijiaji, 2 1 1 0 北京工业大学计算机学院25 这时的条件风险为 即对x x采取 决策时的条件错误率。所以使 的最小风险决策等价于使 最大。 ix1 xxx11ircjcijjjrjrjiiPPPaaR,xx 2 1kckiaRminaR, xirP 最小错误率的贝叶斯决策就是01损失函数下的最小风险贝叶斯决策。北京工业大学计算机学院26小结小结 这一小节讨论了简单的统计决策方法: 最小错误率的贝叶斯决策 122121PPpprrxx 最小
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年甘肃省兰州大学土木工程与力学学院聘用制(B岗)人员招聘模拟试卷及答案详解(网校专用)
- 中国移动山南市2025秋招写作案例分析万能模板直接套用
- 2025年4月四川护理职业学院编外人员招聘14人考前自测高频考点模拟试题及答案详解(考点梳理)
- 2025年福建省南平市光泽县招聘医疗人才10人模拟试卷附答案详解(典型题)
- 2025年枣庄山亭区人民医院公开招聘备案制专业技术人员(15人)模拟试卷完整参考答案详解
- 2025年温岭市公开选调公务员32人考前自测高频考点模拟试题有完整答案详解
- 关于电渡厂环保排量转让合同5篇
- 2025年在线教育平台用户增长与留存策略在线教育行业竞争态势分析报告
- 2025年文旅地产融合模式创新及重点项目投资风险评估报告
- 2025年工业互联网平台漏洞扫描技术风险管理策略报告
- AIGC基础与应用第6章-AIGC造就绘画大师
- 《炼油与化工装置机泵 在线监测系统技术规范》
- 羽毛球竞赛编排知识与方法
- 2023数据标准管理实践
- 非洲水坝施工方案
- Unit 3 Understanding ideas The Road to Success课件 2023-2024学年高中英语外研版选择性必修第一册
- 项目需求分析文档(模板)
- 长阳清江画廊
- 四川2023年专业技术人员公需科目“数字经济与驱动发展”参考答案(通用版)
- 液压泵站使用说明书
- 职工三级安全教育卡模版
评论
0/150
提交评论