模式识别清华-课件第二章

上传人：1*** IP属地：广西上传时间：2024-06-19 格式：DOCX 页数：6 大小：441KB 积分：12 举报 版权申诉

已阅读5页，还剩1页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第二章贝叶斯决策理论与统计判别方法学习指南这一章的主要内容是说明分类识别中为什么会有错分类，在何种情况下会出现错分类？错分类的可能性会有多大？在理论上指明了怎样才能使错分类最少？另一方面，错分类有不同情况，例如误将A错分为B类，或将B类错分为A类就是两种不同的错误。不同的错分类造成的危害是不同的，有的错分类种类造成的危害更大，因此控制这种错分类那么是更重要的。为此引入了一种“风险”与“损失”概念，希望做到使风险最小。要着重理解“风险”与“损失”的概念，以及在引入“风险”概念后的处理方法。理解这一章的关键是要正确理解先验概率，类概率密度函数，后验概率这三种概率，对这三种概率的定义，相互关系要搞得清清楚楚。Bayes公式正是表达这三者关系的式子，要透彻掌握。本章讨论的内容在理论上有指导意义，代表了基于统计参数这一类的分类器设计方法，结合正态分布这一例子的目的是使分类器设计更加具体化。学习这一章还要体会模式识别算法的设计都是强调“最正确”与“最优”，即希望所设计的系统在性能上最优。这种最优是指对某一种设计原那么讲的，这种原那么称为准那么。使这些准那么到达最优，如最小错误率准那么，基于最小风险准那么等。设计准那么,并使该准那么到达最优的条件是设计模式识别系统最根本的方法。课前思考1、机器自动识别分类，能不能防止错分类，如汉字识别能不能做到百分之百正确？怎样才能减少错误？2、错分类往往难以防止，因此就要考虑减小因错分类造成的危害损失，譬如对病理切片进行分析，有可能将正确切片误判为癌症切片，反过来也可能将癌症病人误判为正常人，这两种错误造成的损失一样吗？看来后一种错误更可怕，那么有没有可能对后一种错误严格控制？3、概率论中讲的先验概率，后验概率与概率密度函数等概念还记得吗？什么是贝叶斯公式？4、什么叫正态分布？什么叫期望值？什么叫方差？为什么说正态分布是最重要的分布之一？学习目标这一章是模式识别的重要理论根底，它用概率论的概念分析造成错分类和识别错误的根源，并说明与哪些量有关系。在这个根底上指出了什么条件下能使错误率最小。有时不同的错误分类造成的损失会不相同，因此如果错分类不可防止，那么有没有可能对危害大的错分类实行控制。对于这两方面的概念要求理解透彻。这一章会将分类与计算某种函数联系起来，并在此根底上定义了一些术语，如判别函数、决策面(分界面)，决策域等，要正确掌握其含义。这一章会涉及设计一个分类器的最根本方法——设计准那么函数，并使所设计的分类器到达准那么函数的极值，即最优解，要理解这一最根本的做法。这一章会开始涉及一些具体的计算，公式推导、证明等，应通过学习提高这方面的理解能力，并通过习题、思考题提高自己这方面的能力。本章要点1、机器自动识别出现错分类的条件，错分类的可能性如何计算，如何实现使错分类出现可能性最小——基于最小错误率的Bayes决策理论2、如何减小危害大的错分类情况——基于最小错误风险的Bayes决策理论3、模式识别的根本计算框架——制定准那么函数，实现准那么函数极值化的分类器设计方法4、正态分布条件下的分类器设计5、判别函数、决策面、决策方程等术语的概念6、Bayes决策理论的理论意义与在实践中所遇到的困难难点1、三种概率：先验概率、类概率密度函数、后验概率的定义2、三种概率之间的关系——Bayes公式3、描述随机变量分布的一些定义，如期望值、方差、尤其是协方差、协方差矩阵，其定义、计算方法及内在含义，透彻掌握其含义才会做到灵活运用。知识点§2.1引言在描述本章所要讨论的问题之前，再提一下对于待识别的物理对象的描述问题。假设一个待识别的物理对象用其d个属性观察值描述，称之为d个特征，这组成一个d维的特征向量，而这d维待征所有可能的取值范围那么组成了一个d维的特征空间。为了说明这句话，我们讨论一个具体的例子。假设苹果的直径尺寸限定在7厘米到15厘米之间，它们的重量在3两到8两之间变化。如果直径长度x用厘米为单位，重量y以两为单位。那么，由x值从7到15，y值从3到8包围的二维空间就是对苹果进行度量的特征空间。贝叶斯决策理论方法所讨论的问题是：总共有c类物体，也就是说待识别物体属于这c类中的一个类别，对这c类不同的物理对象，以及各类在这d维特征空间的统计分布，具体说来是各类别ωi=1,2,…,c的先验概率P(ωi)及类条件概率密度函数p(x|ωi)的条件下，如何对某一样本按其特征向量分类的问题。由于属于不同类的待识别对象存在着呈现相同观察值的可能，即所观察到的某一样本的特征向量为X，而在c类中又有不止一类可能呈现这一X值，这种可能性可用P(ωi|X)表示。如何作出合理的判决就是贝叶斯决策理论所要讨论的问题。下一节讨论几种常用的决策规那么，接着要分析正态分布时统计决策的问题以及错误概率等问题。由于这种决策理论基于概率分布为前提，因此在本章还要讨论概念密度函数的估计问题。上一章提到机器实现自动分类有两大类方法：一种是模板匹配方法，而另一种就是对特征空间划分为子空间(每类的势力范围)的方法。本章是针对第二种方法的。核心问题是：样本为特征向量X时，它属于哪一类可能性有多大，如能确定属于各个类别的百分比(概率)分类决策就有了依据。例如某个样本的特征向量为X，X属于第一类样本的可能性为60％，而第二类的可能性为40％。在没有任何样本信息的情况下，那么应将样本决策为第一类以使错分类可能性小(40％)，这就是这一章考虑分类问题的出发点。§2.2几种常用的决策规那么本节将讨论几种常用的决策规那么。不同的决策规那么反映了分类器设计者的不同考虑，对决策结果有不同的影响。其中最有代表性的是基于最小错误率的贝叶斯决策与基于最小风险的贝叶斯决策，下面分别加以讨论。2.2.1基于最小错误率的贝叶斯决策(一)(二)(三)一般说来，c类不同的物体应该具有各不相同的属性，在d维特征空间，各自有不同的分布。当某一特征向量值X只为某一类物体所特有，即，对其作出决策是容易的，也不会出什么过失。问题在于出现模棱两可的情况。此时，任何决策都存在判错的可能性。这一节讨论的是使错误率为最小的决策方法，称为基于最小错误率的贝叶斯决策理论。最小错误率是在统计的意义上说的，请注意其含义。

在这里要弄清楚条件概率这个概念。P(*|#)是条件概率的通用符号，在“|”后边出现的#为条件，之前的*为某个事件，即在某条件#下出现某个事件*的概率。P(ωK|X)是表示在X出现条件下，样本为ωK类的概率。

一个事物在某条件下出现的概率P(*|#)与该事件在不带任何条件下出现的概率(写成P(*))是不相同的。例如全世界人口有60亿。因此你见到一个人在不带任何条件下，有20%的可能性是中国人P(*)=0.2，但是如果你在中国，或香港、台湾，那么中国、香港、台湾都是指一种条件(#)，这种地理条件下，你所见到的某一个人是中国人(*)的概率就要大得多，此时P(*|#)就应该大于20%,甚至更多了。

下面先讨论一个例子——癌细胞的识别，以此说明解决问题的过程。假设每个要识别的细胞已作过预处理，并抽取出了d个特征描述量，用一个d维的特征向量X表示，识别的目的是要依据该X向量将细胞划分为正常细胞或者异常细胞。这里我们用ω１表示是正常细胞，而ω２那么属于异常细胞。

类别的状态是一个随机变量，而某种状态出现的概率是可以估计的。概率的估计包含两层含义，一是由统计资料说明，正常细胞与异常细胞在统计意义上的比例，这称为先验概率P(ω1)及P(ω2)，另一种那么分别表示所检查细胞呈现出不同属性的概率密度函数P(x|ω1)和P(x|ω2)，显然在一般情况下正常细胞占比例大，即P(ω1)>P(ω2)，因此如果我们不对具体的细胞化验值作仔细观察，我们作出该细胞是正常细胞的判决，在统计的意义上来说，也就是平均意义上说，错判可能性比判为异常细胞时小。但是仅按先验概率来决策，就会把所有细胞都划归为正常细胞，并没有到达将正常细胞与异常细胞区分开的目的。这说明由先验概率所提供的信息太少。

为此我们还必须利用对细胞作病理分析所观测到的信息，也就是所抽取到的d维观测向量。为简单起见，我们假定只用其一个特征进行分类，即d=1，并这两类的类条件概率密度函数分布，如图2.1所示，其中P(x|ω1)是正常细胞的属性分布，P(x|ω2)是异常细胞的属性分布。那末，当观测向量为X值时，它属于各类的概率又是多少呢?为此我们可以利用贝叶斯公式,来计算这种条件概率，称之为状态的后验概率P(ωi|X)。基于最小风险的贝叶斯决策(一)(二)上面我们讨论了使错误率最小的贝叶斯决策规那么。然而当接触到实际问题时，可以发现使错误率最小并不一定是一个普遍适用的最正确选择。譬如，在上面讨论过的细胞分类的例子中，把正常细胞错分为癌细胞，或相反方向的错误，其严重性是截然不同的。把正常细胞误判为异常细胞固然会给人带来不必要的痛苦，但假设将癌细胞误判为正常细胞，那么会使病人因失去及早治疗的时机而遭受极大的损失。由此可见，根据不同性质的错误会引起不同程度的损失这一考虑出发，我们宁肯扩大一些总的错误率，但也要使总的损失减少。这会引进一个与损失有关联的，更为广泛的概念——风险。在作出决策时，要考虑所承当的风险。基于最小风险的贝叶斯决策规那么正是为了表达这一点而产生的。在限定一类错误率条件下使另一类错误率为最小的两类别决策**本小节不作根本要求。上面讨论的最小错误率或最小风险决策方法都是在先验概率的条件下进行的，先验概率的数值对决策有很密切的关系。然而有时会遇到先验概率不知道，或先验概率发生变化的情况。在这种情况下，如果仍按某一组先验概率值P(ωi)作决策，那么很可能使实际的决策效果有较大的错误率或较大风险。那末能否在这种情况下，找到一种适宜的分类器设计，使其最大可能的风险为最小。换句话说，如果先验概率值在较大范围内变化，就可能产生的最大风险而言是最小的。而这一节讲的是哪一种方法，即不考虑先验概率，而只要求限定某一种错误率条件下，使另一类错误率最小。这一节仅供有兴趣的同学参考，而最小最大风险决策可参阅讲义《模式识别根本教程》判别函数、决策面与分类器设计以上我们讨论了几种常用的决策原那么，在这些原那么的指导下，可以进行分类器的设计。在讨论分类器设计前，需要说明在分类器设计中使用的一些概念，这就是决策面与判别函数。在前面讨论中曾提到，分类决策实质上是在描述待识别对象的d维特征所组成的特征空间内，将其划分为c个决策域，待识别的特征向量落在哪个决策域，该样本就被判为哪一类。因此决策域的边界面就是决策面，在数学上用解析形式表示成决策面方程。用于表达决策规那么的某些函数那么称为判别函数。显然判别函数与决策面方程是密切相关的，并且都是由相应决策规那么所确定的。§2.3正态分布时的统计决§2.3正态分布时的统计决策(一)正态分布概率密度函数的定义与性质正态分布概率模型下的最小错误率贝叶斯决策学习这一节关键是要将多元正态分

人人文库> 全部分类> 行业资料 > 管理策划

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

模式识别清华-课件第二章

文档简介

温馨提示

最新文档

评论

模式识别清华-课件第二章

文档简介

温馨提示

最新文档

评论

相关文档