模式识别课件 第二章 贝叶斯决策论_第1页
模式识别课件 第二章 贝叶斯决策论_第2页
模式识别课件 第二章 贝叶斯决策论_第3页
模式识别课件 第二章 贝叶斯决策论_第4页
模式识别课件 第二章 贝叶斯决策论_第5页
已阅读5页,还剩74页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、chapter 2 bayesian decision theory 贝叶斯决策论贝叶斯决策论 要点:要点: 重点掌握贝叶斯决策论、最小误差率分类规则、分类器与判别重点掌握贝叶斯决策论、最小误差率分类规则、分类器与判别函数、正态密度、正态分布的判别函数函数、正态密度、正态分布的判别函数 了解贝叶斯决策论了解贝叶斯决策论( (离散性特征离散性特征) ) 在不知道更多信息的情况下,每次出现鲈鱼的先验概率为 ,而鲑鱼的先验概率为 ,其中 先验概率反映了在鱼没有出现之前,我们拥有可能出现鱼的类别的先验知识。 例如:对于鲑鱼与鲈鱼的2类问题,如果用 表示类别状态,那么当 时是鲈鱼,当 时是鲑鱼。由于每次

2、出现的类别不确定,可以假设是一个用概率来描述的随机变量。 2.1 引引 言言 贝叶斯决策是统计模式识别的基本方法, 采用概率的形式来描述,它的前提是: (1). 各类别的总体概率分布是已知的. (2). 要决策分类的类别数是一定的. )(1p12)(2p1)()(21pp 利用类条件概率密度: 及 描述了两种鱼类外观上光泽度的差异。 其中,x为光泽度指标。 类条件概率密度为类别状态为时的x的概率密度函数 仅根据先验信息的判定准则 若 ,则事件 成立; 反之,则 成立。 错误的概率是它们之中较小的那个. 但通常不这样做!但通常不这样做! )()(21pp)|(1xp)|(2xp12 注注 : 假

3、定的类条件概率密度函数图假定的类条件概率密度函数图,显示了模式处于类别显示了模式处于类别 时观察某时观察某 个特定特征值个特定特征值 x 的概率密度的概率密度.如果如果 x 代表了鱼的长度代表了鱼的长度,那么这两条曲线可那么这两条曲线可 描述两种鱼的长度区别描述两种鱼的长度区别.概率函数已归一化概率函数已归一化,因此每条曲线下的面积为因此每条曲线下的面积为1 i贝叶斯公式: 处于类别 并具有特征值 x的模式的联合概率密度可写成两种形式: )()()|()|(xppxpxpiii其中 称为状态的后验概率. )|(xpi混合概率密度函数: 21)()|()(jjjpxpxpi)()|()()|()

4、,(iiiipxpxpxpxp于是,可以导出贝叶斯公式: )()()|()|(xppxpxpiii证据因子先验概率似然函数后验概率(1) 3/1)(, 3/2)(21wpwp在先验概率在先验概率 及图及图2-1给出的后验概率图给出的后验概率图.此情况下此情况下,假定一假定一 个模式具有特征值个模式具有特征值 , 那么它属于那么它属于 类的概率约为类的概率约为0.08, 属于属于 的概率的概率 约为约为0.92.在每个在每个x 处的后验概率之和为处的后验概率之和为1.0 14x21 基于后验概率的决策准则基于后验概率的决策准则 (x 表示观察值表示观察值) 若若 类别判定类别判定 若若 类别判定

5、类别判定 决策后所导致的错误率决策后所导致的错误率 若判定若判定 若判定若判定 )|()|(21xpxp)|()|(21xpxp)|()|(2xpxerrorp)|()|(1xpxerrorp1221 最小化错误概率条件下的贝叶斯决策规则 为了追求最小的错误率,采取如下判定准则: 若 ,则判定类别为 ; 反之,判为 。 可以证明,依从这样的准则可以获得最小错误率: 我们称该准则为“贝叶斯决策准则”。 )|()|(21xpxp)|(),|(min)|(21xpxpxerrorp12 平均错误率: dxxpxerrorpdxxerrorperrorp)()|(),()( 根据贝叶斯公式,由于p(x

6、)为标量,则可以采用等价判定准则: 若 ,则判定类别为 ; 反之,判为 。 )()|()()|(2211pxppxp12)()()|()|(xppxpxpiii 2.2 贝叶斯决策论贝叶斯决策论-连续性特征连续性特征 1.允许利用多于一个的特征允许利用多于一个的特征 2.允许多于两种类别状态的情形允许多于两种类别状态的情形 3.允许有其它行为而不仅是判定类别。允许有其它行为而不仅是判定类别。 4.引入损失函数代替误差概率。引入损失函数代替误差概率。 概概 述述 令1, 2, c表示一系列类别状态。 令1, 2, a表示一系列可能采取的行动(或决策)。 令 (i | j)表示当实际状态为 j 时

7、,采取i 的行为会带来的风险。那么,特征x与行动i 相关联的损失为: 因此, 称为条件风险。 考察损失函数对判定准则的影响考察损失函数对判定准则的影响 cjjjiixpxr1)|()|()|(dxxpxxrr)()| )()|(xri 借助 可以提供一个总风险的优化过程,即遇到特征x,我们可以选择最小化风险的行为来使预期的损失达到最小。 )|(xri 假设对于特征x,决策的行为是 ,则总风险可表示为: )(x为了最小化总风险,对所有 计算条件风险 12ia, ,)|()|()|(1xpxrjcjjii选择行为i ,使得 最小化。最小化后的总风险值称为贝叶斯风险,记为 ,它是可获得的最优结果。

8、*r)|(xri(12) 两类分类问题两类分类问题 行为1对应类别判决1, 2则对应2 。为了简化符号,令 )|(,jiji那么可得两种行为的损失函数 )|()|()|()|()|()|(22, 211 , 2222, 111 , 11xpxpxrxpxpxr 决策决策 按照贝叶斯决策规则,为了使得条件风险最小, 如果 则判为 相反,则判为 )|()|(21xrxr12 结合贝叶斯公式,用先验概率与条件密度来表示 后验概率,等价规则为 如果 则判为 否则,判决为 )()|()()()|()(222, 22, 1111 , 11 , 2pxppxp12 用后验概率来表示,等价规则为 如果 则判为

9、 否则,判决为 )|()()|()(22, 22, 111 , 11 , 2xpxp12通常: ? 0)(0)(2, 22, 11 , 11 , 2 决策决策 等价规则为 如果 则判为 ; 否则,判决为 )()()()()|()|(121 , 11 , 22, 22, 121ppxpxp12注意公式(18)的右边是与x无关的常数,因此可以视为左边的似然比超过某个阈值,则判为 (18) 1 当损失函数简化到所谓的“对称损失”或“当损失函数简化到所谓的“对称损失”或“0-1损失”损失” 函数函数 10)|(jijijicji, 2 , 1, 这个损失函数将这个损失函数将0损失赋给一个正确的判决,而

10、将一损失赋给一个正确的判决,而将一 个单位损失赋给任何一种错误判决,因此所有误判都是个单位损失赋给任何一种错误判决,因此所有误判都是 等价的。与这个损失函数对应的风险就是等价的。与这个损失函数对应的风险就是平均误差概率平均误差概率。 2.3 2.3 最小误差率分类最小误差率分类 1(| )(|) (| )(| )1(| )ciijjjjj iirxpxpxpx 对于 , 若 ,则判定类别为 ; 反之,判为 。 (| )(| )ijpxpxijij因此, 最小化风险, 就是最大化后验概率 , 即最小误差率的分类准则。 (| )ipx左图说明,如果左图说明,如果 引入一个引入一个0-1损失损失 或

11、分类损失,那么或分类损失,那么 判别边界将由阈值判别边界将由阈值 决定;而如果决定;而如果 损失函数将模式损失函数将模式 判为判为 的惩罚大于的惩罚大于反过来情况,将得反过来情况,将得到较大的阈值到较大的阈值 使使得得r1变小变小 ba1b22.3.1 极小极大化准则(先验概率未知情形)极小极大化准则(先验概率未知情形) 有时我们需要设计在整个先验概率范围内都能很好操作的有时我们需要设计在整个先验概率范围内都能很好操作的 分类器。一种合理的设计方法就是分类器。一种合理的设计方法就是使先验概率取任何一种使先验概率取任何一种 值时所引起的总风险的最坏情况尽可能小,也就是说最小值时所引起的总风险的最

12、坏情况尽可能小,也就是说最小 化最大可能的风险。化最大可能的风险。 我们以我们以r1表示分类器判为表示分类器判为 1时的特征空间的区域,同样的时的特征空间的区域,同样的 有有r2和和 2,总风险的形式可表示为,总风险的形式可表示为 121,1111,2222,1112,222() ( |)() ( |)() ( |)() ( |)rrrpp xpp xdxpp xpp xdx判为判为 1 判为判为 2 结合公式结合公式 与与 )(1)(12ppdxxpdxxprr)|(1)|(1211122, 22, 1211 , 11 , 22, 21 , 11112, 21 , 12, 21)|()()|

13、()()()()|()()(rrrdxxpdxxppdxxppr可以得到可以得到 等式表明一旦判别边界确定后,总风险与等式表明一旦判别边界确定后,总风险与 成成 线形关系。如果能找到一个边界使比例为线形关系。如果能找到一个边界使比例为0,那么风险,那么风险将与先验概率独立。这就是将与先验概率独立。这就是极小极大化求解。极小极大化求解。 )(1p122,21,22,221,12,11,11()( |)()( |)mmrrrp xdxp xdx风险风险 作业作业:计算计算 2.3.2 neyman-pearson准则准则 最小化最小化某个约束的风险(资源有限的情形)。某个约束的风险(资源有限的情形

14、)。 对某个给定的对某个给定的i,最小化在约束条件,最小化在约束条件 的总风险。的总风险。 1(| )rx dx常数 例如:将鲈鱼误判为鲑鱼的误差率不得超过例如:将鲈鱼误判为鲑鱼的误差率不得超过1%。 2.4 分类器与判别函数分类器与判别函数 2.4.1 多类情况多类情况 有许多方式来表述模式分类器,用的最多的是一种有许多方式来表述模式分类器,用的最多的是一种 判别函数判别函数 若对于所有的若对于所有的 都有都有 )(xgiij )()(xgxgji则分类器将这个特征向量则分类器将这个特征向量x判给判给 i上图为包含上图为包含d个输入个输入c个判别函数的系统。确定哪个判别函数值个判别函数的系统

15、。确定哪个判别函数值 最大,并相应地对输入作分类。最大,并相应地对输入作分类。 不同情况下的分类器的表示方式不同情况下的分类器的表示方式 一般风险的情况下为一般风险的情况下为 )|()(xrxgii)|()(xpxgii 最小误差概率情况下最小误差概率情况下 其它一些较常见的形式其它一些较常见的形式 jjjiiiipxppxpxpxg)()|()()|()|()()()|()(iiipxpxg)(ln)|(ln)(iiipxpxg 尽管判别函数可写成各种不同的形式,但是判决规则是相同的。尽管判别函数可写成各种不同的形式,但是判决规则是相同的。 每种判决规则都是将特征空间划分每种判决规则都是将特

16、征空间划分c个判决区域,个判决区域, 如果对于所有的如果对于所有的 ,有,有 那么那么x属于属于 。 要求我要求我 们将们将x分给分给 。此区域由判决边界来分割,其判决边界即判决。此区域由判决边界来分割,其判决边界即判决 空间中使判决函数值最大的曲面。如图空间中使判决函数值最大的曲面。如图 crr,1ij )()(xgxgjiiri在这个二维的两类问题的分类器中,概率密度为高斯分布。判别边界由两在这个二维的两类问题的分类器中,概率密度为高斯分布。判别边界由两个双曲面构成,因此判决区域个双曲面构成,因此判决区域r2并非是简单连通的。椭圆轮廓线标记出并非是简单连通的。椭圆轮廓线标记出1/e乘以概率

17、密度的峰值。乘以概率密度的峰值。 则如果则如果 ,则将,则将x判给判给 ,否则给,否则给 。 2.4.2 两类情况(二分分类器两类情况(二分分类器-dichotomizer) 对于二分分类器,可以定义一个简单判别函数对于二分分类器,可以定义一个简单判别函数 ( )0g x 12( )( )( )g xg xgx1212( )(| )(| )g xpxpx 最小误差概率情况下最小误差概率情况下 或:或: 1122( |)()( )lnln( |)()p xpg xp xp 2.5 正态密度正态密度 单变量密度函数单变量密度函数 单变量正态分布单变量正态分布 211( )exp()22xp xdx

18、xxpxe)()(dxxpxxe)()()(222容易计算其期望值与方差容易计算其期望值与方差 2( )( ,)p xn 2|x单变量正态分布大约有单变量正态分布大约有95%的区域在的区域在 范围内,如图范围内,如图 此分布的峰值为此分布的峰值为 2/1)(p 正态分布与熵之间的关系正态分布与熵之间的关系 熵的定义熵的定义 dxxpxpxph)(ln)()(2log单位为奈特单位为奈特; 若换为若换为 ,单位为比特。熵是一个非负的量单位为比特。熵是一个非负的量 用来描述一种分布中随机选取的样本点的不确定性。可以用来描述一种分布中随机选取的样本点的不确定性。可以 证明正态分布在所有具有给定均值和

19、方差的分布中具有最大证明正态分布在所有具有给定均值和方差的分布中具有最大 熵。并且,如中心极限定理所述,大量的小的,独立的随机熵。并且,如中心极限定理所述,大量的小的,独立的随机 分布的总和等效为高斯分布。分布的总和等效为高斯分布。 多元密度函数多元密度函数 多元正态密度多元正态密度 11/2/211( )exp ()()2(2 )tdp xxx其中其中x是一个是一个d维列向量,维列向量, 是是d维均值向量,维均值向量, 是是 的协方差矩阵,的协方差矩阵, 和和 分别是其行列式的值和逆。分别是其行列式的值和逆。 1dd( )( , )p xn形式上有:形式上有: ( )xxp x dx()()

20、()() ( )xxxxp x dx 协方差矩阵协方差矩阵 通常是对称的且半正定。我们将严格限定通常是对称的且半正定。我们将严格限定 是正定的。对角线元素是正定的。对角线元素 是相应的是相应的 方差方差; 非对角线元素非对角线元素 是是 和和 的协方差。如果的协方差。如果 和和 统计独立,则统计独立,则 。如果所有的非。如果所有的非 对对 角线元素为角线元素为0,那么,那么p(x)变成了变成了x中各元素的单变量正态密度函数的中各元素的单变量正态密度函数的 内积。内积。 ijiiix0ijixixjxjx 服从正态分布的随机变量的线性组合,不管这些随机变量是独立服从正态分布的随机变量的线性组合,

21、不管这些随机变量是独立 还是非独立的,也是一个正态分布还是非独立的,也是一个正态分布。(这是个非常有用的结论)这是个非常有用的结论) 特别地,如果特别地,如果 ,a是一是一d*k的矩阵且的矩阵且 是是 一一k维向量,则维向量,则 ( )( , )p xntya x( )(,)ttp xn aa a),()(),()(aaayxayxtttnpnp 白化(whitening) 变换 f f: 其列向量是 的正交特征向量的正交特征向量. . l:l: 与特征值对应的对角矩阵. 白化(whitening) 变换 iaaawtww2/1 2.6 正态分布的判别函数正态分布的判别函数 111( )()(

22、)ln2lnln()222tiiiiiidg xxxp )(ln)|(ln)(iiipxpxg最小误差概率分类可通过判别函数获得最小误差概率分类可通过判别函数获得 如果已知如果已知 ( |) (,)iiip xn那么那么 11/2/21( |)exp ( 1/2()()(2 )tiiiidip xxx其中:其中: 情况情况1: 2ii 2i 这种情况发生在各特征统计独立,且每个特征具有相同的这种情况发生在各特征统计独立,且每个特征具有相同的 方差时。此时的协方差阵是对角阵,仅仅是方差时。此时的协方差阵是对角阵,仅仅是 与单位阵与单位阵i 的乘积。几何上它与样本落于相等大小的超球体聚类中的的乘积

23、。几何上它与样本落于相等大小的超球体聚类中的 情况相对应,第情况相对应,第i类的聚类以均值向量类的聚类以均值向量 为中心。为中心。 省略掉其它无关紧要的附加常量,可得到简单的判决函数省略掉其它无关紧要的附加常量,可得到简单的判决函数 2)(ln2)(22iiipxxg展开后我们得到展开后我们得到 省略附加常量,等价于线性判决函数省略附加常量,等价于线性判决函数 其中其中 且且 称称 为第为第 i个方向的阈值或者偏置。个方向的阈值或者偏置。 0)(itiiwxwxg21( )2ln()2tttiiiiig xx xxp iiiw21021ln()2tiiiiwp 0iw 使用线性判别函数的分类器

24、称为“线性机器”。这类分类器有许多有使用线性判别函数的分类器称为“线性机器”。这类分类器有许多有趣的理论性质,其中一些将在第趣的理论性质,其中一些将在第5章中详细讨论。此处只需注意到一个线章中详细讨论。此处只需注意到一个线性机器的判定面是一些超平面,它们是由两类问题中可获得最大后验概性机器的判定面是一些超平面,它们是由两类问题中可获得最大后验概率的线性方程率的线性方程 来确定。来确定。 在以上的例子中,该方程可写为在以上的例子中,该方程可写为 其中其中 且且 此方程定义了一个通过此方程定义了一个通过 x0 且与向量且与向量 w 正交的超平面。由于正交的超平面。由于 , 将将 ri 与与 rj

25、分开的超平面与两中心点的连线垂直。若分开的超平面与两中心点的连线垂直。若 则上式则上式 右边第二项为零,因此超平面垂直平分两中心点的连线。如图右边第二项为零,因此超平面垂直平分两中心点的连线。如图 )()(xgxgji0)(0 xxwtjiw)()()(ln)(21220jijijijippx)()(jippjiw如果两种分布的协方差矩阵相等且与单位阵成比例,那么它们呈如果两种分布的协方差矩阵相等且与单位阵成比例,那么它们呈d维球状分布,维球状分布,其判决边界是一个其判决边界是一个d-1维归一化超平面,垂直于两个中心的连线。在这些一维,维归一化超平面,垂直于两个中心的连线。在这些一维,二维及三

26、维的例子中,是假设在二维及三维的例子中,是假设在 的情况下来显示的情况下来显示 和判决和判决 边界的。边界的。 )()(jipp)|(ixp 如果所有如果所有c类的先验概率类的先验概率 相等,那么相等,那么 项就成了另一可省略项就成了另一可省略 的附加常量。此种情况下,最优判决规则可简单陈述如下:的附加常量。此种情况下,最优判决规则可简单陈述如下: 为将某特征向量为将某特征向量 x 归类,通过测量每一个归类,通过测量每一个 x 到到 c 个均值向量中的个均值向量中的 每一个欧氏距离,并将每一个欧氏距离,并将 x 归为离它最近的那一类中。这样一个分类归为离它最近的那一类中。这样一个分类 器被称为

27、器被称为 “最小距离分类器最小距离分类器”。如果每个均值向量被看成是其所属模”。如果每个均值向量被看成是其所属模 式类的一个理想原型或模板,那么本质上是一个式类的一个理想原型或模板,那么本质上是一个模板匹配技术模板匹配技术。 )(ip)(lnip如图:随着先验概率的改变,判决边界也随之改变;对于差别较大的离如图:随着先验概率的改变,判决边界也随之改变;对于差别较大的离散先验概率而言,判决边界不会落于这些一维散先验概率而言,判决边界不会落于这些一维, 二维二维 及三维球状高斯及三维球状高斯分步的中心点之间。分步的中心点之间。 情况情况2 : 第二类简单的情况是所有类的协方差阵都相等,但各自的均值

28、向量第二类简单的情况是所有类的协方差阵都相等,但各自的均值向量 是任意的。几何上,这种情况对应于样本落在相同大小和相同形状是任意的。几何上,这种情况对应于样本落在相同大小和相同形状 的超椭球体聚类中,第的超椭球体聚类中,第 i类的聚类中心在向量类的聚类中心在向量 附近。此时的判决附近。此时的判决 函数可从函数可从 简化为简化为 )(ln)()(21)(1ijtiipxxxgii 将二次型展开后,可再次得到线性判决函数将二次型展开后,可再次得到线性判决函数 0)(itiiwxwxg其中其中 iiw1111( )()()ln2lnln()222tiiiiiidg xxxp 1021ln()2tii

29、iiwp由于判决函数是线性的,判决边界同样是超平面由于判决函数是线性的,判决边界同样是超平面 0)(0 xxwt)(1jiw)()()()(/ )(ln)(2110jijitjijijippx其中其中 且且 如果先验概率相等,其判决面与均值连线相交于中点;若不如果先验概率相等,其判决面与均值连线相交于中点;若不 等,最优边界超平面将远离可能性较大的均值。如图等,最优边界超平面将远离可能性较大的均值。如图 相等但非对称的高斯分相等但非对称的高斯分布概率密度(由二维平布概率密度(由二维平面和三维椭球面表示)面和三维椭球面表示)及判决区域。判决超平及判决区域。判决超平面未必和均值连线垂直面未必和均值

30、连线垂直正交。正交。 情况情况3 : 任意i0)(itiitiwxwxwxxg121iiwiiiw1在一般的多元正态分布的情况下,每一类的协方差是不同,其在一般的多元正态分布的情况下,每一类的协方差是不同,其 判决函数显然也是二次型判决函数显然也是二次型 其中其中 在两类问题中,其对应的判决面是超二次曲面。在两类问题中,其对应的判决面是超二次曲面。 1011lnln()22tiiiiiiwp 任意高斯分布导致一般超二次曲面的贝叶斯判决边界。反之,任意高斯分布导致一般超二次曲面的贝叶斯判决边界。反之, 给定任意超二次曲面,就能求出两个高斯分布,其贝叶斯判别给定任意超二次曲面,就能求出两个高斯分布

31、,其贝叶斯判别 边界就是该超二次曲面。它们的方差由常概率密度的围线表示边界就是该超二次曲面。它们的方差由常概率密度的围线表示 p42 例例1 p42 例例3 23 passingnot ,1875. 0125. 1514. 3 boundarydecision 5 . 0)()(2/1002/1,2/10022002,23,2002/1,6321122112112211xxxpp 2.9 贝叶斯决策论贝叶斯决策论 -离散特征离散特征 到目前为止所讨论的特征向量到目前为止所讨论的特征向量 x 可以为可以为 d 维欧氏空间中的任意一点。但维欧氏空间中的任意一点。但 是,在许多实际应用中,是,在许多

32、实际应用中,x中的元素可能是二进制,三进制或者更高的离散中的元素可能是二进制,三进制或者更高的离散整数值,以至于整数值,以至于 x 可以被认为是可以被认为是m个离散值个离散值 中的一个。在这种中的一个。在这种情况下,情况下, 变得奇异化,积分形式变得奇异化,积分形式 dxxpj)|()|(xjxpmvv,1转变为求和形式转变为求和形式 )|(jxp其它方面与连续的情况基本相同,这里不一一赘述其它方面与连续的情况基本相同,这里不一一赘述。 概率密度函数概率密度函数 换成换成 概率分布函数概率分布函数 ( )p( )p考虑两类问题,其中特征向量的元素为二值的,并且条件独立。考虑两类问题,其中特征向

33、量的元素为二值的,并且条件独立。 令令 ,其中,其中 可能为可能为0或或1,且,且 2.9.1 独立的二值特征独立的二值特征 1( ,.,)dxxxix( |)ip x1pr1|iipx且且 2pr1|iiqx假设条件独立,可将假设条件独立,可将x元素的概率写为元素的概率写为 ,即,即 111( |)(1)iidxxiiip xpp121( |)(1)iidxxiiip xqq且且 那么似然比为那么似然比为 11121( |)() ()( |)1iidxxiiiiippp xp xqq由公式由公式 得判决函数得判决函数 1121()( )ln(1)lnln1()diiiiiiipppg xxx

34、qqp1122( |)()( )lnln( |)()p xpg xp xp01i101212( )(1) ln 1,.,(1)1() lnln1() g(x)0 diiiiiiidiiig xw xwpqwidqpppwqp若若 判别为判别为 ;否则为;否则为 注意判决函数对注意判决函数对 是线性的,可改写为是线性的,可改写为 其中其中 且且 ix01( )diiig xwxw g(x)可以看作是可以看作是x的各分量的加权组合。的各分量的加权组合。 注意权重注意权重wi 的意义。的意义。 i(1) ln 1,.,(1)iiiipqwidqp 特征独立的条件产生线性分类器,而如果特征不独立将产特

35、征独立的条件产生线性分类器,而如果特征不独立将产生复杂的分类器。生复杂的分类器。 example: 三维二值特征的贝叶斯决策 75. 25 . 05 . 0ln5 . 018 . 01ln3863. 1)8 . 01 (5 . 0)5 . 01 (8 . 0ln3 , 2 , 1, 5 . 0, 8 . 05 . 0)()(31021iiiiwwiqpppexample: 三维二值特征的贝叶斯决策 83. 15 . 05 . 0ln5 . 018 . 01ln02 , 1,3863. 1)8 . 01 (5 . 0)5 . 01 (8 . 0ln5 . 02 , 1, 5 . 0, 8 . 0

36、5 . 0)()(21033321iiiiwwiwqpiqppp 2.7 误差概率和误差积分误差概率和误差积分 二分分类器二分分类器: 考虑以非最优方式将空间分成两个区域考虑以非最优方式将空间分成两个区域ri 与与 rj , 则误差则误差概率为概率为: 2121122111221122()(,)(,)(|) ()(|) ()( |) ()( |) ()rrp errorp xrp xrp xrpp xrpp xpdxp xpdx上式的值与判决点的取值有关上式的值与判决点的取值有关. 多类情况 正确分类的概率 贝叶斯分类器通过选择对所有x使得被积函数最大化的区域使正确分类的概率最大化。 没有其他

37、分类方法能产生更小的分类概率。 ciriiidppcorrectp1)()|()(xx2.8 正态密度的错误上界正态密度的错误上界 在高斯函数的情况下, 整个误差率计算过程相当复杂。 特别是高维情形。 判决区域可能不连续。 在两类情况下,一般错误积分公式可近似的给出一个误差率的上界。 12(| )min (| ), (| )p error xppxxdxxpxerrorpdxxerrorperrorp)()|(),()(chernoff 界 11212112211min , for ,0 and 01(| )min (| ), (| )()(, )(| ) ( )min (| ), (| )

38、( )min ( |) (), ( |) ()()()a ba ba bp error xppp errorp error x dxp error x p x dxppp x dxp xpp xpdxp errorppxxxx12121()12121122112112()( |)( |), ( |)( |)(1)( )() (1) ()2(1)1ln2ktppdppdek xxxxxx对于正态密度习题36,作业! 其中: chernoff bound 0.66 bhattacharyya bound 0.5 bhattacharyya bound 21211212112)2/1(2121212ln21)(2)(81)2/1 ()()()|()|()()()(2/1set xxxtkkeppdpppperrorpexample: 在高斯分布下的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论