版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章贝叶斯决策理论2.1引言2.2基于最小错误率的贝叶斯决策2.3基于最小风险的贝叶斯决策2.4分类器、判别函数及决策面2.5正态分布下的统计决策第二章贝叶斯决策理论2.1引言2.2基于最小错误率的贝叶斯决策2.3基于最小风险的贝叶斯决策2.4分类器、判别函数及决策面2.5正态分布下的统计决策统计决策理论是模式分类问题的基本理论之一贝叶斯决策理论是统计决策理论中的一个基本方法贝叶斯决策的两个要求各个类别的总体概率分布(先验概率和类条件概率密度)是已知的要决策分类的类别数是一定的2.1引言黑色:第一类粉色:第二类绿色:哪一类?统计决策理论就是根据每一类总体的概率分布决定未知类别的样本属于哪一类决策2.1引言评价决策有多种标准,对于同一个问题,采用不同的标准会得到不同意义下“最优”的决策贝叶斯决策常用的准则:
最小错误率准则
最小风险准则
Neyman-Pearson(黎曼皮尔逊)准则最小最大决策准则决策准则2.1引言在连续情况下,假设对要识别的物理对象有d种特征观察量x1,x2,…xd,这些特征的所有可能的取值范围构成了d维特征空间。称向量假设要研究的分类问题有c个类别,类型空间表示为:为d维特征向量。基本概念2.1引言先验概率:类条件概率:后验概率:
几个重要概念2.1引言先验概率:类条件概率:后验概率:
未获得观测数据之前类别的分布几个重要概念2.1引言先验概率:类条件概率:后验概率:
未获得观测数据之前类别的分布表示在类条件下x的概率分布密度几个重要概念2.1引言先验概率:类条件概率:后验概率:
未获得观测数据之前类别的分布表示在类条件下x的概率分布密度在x出现条件下类出现的概率几个重要概念2.1引言第二章贝叶斯决策理论2.1引言2.2基于最小错误率的贝叶斯决策2.3基于最小风险的贝叶斯决策2.4分类器、判别函数及决策面2.5正态分布密度(TheNormalDensity)2.6正态分布的判别函数鲈鱼/鲑鱼例子自然状态下,先验的类别状态,
i,i=1,2
i类别状态是一个随机变量,P(
i)表示为先验概率。捕获鲈鱼和鲑鱼的几率相等。P(
1)=P(
2)(先验)P(
1)+P(
2)=1(排除其它鱼的种类)2.2基于最小错误率的贝叶斯决策仅含先验信息的判别规则这种分类决策没有意义由先验概率所提供的信息太少2.2基于最小错误率的贝叶斯决策采用类条件信息——类条件概率密度函数p(x|
1):鲈鱼的属性分布p(x|
2):鲑鱼的属性分布。2.2基于最小错误率的贝叶斯决策采用类条件信息——类条件概率密度函数p(x|
1):鲈鱼的属性分布p(x|
2):鲑鱼的属性分布。2.2基于最小错误率的贝叶斯决策鲈鱼和鲑鱼判别中的类条件概率密度函数(以光泽度为例)贝叶斯公式先验概率,后验概率,概率密度函数之间关系贝叶斯公式通过类条件概率密度形式的观察值,将先验概率转化为后验概率。2.2基于最小错误率的贝叶斯决策后验概率含义
P(ω1|x):当观测向量为x值时,是鲈鱼的概率。P(ω2|x):当观测向量为x值时,是鲑鱼的概率。2.2基于最小错误率的贝叶斯决策P(error|x)=P(
2|x)判定为
1(错误选择
2);基于后验概率的决策规则:存在一个观察值x(特征)如果P(
1|x)>P(
2|x)类别状态=
1如果P(
1|x)<P(
2|x)类别状态=
2因此,无论何时观测到某一个特定值x,概率误差为:P(error|x)=P(
1|x)判定为
2(错误选择
1);2.2基于最小错误率的贝叶斯决策因此,P(error|x)=min[P(
1|x),P(
2|x)]错误概率的最小化判定规则:如果P(
1|x)>P(
2|x),判定为
1;否则,判定为
2。(最大后验概率准则可以保证最小错误率,所以又称最小错误率准则)基于后验分布的判别规则:2.2基于最小错误率的贝叶斯决策基于最小错误率的贝叶斯决策:20等价形式2.2基于最小错误率的贝叶斯决策例:假设在某个局部地区细胞识别中正常和异常两类的先验概率分别为正常状态:异常状态:现有一待识别的细胞,其观察值为x,类条件概率密度分别为,试对该细胞x进行分类。
2.2基于最小错误率的贝叶斯决策例:假设在某个局部地区细胞识别中正常和异常两类的先验概率分别为正常状态:异常状态:现有一待识别的细胞,其观察值为x,类条件概率密度分别为,试对该细胞x进行分类。解:2.2基于最小错误率的贝叶斯决策以一维情况为例讨论基于最小错误率的贝叶斯决策确实对应最小错误率统计意义上的错误率,即平均错误率,用P(e)表示23最小错误率的讨论2.2基于最小错误率的贝叶斯决策24最小错误率的讨论2.2基于最小错误率的贝叶斯决策在C类别情况下最小错误率贝叶斯决策规则的后验概率形式:
先验概率与类条件概率密度相联系的形式:25C类别情况下最下错误率2.2基于最小错误率的贝叶斯决策26小结基于最小错误率的贝叶斯决策规则:贝叶斯公式:2.2基于最小错误率的贝叶斯决策第二章贝叶斯决策理论2.1引言2.2基于最小错误率的贝叶斯决策2.3基于最小风险的贝叶斯决策2.4分类器、判别函数及决策面2.5正态分布下的统计决策28例子1:鲈鱼和桂鱼的出售Seabass:鲈鱼Salmon:鲑鱼2.3基于最小风险的贝叶斯决策29例子2:良性和恶性肿瘤的诊断2.3基于最小风险的贝叶斯决策30主要思想:上述最小错误率决策中,使错误率达到最小是重要的。但实际上,有时候需要考虑一个比错误率更广泛的概念—风险,而风险又是和损失紧密相连的。我们对样本的分类不仅要考虑到尽可能作出正确的判断,而且还要考虑到作出错误判断时会带来什么后果。最小风险贝叶斯决策正是考虑各种错误造成损失不同而提出的一种决策规则。2.3基于最小风险的贝叶斯决策(3)决策/行动指将模式x判定为ωi或者是拒判。决策空间是由a个决策组成(4)损失函数为表示当样本x真实状态为ωj而所采取的决策为
时所带来的损失。31x是d维随机向量(2)状态空间Ω由c个自然状态(c类)组成:
2.3基于最小风险的贝叶斯决策32条件风险:由于引入了“损失”的概念,在考虑错判所造成的损失时,就不能只根据后验概率的大小来做决策,而必须考虑所采取的决策是否使损失最小。对于给定的x,如果采取决策αi
,从决策表可见,λ可以在c个λ(αi,ωj),j=1,2,…,c值中任取一个,其相应概率为P(ωj|x)。因此在采取决策αi情况下的条件期望损失(也称为条件风险)R(αi|x)为:2.3基于最小风险的贝叶斯决策期望风险:对于x的不同观察值,采取决策αi时,其条件风险大小是不同的。所以究竟采取哪一种决策将随x的取值而定。这样,决策α可以看成随机向量x的函数,记为α(x)。可以定义期望风险Rexp为:期望风险反映对整个空间上所有x的取值采取相应的决策α(x)所带来的平均风险。2.3基于最小风险的贝叶斯决策34决策规则:在考虑错判带来的损失时,总是希望损失最小。如果在采取每一个决策或行动时,都使其条件风险最小,则对所有的x作出决策时,其期望风险也必然最小。这就是最小风险贝叶斯决策。最小风险贝叶斯决策规则为:2.3基于最小风险的贝叶斯决策352.3基于最小风险的贝叶斯决策36举例例:在某个局部地区细胞识别中正常(
1)和异常(
2)两类的先验概率为:P(ω1)=0.9,P(ω2)=0.1,满足:对于未知细胞x,利用最小风险贝叶斯决策和最小错误率贝叶斯决策,问该细胞属于正常细胞还是异常细胞?决策状态ω1ω2α106α210P(x/ω1)=0.2,
P(x/ω2)=0.42.3基于最小风险的贝叶斯决策37举例例:在某个局部地区细胞识别中正常(
1)和异常(
2)两类的先验概率为:P(ω1)=0.9,P(ω2)=0.1,满足:对于未知细胞x,利用最小风险贝叶斯决策和最小错误率贝叶斯决策,问该细胞属于正常细胞还是异常细胞?决策状态ω1ω2α106α210P(x/ω1)=0.2,
P(x/ω2)=0.4解:计算出后验概率2.3基于最小风险的贝叶斯决策38举例因为,决策为ω2,即判别待识别细胞为异常细胞。利用基于最小错误率的准则,判定为ω1,这里损失函数起了决定性作用。各种错误造成的损失不同,正常细胞判定为异常细胞的损失远大于异常判定为正常的损失。
计算条件风险:分析:最小风险决策必须要有合适的损失函数λ,实际中要列出合适的决策表很不容易,往往要根据所研究的具体问题,分析错误决策造成损失的严重程度,与有关专家共同商讨来确定,才能做出更有效的决策。2.3基于最小风险的贝叶斯决策39两分类问题下的最小风险准则决策行动:
1
:对应于类别判别
1;
2:对应于类别判别
2。损失:表示当实际类别为
j时误判为
i
所引起的损失。条件风险(条件期望损失):最小风险决策规则:如果,则根据决策行动
1
,判决类别
1。2.3基于最小风险的贝叶斯决策40似然比形式
等价于:与x无关,对于某个问题,是个可以事先计算的常量。
似然比大于某个阈值,则采取行动决策
1(判决
1);否则为:
22.3基于最小风险的贝叶斯决策41
两分类问题下的最小风险准则在两类问题中,若有,决策规则变为2.3基于最小风险的贝叶斯决策42
多类问题下的最小风险准则在c个类别的问题中,如果损失函数为“0-1”损失函数:“0-1”损失函数:1)对于c类问题只有c个决策,2)实际类别正确判定为第j类时,损失为0。3)实际类别误判为第类时,损失均为1。2.3基于最小风险的贝叶斯决策43“0-1”
损失函数下的最小风险准则最小错误率贝叶斯决策是在0-1损失函数条件下的最小风险贝叶斯决策,最小错误率贝叶斯决策是最小风险贝叶斯决策的特例。2.3基于最小风险的贝叶斯决策第二章贝叶斯决策理论2.1引言2.2基于最小错误率的贝叶斯决策2.3基于最小风险的贝叶斯决策2.4分类器、判别函数及决策面2.5正态分布下的统计决策判别函数(DiscriminantFunction):用于表示决策规则的某些函数gi(x)称为判别函数。每个类别对应一个判别函数,。判别函数与决策面方程密切相关,且都由相应的决策规则所确定。表达同样的判决规则可能采用不同的判别函数,只要满足如下条件:例如:
gi(x)kgi(x),k为正常数
gi(x)gi(x)+k,k为任意常数
gi(x)ln(gi(x))用f(gi(x))替换gi(x),其中f(*)为单调递增函数2.4分类器、判别函数及决策面决策面(DecisionSurface):对于c类分类问题,按照决策规则可以把d维特征空间分成c个决策域,将划分决策域的边界面称为决策面,在数学上用解析形式可以表示成决策面方程。
判决区域Ri是特征空间中的一个子空间,判决规则将所有落入Ri的样本x分类为类别ωi;判决边界是特征空间中划分判决区域的(超)平面;在判决边界上,通常有两类或多类的判别函数值相等。2.4分类器、判别函数及决策面2.4分类器、判别函数及决策面分类器设计(Classifier):分类器设计就是设计判别函数,求出判定面方程g(x)分类器最常用的表述方式为判别函数:每个类别对应一个判别函数。基于判别函数的判决:如果:,则属于决策面方程:基于最小错误率的判决函数基于最小风险的判决函数2.4分类器、判别函数及决策面两分类下的判别函数特殊的,对于两分类问题,也可以只用一个判别函数
令:判决规则例如:决策面:如果:则模式为否则为2.4分类器、判别函数及决策面50两分类下的判别函数2.4分类器、判别函数及决策面例子求:利用最小错误率和最小风险决策分别写出判别函数和决策面方程。2.4分类器、判别函数及决策面52例子求:利用最小错误率和最小风险决策分别写出判别函数和决策面方程。利用最小错误率决策,其对应的判别函数为:决策面方程为:利用最小风险决策,其对应的判别函数为:决策面方程为:2.4分类器、判别函数及决策面53多分类下的判别函数判决函数:决策面:则模式为:2.4分类器、判别函数及决策面54多分类下的判别函数分类器设计:它的功能是先计算出c个判别函数gi,再从中选出对应于判别函数为最大值的类作为决策结果。2.4分类器、判别函数及决策面55判别函数、决策面2.4分类器、判别函数及决策面判别函数,决策面2.4分类器、判别函数及决策面第二章贝叶斯决策理论2.1引言2.2基于最小错误率的贝叶斯决策2.3基于最小风险的贝叶斯决策2.4分类器、判别函数及决策面2.5正态分布下的统计决策2.5正态分布下的统计决策为什么研究正态分布?物理上的合理性:较符合很多实际情况,观测值通常是很多种因素共同作用的结果,根据中心极限定理(这组定理是数理统计学和误差分析的理论基础,指出了大量随机变量累积分布函数逐点收敛到正态分布的积累分布函数的条件),服从正态分布。数学上比较简单:参数个数少单变量正态分布多元正态分布59单变量正态分布
2.5正态分布下的统计决策多元正态分布函数期望(均值向量)协方差矩阵(对称非负定)2.5正态分布下的统计决策多变量正态分布
二次型xT∑x≥0●协方差矩阵总是对称阵,协方差矩阵为
的方差就是对角线上的元素非对角线上的元素就是和的协方差。2.5正态分布下的统计决策●协方差矩阵总是非负定阵。●对于任意随机向量x,xT∑x是∑的二次型。如果对x≠0的一切x
有
xT∑x≥0都成立,则称∑为非负定阵。●若xT∑x>0,则∑为正定阵。●对于正定矩阵,各阶主子式非零(包括|∑|≠0)。多元正态分布的性质参数个数:d+d(d+1)/2
均值向量:d个参数协方差矩阵:对称的d维矩阵,d(d+1)/2个参数等密度点的轨迹为一超椭球面要使密度p(x)值不变,需指数项为常数,即:超椭球面2.5正态分布下的统计决策多元正态分布的性质马氏距离:与欧式距离:马氏距离考虑数据各个维度间的相关性,x到的马氏距离为常数时,所组成的超椭球面为等密度点。2.5正态分布下的统计决策2.多元正态分布的性质⑴参数μ和∑对分布的决定性⑵等密度点的轨迹为一超椭球面⑶不相关性等价于独立性⑷边缘分布和条件分布的正态性⑸线性变换的正态性⑹线性组合的正态性⑴参数μ和∑对分布的决定性多元正态分布被均值向量μ和协方差矩阵∑所完全确定。均值向量μ由d个分量组成;协方差矩阵∑由于其对称性故其独立元素有p(x)~N(μ,∑)多元正态分布概率密度函数常记为⑵等密度点的轨迹为一超椭球面从正态分布总体中抽取的样本大部分落在由μ和∑所确定的一个区域里。从一个以均值μ为中心的云团内的二维高斯分布中取出的样本。椭圆显示了等概率密度的高斯分布轨迹。■当指数项为常数时,密度p(x)值不变,因此等密度点应是此式的指数项为常数的点,即应满足■
证明上式的解是一个超椭球面,且它的主轴方向由∑阵的特征向量所决定,主轴的长度与相应的协方差矩阵∑的本征值成正比。在数理统计中上式所表示的数量:为x到μ的Mahalanobis距离的平方。所以等密度点轨迹是x到μ的Mahalanobis距离为常数的超椭球面。这个超椭球体大小是样本对于均值向量的离散度度量。可以证明对应于Mahalanobis距离为超椭球的体积是其中Vd是d维单位超球体的体积。⑶不相关性等价于独立性不相关与独立的定义:若E{xi
xj}=E{xi}·E{xj}则定义随机变量xi和xj是不相关的。若p(xi,xj)=
p(xi)p(xj)则定义随机变量xi和xj是独立的。
■一般情况下相关与独立的关系独立性是比不相关性更强的条件,独立性要求
p(xi,xj)=p(xi)p(xj)对于xi和xj都成立。不相关性是两个随机变量的积的期望等于两个随机变量的期望的积,它反映了xi与xj总体的性质。若xi和xj相互独立,则它们之间一定不相关;反之则不一定成立。■多元正态分布情况对多元正态分布的任意两个分量xi和xj而言,若xi与xj互不相关,则它们之间一定独立。在正态分布中不相关性等价于独立性。(证明见P27)推论:如果多元正态随机向量的协方差阵是对角阵,则x的分量是相互独立的正态分布随机变量。⑷边缘分布和条件分布的正态性多元正态分布的边缘分布和条件分布仍然是正态分布。二元正态分布协方差矩阵∑及其逆矩阵∑-1为根据边缘分布定义其中由于所以x1的边缘分布
就是说边缘分布p(x1)服从以均值为方差为的正态分布。
同理可以推出x2的边缘分布为对于给定x1的条件下x2的分布,有定义p(x2|x1)=p(x1,x2)/p(x1)同理可以写出给定x2条件下x1的分布:⑸线性变换的正态性若对x用线性变换矩阵A(A是非奇异(|A|≠0)的)作线性变换,y
=Ax则y服从以均值向量为Aμ,协方差矩阵为A∑AT的多元正态分布。即p(y)~N(Aμ,A∑AT)⑹线性组合的正态性若x为多元正态随机向量,则线性组合是一维的正态随机变量,则y服从:其中是与x同维的向量。根据最小错误率贝叶斯判别函数,在多元正态概型(p(x|ωi)~N(μi,∑i),i=1,…,c)下就可以立即写出其相应的表达式。判别函数为:决策面方程为:
即
(1)2.5正态分布下的统计决策情况一:各类协方差阵相等,且每类各特征独立,方差相等(对角矩阵)情况二:各类协方差阵相等情况三:各类协方差阵不相等
任意的2.5正态分布下的统计决策情况一:将代入得到决策函数展开决策函数其中,二次项与i无关2.5正态分布下的统计决策正交因此,等价的判决函数为:其中:决策面可以写成:其中:过与的超平面此时,写成了一个线性判别函数的形式。2.5正态分布下的统计决策当,当,向先验概率小的方向偏移。位于两中心的中点;在先验概率相等的情况下,最优判决的规则为:为将某特征向量x归类,通过测量每一x到c个均值向量中心的每一个欧氏距离,并将x归为离它最近的那一类。这样的分类器称为“最
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026贵州安顺西秀区第三幼儿园凯旋公园里分园招聘教师备考题库及参考答案详解一套
- 2026中共北京市房山区委党校面向高校毕业生招聘2人备考题库及答案详解(夺冠系列)
- 2026重庆市潼南区教育事业单位定向考核招聘30人备考题库及一套完整答案详解
- 2026海南三亚市崖州区社会招聘事业单位工作人员(含教师)77人备考题库(第1号)附答案详解(综合卷)
- 2026山东大学岩土与地下工程研究院招聘非事业编制人员备考题库有完整答案详解
- 2026河南焦作新材料职业学院招聘备考题库含答案详解(夺分金卷)
- 2026内蒙古鄂尔多斯电力冶金集团股份有限公司招聘43人备考题库附答案详解(预热题)
- 2026四川凉山州成环生态环境有限责任公司招聘综合管理等岗位4人备考题库含答案详解(模拟题)
- 2026湖北襄阳市襄州区引进事业单位急需紧缺博士人才8人备考题库含答案详解(完整版)
- 2026年河南省事业单位联考招聘13685人备考题库含答案详解(预热题)
- 结构拆改施工方案
- 2026山东济南城市投资集团有限公司社会招聘47人农业笔试备考题库及答案解析
- 2026年四川省绵阳市社区工作者招聘笔试参考题库及答案解析
- 2026年总工会招聘笔试全网首发独家试题及答案
- 律师调解工作室工作制度
- 《社会工作综合能力(初级)》课件全套 第1-12章 社会工作服务的内涵 社会工作综合能力(初级)-社会工作服务相关法规与政策 社会工作综合能力(初级)
- 厨余垃圾处理项目环评报告
- 2026年低空经济(eVTOL)载人项目商业计划书
- AI辅助麻醉深度监测的临床应用
- 大连理工大学《机器学习》2024 - 2025 学年第一学期期末试卷
- 下腔静脉阻塞的护理
评论
0/150
提交评论