概率密度估计及近邻法.ppt

上传人：闯*** IP属地：广东上传时间：2020-01-26 格式：PPT 页数：63 大小：6.24MB 积分：25 举报 版权申诉

已阅读5页，还剩58页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第三章概率密度函数估计及近邻法EstimationofProbabilityDensityFunctionandTheNearestNeighborRule 1引言 2总体分布的参数估计极大似然估计贝叶斯估计参数 3总体分布的非参数估计Parzen窗法kN近邻法 4近邻法则 1引言基于样本的两步贝叶斯决策估计类条件概率密度和先验概率利用和完成分类器设计第二章本章讨论从样本集推断总体概率分布p x wi 而样本的先验概率P wi 的估计较易实现概率密度函数含参数和形式两方面内容分别称为参数估计和非参数估计其估计方法 1 监督参数估计已知样本类别wi及其p x wi 形式而参数未知需从训练样本x估计参数q 如一元正态分布的m s2等参数 2 非监督参数估计未知样本类别wi 已知概率密度函数p x wi 的形式但参数未知需从样本x估计参数上述两种均可用极最大似然法和Bayes估计法来估计参数 3 非参数估计即估计p x wi 形式已知样本类别但未知概率密度函数的形式要从样本推断p x wi 属于哪种分布可用Parzen窗法和kN近邻法 4 近邻法则不属于估计内容直接利用样本设计分类器非参数即分类中不需要估计概率密度函数方法之一 5 参数估计的几个基本术语统计量每个训练样本都包含总体信息根据从总体中抽取的样本集构造某种函数该函数统计学中称为统计量参数空间概率密度形式已知参数q未知 q可取值的集合称为参数空间记为点估计估计量和估计值构造一个统计量f x1 xn 作为参数q的估计量如果x1 xn属于某类代入统计量f 就可得到该类具体的估计值本章参数估计属于点估计区间估计要求用区间 d1 d2 作为q可能取值范围的一种估计该区间称为置信区间 2总体分布的参数估计 1 极最大似然估计基本原理把参数q看成确定的非随机但取值未知最好估计值是在样本x概率为最大条件下得到的假设按类别把样本集分成c个子集x1 x2 xc 其中xj中的样本是从概率密度为p x wj 的总体中独立抽取的 p x wj 形式已知参数qj未知可写成p x wj qj 不同类的参数独立即xi不包含qj信息 i j 这样每一类可单独处理共处理c个独立问题设某类有N个样本组成了样本集x x1 x2 xN 样本是独立从该类抽取的因此N个随机变量的联合概率密度统计学中称p x q 为相对于样本集x的q的似然函数l q 似然函数l q 给出了从总体中抽取的x1 x2 xN这N个样本的概率极大似然估计值定义令l q 为样本集x的似然函数在的参数空间中能使l q 极大化的那个值极大似然法的主要思想如果在一次观察中一个事件出现了则这个事件出现的可能性最大事件x x1 x2 xN 在一次观察中即从总体中抽取N个样本出现了就可认为p x q 达到极大值即在参数空间中使似然函数极大化的值一个简单的例子假设似然函数p x q 对未知参数q是连续可微的则可由典型的求极值的方法求得求极大值的必要条件单个q的情况下若q是向量有s个分量q q1 qs T 则多变量的梯度算子对数似然函数H q 是单调的增函数为计算方便一般用对数似然函数正态分布的极大似然估计从总体中抽取N个样本xk 观察下列不同情况已知均值向量m未知即q m m的极大似然估计必须满足方程未知均值的极大似然估计正是样本的算术平均一维正态情况两个参数均未知设q1 m q2 s2 q q1 q2 T 多维正态密度的情况计算方法和形式完全类似只是复杂些计算结果均值向量的极大似然估计是样本的均值而协方差的极大似然估计是N个矩阵的算术平均这是一致估计协方差矩阵的无偏估计为 2 Bayes估计和Bayes学习 Bayes估计根据样本集x确定总体某个参数qBayes学习利用样本集x确定概率密度函数p x Bayes估计基本原理把参数q当作具有某种先验分布p q 的随机变量对样本x观察使先验分布转化为后验分布p q x 据此再修正原先的估计假设把所有的样本按类别分成c个子集每个子集有N个样本x x1 x2 xN 每类可单独处理已知样本的分布形式p x q 而参数q未知 q为随机变量已知其先验概密函数p q 贝叶斯估计和最小风险贝叶斯决策可统一 Bayes估计有一个样本集x 用来估计所属总体分布的某个参数使带来的贝叶斯风险最小 Bayes估计最小风险R为给定条件下某个估计量的期望损失常称为条件风险使条件风险最小的估计量q 也就是贝叶斯估计经推导 P 52定理3 1 使用平方误差损失函数时得到估计量为条件期望 Bayes参数估计步骤确定q的先验概率密度函数p q 由样本集x x1 x2 xN 计算样本的联合分布它是q的函数用Bayes公式求后验分布p q x 求样本的估计量q 正态分布情况的Bayes估计举例样本为一维正态分布p x m N m s2 m未知 m是随机的其先验概密p m N m0 s02 N个样本构成样本集x x1 x2 xN 求m的估计量解用Bayes公式求m的后验分布 a 比例因子与无关根据上述假设代入计算后验概密p x p x 是的二次函数的指数函数仍是正态密度写成 Bayes学习求概率密度函数p x X 从联合密度求条件概密函数X由N个样本组成 X x1 xN 用Bayes公式计算q的后验分布p q X 根据独立性其中XN x1 xN 1 xN XN 1 x1 xN 1 已知q的先验概密p q X0 p q 根据样本序列 x1 xN 按下式反复计算得到概率密度的序列p q p q x1 p q x1 x2 同时修改q 如果这个密度序列在估计值附近产生一个陡峰即d函数这种性质称为Bayes学习 Bayes学习步骤前三步同Bayes估计下面的步骤读入第一个样本x1 计算得到得到后验概密p q x1 据此作为下一步计算的先验概率密度读入样本x2 计算得到p q x1 x2 这样得到一个概率密度序列这个过程称为参数估计的递归的Bayes方法这个序列收敛于一个q0为中心的d函数则这个性质称Bayes学习大多数密度函数有此性质从前例Bayes学习得到条件概率密度函数非监督参数估计方法所采用的也是这两种方法但计算较复杂就极大似然估计来说由于样本的类别未知因此定义c类样本组成的混合密度建立似然函数 3总体分布的非参数估计根据训练样本集x x1 x2 xN 估计总体分布概率密度函数p x x1 x2 xN 形式基本思想每个样本对总体概率密度分布都有贡献如矩形a N个样本的贡献叠加起来得到概率密度估计如虚线也可认为每个样本在自己位置上贡献增大离得远贡献小如正态分布同样叠加得到概率密度估计下图直方图方法估计一维概率密度函数近似值将x轴划分为长度为h的区间样本x落在某个区间的概率就是这个区间的估计值样本总数为N 落在某个区间的点数为kN 相应的概率近似于频数 P kN N概率密度在同一个区间为常数近似等于估计值收敛于真实值的条件 hN 0 kN kN N 0 这三个条件表示对N的依赖型理论上讲要使就必须使体积V趋于零同时N和k趋于无穷大若体积V固定样本取得越来越多则k N收敛只能得到p x 的空间平均估计若样本数N固定使R不断缩小 V趋于零会发生两种无意义情况一是区域内不包含任何样本 p x 0 二是碰巧有一个样本 p x 实际上样本是有限的 V也不能任意缩小若用这种方法估计频数k N和估计的p x 将存在随机性都有一定的方差假设有无限多的样本可利用在特征空间构造包含x点的区域序列R1 R2 RN 对R1用一个样本进行估计对R2用二个样本设落在RN的x点数为kN 则第N次估计的概率密度函数为要使满足这三个条件的区域序列通常有两种方法 Parzen窗法把包含x点的区域序列 VN 选为样本数目N的函数并使其空间体积VN随N的增大而减小例如VN N 1 2 但对kN和kN N都要加些限制条件以使估计值收敛于p x kN近邻法把KN选为样本数目的函数让kN为N的某个函数例如kN N1 2 并调整体积VN大小使区域正好包含x的kN个近邻则该区域体积可用作x点的密度估计 2 Parzen窗法窗估计的概念多维情况下围绕x点的区域RN为一个超立方体边长为hN d为特征空间维数训练样本xi是否落入这个超立方体内检查x xi的每个分量值若小于hN 2 则在RN内其中x为数轴特征空间坐标轴上的点为了用函数描述落入VN中训练样本的数目kN 定义窗函数对u的特征空间来说 f u 是围绕原点的1个单位超立方体若u x xi hN 则窗函数当某个样本xi落入以x为中心体积为VN的立方体内时计为1 否则为0 落入VN内的样本数 x点的密度估计Parzen窗的密度估计在以x为中心的立方体内的样本应相加用方窗的直观解释一维概率密度函数的估计样本集x x1 x2 x5 有五个样本每个样本xi在以x xi为中心宽为h的范围内对概率密度函数贡献为1 数轴x上任一点的概密函数是样本集中全部样本对概密函数之和对所有的点求和得到p x 的分布虚线所示如果样本数很多并选择适当的窗函数估计的概率密度函数的性质有可能接近真实的概率密度函数p x 估计量为密度函数的条件为使是一个估计合理的概率密度函数必须满足对概率密度函数的基本要求即它应该非负且在特征空间积分为1 为此窗函数须满足两个条件窗函数的选择方窗函数正态窗函数指数窗函数只要所选择的函数满足前述的两个条件式都可作为窗函数估计量的统计性质产生随机变量的补充材料共四页三个问题产生 0 1 之间均匀分布的随机数ui方法产生随机变量方法非 0 1 均匀分布的随机数基本方法反变换法以概率积分变换定理为基础的一种常用的抽样方法其基础是 0 1 之间均匀分布的随机数若随机变量x的分布函数为F x 其反函数F 1 可用 0 1 之间均匀分布的随机数来产生要求分布的随机变量具体方法U为 0 1 均匀分布随机数令U F x x F 1 U x 即为所要求分布的随机变量 x 产生一维正态分布随机变量的近似方法举例根据已知概率密度函数p x 产生一系列随机变量作为样本用正态窗函数估计样本的总体分布并与真实的概率密度函数作比较采用下列两种样本 p x 是均值为0方差为1的正态分布生成样本xi p x 是两个均匀分布的混合密度生成样本xi 其他统计落入正态窗的随机样本数计算p x 的估计值在计算中要注意公式中变量和参数的意义这种方法具有普遍性即不管是规则或不规则单峰或多峰分布都可用但需要的样本数量很大从图中可看出N 256 h1 1时接近真实分布而h1 4时噪声小当样本数很多时 h1影响不大均值为0方差为1的正态分布二个均匀分布的混合密度基本步骤产生训练集样本有两种方法在问题域中搜集样本根据题意按已知的概率密度产生随机样本设x为d维的数轴以体积在数轴上向前推进即N 1 2 3 这样就可统计落入各体积的样本数KN 选择窗函数f u 利用概率密度函数公式进行统计计算数轴上各点的密度对所有的点求和用图形表示概率密度曲面一维为曲线如果自行按某种概率密度产生的随机数则可将计算得到的曲面线与其进行比较以验证Parzen窗法的正确性 3 kN近邻法Parzen窗存在问题体积V的选择V1的选择很敏感太小大部分是空的噪声大太大估计值平坦不能反映总体分布变化 kN近邻法体积不是样本的函数而是kN的函数先确定kN 然后以x点为中心让体积不断扩大直到捕获到kN个样本为止这些样本称为x的kN个近邻如果点x附近密度愈高则体积愈小分辨率高反之体积愈大 kN近邻估计公式估计的pN x 收敛于真实概率密度p x 的充分必要条件 kN可取为N的某个函数如k1 0选择k1 使kN 1 这种方法同样要求样本数量要大一维要几百个样本二维要几千个样本例条件同上例用kN近邻法 p x 是均值为0方差为1的正态分布生成样本xi p x 是二个均匀分布的混合密度生成样本xi设N 1 16 256 kN 1 4 16 估计结果为左图所示计算步骤与Parzen窗法类似其他 4近邻法 kN近邻法是利用样本进行概率密度函数的估计现在讨论的是直接利用样本根据距离分类近邻法在设计阶段已根据训练集样本在特征空间划分了边界计算待识别样本点x到周围近邻的距离将x归入最近邻中样本所属的那个类最近邻法k 近邻法此法属非参数法无需估计概率密度有近邻法线性判别函数和聚类非监督学习法两种近邻法 1 最近邻法决策规则设有c个类别每类有标明类别的Ni个样本 i 1 2 c wi类的判别函数和决策规则比较未知样本x与个已知类别样本xik间的欧氏距离将x归入离它最近的那个样本类最近邻法错误率的分析训练集样本数有限有时多一个或少一个对分类结果影响较大例如图中有A类和B类 O代表待分样本用欧氏距离测量 O的近邻为A3 分在A类若将A3拿开 O就分在B类说明最近邻法错误率有偶然性样本越多偶然性减少因此用训练样本数增到极大来评价性能用到渐近概念分析错误率设N个样本下的平均错误概率为PN e 且样本x的最近邻为x 则可证明下述关系根据第二章贝叶斯错误率P 最近邻法渐近平均错误率P的范围上下界根据最近邻法错误率的公式图中标明最近邻法错误率的上下界 Bayes错误率在0和 c 1 c之间当Bayes错误率较小时最近邻法的错误率最大为Bayes两倍一般情况下近邻法错误率在阴影区域中近邻法是一种次优法它的错误率比Bayes决策大当样本数目无限大时它的错误率P不会超过Bayes错误率P 的2倍 P 2P P P 2 k 近邻法最近邻法的改进在待分样本x的k个近邻中按出现最多的样本类别来作为x的类别即在x的近邻中一一找出它们的类别进行判别方法首先规定k的大小找出待分样本x的k个近邻看这k个近邻中多数属于哪一类就将x归为这一类 x附近的n个样本中来自w1类的有n1个设近邻有k1 来自w2类的有n2个近邻有k2个来自wc类的有nc个近邻有kc个判别函数 gi x ki i 1 2 c决策规则例图中设定k 5 用欧氏距离度量X到这三类的距离得到 k1 4 k2 1 k3 0 根据判别规则X为w1类最近邻法是k近邻法的特例 k 1 k近邻法克服了最近邻法的偶然性增加了可靠性两种近邻法的比较图例用欧氏距离度量最近邻法待分类样本X属于A k近邻法 k 8 A类k1 3 B类k2 5 X属于B 直观上X划分到B合理 k 近邻法错误率在两类情况下 k为奇数时避免出现k1 k2的情况两类问题的k 近邻法的错误率下界为P 上界为Ck P 其中Ck是大于的关于的P 函数并随着k增加而减小可得图中为具有不同k值时k 近邻法错误率的上下界

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

概率密度估计及近邻法.ppt

文档简介

温馨提示

最新文档

评论

概率密度估计及近邻法.ppt

文档简介

温馨提示

最新文档

评论

相关文档