概率密度函数的非参数估计.ppt

上传人：x*** IP属地：四川上传时间：2020-03-26 格式：PPT 页数：46 大小：601KB 积分：15 举报 版权申诉

已阅读5页，还剩41页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第四章概率密度函数的非参数估计 4 1基本思想 4 1基本思想令R是包含样本点x的一个区域其体积为V 设有n个训练样本其中有k个落在区域R中则可对概率密度作出一个估计相当于用R区域内的平均性质来作为一点x的估计是一种数据的平滑有效性当n固定时 V的大小对估计的效果影响很大过大则平滑过多不够精确过小则可能导致在此区域内无样本点 k 0 此方法的有效性取决于样本数量的多少以及区域体积选择的合适收敛性构造一系列包含x的区域R1 R2 对应n 1 2 则对p x 有一系列的估计当满足下列条件时 pn x 收敛于p x 区域选定的两个途径 Parzen窗法区域体积V是样本数n的函数如 K 近邻法落在区域内的样本数k是总样本数n的函数如 Parzen窗法和K 近邻法 4 2Parzen窗方法定义窗函数 1维数据的窗函数概率密度函数的估计超立方体中的样本数概率密度估计窗函数的要求上述过程是一个内插过程样本xi距离x越近对概率密度估计的贡献越大越远贡献越小只要满足如下条件就可以作为窗函数窗函数的形式窗函数的宽度对估计的影响 hn称为窗的宽度窗函数的宽度对估计的影响识别方法保存每个类别所有的训练样本选择窗函数的形式根据训练样本数n选择窗函数的h宽度识别时利用每个类别的训练样本计算待识别样本x的类条件概率密度采用Bayes判别准则进行分类 Parzen窗的神经网络实现神经元模型简化神经元模型 Parzen窗函数的神经元表示窗函数取Gauss函数所有的样本归一化令神经元的权值等于训练样本即则有概率神经网络 PNN ProbabilisticNeuralNetwork PNN的训练算法 begininitializej 0 n 训练样本数 aji 0doj j 1normalize train wj xjifthenaji 1untilj n PNN分类算法 begininitializek 0 x 待识模式dok k 1ifaki 1thenuntilk nreturnend 径向基函数网络 RBF RadialBasisFunction RBF与PNN的差异神经元数量 PNN模式层神经元数等于训练样本数而RBF小于等于训练样本数权重 PNN模式层到类别层的连接权值恒为1 而RBF的需要训练学习方法 PNN的训练过程简单只需一步设置即可而RBF一般需要反复迭代训练径向基函数网络的训练 RBF的训练的三种方法根据经验选择每个模式层神经元的权值wi以及映射函数的宽度用最小二乘法计算模式层到类别层的权值用聚类的方法设置模式层每个神经元的权值wi以及映射函数的宽度用最小二乘法计算模式层到类别层的权值通过训练样本用误差纠正算法迭代计算各层神经元的权值以及模式层神经元的宽度 4 3近邻分类器后验概率的估计Parzen窗法估计的是每个类别的类条件概率密度而k 近邻法是直接估计每个类别的后验概率将一个体积为V的区域放到待识样本点x周围包含k个训练样本点其中ki个属于 i类总的训练样本数为n 则有 k 近邻分类器 k 近邻分类算法设置参数k 输入待识别样本x 计算x与每个训练样本的距离选取距离最小的前k个样本统计其中包含各个类别的样本数ki k 近邻分类 k 13 最近邻规则分类规则在训练样本集中寻找与待识别样本x距离最近的样本x 将x分类到x 所属的类别最近邻规则相当于k 1的k 近邻分类其分类界面可以用Voronoi网格表示 Voronoi网格距离度量距离度量应满足如下四个性质非负性自反性当且仅当对称性三角不等式常用的距离函数欧几里德距离 EucideanDistance 常用的距离函数街市距离 ManhattanDistance 常用的距离函数明氏距离 MinkowskiDistance 常用的距离函数马氏距离 MahalanobisDistance 常用的距离函数角度相似函数 AngleDistance 常用的距离函数海明距离 HammingDistance x和y为2值特征矢量 D x y 定义为x y中使得不等式成立的i的个数最近邻分类器的简化最近邻分类器计算的时间复杂度和空间复杂度都为O dn d为特征维数通常只有当样本数n非常大时分类效果才会好简化方法可以分为三种部分距离法预分类法剪辑近邻法部分距离法定义 Dr x y 是r的单调不减函数令Dmin为当前搜索到的最近邻距离当待识别样本x与某个训练样本xi的部分距离Dr x xi 大于Dmin时 Dd x xi 一定要大于Dmin 所以xi一定不是最近邻不需要继续计算Dd x xi 预分类搜索树预分类搜索树在特征空间中首先找到m个有代表性的样本点用这些点代表一部分训练样本待识别模式x首先与这些代表点计算距离找到一个最近邻然后在这个最近邻代表的样本点中寻找实际的最近邻点这种方法是一个次优的搜索算法剪辑近邻法最近邻剪辑算法begininitializej 0 D dataset n numberoftrainingsamplesconstructthefullVoronoidiagramofDdoj j 1 FindtheVoronoineighborsofXjifanyneighborisnotfromthesameclassasXjthenmarkXjuntilj nDiscardallpointsthatarenotmarkedConstructtheVoronoidiagramoftheremainingsamplesend 剪辑近邻法剪辑近邻法 RCE网络 RCE网络的训练算法 begininitializej 0 n patterns smallpattern m maxradius aij 0doj j 1trainweight wj xjifthenaji 1findnearestpointnotin i setra

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

概率密度函数的非参数估计.ppt

文档简介

温馨提示

最新文档

评论

概率密度函数的非参数估计.ppt

文档简介

温馨提示

最新文档

评论

相关文档