




已阅读5页,还剩9页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1. 模式识别的定义:所谓模式识别是根据研究对象的特征或属性,利用以计算机为中心的机器系统运用一定的分析算法认定它的类别,系统应使分类识别的结果尽可能地符合真实。2. 模式识别系统的主要环节:1特征提取2特征选择3学习和训练4分类识别3. 特征空间和特征矢量能描述模式特性的量(测量值)。在统计模式识别方法中,通常用一个矢量 表示,称之为特征矢量,记为 4. 模式识别三大任务:模式采集:从客观世界(对象空间)到模式空间的过程称为模式采集。特征提取和特征选择:由模式空间到特征空间的变换和选择类型判别:特征空间到类型空间所作的操作。5. 聚类分析的基本思想:相似的归为一类,不相似的作为另外一类。6. 分类无效时的情况:1特征选取不当使分类无效2特征选取不足可能使不同类别的模式判为一类3特征选取过多可能无益反而有害,增加分析负担并使分析效果变差4量纲选取不当,也可使分类无效7. 距离测度(差值测试)测度基础:两个矢量矢端的距离测度数值:两矢量各相应分量之差的函数。1. 欧氏(Euclidean)距离: 2. 绝对值距离:d(x,y)=ni=1 |Xi-Yi|结论:马氏距离对一切非奇异线性变换都是不变的!8. 匹配测度:此时,若对象有此特征,则相应分量定义为1,而相应分量为0表示对象无此特征,这就是所谓的二值特征。(1) Tanimoto测度:例题:设两个矢量 x=(0,1,0,1,1,0) ,y=(0,0,1,1,0,1)可算得: xx=3,yy=3,xy=1则:(2) Rao测度(3)(4) 简单匹配系数:(5)(6) Dice系数:(7)Kulzinsky系数: 9. 基于类内,类间距离的准则函数:设待分类模式集Xi;i=1,2,.N,将它们分成c类,Wj类含nj个模式,分类后个模式记为X(j)i;j=1,2,.,c;i=1,2,nj。 例题:证明:聚类准则函数: 10. 谱系聚类法:(系统聚类法,层次聚类法)算法思想:首先将 N 个模式视作各自成为一类,然后计算类与类之间的距离,选择距离最小的一对合并成一个新类,计算在新的类别分划下各类之间的距离,再将距离最近的两类合并,直至所有模式聚成两类为止。例题:P29页。例题:给出6个样本特征矢量如下,按最小距离原则进行聚类: X1=(0,3,1,2,0) X2=(1,3,0,1,0) X3=(3,3,0,0,1) X4=(1,1,0,2,0) X5=(3,2,1,2,1) X6=(4,1,1,1,0)解答:P29页自己抄上去太长了。11. C-均值法基本思想:该方法取定 C个类别和选取 C个初始聚类中心,按最小距离原则将各模式分配到 C类中的某一类,之后不断地计算类心和调整各模式的类别,最终使各模式到其判属类别中心的距离平方之和最小。算法步奏:1) 任选C个模式特征矢量作为初始聚类中心:z1,z2,z3,。zc,令K=02) 将带分类的模式特征矢量集Xi中的模式诸葛按最小距离原则分划给c类中的某一类。3) 计算重新分类后的各类中心4) 如果Z12. 改进算法:13.该章习题答案:2.7 试用最大最小距离聚类算法对样本集X进行聚类,。 解:Step1.选第一个类心;找距离最远的样本作为第二个类心;计算;取参数q=0.3;求距离门限Step2.对剩余样本按最近原则聚类: 所有样本均已归类,故聚类结果为:,。2.8 对2.7题中的样本集X,试用C-均值算法进行聚类分析。解:取类数C=2Step1.选初始类心,第一个类心;Step2. 按最近原则聚类:由图示可知,其余样本距离较近,所以第一次聚类为:,Step3.计算类心:Step4.若类心发生变换,则返回Step2,否则结束。计算过程如下:同理可得所以第二次聚类为:,计算新的类心:同上,第三次聚类为:,各样本类别归属不变,所以类心也不变,故结束14. 线性可分:对于来自两类的一组模式X1,X2,.Xn,如果能用一个线性判别函数正确分类则称他们是线性可分的,否则成为非线性可分。15. 例题:根据结论得出X归属于W216. Fisher线性判别:Fisher判别规则为:17. 感知器算法:对初始的或迭代中的增广权矢量W,用训练模式检验它的合理性,当不合理时,对其进行校正,校正方法实际上是最优化技术中的梯度下降法。18. 最小误判概率准则判决:判决规则:如果:则等价判决规则:例题:模式分布如图所示,两类的均矢和协方差阵可用下式估计。 解: 假设判决式:4.2 设一维两类模式满足正态分布,它们的均值和方差分别为,m1=0,s1=2,m2=2,s2=2,p(x) N(m,s),窗函数P(1)= P(2),取0-1损失函数,试算出判决边界点,并绘出它们的概率密度函数曲线;试确定样本-3,-2,1,3,5各属哪一类。解:19. 参数估计有两类方法:将参数作为非随机量处理,如矩法估计、最大似然估计;将参数作为随机变量,贝叶斯估计就属此类。例题5.120. 一、 设总体分布密度为, , 并设,分别用最大似然估计和贝叶斯估计计算,已知的先验分布。21. 解:根据贝叶斯公式:1- NN法的误判概率思想:(这个不太肯定,太复杂了。Y的要人命啊)22. 剪辑最近邻法:思想:清理两类的辩解,去掉类别混杂的样本,使两类边界更清晰。23. 特征提取与选择的基本任务是研究如何从众多特征中秋出那些对分类识别最具有效的特征,从而实现特征空间维数的压缩。24. 类别可分性判据:(1) 与误判概率(或误分概率的上界、下界)有单调关系。(2) 当特征相互独立时,判据有可加性,即 :(3)
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025-2030肉牛养殖散户退出机制与产业整合策略报告
- 2025-2030肉牛产业技术推广体系重构与农技服务创新研究
- 2025-2030羊肉行业产能过剩预警与去库存方案报告
- 2025-2030精神健康服务需求激增及数字化诊疗手段与保险支付创新报告
- 2025-2030第三代功率半导体器件可靠性测试标准与车规认证研究报告
- 广告摊位设计装修方案(3篇)
- LDA和SICAS模型在抖音电商营销策略中的应用研究
- 砂岩岩性自动识别的高新技术:高光谱与支持向量机技术
- 体育教学篮球投篮技巧实践指南
- 融媒体环境下高校网络舆情防控机制构建与实证
- 贵阳市殡仪服务中心招聘考试真题2024
- 中学藏文散文教学课件大纲
- 第4课《乡愁》课件-2025-2026学年统编版语文九年级上册
- 兵役法教学课件
- 第六届山东省无人机技术与应用职业技能竞赛(无人机测绘操控员)题库(含答案)
- 第1章三角形单元测试2025-2026学年苏科版八年级数学上册
- 2025-2026学年人教版小学数学四年级上册教学计划及进度表
- 高中语文课本中的作文素材(选必上)
- 2025年中医确有专长考试题库(附答案)
- 2025年秋季学期(统编版)二年级上册语文教学工作计划及教学进度表
- 2025年小学会计入职考试题库
评论
0/150
提交评论