非参数判别分类方法1课件_第1页
非参数判别分类方法1课件_第2页
非参数判别分类方法1课件_第3页
非参数判别分类方法1课件_第4页
非参数判别分类方法1课件_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章非参数判别分类方法非参数判别分类方法是当前模式识别中主要使用的方法,并且涉及到人工神经元网络与统计学习理论等多方面,是本门课最核心的章节之一。学习指南非参数判别分类方法的核心是由训练样本集提供的信息直接确定决策域的划分方法。

本章最重要的概念是分类器设计用一种训练与学习的过程来实现。机器自动识别事物的能力通过训练学习过程来实现,其性能通过学习过程来提高,这是模式识别、人工神经元网络中最核心的内容。4/2/20231学习这一章要进一步体会模式识别中确定准则函数并实现优化的计算框架。由于决策域的分界面是用数学式子来描述的,如线性函数,或各种非线性函数等。因此确定分界面方程包括选择函数类型与确定最佳参数两个部分。一般说来选择函数类型是由设计者确定的,但其参数的确定则是通过一个学习过程来实现的,是一个叠代实现优化的过程。因此本章从最简单的函数类型讲起,再扩展到非线性函数。4/2/20232中国矿业大学计算机科学与技术学院数学是模式识别中不可缺少的工具,希望大家学习时,遇到的数学方面的内容要通过再学习、复习等进一步掌握,如线性代数、矩阵的特征值分解与特征向量等概念的运用上起到很重要的作用。通过这门课学习,加深对这些数学工具的理解与运用熟练程度是会终身受益的。对于数学推导理解程度的要求,对增强同学分析问题解决问题的能力有好处。4/2/20233中国矿业大学计算机科学与技术学院本章重点1、非参数判别分类器的基本原理,与参数判别分类方法的比较。2、线性分类器的三种典型方法——以Fisher准则为代表的传统模式识别方法,以感知准则函数为代表的机器自学习方法,以及支持向量机代表的统计学习理论。3、近邻法的工作原理及其改进。4、线性分类器扩展到非线性分类器,两类别分类方法与多类别分类方法。4/2/20235中国矿业大学计算机科学与技术学院1、Fisher准则函数,其中用到向量点积,带约束条件的拉格朗日乘子法以及矩阵的特征值、特征向量等数学工具。要求对这些数学工具较深理解。2、感知器准则函数提出利用错误提供信息实现叠代修正的学习原理。3、支持向量机方法设计约束条件为不等式的极值优化问题。本章难点4、三种不同典型方法的优缺点比较。5、近邻法的改进。4/2/20236中国矿业大学计算机科学与技术学院1、机器能否像人类一样通过例证教育认知事物,修正观念中的错误的成分?2、机器学习过程中有教师吗?谁是教师?3、什么叫线性分类器?按照基于最小错误率贝叶斯决策,什么条件下才能用线性分类器?课前思考题4/2/20237中国矿业大学计算机科学与技术学院非参数判别分类方法的两个过程设计者确定使用什么典型的分类决策方法利用训练样本集提供的信息确定这些函数中的参数4/2/20239中国矿业大学计算机科学与技术学院线性判别函数的一般形式3.1.1线性判别函数的基本概念其中w

0是个常数,称为阈值权,x是维特征向量,w称为权向量,分别表示为:4/2/202310中国矿业大学计算机科学与技术学院在线性判别函数条件下它对应d维空间的一个超平面。相应的决策规则决策面方程4/2/202311中国矿业大学计算机科学与技术学院向量W的意义4/2/202313中国矿业大学计算机科学与技术学院3.1.2广义线性判别函数线性判别函数是形式最为简单的判别函数,但是它不能用于稍复杂一些的情况,例如,欲设计这样一个一维样本的分类器,使其性能为:相应的决策规则为:设计一判别函数:4/2/202314中国矿业大学计算机科学与技术学院广义线性判别函数基本思想:g(X)不再是x的线性函数,而是一个二次函数,此时通过选择一种映射X→Y,即将原样本特征向量X映射成另一向量Y,从而把二次函数转换成线性函数。

4/2/202315中国矿业大学计算机科学与技术学院其中写成另一种形式Y为增广样本向量,a为增广权向量。4/2/202317中国矿业大学计算机科学与技术学院例:一个一维特征空间的分类器其决策面方程为:在一维空间中为一个点,经齐次简化后可得:4/2/202318中国矿业大学计算机科学与技术学院思考如果在两维空间存在一条不过原点的直线采用增广向量形式:问题:在增加一维的三维空间中,aTY=0表示的是什么呢?答:一个过原点的平面,方程为ay1+by2+cy3=04/2/202319中国矿业大学计算机科学与技术学院3.1.3设计线性分类器的主要步骤(1)按需要确定一准则函数J。(2)确定准则函数J达到极值时W*,w0

*和a*的具体数值,从而确定判别函数,完成分类器设计。得到线性判别函数:这种方法的具体过程可大致分为:4/2/202321中国矿业大学计算机科学与技术学院3.2Fisher线性判别Fisher线性判别函数是研究线性判别函数中最有影响的方法之一。对线性判别函数的研究就是从R.A.Fisher在1936年发表的论文开始的。4/2/202322中国矿业大学计算机科学与技术学院1.Fisher准则函数基本思想设计线性分类器首先要确定准则函数,然后再利用训练样本集确定该分类器的参数,以求使所确定的准则达到最佳。

在使用线性分类器时,样本的分类由其判别函数值决定,而每个样本的判别函数值是其各分量的线性加权和再加上一阈值w0。如果向量W的幅度为单位长度,则线性加权和又可看作各样本向量在向量W上的投影。显然样本集中向量投影的分布情况与所选择的W向量有关。

4/2/202323中国矿业大学计算机科学与技术学院样本在d维X空间的一些描述量(1)各类样本均值向量(2)样本类内离散度矩阵与总类内离散度矩阵

(3)样本类间离散度矩阵4/2/202325中国矿业大学计算机科学与技术学院样本在一维Y空间的一些描述量(1)各类样本均值(2)样本类内离散度矩阵与总类内离散度矩阵

4/2/202326中国矿业大学计算机科学与技术学院2.最佳W值的确定最佳W值的确定实际上就是对准则函数求取其取极大值时的W*

设计一拉格朗日函数:其中λ为拉格朗日乘子,按拉格朗日算法对上式求对W的偏导数,且令其在W=W*时为零,得:4/2/202329中国矿业大学计算机科学与技术学院实际上我们关心的只是向量W*的方向,其数值大小对分类器没有影响。因此在忽略了数值因子R/λ后,可得:矩阵非奇异即该矩阵可逆,上式是典型的求矩阵特征值问题。其中

是一个数量,可用数值R表示,则上式可写成:4/2/202330中国矿业大学计算机科学与技术学院最佳法线向量使Fisher准则函数达极大值的解,也就是按Fisher准则将d维X空间投影到一维Y空间的最佳投影方向,该向量W*的各分量值是对原d维特征向量求加权和的权值。该式与在两类正态分布且具有相同的协方差矩阵Σ时,按

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论