理学模式识别与神经网络_第1页
理学模式识别与神经网络_第2页
理学模式识别与神经网络_第3页
理学模式识别与神经网络_第4页
理学模式识别与神经网络_第5页
已阅读5页,还剩86页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

理学模式识别与神经网络第1页/共91页2023/4/182模式识别与神经网络hujing第2页/共91页2023/4/183主要内容:介绍模式识别的基本概念介绍神经网络技术在模式识别领域的发展与应用介绍神经网络如何应用于仿生模式识别研究中的。神经网络泛化能力的提高。第3页/共91页2023/4/184第一个主题--模式识别的

基本概念模式和模式识别的概念模式识别的发展简史和应用模式识别的主要方法模式识别的系统和实例?第4页/共91页2023/4/185模式识别模式识别作为一个研究领域,迅速发展于20世纪60年代,它既是一个多领域的交叉学科,又是一个与实际问题结合非常紧密的应用学科。

第5页/共91页2023/4/186什么是模式第6页/共91页2023/4/187模式的定义广义地说,存在于时间和空间中可观察的物体,如果我们可以区别它们是否相同或是否相似,都可以称之为模式。模式所指的不是事物本身,而是从事物获得的信息,因此,模式往往表现为具有时间和空间分布的信息。模式的直观特性:可观察性可区分性相似性第7页/共91页2023/4/188模式识别的概念模式识别–直观,无所不在,“人以类聚,物以群分”周围物体的认知:桌子、椅子人的识别:张三、李四声音的辨别:汽车、火车,狗叫、人语气味的分辨:炸带鱼、红烧肉人和动物的模式识别能力是极其平常的,但对计算机来说却是非常困难的。因此模式识别的任务就是让计算机能够像人那样认识事物。第8页/共91页2023/4/189模式识别简史1929年G.Tauschek发明阅读机,能够阅读0-9的数字。30年代Fisher提出统计分类理论,奠定了统计模式识别的基础。50年代NoamChemsky提出形式语言理论——傅京荪提出句法结构模式识别。60年代L.A.Zadeh提出了模糊集理论,模糊模式识别方法得以发展和应用。80年代以Hopfield网、BP网为代表的神经网络模型导致人工神经元网络复活,并在模式识别得到较广泛的应用。90年代小样本学习理论,支持向量机也受到了很大的重视。(Vipnik.N)第9页/共91页2023/4/1810与模式识别相关的学科统计学概率论线性代数(矩阵计算)形式语言机器学习人工智能图像处理计算机视觉…第10页/共91页2023/4/1811模式识别的研究目的目的:利用计算机对物理对象进行分类,在错误概率最小的条件下,使识别的结果尽量与客观物体相符合。Y=F(X)X的定义域取自特征集Y的值域为类别的标号集F是模式识别的判别方法第11页/共91页2023/4/1812模式识别的应用(举例)生物学自动细胞学、染色体特性研究、遗传研究天文学天文望远镜图像分析、自动光谱学经济学股票交易预测、企业行为分析医学心电图分析、脑电图分析、医学图像分析第12页/共91页2023/4/1813模式识别的应用(举例)工程产品缺陷检测、特征识别、语音识别、自动导航系统、污染分析军事航空摄像分析、雷达和声纳信号检测和分类、自动目标识别安全指纹识别、人脸识别、监视和报警系统第13页/共91页2023/4/1814模式识别的方法模式识别系统的目标:在特征空间和解释空间之间找到一种映射关系,这种映射也称之为假说。特征空间:从模式得到的对分类有用的度量、属性或基元构成的空间。解释空间:将c个类别表示为 其中为所属类别的集合,称为解释空间。第14页/共91页2023/4/1815假说的两种获得方法监督学习、概念驱动或归纳假说:在特征空间中找到一个与解释空间的结构相对应的假说。在给定模式下假定一个解决方案,任何在训练集中接近目标的假说也都必须在“未知”的样本上得到近似的结果。依靠已知所属类别的的训练样本集,按它们特征向量的分布来确定假说(通常为一个判别函数),只有在判别函数确定之后才能用它对未知的模式进行分类;对分类的模式要有足够的先验知识,通常需要采集足够数量的具有典型性的样本进行训练。第15页/共91页2023/4/1816假说的两种获得方法(续)非监督学习、数据驱动或演绎假说:在解释空间中找到一个与特征空间的结构相对应的假说。这种方法试图找到一种只以特征空间中的相似关系为基础的有效假说。在没有先验知识的情况下,通常采用聚类分析方法,基于“物以类聚”的观点,用数学方法分析各特征向量之间的距离及分散情况;如果特征向量集聚集若干个群,可按群间距离远近把它们划分成类;这种按各类之间的亲疏程度的划分,若事先能知道应划分成几类,则可获得更好的分类结果。第16页/共91页2023/4/1817模式分类的主要方法数据聚类统计分类结构模式识别神经网络第17页/共91页2023/4/1818数据聚类目标:用某种相似性度量的方法将原始数据组织成有意义的和有用的各种数据集。是一种非监督学习的方法,解决方案是数据驱动的。第18页/共91页2023/4/1819统计分类基于概率统计模型得到各类别的特征向量的分布,以取得分类的方法。特征向量分布的获得是基于一个类别已知的训练样本集。是一种监督分类的方法,分类器是概念驱动的。第19页/共91页2023/4/1820结构模式识别该方法通过考虑识别对象的各部分之间的联系来达到识别分类的目的。识别采用结构匹配的形式,通过计算一个匹配程度值(matchingscore)来评估一个未知的对象或未知对象某些部分与某种典型模式的关系如何。当成功地制定出了一组可以描述对象部分之间关系的规则后,可以应用一种特殊的结构模式识别方法–句法模式识别,来检查一个模式基元的序列是否遵守某种规则,即句法规则或语法。第20页/共91页2023/4/1821神经网络神经网络是受人脑组织的生理学启发而创立的。由一系列互相联系的、相同的单元(神经元)组成。相互间的联系可以在不同的神经元之间传递增强或抑制信号。增强或抑制是通过调整神经元相互间联系的权重系数来(weight)实现。神经网络可以实现监督和非监督学习条件下的分类。第21页/共91页2023/4/1822模式识别系统模式识别系统的基本构成数据获取特征提取和选择预处理分类决策分类器设计第22页/共91页2023/4/1823模式识别系统组成单元数据获取:用计算机可以运算的符号来表示所研究的对象二维图像:文字、指纹、地图、照片等一维波形:脑电图、心电图、季节震动波形等物理参量和逻辑值:体温、化验数据、参量正常与否的描述预处理单元:去噪声,提取有用信息,并对输入测量仪器或其它因素所造成的退化现象进行复原第23页/共91页2023/4/1824模式识别系统组成单元特征提取和选择:对原始数据进行变换,得到最能反映分类本质的特征测量空间:原始数据组成的空间特征空间:分类识别赖以进行的空间模式表示:维数较高的测量空间->维数较低的特征空间分类决策:在特征空间中用模式识别方法把被识别对象归为某一类别基本做法:在样本训练集基础上确定某个判决规则,使得按这种规则对被识别对象进行分类所造成的错误识别率最小或引起的损失最小第24页/共91页2023/4/1825模式识别过程实例在传送带上用光学传感器件对鱼按品种分类 鲈鱼(Seabass)

品种 鲑鱼(Salmon)第25页/共91页2023/4/1826识别过程数据获取:架设一个摄像机,采集一些样本图像,获取样本数据预处理:去噪声,用一个分割操作把鱼和鱼之间以及鱼和背景之间分开第26页/共91页2023/4/1827识别过程特征提取和选择:对单个鱼的信息进行特征选择,从而通过测量某些特征来减少信息量长度亮度宽度鱼翅的数量和形状嘴的位置,等等…分类决策:把特征送入决策分类器第27页/共91页2023/4/1828实例第28页/共91页2023/4/1829第29页/共91页2023/4/1830第30页/共91页2023/4/1831第31页/共91页2023/4/1832训练和测试训练集:是一个已知样本集,在监督学习方法中,用它来开发出模式分类器。测试集:在设计识别和分类系统时没有用过的独立样本集。系统评价原则:为了更好地对模式识别系统性能进行评价,必须使用一组独立于训练集的测试集对系统进行测试。第32页/共91页2023/4/1833第二个主题

神经网络在模式识别领域中的应用神经网络技术,因其优异的分类能力而被广泛地应用于各种模式识别系统中,为模式识别系统的迅猛发展起到了极大的推动作用。

第33页/共91页2023/4/1834神经网络在模式识别领域应用的优势以与统计模式识别相比较为例。第34页/共91页2023/4/1835统计模式识别第35页/共91页2023/4/1836统计模式识别的不足参数估计法--在参数估计法中错误的估计了分布的形式。非参数估计法--数据点较为稀疏而导致较差的核函数密度估计。线性判别法可以避免上述问题,不再需要对类条件的概率密度函数进行估计或是对样本的分布十分清晰。但是假定决策面为线性的前提下展开讨论的,非线性情况不太好。

第36页/共91页2023/4/1837神经网络用于分类的优势1:神经网络是数据驱动的自适应模型,它们根据数据自适应的调整自己,而无需对数据的分布以及数据的模型十分了解。2:神经网络可以以某种特定精度逼近任何一个函数。3:神经网络是非线性的,这使得它们在构造现实世界中复杂关系模型时可以十分灵活。4:神经网络可以估计后验概率。有关这一点,AndrewR.webb在“多层感知器的非线性判别分析”一文中进行了分析与说明。第37页/共91页2023/4/1838神经网络发展的历史回顾1:1943年McCulloch和Pitts根据神经传输中的“0”,“1”律,第一个提出神经元模型。2:五十年代末,F.Rosenblatt设计了感知机。3:1969年,Minsky与Papert首先提出了感知器的功能有限,并首次提到了“线性可分”的概念。同时也是第一个意识到神经元模型的几何意义。4:1965年Nilsson对多层感知机进行了描述,给出了具有隐节点的广义感知机。5:1986年,Rumehart和McClelland出版了著名的PDP专著,提出了前向神经网络的概念和相应的“BP”算法。

第38页/共91页2023/4/1839用于模式识别的神经网络分类器原理神经网络是一种基于距离度量的数据分类方法,这个方法就是通过最小化输出与期望值之间的偏差来实现。第39页/共91页2023/4/1840神经元的数学模型最早的设计与改造方案。神经元是神经网络的基本处理单元,神经元的数学模型为:

第40页/共91页2023/4/1841感知器原理感知器的输出:d(x)=wx+w0假设对于一个c类分类问题,需要找到一个线性判别方法。现在假设得到一个判别单元,它的输入变量是特征,输出变量是一个线性函数,所以称之为“线性网络”。 第41页/共91页2023/4/1842线性可分的一个实例通过感知器学习准则来解决一个判别手写的U和V的两类分类问题。它们书写在一个7×8的方格里,并且图像进行了二值化处理,通过统计黑像素点的个数得到水平方向和垂直方向的投影。第42页/共91页2023/4/1843线性可分对于一个线性可分的U和V集合,感知器不断调整一个判别直到完全分开为止。第43页/共91页2023/4/1844线性不可分的实例对于线性不可分的U和V,感知器不会收敛,它将在U和V的两个聚类分解线附近振荡。第44页/共91页2023/4/1845非线性现实生活中大多数模式识别都曾现非线性特性。神经网络的非线性特性设计以满足实际应用。第45页/共91页2023/4/1846非线性特性的改进(一)--对原模型的功能函数进行修改。利用感知器,只能得到简单类型的决策面。这就构成了感知器的应用局限。改进方法--将原模型的功能函数改为非线性判别函数。使用非线性判别函数的模式分类器称作“∮工作机”;∮工作机具有如下形式:d(x)=w∮(x)+w0

可以看到判别函数不再是原始测量x的线性函数(d(x)=wx+w0),而∮是非线性函数。第46页/共91页2023/4/1847实例一:径向基函数 (RBF)“径向对称非线性基函数”的线性组合。一般可表示为:

d(x)=∑w∮(∣x–u∣/h)+w0

RBF的最显著优点是它的简单性,一旦非线性的形式和中心被确定,就可以得到一个非线性模型,而模型参数就可以很容易地由最小平方法获得,或者通过真正合适的优化方法获得。第47页/共91页2023/4/1848用RBF进行分类实例该例子是一个一维例子,从两个单变量,单位方差,均值分别为0和2的正态分布中抽取数据,并将数据表于图上。第48页/共91页2023/4/1849实例二:多层感知器多层感知器由输入层、隐节点层以及输出层组成,其中隐节点层可以为一层或多层。多层感知器中每个神经元的激励函数是可微的Sigmoid函数。

d(x)=w(x+0)

(z)=1/(1+exp(z)

第49页/共91页2023/4/1850与RBF网络的不同之处多层感知器是对非线性映射的全局逼近;而RBF网络是使用局部指数衰减的非线性函数(如高斯函数)对非线性输入输出映射进行局部映射。

第50页/共91页2023/4/1851实例三:受限库仑能量分类器

受RBF网络的启发: 用“钟形”的对称函数代替s形函数,用局部划分代替全局划分。它是一个超球分类器的典型代表。

其隐层单元的功能函数;(用“圆形”函数代替全局划分)。其中D(U,x)是输入空间的某个距离函数。这个功能函数相当于以输入x为中心,进行小领域覆盖,直到所有样本被覆盖完毕为止。

第51页/共91页2023/4/1852受限库仑能量分类器的结构

第52页/共91页2023/4/1853非线性特性的改进(二)--对神经网络的结构进行重新设计于改造。实例一:级联网实例二:高阶网第53页/共91页2023/4/1854实例一:级联网的设计与构造修剪法--首先给定一个足够大的神经网络结构(较实际需要的大小而言),然后在训练过程中动态地撤掉那些不重要的权重和神经元。增长法--从一个小的网络结构开始,逐步增加隐节点和隐层,直到网络适应给定的任务为止。

第54页/共91页2023/4/1855实例:增长形级联网整个网络由单个子网串联而成;每个子网则由工作子网和监督子网组成。

第55页/共91页2023/4/1856级联网的优势1)实现了任务的自动分解和模块化训练策略,提高了训练速度。2)在训练过程中,训练集自动减少,学习复杂度随子网的不断增加而降低。3)更适于复杂任务的分类和识别。

第56页/共91页2023/4/1857实例二:高阶网一阶网络的扩展形式,并对输入形式进行了修改。

修改方式有两种:连接函数形式与向量积形式第57页/共91页2023/4/1858(一)连接函数对输入项进行预处理-输入项并不作为网络的直接输入,而是经过连接函数的转换为第58页/共91页2023/4/1859(二)向量积高阶网最常采用的方法是利用向量积的方法获得高阶项

第59页/共91页2023/4/1860第三个主题仿生模式识别第60页/共91页2023/4/1861第61页/共91页2023/4/1862第62页/共91页2023/4/1863第63页/共91页2023/4/1864第64页/共91页2023/4/1865第65页/共91页2023/4/1866第66页/共91页2023/4/1867仿生模式识别的理论基点对这类事物全体在特征空间形成的无穷点集合的“形状”的认识--点集拓扑学第67页/共91页2023/4/1868第68页/共91页2023/4/1869第69页/共91页2023/4/1870第70页/共91页2023/4/1871第71页/共91页2023/4/1872第72页/共91页

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论