模式识别理论的研究与应用.doc_第1页
模式识别理论的研究与应用.doc_第2页
模式识别理论的研究与应用.doc_第3页
模式识别理论的研究与应用.doc_第4页
模式识别理论的研究与应用.doc_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

.模式识别理论的研究与应用摘要:通过对模式识别系统的简要评述, 对近年来几种基本的模式识别方法进行了总结, 并对模式识别在字符识别方面的应用原理作了介绍。字符识别技术属于模式识别的范畴,本文首先介绍模式识别的基本理论和基本方法,然后阐述了模式识别技术在光学识别技术上的应用,并将其应用到角铁字符识别系统上。实践证明,采用模式识别!能减轻人工操作的复杂性和失误。关键字:字符识别;模式识别;凹凸字符;OCR(光学字符识别);特征抽取Research and Application of Pattern Recognition TheoryAbstract: In this paper components of pattern recognition system were introduced. Several basic pattern recognition methods which were frequently utilized are summed up. Finally Chinese character recognition which is a application of pattern recognition were introduced.Character recognition technology belongs to the category of pattern recognition, this paper first introduce the basic theory and basic methods of pattern recognition, and then expounds the application of pattern recognition technology in optical recognition technology! And apply it to the Angle iron character recognition system. Practice has proved that using pattern recognition! To reduce the complexity of manual operation and failure. KeyWord: Character Recognition; Pattern Recognition;Protuberant Characters;Optical Character Recognition;Feature Extraction引言字符识别是模式识别领域的一项传统课题,其中汽车车牌及手写字体、印刷字体等的识别研究己经取得了很大的进展并且得到了广泛应用,但是对于“无色差字符”(即字符与背景的材质相同)图像的研究远不如前者多,在研究成果和应用上也就相应产生了差距。这主要是由于这种“无色差字符”是靠凸、凹字模对压形成突出或者凹进表面的字体,在光学成像时,字符的轮廓是靠其表面不同强度的反射光,而不是靠材质对光线的不同吸收程度而形成的,比较有代表性的就是角铁、轮胎、标牌等。但是提高这种“无色差字符”的识别率,在诸多行业中,例如冶金、建材等均具有重要意义。对于车牌等字符识别的研究也均有极大的参考价值。1模式识别技术的基本理论模式识别是信号处理与人工智能的一个重要分支。人工智能是专门研究用机器人模拟人的动作、感觉和思维过程与规律的一门科学,而模式识别则是利用计算机专门对物理量及其变化过程进行描述与分类,通常用来对图像、文字、相片以及声音等信息进行处理、分类和识别。它诞生于20世纪,20年代,随着40年代计算机的出现,50年代人工智能的兴起,模式识别在60年代初迅速发展为一门科学。它所研究的理论和方法在很多科学和技术领域中得到了广泛的重视与应用,推动了人工智能系统的发展,扩大了计算机应用的可能性。我们在生活中时时刻刻都在进行模式识别,如识物辨声辨味等行为均属于模式识别的范畴。模式识别技术在社会生活和科学研究的许多方面有着巨大的现实意义,己经在许多领域得到了广泛应用。 随着计算机技术和人工智能、思维科学研究的迅速发展, 模式识别技术正在向更高、更深的层次发展。计算机出现后,人们企图用计算机来实现人或动物所具备的模式识别能力。当前主要是模拟人的视觉能力、听觉能力和嗅觉能力,如现在研究比较热门的图像识别技术和语音识别技术。这些技术己被广泛应用于军事与民用工业中。模式识别的理论和方法还广泛应用于工业控制系统、地质地理、气象、化工、环境、生物医学等领域中去。1.1模式识别的基本概念 一个模式识别系统可分为四个主要部分,其框图如图一所示:图一 模式识别系统的组成通常, 把通过对具体个别事物进行观察所得到的,具有时间和空间分布的信息称为模式,而把模式所属的类别或同一类中模式的总体称为模式类。 一个模式识别系统主要由 4个部分组成: 数据获取、 预处理、 特征提取和选择、 分类决策,其基本职能就是对系统所要处理的模式究竟属于哪一类别做出判别。 把输入模式转换成适合于机器处理的形式,这就是数据获取的过程。 预处理的目的是去除噪声,加强有用的信息,并对由输入设备或其他因素造成的退化现象进行复原,以利于特征提取的进行。经过预处理后的数据维数很高,为了有效地实现分类识别, 需要对原始数据进行变换,得到最能反映原始模式本质的特征向量。把原始数据组成的空间叫做测量空间, 把分类识别赖以进行的空间叫做特征空间。 通过变换可以把在维数较高的测量空间中表示的模式变为在维数较低的特征空间中表示的模式,这就是特征的提取和选择。 一组稳定的、 具有代表性的特征, 是一个识别算法的核心, 因此,采用不同特征的识别算法尽管分类策略相同也应属于不同的算法。分类决策是在特征空间中用所设计的分类器把被识别对象归为某一类别。构造一个模式识别系统包括两个方面: 一是系统设计,二是系统的实现。首先需要从每一类别中找出能代表该类的样本, 作为训练集,利用这些样本进行分类器的设计,然后再利用设计好的分类器对输入模式进行识别。广义上说,模式(pattern)是供模仿用的完美无缺的标本,通常,把通过对具体的个别事物进行观察所得到的具有时间和空间分布的信息称之为模式;而把模式所属的类别或同一类中模式的总体称为模式类。模式识别(Pattern Recognition)是指对表征事物或现象的各种形式的(数值的、文字的和逻辑关系的)信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程,是信息科学和人工智能的重要组成部分。1.2模式识别的方法1.2.1决策理论法又称统计法,是发展较早也比较成熟的一种方法。被识别对象首先数字化,变换为适于计算机处理的数字信息。一个模式常常要用很大的信息量来表示。许多模式识别系统在数字化环节之后还进行预处理,用于除去混入的干扰信息并减少某些变形和失真。随后是进行特征抽取,即从数字化后或预处理后的输入模式中抽取一组特征。所谓特征是选定的一种度量,它对于一般的变形和失真保持不变或几乎不变,并且只含尽可能少的冗余信息。特征抽取过程将输入模式从对象空间映射到特征空间。这时,模式可用特征空间中的一个点或一个特征矢量表示。这种映射不仅压缩了信息量,而且易于分类。在决策理论方法中,特征抽取占有重要的地位,但尚无通用的理论指导,只能通过分析具体识别对象决定选取何种特征。特征抽取后可进行分类,即从特征空间再映射到决策空间。为此而引入鉴别函数,由特征矢量计算出相应于各类别的鉴别函数值,通过鉴别函数值的比较实行分类。1.2.2句法方法又称结构方法或语言学方法。其基本思想是把一个模式描述为较简单的子模式的组合,子模式又可描述为更简单的子模式的组合,最终得到一个树形的结构描述,在底层的最简单的子模式称为模式基元。在句法方法中选取基元的问题相当于在决策理论方法中选取特征的问题。通常要求所选的基元能对模式提供一个紧凑的反映其结构关系的描述,又要易于用非句法方法加以抽取。显然,基元本身不应该含有重要的结构信息。模式以一组基元和它们的组合关系来描述,称为模式描述语句。这相当于在语言中,句子和短语用词组合,词用字符组合一样。基元组合成模式的规则,由所谓语法来指定。一旦基元被鉴别,识别过程可通过句法分析进行,即分析给定的模式语句是否符合指定的语法,满足某类语法的即被分入该类。模式识别方法的选择取决于问题的性质。如果被识别的对象极为复杂,而且包含丰富的结构信息,一般采用句法方法:被识别对象不很复杂或不含明显的结构信息。一般采用决策理论方法。这两种方法不能截然分开,在句法方法中!基元本身就是用决策理论方法抽取的。在应用中,将这两种方法结合起来分别施加于不同的层次,常能收到较好的效果。1.2.3 模糊识别法模糊识别的理论基础是模糊数学。它根据人辨识事物的思维逻辑, 吸取人脑的识别特点,将计算机中常用的二值逻辑转向连续逻辑。模糊识别的结果是用被识别对象隶属于某一类别的程度即隶属度来表示的,一个对象可以在某种程度上属于某一类别, 而在另一种程度上属于另一类别。一般常规识别方法则要求一个对象只能属于某一类别。基于模糊集理论的识别方法有: 最大隶属原则识别法、择近原则识别法和模糊聚类法。1.2.4 人工神经网络识别法人工神经网络的研究起源于对生物神经系统的研究。它将若干处理单元(即神经元)通过一定的互连模型连结成一个网络,这个网络通过一定的机制(如BP网络)可以模仿人的神经系统的动作过程, 以达到识别分类的目的。人工神经网络区别于其他识别方法的最大特点是它对待识别的对象不要求有太多的分析与了解, 具有一定的智能化处理的特点。神经网络侧重于模拟和实现人认知过程中的感知觉过程、形象思维、 分布式记忆、 自学习和自组织过程, 与符号处理是一种互补的关系。 但神经网络具有大规模并行、分布式存储和处理、 自组织、 自适应和自学习的能力, 特别适用于处理需要同时考虑许多因素和条件的、 不精确和模糊的信息处理问题。1.2.5 模板匹配识别模板匹配的原理是选择已知的对象作为模板,与图像中选择的区域进行比较,从而识别目标。 模板匹配依据模板选择的不同,可以分为两类: 以某一已知目标为模板,在一幅图像中进行模板匹配,找出与模板相近的区域,从而识别图像中的物体, 如点、 线、 几何图形、 文字以及其他物体; 以一幅图像为模板, 与待处理的图像进行比较,识别物体的存在和运动情况。 模板匹配的计算量很大,相应的数据的存储量也很大,而且随着图像模板的增大,运算量和存储量以几何数增长。 如果图像和模板大到一定程度,就会导致计算机无法处理,随之也就失去了图像识别的意义。 模板匹配的另一个缺点是由于匹配的点很多,理论上最终可以达到最优解,但在实际中却很难做到。1.2.6 支持向量机的模式识别V. Vapnik提出的支持向量机(Support Vector Machine,即SVM)的基本思想是: 先在样本空间或特征空间,构造出最优超平面, 使得超平面与不同类样本集之间的距离最大,从而达到最大的泛化能力。 支持向量机结构简单,并且具有全局最优性和较好的泛化能力, 自 20 世纪 90 年代中期提出以来得到了广泛的研究。支持向量机方法是求解模式识别和函数估计问题的有效工具。SVM在数字图像处理方面的应用是:寻找图像像素之间的特征的差别,即从像素点本身的特征和周围的环境(临近的像素点)出发,寻找差异,然后将各类像素点区分出来。2模式识别技术在OCR(Optical Character Recognition)中的应用利用计算机自动识别字符的技术,是模式识别应用的一个重要领域。人们在生产和生活中,要处理大量的文字、报表和文本。为了减轻人们的劳动!,提高处理效率,50年代开始探讨一般文字识别法,并研制出光学字符识别器。60年代出现了采用磁性墨水和特殊字体的实用机器。60年代后期,出现了多种字体和手写体文字识别机,其识别精度和机器性能都基本上能满足要求,如用于信函分拣的手写体数字识别机和印刷体英文数字识别机。70年代主要研究文字识别的基本理论和研制高性能的文字识别机,并着重于汉字识别的研究。2.1文字识别系统的组成一般来说,文字识别系统主要由3个部分组成:信息采集、信息分析和处理及信息的分类判别,如图二所示。信息采集,将纸面上的文字灰度变换成电信号,输入到计算机中去。信息采集由文字识别机中的送纸机构和光电变换装置来实现,有飞点扫描$、摄像机、光敏元件和激光扫描等光电变换装置。信息分析和处理:对变换后的电信号消除各种由于印刷质量、纸质(均匀性、污点等)或书写工具等因素所造成的噪音和干扰,进行大小、偏转、浓淡、粗细等各种正规化处理。信息的分类判别:对去掉噪声并正规化后的文字信息进行分类判别,以输出识别结果。图二 文字识别系统的基本构成2.2文字识别方法文字识别方法基本上分为统计逻辑、判断和句法三大类。常用的方法有模板匹配法和几何特征抽取法。模板匹配法将输入的文字与给定的各类别标准文字(模板)进行相关匹配,计算输入文字与各模板之间的相似性程度,取相似度最大的类别作为识别结果。这种方法的缺点是当被识别类别数增加时,标准文字模板的数量也随之增加。这一方面会增加机器的存储容量,另一方面也会降低识别的正确率。所以这种方式适用于识别固定字型的印刷体文字。这种方法的优点是用整个文字进行相似度计算,所以对文字的缺损、边缘噪声等具有较强的适应能力。几何特征抽取法抽取文字的一些几何特征,如文字的端点、分叉点、凹凸部分以及水平、垂直、倾斜等各方向的线段、闭合环路等,根据这些特征的位置和相互关系进行逻辑组合判断,获得识别结果。这种识别方式由于利用结构信息,也适用于手写体文字那样变型较大的文字。3角铁字符识别系统的设计在对钢铁厂的角铁生产的需求进行了解后,本文提出在Windows XP操作系统下,采用Visual C+6.0作为开发工具,根据面向对象的编程思想,对角铁上的凹凸字符进行识别。3.1识别分拣系统如图三所示为钢铁厂拟对原生产线进行改造的示意图。在原生产线引入识别分拣系统后,可以大大提高企业的生产效率,从而实现企业对产品的信息化管理。本文的研究内容属于电脑识别部分,一方面实现对角铁上凹凸字符的识别;一方面可以实现识别后的信息管理,减轻人工操作的复杂性和失误。图三 识别分拣系统示意图3.2图像采集图像在自然形式下,并不能直接由计算机进行分析,计算机图像处理都是针对数字图像进行处理。因此,需要将一副图像从原来的形式转化为数字形式即对图像数字化(硬件实现部分通常包括摄像器件、图像采集卡、光源和镜头)。在角铁字符识别的试验阶段,采用了彩色数码相机作为图像的采集工具。数字相机的图像是由镜头产生的光学图像经过面阵CCD转换为电荷包图像,再经AD转换器。数码相机的最大特点是它以一系列的二进制数字和标准的图像存储方式把所摄图像存放在内存储器中,并可通过专用接口与计算机相连,实现图像传输和计算机处理的功能。3.3图像信息分析及处理在图像的预处理阶段,经过对角铁凹凸字符的特点进行分析,以Visual C+6.0作为开发平台。采用了多种数字图像处理方法,对角铁图像进行了处理。Visual C+6.0是Microsoft公司开发的面向Windows程序设计的一整套开发环境Visual Studio中的一种开发工具。经过Microsoft公司不断的完善,Visual C+在开发速度、程序执行效率、程序大小、与系统的继承性方面都有极大的提高。这使得它不但适合开发一般的应用软件包括数据库应用软件、底层驱动软件,而且更适合算法(图形图像、压缩等)的编程。Visual C+的继承开发环境包含了开发Windows应用程序的完整工具集:文本编辑器、资源编辑器、项目管理器、优化编辑器、继承调试器和联机帮助工具等。所有工具都可以在Visual C+工作平台上启动运行,同时又紧密地集成在一起协同工作,Visual C+的App-Wizard工具可以快速创建一个应用程序的框架,自动生成一个应用程序的源代码及资源文件。Class-Wizard是一个C+类管理工具,用于支持MFC窗口和应用程序框架类。Class-Wizard和App-Wizard的应用大大简化了Windows应用程序的开发工程。利用Microsoft基本类库MFC(Microsoft Foundation Class L

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论