




已阅读5页,还剩60页未读, 继续免费阅读
(机械电子工程专业论文)基于神经网络的机械零件识别研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
四川大学硕士学位论文 基于神经网络的机械零件识别研究 机械电子工程专业 研究生欧彦江指导教师袁中凡 机械零件自动检测是制造业中生产系统的一个重要环节,现代制造技术在各种 批量生产以及在多品种的生产中,广泛地采用自动检测、产品识别来监控、保证产 品质量,使得加工系统运行更可靠。它从一定程度上决定了实现企业柔性制造自动 化的进程。是制造业信息化的关键环节因而,计算机视觉检测技术在机械制造企 业的产品质量检测和加工过程检测中的广泛应用具有十分重要的意义自动目标识 别( a r t ) 技术是计算机视觉的一个重要分支,是指在无人干预的条件下,通过分析 获取的图像数据对特殊物理目标的识别、定位和描述的模式识别技术。 要实现机械零件的自动检测,首先要通过指定的测量或图像采集设备获得机 械零件的图像,从而使机械零件数字化。然后对获得零件图像进行识别,得出零件 的种类。最后对零件图像进行检测本文所做的工作就是利用人工神经网络对已获 得的机械零件图像进行识别。本文的思想源头来自于对人类视觉的灵活性及鲁棒性 的考察,将人类视觉优势的根源即生物神经网络系统的人工数字模型即人工神经网 络引入图像识别领域,与常规的数字图像处理技术相结合,旨在发挥两者的优势弥 补双方的不足,寻找出一种具有较强的灵活性通用性以及鲁棒性的平面图像识别算 法。 为了实现机械零件图像的识别,本文作了如下工作: ( 1 ) 研究了图像处理方面的相关知识,研究了图像的滤波以及二值化的理论, 对比了几种图像边缘检测算于,最终决定采用中值滤波并以c a n n y 边缘检钡0 算子检 测图像边缘。 ( 2 ) 研究了图像的两种不变特征:h u 的仿射不变矩和n m i 特征,通过实验验 一一黑型噔型噔燮_一一-。_一 删忡删岬嗍棚_ 酬_ 帅圳_ _ _ 删岬_ 忡_ h _ 嘛删_ _ 种州瑚_ 删删_ 岬_ 岬秆。_ ”。1 。”一“ 。 涯,发现鼬琴变矩熬5 ,6 ,7 4 输鞭,掰 以本文选择了潦4 阶举褒镶辎n 隧特援作为本文机械零侔闺像苓燮镣糍t 份为辫经 蠲络螽 | 输入矗 ( 3 ) 分摄蠲| | :莲:较丁近年柬较瓷广泛采燕憋j 恁种爨露 ;鼗裂蠢法擎并燕簧介缁了 耱经秘络识剐法f 分耩了b p 。算法翔络模燮静建立、学习斌鲻、掰络结构设诗、阏 终谖缘以及b p 溺络算法绱改遴尊 ( 4 ) 建立了舀像谈霸埴的b p 神经网络采用了单隐禽胺,5 3 0 - 5 的喇终终鞠; 辩络激滔瞒数袋蠲i o 鲻咖蓼g 暖数,谢练冀法袋惩l e v e n b e r g 虢粼脚簿法f 渊 练甄椿为0 0 0 0 5 该嬲终封l l 练襻本的识嬲率必t 0 0 ,黠溅试样本鹩谈鬟零为 9 6 溉奇 ( 5 簸瑶慧结了本文所徽的王作,分析了实验结鬃产耋鹃原羧,菸对爨续工嚣 俸j 彗了袋望4 美键谲:爨缘处理,篌式识瓣,边缘捡测争誉变雉特程,襻缝弼络 四川大学硕士学位论文 r e s e a r c ho i lm e c h a n i c a lp a r tr e c o g n iti o n b a s e do nn e u r a ln e t w o r k m e c h a t r o n i ce n g i n e e r i n g p o s t g r a d u a t e :o ay a n j i a n g s u p e r v i s o r :p r o f y u a nz h o n g f a n m e c h a n i c a lp a r t sa u t o - t e s ti sa ni m p o r t a n ts e g m e n to fm a n u f a c t u r es y s t e m m o d e r n m a n u f a c t u r et e c h n o l o g yh a sb e e nw i d e l yu s gt h e a u t o - t e s ta n dp m d u c b r c c o g n i z e t e c h n o l o g yt oe n s u r et h eq u a l i t yo fp r o d u c ta n de v e nt om a k e m a n u f a c t u r es y s t e mr u ni n m o r er e l i a b l e i ti sak e ys e g m e n ti nt h ep r o c e s so fm a n u f a c t u r i n gi n d u s t r yi n f o r m a t i o n s ot h ec o m p u t e rv i s i o nt e s tt e c h n o l o g yh a sv e r yi m p o r t a n tu s ei nt e s to f p r o d u c t sq u a l i t y a n do fm a n u f a c t u r ep r o c e s so fm a n u f a c t u r i n gi n d u s t r y a r tt e c h n o l o g yi sa ni m p o r t a n t b r a n c ho f c o m p u t e rv i s i o n , a n di st h ep a t t e r nr e c o g n i t i o nt e c h n o l o g yw h i c hc a nr e c o 粤l i z e , l o c a t i o na n dd e s c r i b et h es p e c i a lp h y s i c a lt a r g e tt h r o u 曲a n a l y z i i l gt h ei m a g e sd a t a i fw ew a n tt or e a l i z et h ea u t o - t e s to fm e c h a n i c a lp a r t , f i s to fa l l ,w es h o u l dg e tt h e i n l a g eo fp a r tt h r o u g h c e r t a i nt e s t i n ga n dc o l l e c t i n ge q u i p m e m , a n dm a k et h e p a r t d i g i 妇a n dt h e nw ec a ng e tt h et y p eo f p a r tb yp a t t e r nr e c o g n i t i o n a tl a s t , w et e s tt h e p a r tb yi m a g e t h ew o r k o f t h i sp a p e ri st or e c o g n i z et h ei m a g eo f p a r tb yn e u r a ln e t w o r k t h ei d e aa b o u tt h i sp a p e rc o m e sf r o mo b s e r v a t i o nt of l e x i b i l i t ya n ds t a b i l i z a t i o nv i s i o n b e h a v i o ro fh u m a n i nt h i sp a p e r , t h ea d v a n t a g e so fh u m a nv i s i o ni si n t r o d u c e di nt h e i m a g er e c o 留a i t i n nf i e l da n dc o m b i n e dw i t hg e n e r a ld i g i t a li m a g ep r o c e s s i n gt e c h n o l o g y t om a k et h eb e s lo f t h e i ra d v a n t a g e sa n dm a k eu pt h e i rd i s a d v a n t a g e s i nt h i sw a y , w ec a n f i n daf l e x i b l e ,u n i v e r s a la n ds t a b l ea l g o r i t h mo ff l a ti m a g er e c o g n i t i o n , t or e a l i z et h ep a r c r nr e c o g n i t i o n , t h em a i nw o r ki si i s t e df o l l o w i n g : 1 ) w bh a v es t u d i e dt h et h e o r i e sa b o u ti m a g ep r o c e s s i n g , b i n a r ym l a g e , a n di m a g ef i l t e r a n dc o n t r a s ts e v e r a le d g ed e t e c to p e r a t o r s a tl a s t ,w ed e c i d et ou s em e d - f i l t e rt o e l i m i n a t et h ei m a g e sn o i s ea n du s ct h ec a n n ye d g ed e t e c to p e r a t o rt od e t e c tt h ee d g e o fi m a g e 2 1s t u d yt h et w of i x t u r ef e a m r e so fi m a g e :h um o m e n tf e a t u r e sa n dn m if e a t u r e t h r o u g he x p e r i m e n t , w ef i n dt h a tt h es t a b i l 时o f5 , 6 ,7o r d e rm o m e n t sa r en o t a sw e l l a st h a to f1 2 3 ,4o r d e rm o m e n t s s ow eu s et h el 2 ,3 ,4o r d e rm o m a n t sa n dn m l f e a t u r ea st h ei n p u to f n e u t r a ln e t w o r k 3 1d i s c u s sa n dc o n t r a s ts e v e r a lm e t h o d so fp a t t e r nr e c o g n i t i o nw h i c hu s e dw i d e l yr e c e n t y e a r s 。a n dm a i n l yi n t r o d u c et h em e t h o do fa n i f i c i a ln e u t r a ln e t w o r k , a n a l y z et h e 婴! ! 查兰堡主兰竺堡茎 b u i l d i n g , l e a r n i n gr u l e sa n dw a i n i n go fb pn e u r a ln e t w o r k , a n dt h ei m p r o v e m e n to f a l g o r i t h mo fb pn c t w o r l 4 ) b u i l dt h eb pn e u t r a ln e t w o r kt h a tu s e df o rp a t t e r nr e e o 鲫j d o n t h i sn e t w o r kb u i l ti n 5 - 3 0 - 5s t r u c t u r e t h ea c t i v a t i o nw a n s f e rf u n c t i o no fn e t w o r ki s l o g s i g i o g s i g , a n d t r a i n i n ga l g o r i t h mi sl e v c n b c r g - m a r q u a r d ta l g o r i t h 巩t h eg o a lo ft r a i n i n gi s0 0 0 0 5 t h ep e r c e n to f r e c o g n i t i o no f t h i sn e t w o r kf o r t r a i n i n gs p e c i m e ni s1 0 0 , a n df o rt e s t s p e c i m e ni s9 6 8 5 ) a tl a s t , w es u n l l l 谢z et h ew o r kt h a th a v ed o n ei nt h i sp a p e r , a n a l y z et h er e a s o no f s o m ee l r o ti nt h ee x p e r i m e n t , a n d b r i n gf o r w a r dt h ew o r k a r e rt h i sp a p e r k e yw o r d s :i m a g ep r o c e s s i n g ,p a t t e r n r e c o g n i t i o n ,e d g ed e t e c t ,m o m e n t i n v a r i a n t s ,n e u t r a ln e t w o r k 四川大学硕士学位论文 第一章绪论 1 1 引言 视觉是人的一个非常重要的感官,它可以为人提供物体的形状,大小,位 置等具体空间位置信息,这是其他感官所不能取代的,以至于一个人在失去触 觉,嗅觉乃至听觉还可以傲很多事情,而在没有视觉的情况下将举步维艰。 从信息量的角度来看,在人类接受的感官信息中,视觉信息占6 0 ,听觉 信息占2 0 ,其它如味觉、触觉,嗅觉等加起来不过占2 0 在相同条件下, 常规的视频图像的数据量比语音的数据量大6 0 0 2 5 0 0 倍,视觉信息是人类从 外界获取信息的主要方式。 自从电子计算机技术的诞生以来,人们一直在探索如何让计算机拥有向人 类一样的视觉,在此研究过程中逐渐形成了一门前沿学科“计算机视觉”。计 算机视觉是研究采用电子计算机实现对动物视觉功能模拟的科学和技术。它的 具体研究内容足让计算机通过对数字图像分析获取图像所包含一个或多个客 体的信息,包括它的形状、位置、颜色、材质等,从而达到使计算机具有动物 相似的对图像内容理解的能力。计算机视觉是与图像处理、模式识别、计算机 图形学、人工智能、认知学、神经心理学、等多门科学有着密切的联系的,综 合性交叉科学。由于计算机视觉方向的研究可以大大扩展电子计算机所能处理 的信息的对象的范围和处理能力,所以一直以来都受到广泛的重视,是一个非 常活跃的研究领域。它的研究成果正被广泛应用于工农业检测、遥感图像分析、 医学图像处理、雷达和声纳目标识别等民用与军用领域。 1 2 图像识别的研究历史及其意义“胡b 1 图像识别技术的发展大致经历了三个阶段:文字识别、数字图像处理与识 别、物体识别。 文字识别的研究是从1 9 5 0 年前后开始的,逐年发展到文字识别,研发了许 多专用设备,例如从印刷文字到手写文字,开始是识别字母、数字和符号,应 用非常广泛,并且已经研制很多相关设备。 识别的研究也已取得了很大的进展。例如,邮政读号机就是一种专用文字 识别设备。在我国汉字汉字识别的研究也取得了很多成果。 四川大学硕七学位论文 图像处理和识别的研究,大致是从1 9 6 5 年开始的。开始人们主要是对照相技 术、光学技术的研究,而现在则是通过计算机来完成计算机图像处理不但可 以消除图像的失真,噪声,同时还可以进行图像的增强和复原,然后进行图像 的判读、解析与识别,如航空照片的解析、遥感图像的处理与识别等,其用途 之广,不胜枚举。 物体识别也就是对三维世界的感知认识。它和机器人的研究有着密切关系。 属于计算机视觉范畴,它不需要建立三维物体的模型。随着计算机、信息科学、 人工智能领域的发展,三维物体的识别己成为新的研究热点。 总之,图像识别就是对经过预处理后的图像进行特征提取,如提取图像的 边缘线及轮廓,进行区域分割等,然后根据图形的几何或纹理等特征利用模式 匹配、判别函数、决定数图匹配等识别理论对一图像进行分类,并对整个图像 作结构上的分析。 1 3 计算机视觉检测在制造系统中的应用 在现代机械制造系统中每个环节都是紧密联系的。制造系统的任何一个环 节没有及时引进先进的理论和技术而落后于时代的发展都会成为制造业发展 的障碍。检验和测试环节是制造系统的重要组成部分,如该环节与系统中其他 环节不能很好的匹配,那么系统中的信息和物流的流动都将无法顺利的实现。 随着c i m s 的推广应用企业在向柔性化自动化发展的过程中提出了对计算机辅 助质量( c a q ) 的需求。目前计算机辅助检测计划( c a i p ) 已成为c a q 系统的重要组 成部分他的核心问题是解决如何检测零件。在柔性制造系统中坐标测量机 ( c 胁) 是重要的检测手段,在制造业中得到广泛的应用。随着柔性制造系统( f m s ) 的推广,人们对检测系统的智能化柔性快速性等方面提出了更高的要求以适应 多品种小批量生产的需要。计算机视觉用于工业检测领域是最近三十年才开始 讨论的事情。但这一技术的出现为工业检测技术的发展拓展了空间。由于计算 机视觉系统可以快速获取大量的信息,且易于同设计信息和加工控制信息集成 。用于工况检测现场监控的计算机视觉系统已广泛的应用在工业商业等领域。 计算机视觉作为一种检测手段,已经越来越引起人们的重视,逐步形成一种新 的检测技术计算机视觉检测( a u t o m a t e dv i s u a li n s p e c t i o n ,a v i ) 技术。a v i 是 2 四川大学硕士学位论文 一种以计算机视觉方法为基础综合运用图像处理测量及模式识别等技术的非 接触检测方法原理是对计算机视觉系统得到的被测目标图像作分析,从而得 到所需测量信息。并根据已有的先验知识判别被测目标是否规范( 即合格或不 合格) 。与传统的机械电子或光学仪器相比它具有以下的优越性: 1 、更好的柔性。基于计算机视觉技术的检测手段对被检测工件和过程有 很强的适应能力,只有柔性加工环节而没有柔性检测环节的柔性制造系统( f m s ) 是不完善的。 2 ,具有良好的接口能力。可以很容易的将其集成n f m s 或c i m s 系统中去。 3 、图像采集中获得的信息量。一幅5 1 2 x 5 1 2 8 的灰度图像中包含了2 5 6 k 字节的信息,这是传统的机械电子与光学仪器无法与之相比的 4 、在尽可能大的程度上消除了主观因素对于检测结果的影响使得不同检 测结果之间具有良好的可比性。 5 、更高的检测效率。 研究视觉检测技术在机械工件检测中的应用,对现代柔性机械制造系统的 发展和推广有很现实的意义。计算机视觉检测按其所处理的图像数据类型可分 为二值图像、灰度图像、彩色图像和深度图像的视觉检测。大部分零件视觉检 测系统采用二值图像数据格式,其图像精度要求不高,可减少检测所需的数据 量,有助于满足系统速度和成本要求。 1 4 机械零件图像识别问题 一般认为,机械零件是组成能独立完成某项功能的机器组成单元,按照概念 外延可以分为两种:一种是狭义的机械零件,其机器或其部件中不可再分割的 组成单元:另一种是广义的机械零件,即机械中单独存在的实体或具有独立功 能的实体,它不仅包括机器或其部件中不可再分的组成单元,也包括具有独立 功能的部件或组件。也就是说小到一个简单的螺帽,大到一台机器都可以叫零 件。 ( 1 ) 机械零件的参数特征分析 机械零件需要检测的参数很多,这些参数可以分为两大类。一是物理参数, 如硬度、弹性、重量、力、力矩、速度、刚度和温度等:另一类是几何参数。 四川大学顾士- 学位论文 计算机视觉检测主要研究的是机械零件的几何参数。 根据工程测量的过程,常用需要检测的几何参数有下列几种:机械零 部件的尺寸:机械零件的形状特征:机械零部件表面相互位置:机械零件 的表面粗糙度:机械零件的表面缺陷等 对于某些物理参数的测量,如硬度、弹性以及重量等等,也可以转化为几 何参数进行自动检测。 不同的几何参数,有不同的检测方法。根据检测时所表现出来的特征,可 以归纳为下列几种类型: 尺寸检测:形状公差检测:位置公差检测:跳动公差:零件表面 粗糙度、表面缺陷等。 在利用视觉检测机械零件尺寸过程中,应该根据不同的测量目的确定不同 的检测方法。尤其在设计视觉检测方法时,应该首先确定需要检测的几何参数, 根据该参数设计选择检测的方式。 对于尺寸的检测来讲,针对不同的检测目标和被检测物体在投影面中的投 影,分析相应的关系,进行相应的转换。 在实际检测的过程中,应该根据具体的情况具体分析,做不同的转换测量, 从而简化测量的难度和复杂程度。 , ( 2 ) 机械零件的特征参数的提取 目标提取o 从边缘检测获得的待测零件边缘数据点集合中,进行目标提取、几何特 征参数的提取和符号化环节的设计,在计算机视觉检测系统中具有至关重要 的意义 从二维视觉系统的输入图像中提取目标的方法有两类:二值化的方法和 边缘检测的方法。一般来说,二值化方法简单,计算量相对较小,在提取速 度上占优势。但不足之处在于精度没有保证,且抗干扰的能力也比较差。所 以,二值化的方法比较适合那些对几何尺寸的精度要求不高、原始图像质量 较好、但是实时性要求较高的场合。边缘检测的方法内涵十分丰富,计算精 度高、抗噪声能力强,在许多应用场合都有较好的表现,虽然计算星相对较 大,但随着计算机技术的飞速发展,这个问题已经不太重要了。 4 四川大学硕十学位论文 几何特征参数的提取。町 一般的,对由多个几何特征组成的零件轮廓属性的测量都可以通过对多 个几何特征的检测得到。如对直线长度的测量,实际上是求构成该直线的线 段长度。对于顶角的测量实际上是求构成角度的两条直线之间的夹角,因此, 求出两直线方程后,即可计算他们的夹角。 为了保证识别的正确率和节省系统资源,必须提高检测的目标所采用的 特征参数的“质量”,即能用最少的特征参数表达尽可能多的目标。因此几 何特征参数的提取和符号化环节的作用是非常重要的:一方面要把来自目标 提取环节的具体边缘图像转化成计算机可以识别和理解的抽象数据,同时还 得完成压缩数据量的任务。该过程的实现难度直接取决于对视觉系统功能的 要求 一般来说,直线、圆、椭圆是构成零件几何元素的基本特征,但曲线也 是构成机械零件的一个重要的要素。系统对于各个几何元素的测量基本上都 可以归结到对直线和圆、椭圆的测量,即对直线和圆参数的提取。 1 5 采用神经网络方法的可行性 对于真实世界的图像识别的研究,面临着下面几个问题: ( 1 ) 大数据量的图像,一般来说,要取得较高的识别精度,原始图像应具有 较高的分辨率,至少应大于6 4x6 4 : ( 2 ) 位移、旋转、尺度变化、扭曲不变性,和人类视觉系统一样,目标和传 感器之间存在有位置的变化,因此,要求系统在目标产生位移、旋转、尺度变 化、扭曲时,仍能够正确识别目标: ( 3 ) 图像污损,由于目标环境的干扰、传感器的误差、噪声、背景干扰、变 形等会污损图像: ( 4 ) 实时性,在工业生产的应用中,大都要求系统能够实时地识别目标,这 就要求系统有较快的处理速度和识别速度。 当前国内的研究现状主要有: 华北电力大学的魏钰提出了一种基于数字图像轮廓特征的机械零件自动有效识 别的系统。提出了标记轮廓曲线变化的特征,且该形状描述子即具有平移、旋转和尺 四川大学硕士学位论史 度不变性。利用工业摄像镜头代替目视作为一个传感器。经过光电转换、图像采样、 图像处理、图像分析识别等一系列的操作,就可以达到机械零件识别的目的。 浙江工业大学的姜庆胜在研究了近几年来计算机视觉在机械零件曲线检测技术 发展状况的基础上,结合现代先进制造技术的要求,在研究分析机械零件的基本构成元 素点、直线、圆和椭圆的检测与识别基础上。迸一步研究了机械零件平面曲线的 检测与识别从而实现了对含有曲线的较复杂机械零件的检测与识别得出了些适合 应用于工程实际的软件、硬件技术。 上海交通大学的黄红艳、杨煌普研究了基于高阶神经网络的机械零件形状 识别,提出一种机械零件在线自动检测的形状识别系统。该系统以零件各边的 长度,角度,圆心角和与邻边夹角4 个特征来表示零件的形状,并采用高阶神 经网络,实现了零件的平移,尺度和旋转小变性识别。 清华大学的王涛、刘文印、孙家广等利用基于曲线多边形近似的连续傅立 叶变换方法计算傅立叶描述子,并通过形状的主方向消除边界起始点相位影响 的方法,定义了新的具有旋转、平移和尺度小变的归一化傅立叶描述子来进行 形状识别。 结合上述研究结果,并考虑到机械零件识别的具体情况,本文准备将人工 神经网络应用于机械零件目标识别系统中用来解决利用传统的统计模式识别 方法与模板匹配方法难以解决的目标识别问题。人工神经网络因为其分布式信 息存储和大规模自适应并行处理满足了对大数据量目标图像的实时处理要求, 其高度容错性又容许许多目标图像出现背景模糊和局部残缺。 迄今为止开发的3 0 余种神经网络模型都是针对于某种特定用途的。在这些 模型中,b p 网络足发展最为成熟,应用也最为广泛的一种模型。因此我们将采 用b p 网络来识别机械产品图像。 1 6 本课题主要研究内容 本文的工作是对机械产品图像进行识别。文中提取图像的矩特征,并通过 建立b p 神经网络来进行识别。图像识别过程分为3 步:图像处理、特征提取、 模式识别。 本文的研究内容及结构如下: 6 四川大学硕士学位论文 第一章介绍了图像识别的研究历史以及其意义、机械零件图像识别问题, 并简单阐述了采用神经网络进行图像识别的可行性。 第二章介绍了图像识别的基本理论与图像处理方法,包括图像的噪声消 除、图像的锐化、图像边缘检测、图像二值化以及图像的特征提取的相关概念。 第三章介绍了人工神经网络的基本概念、基本结构,并着重介绍了b p 神 经网络的结构、相关算法以及b p 网络的特点。 第四章讨论了利用神经网络实现机械产品图像的识别的方法首先是对产 品图像进行处理,包括对图像的锐化、边缘检测、二值化等处理并通过实验 进行讨论比较,选定了适合的矩特征;同时依据神经网络的原理及实验结果确 定了b p 神经网络的结构,并对目标图像进行测试,得出测试结果 第五章结束语,总结了本课题的主要的工作和结果,并对后续工作进行了 展望。 7 四川大学硕学位论叟 第二章图像识别理论与图像处理方法 2 1 图像识别相关理论 2 1 ,1 图像识别系统基本原理 基于图像的模式识别系统一般分为三个部分,其框图如图2 1 所示,第一 部分是图像信息的采集和获取,它相当于对被研究对象的调查和了解,从中得 到数据和信息,所以这一步的作用就是将目标图像经过摄像头和扫描仪等电子 设备转为电信号:第二部分就是对信息的加工和预处理,其作用就是将获得的 电信号信息进行加工、整理、分析,提出其中反映目标特点的本质特征,特征 的提取和特征选择对整个系统识别分类的结果有很大影响:第三部分就是识别 或分类过程,这部分功能就是将前一部分的特征向量空间映射到类型空间,也 即相当于人从感性认识上升到理性认识而作出结论的过程。第三部分与特征抽 取的方式密切相关,它的复杂程度也依赖于特征抽取的方式,例如,类似度、 相关性、最小距离等等。其中前两部分足属于图像处理范畴,第三部分为模式 识别范畴。我们也把预处理和特征提取部分称为低级处理,而判决和分类部分 称为高级处理。 图2 1 图像识别系统简单框图 针对模式特征的不同选择及判别决策方法的不同,基于图像的模式识别的 方法也是多种多样,有模板匹配识别法、统计模式识别、模糊模式识别、句法 模式识别法和神经网络模式识别等,下面将逐一简单介绍各种识别方法。 2 1 2 模式识别 模式识别是要把一种研究对象,根据其某些特征进行识别并分类。具体地, 就是从不相关的细节背景中,抽取数据的特征,根据这些特征对数据进行分类, 8 四川大学硕士学位论文 把其特征相同的数据归属同一类。 目前,模式识别的理论和方法一般分为四大类0 1 : 1 统计模式识别: 基于模式的有效特征,利用决策理论划分特征空间的方法来进行分类所使 用的特征一般都是有效的测量数值,或者是经过变换而提取的数值特征。 统计模式识别是目前应用最广的方法,是彻底理解各种模式识别过程的基 础。顾名思义,统计模式识别是用统计数学为工具解决模式识别问题。在统计 模式识别中,首先从模式中提取一些叫做特征的特征度量,然后把每一个模式 指定到某一模式类的识别是用划分特征空间的办法来实现的。所以,在统计模 式识别的前提下,模式识别要解决两个问题:第一个问题是应该从输入模式中 提取什么样的特征,即特征提取。第二个问题是根据所选择的特征度量进行分 类的问题。通常所测得的模式的特征构成一个特征空间,每个模式的特征集合 可以作为一个向量,表现为特征空间中的一个点。判决规则把特征空间分成不 相交的区域,而判决方程所表示的超平面构成判决边界模式分类的统计方法 主要有决策论方法,最近邻规则,线性判别函数。决策论的思想是由条件概率 与贝叶斯公式出发,推导出一个特定的判决规则所对应的条件风险和平均风险 表达式,然后求取对应某一模式使得平均损失最小的判决规则。最近邻规则的 主导思想是:模式空间中比较聚合在一起的模式应属于同一类别,或者它们所 属的类别至少应有相同的后验分布。线性判别函数法与上述的方法不同。判别 函数法是以判决边界的函数形式的假定为其特性的,而上述的方法都是以分布 为特性的。线性判别函数法首先决定一个合理的线性判决边界函数,然后想办 法确定函数的系数。 其大致过程如图2 2 所示。图中的上半部分是识别部分,即对未知类别的 图像进行分类:下半部分是分析部分,即对已知类别的图像样本判定出判别函 数及判别规则,使得对未知类剐的图像能够进行分类框图右下角部分是自适 应处理部分,当用训练图像样本根据某些规则判定出一些判决规则后,再对这 些训练样本逐个进行检测,观察是否有误差。这样不断改进判别规则,直到满 足要求为止。 9 四川大学硕十学位论文 图2 2 统计图像识别框图 统计图像识别部分主要由特征提取、特征选择和分类等三部分组成。 1 ) 特征提取为了将千差万别的图像进行区别和分类,需要通过一些手段,将各 类图像的重要特性用数字刻画出来,就是所谓的特征提取。 2 ) 特征选择为了更有效地利用图像的特征,有必要对特征进一步进行选择,使 其尽量设法去掉这些误差,而又保留原来特征中的信息。这往往利用原来的特 征,通过些方法,找出某些综合性指标来。 3 ) 分类就是要设计识别方案,使得对任何一个未知类别的图像,根据方案就可 以判定它属于哪一类。由于同一类图像往往可以用不同的一组数表示,因此, 可以用统计方法来设计识别方案。有时也可以用统计方法来进行特征选择。此 外,也经常用己知类别的一些图像( 样本) 来设计识别方案,使得这个方案对 原来已知类别的图像能正确地识别,或者在某种意义下使得错误判别的可能性 最小。 2 句法模式识别:依靠模式的结构信息,利用形式语言理论进行分类。 1 0 阴川大学硕学位论文 句法识别方法的思路是:分析模式的结构,把复杂的模式看成是由简单的子 模式所组成,把最简单的子模式作为基元,从基元的集合出发,按一定的构成 规则去描述较复杂的图像。基元与基元之间的连接规则称为文法。对训练模式 样本构造文法的过程为造句。识别一个模式是不是某文法规定的那一类图像, 就是分析它,看是否能从基元按该文法生成这个模式。所以句法模式识别的过 程是首先将模式分割成子模式并且选取适当的基元,然后按模式中各部分的结 构关系把该图像变换成基元表示的字链,或高维文法中基元表示的树状结构或 关系图。最后通过语法分析判决代表模式的基元字链、树或关系图是不是某一 个文法所生成的,属不属于该文法所代表的模式类别。句法模式识别的系统框 图如图2 3 所示。 3 模糊模式识别: 图2 3 句法模式识别框图 以用这个集合的特征 则x 不属于e 。在模 论“不是年老就是年 四川大学硕士学位论文 轻的问题”的问题,而是研究“取得年老的资格与标准”具体的说,用一个 取值在 0 ,1 上的一个函数f ( x ) ,由这个函数值的大小来刻划取得“年老” 的资格和程度所以,一个函数f ( x ) 就代表模糊集,而只取0 和l 两个值的 函数对应着一个古典的集合因此,模糊集是古典集合论的推广。在模糊集中, 也可以引进各种运算、关系等概念,这样形成一整套理论,并用这套理论解决 图像识别中的问题。 模糊模式识别其实就是在模式识别问题中引进模糊逻辑的方法或者思想。 模糊模式识别在统计模式识别中已经取得了较好的应用,模糊理论在图像识别 系统的应用t 主要是利用模糊理论对图像特征模糊化和模糊分类。 模糊特征其实就是根据一定的模糊化规则将图像的一个特征或者一组特征 分成多个模糊变量,使每个模糊变量能表达原特征的一部分特性,然后用这些 新的模糊特征代替原来的特征进行模式识别,虽然模糊特征相对原来的特征数 量变多了,但是可能使分类结果和特征值闻的关系线性化,从而简化了分类器 的设计,提高了分类器的性能。 模糊分类其实就是把样本空间分成若干个子集,而这些子集用模糊子集的 概念来代替,从而得到模糊分类结果,也即分类结果的模糊化。模糊分类中的 一个样本将不再属于某个特定的类别,而是以不同的可信程度属于某个类别, 这样的优点是:( 1 ) 分类结果中可以反映出分类过程中的不确定性,利用用户 根据可信程度决策:( 2 ) 如果采用多级分类,这能为下级分类提供分类信息。 分类结果模糊化通常没有固定的方法,一般结合实际情况和分类器的特性来设 计。如样本的偏离距离、神经网络的输出大小等。 目前模糊模式识别的主要方法有:最大隶属原则识别法、接近原则识别法和 模糊聚类分析法。 4 神经网络模式识别”“”: 前面所提到的统计模式识别方法和模糊模式识别方法虽然在一定程度上能 解决图像识别领域的实际问题,但是这些识别方法需要大量的计算统计,识别 速度慢,判别函数选取困难,没有自学习功能,严重影响了其在图像识别领域 的应用。随着人工神经网络技术的发展,模式识别技术也出现了一种新型的识 别方法:基于人工神经网络的模式识别方法。在一定程度上神经网络的识别方 1 2 四川大学硕士学位论文 法不同于前面提到的模板匹配法、统计模式识别法、结构模式识别法、模糊识 别法和句法模式识别,但又在一定程度上与这几种方法又有许多相似的地方 神经网络与传统的统计模式识别在很多方面是联系的,这种联系不但在于它们 都是试图从样本数据出发完成模式识别问题,更重要的是它们在方法上有一定 的等价关系。同时结合模糊算法构成的模糊神经网络与模糊模式识别方法又有 很多相似的地方。所以神经网络的模式识别并不能作为模式识别理论中不同于 统计模式识别、结构模式识别等的新的识别方法,但是由于神经网路识别方法 在实践中得到愈来愈广的应用,可以看作是传统模式识别方法的一种推广和改 进。图2 4 是神经网络图像识别系统的一般模型 图2 4 神经网络图像识别系统的一般模型 人工神经网络方法实现模式识别,可处理一些环境信息十分复杂,背景知 识不清楚,推理规则不明确的问题,允许样品有较大的缺损、畸变,神经网络 方法的缺点是其模型在不断丰富完善中,目前能识别的模式类还不够多,神经 网络方法运行速度快,自适应性能好,具有较高的分辨率。 一般神经网络模式识别系统由预处理,特征提取和神经网络分类器组成。 预处理就是将原始数据中的无用信息删除、平滑、二值化和进行幅度归一化等。 神经网络图像识别系统中的特征提取部分不一定存在,这样就分为两大类:( 1 ) 有特征提取部分的:这一类系统实际上是传统方法与神经网络方法技术的结 合,这种方法可以充分利用人的经验来获取模式特征以及神经网络分类能力来 四川i 大学硕十学位论文 识别目标图像。特征提取必须能反应整个图像的特征。但它的抗干扰能力不如 第2 类。( 2 ) 无特征提取部分的:省去特征抽取,整副图像直接作为神经网络 的输入,这种方式下,系统的神经网络结构的复杂度大大增加了,输入模式维 数的增加导致了网络规模的庞大。此外,神经网络结构需要完全自己消除模式 变形的影响。但是网络的抗干扰性能好,识别率高由于本文的被识别对象是 机械产品的图像,经实验证明,第一种方法完全可以实现识别要求,并且构建 的神经网络结构简洁,所以我们采用第一种有特征提取部分的神经网络识别方 法。 当神经网络用于分类时,首先要选择各类的样本进行训练,每类样本的个 数要近似相等。其原因在于一方面防止训练后网络对样本多的类别响应过于敏 感,而对样本数少的类别不敏感。另一方面可以大幅度提高训练速度,避免网 络陷入局部极小点。 由于神经网络不具有不变识别的能力,所以要使网络对模式旋转、伸缩具 有不变性,要尽可能选择各种可能情况的样本。例如要选择不同姿态、不同方 位、不同角度、不同背景等有代表性的样本,这样可以保证网络有较高的识别 率。 构造神经网络分类器首先要选择适当的网络结构:神经网络分类器的输入 就是图像的特征向量;神经网络分类器的输出节点应该是类别数。隐层数要选 好,每层神经元数要合适,目前有很多采用一层隐层的网络结构。然后要选择 适当的学习算法,这样才会有很好的识别效果。在学习阶段应该用大量的样木 进行训练学习,通过样本的大量学习对神经网络的各层网络的连接权值进行修 正,使其对样本有正确的识别结果,这就像人记数字一样,网络中的神经元就 像是人脑细胞,权值的改变就像是人脑细胞的相互作用的改变,神经网络在样 本学习中就像人记数字一样,学习样本时的网络权值调整就相当于人记住各个 数字的形象,网络权值就是网络记住的内容,网络学习阶段就像人由不认识数 字到认识数字反复学习过程是一样的。神经网络是按整个特征向量的整体来记 忆图像的,只要大多数特征符合曾学习过的样本就可识别为同一类别,所以当 样本存在较大噪声时神经网络分类器仍可正确识别。 1 4 网川大学硕士学位论文 2 2 图像的噪声消除 2 2 1 中值滤波1 噪声可以理解为妨碍人的视觉器官或系统传感器对所接收的图像源信息进 行理解或分析的各种因素。一般噪声是不可预测的随机信号,它只能用概率统 计的方法去认识。噪声对图像处理十分重要,它影响图像处理的输入、采集、 处理的各个环节以及输出结果的全过程。特别是图像的输入、采集的噪声是个 十分关键的问题,若输入伴有较大的噪声,必然会影响处理全过程以及输出结 果。因此一个良好的图像处理系统,不论是模拟处理还是计算机处理无不把减 少最前一级的噪声作为主攻的目标。去噪已经成为图像处理中极其重要的步 骤。 中值滤波( m e d i a nf i l t e r i n g ) 是基于排序统计理论的一种能有效抑制噪 声的非线形信号处理技术1 9 7 1 年,图基( t u k e y ) 在进行时间序列分析时提 出中值滤波器的概念,后来人们又将其引入到图像处理中这种滤波器的优点 是运算简单而且速度较快,在滤波叠加白噪声和长尾叠加噪声方面显示出了极 好的的性能。中值滤波器在滤除噪声( 尤其是脉冲噪声) 的同时能很好的保护 信号的细节信息( 例如:边缘、锐角等) 。另外,中值滤波器很容易自适应化, 从而可以进一步提高其滤波性能。常用的中值滤波器通常分为一维中值滤波器 和二维中值滤波器。“” 一个大小为n ( n 为奇数) ,对一个一维序列f 尼,f 刁的标准中值滤波器 定义为: d y , :r e e d x i 。ie z 2m e d ( x | 1 x i 。x i 。i ) 1 z( 2 - 1 式中量= ( n - 1 ) 历z 表示所有自然数的集合。而m e d ( x i ,尼,x o ) 表 示所,尼,尼r 1 个数的中值,当n 为奇数时,兄,尼,x o 的中值 就是按数值大小顺序处于中间位置的数:当n 为偶数时,此n 个数的中值定义 为两个中间数的平均值。 式( 2 - 1 ) 定义的中值滤波器也称为滑动中值滤波器或游动中值滤波器。从 上述定义可以得到一维信号的中值滤波器的工作原理:中值滤波器的移动窗口 四川大学顾士学位论文 a 的长度通常为奇数,任意时刻窗口内所有观测值按其数值大小排队,中间位 置观测值作为中值滤波器的输出值。 将一维中值滤波器理论扩展到二维信号中去,就产生了二维中值滤波器。 如果数字图像由方格上的数集,正,表示,这里f - ,取遍z7 或z2 的某子 集。那么一个具有滤波器窗口a ,其尺寸为胙f 戥十,) ( 2 k 十, 对于图像优, ( ,f ,e z2 ,的二维中值滤波器为: y l j = r e e d x m ji t r s 1 a 0 2 - 小 中值滤波器用于图像处理中是这样进行的:设置一个滤波窗口,将其移遍图像 ( 序列) 上的点,且用窗口内的各原始值的中值代替窗口中心点的值。 值图像,将我们所需的目标部分从复杂的图像背景中脱离出来,以利于我们后 ff _ :r ) = ( 2 - 3 ) fo x t 1 6 四j i i l 学硕t 学位论文 了一幅黑白二值图,阀值处理是灰度图转二值图的一种常用方法 也可以采用两个阀值,即t 1 和t 2 ,称为双固定阀值法。双固定阀值法预先 设置了两个阀值t l 和t 2 ,t i t 2 ,当对图像进行处理时,如果某个像素的灰度 值小于t l 则置0 ( 或
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年事业单位工勤技能-安徽-安徽殡葬服务工五级(初级工)历年参考题库含答案解析
- 2025年事业单位工勤技能-安徽-安徽广播电视天线工五级(初级工)历年参考题库含答案解析
- 2025年事业单位工勤技能-安徽-安徽园林绿化工四级(中级工)历年参考题库含答案解析
- STING-agonist-43-生命科学试剂-MCE
- Mathemycin-B-生命科学试剂-MCE
- 2S-6R-10R-14-Tetramethylpentadecanoyl-CoA-2S-Pristanoyl-coenzyme-A-生命科学试剂-MCE
- 市场洞察高级分析师面试题及答案解析
- Oracle数据库管理面试题库
- 广电行业人才选拔新策略:江苏有线招聘面试题及答案解析
- 研发工程师面试技巧与题目
- IFS公司产品综合介绍
- 北信源终端安全登录与文件保护系统用户使用手册
- 护理文书书写规范-课件
- 安全技术交底签字表格【范本模板】
- 工程质保期满验收报告模板
- 2023年版下肢动脉硬化闭塞症诊治指南
- 决奈达隆在心房颤动治疗中的应用培训课件
- DB21T 3164-2019 辽宁省绿色建筑施工图设计审查规程
- 工伤知识培训(工伤待遇篇)课件
- 外研版八年级下册英语 module 6 测试
- 交通运输安全管理整套教学课件
评论
0/150
提交评论