(计算机软件与理论专业论文)玻璃缺陷识别.pdf_第1页
(计算机软件与理论专业论文)玻璃缺陷识别.pdf_第2页
(计算机软件与理论专业论文)玻璃缺陷识别.pdf_第3页
(计算机软件与理论专业论文)玻璃缺陷识别.pdf_第4页
(计算机软件与理论专业论文)玻璃缺陷识别.pdf_第5页
已阅读5页,还剩59页未读 继续免费阅读

(计算机软件与理论专业论文)玻璃缺陷识别.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要图象模式识别是一个非常活跃的研究方向,玻璃缺陷识别是模式识别的一个重要应用领域。玻璃缺陷识别主要包括两个方面的工作:玻璃缺陷的特征提取;玻璃缺陷的分类识别。本文在玻璃缺陷识别的这两个主要环节上均进行了研究工作。矩特征方法是玻璃缺陷识别领域中新采用的特征提取方法,也是目前该领域的主流方法,但缺乏识别率数据的报道。本文从矩特征提取方法的实验研究开始,主要工作体现在以下几个方面:1 提出了基于小波分析系数提取玻璃缺陷特征的方法,直接利用小波系数作为特征进行了分析。小波分析的多尺度分解特性既能反映原始图像的局部信息又能反映其全局信息,且消除了噪声,实现了图像的压缩。2 提出了基于小波包分析提取玻璃缺陷特征的方法,并利用小波包分解进行能量特征提取。由于小波包比普通小波具有更强的时频分辨率,使本方法能提取原始信号中更为精细的时频局域信息作为特征,更能区分不同类目标的细微差异,识别精度和分类性能得以提高。3 采用了基于改进的b p 网络的模式识别方法,该方法有效地实现了玻璃缺陷的分类识别,减少了训练时间,提高了算法的效率。本文实验证明,传统的玻璃缺陷识别方法( 基于几何特征的缺陷识别法、基于模板匹配的缺陷识别法) ,平均识别率仅有6 5 署i6 8 左右,基于矩分析和b p 网络的玻璃缺陷识别方法,平均识别率达到7 9 2 。而本文引入的基于小波分析系数和b p 网络的玻璃缺陷识别方法,平均识别率达到8 6 7 ,基于小波包分析和b p 网络的玻璃缺陷识别方法,平均识别率达到8 9 2 。因此,采用本文的特征提取和分类识别方法比传统的玻璃缺陷识别方法和基于矩特征的玻璃缺陷识别方法具有更高的识别率。关键词缺陷识别,小波分析,小波包分析,矩,b p 网络a b s t r a c tt h ei m a g ep a t t e r nr e c o g n i t i o ni sa ne x t r e m e l ya c t i v er e s e a r c hd i r e c t i o n t h eg l a s sd e f e c tr e c o g n i t i o ni sa ni m p o r t a n ta p p l i c a t i o na r e ai np a r e r nr e c o g n i t i o n t h eg l a s sd e f e c tr e c o g n i t i o nm a i n l yi n c l u d e st h ef o l l o w i n gs t e p s :f e a t u r ee x t r a c t i o no ft h eg l a s sd e f e c ta n dp a t t e r nc l a s s i f i c a t i o no ft h eg l a s sd e f e c t i nt h i sa r t i c l e ,w ec a r r yo nt h er e s e a r c hw o r ki nt h e s et w ok e ys t e p s t h ea l g o r i t h mo fm o m e n tf e a t u r ei st h eu p d a t e da l g o r i t h mo ff e a t u r ee x t r a c t i o n ,i sa l s ot h ec u r r e n tm a i n s t r e a mm e t h o di nt h i sa r e a ,b u ti tl a c k st h er e p o r to fr e c o g n i t i o nr a t e b e g i n n i n go nt h er e s e a r c ha n de x p e r i m e n to fm o m e n tf e a t u r ee x t r a c t i o n ,o u rw o r kf o c u so nt h ef o l l o w i n ga s p e c t s :1 w ep r e s e n tt h ea l g o r i t h mo fw a v e l e ta n a l y s i st oe x t r a c tt h eg l a s sd e f e c tf e a t u r e sb yu s i n gw a v e l e tc o e f f i c i e n t s t h em u l t i s c a l ed e c o m p o s i n gc h a r a c t e r i s t i co fw a v e l e ta n a l y s i sc a nr e f l e c tt h el o c a la n dg l o b a li n f o r m a t i o no ft h ep r i m i t i v ei m a g e s ,a l s oc a ne l i m i n a t et h en o i s e sa n dc o m p r e s st h ei m a g e s 2 w ep r e s e n tt h ea l g o r i t h mo fw a v e l e tp a c k e ta n a l y s i st oe x t r a c tt h eg l a s sd e f e c tf e a t u r e s b yu s i n gw a v e l e tp a c k e td e c o m p o s i t i o n ,w ec a ne x t r a c tt h ee n e r g yf e a t u r e sa n dt h e ns o l v et h ef e a t u r ec l a s s i f i c a t i o nt a s k b e c a u s et h ew a v e l e tp a c k e th a ss t r o n g e rt i m e - f r e q u e n c yr e s o l u t i o nt h a nt h eo r d i n a r yw a v e l e t ,t h i sm e t h o dc a ne x t r a c tm o r es o p h i s t i c a t e dl o c a li n f o r m a t i o na n dc a nf i n dm o r es l i g h td i f f e r e n c eo ft h ed i f f e r e n tk i n do fg o a l t h er e c o g n i t i o np r e c i s i o na n dt h ec l a s s i f i e dp e r f o r m a n c ec a nb ei m p r o v e d 3 w ea d o p ta ni m p r o v e db pn e t w o r k sf o rc l a s s i f i c a t i o n b yu s i n gt h i sa l g o r i t h m ,w en o to n l ys o l v et h ec l a s s i f i c a t i o nt a s ko f t h eg l a s sd e f e c tb u ta l s or e d u c et h et r a i n i n ga n dt e s tt i m e o u re x p e r i m e n t ss h o wt h a tt h em e t h o d sb a s e do nt h et r a d i t i o n a lg l a s sd e f e c tr e c o g n i t i o n ( b a s e do ng e o m e t r i c a lf e a t u r e sa n dt e m p l a t em a t c h i n g ) o n l yh a v ea v e r a g er e c o g n i t i o nr a t ea b o u t6 5 a n d6 8 ,t h em e t h o db a s e do nm o m e n ta n a l y s i sa n dt h eb pn e t w o r k sa c h i e v e sa v e r a g er e c o g n i t i o nr a t ea b o u t7 9 2 t h em e t h o db a s e do nt h ew a v e l e ta n a l y s i sc o e f ! f i c i e n ta n dt h eb pn e t w o r k sa c h i e v e sa v e r a g er e c o g n i t i o nr a t ea b o u t- -8 6 7 t h em e t h o db a s e do nt h ew a v e l e tp a c k e ta n a l y s i sa n dt h eb pn e t w o r k sa c h i e v e sa v e r a g er e c o g n i t i o nr a t ea b o u t8 9 2 t h e r e f o r e u s i n go u rm e t h o r d so ff e a t u r ee x t r a c t i o na n dp a t t e mc l a s s i f i c a t i o n ,w ec a no b t a i nah i g h e rr e c o g n i t i o nr a t et h a nt h et r a d i t i o n a lr e c o g n i t i o nm e t h o d sa n dt h er e c o g n i t i o nm e t h o db a s e do i lm o m e n tf e a t u r e s k e yw o r d sd e f e c tr e c o g n i t i o n ,w a v e l e ta n a l y s i s w a v e l e tp a c k e ta n a l y s i s ,m o m e n t ,b pn e t w o r k s原创性声明本人声明,所呈交的学位论文是本人在导师指导下进行的研究工作及取得的成果。尽我所知,除论文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得中南大学或其他单位的学位或证明而使用过的材料。与我共同工作的同志对本研究所作的贡献已在论文的致谢语中作了明确的说明。作者签名:圣迄盔塾日期:盘! 年月盟日关于学位论文使用授权说明本人了解中南大学有关保留、使用学位论文的规定,即:学校有权保留学位论文,允许学位论文被查阅和借阅:学校可以公布学位论文的全部或部分内容,可以采用复印、缩印或其它手段保存学位论文;学校可根据国家或湖南省有关部门规定送交学位论文。、日期:重型年月竺日硕:j :学位论文第一章绪论第一章绪论现代社会己进入信息时代,随着计算机技术、通信技术和计算机网络技术的发展,自动化的信息处理能力和水平不断提高,在这种情况下,作为信息来源的自动检测、图像识别技术越来越受到人们的重视。人们致力于研究计算机图像处理与模式识别的理论与技术,一方面是为了使机器向更高的智能化方向发展,另方面则是为了满足由人类生活环境中所提出的各种不同的需求。现在,图像识别技术已被广泛应用到许多领域当中,例如:宇宙探测、遥感技术、生物医学工程、交通、邮电、军事、公安及工业领域等等。可见,图像识别技术的研究具有很大的实用和经济价值,具有广阔的应用前景。1 1 图像识别系统的构成一般来况,不同的模式识别方法所对应的模式识别系统也是不同的,一个图像识别系统m ,3 1 主要由三个部分组成:预处理、特征提取、分类识别,如图1 1所示:图1 1图像识别系统的构成下面将简单对这几个部分作些说明。1 预处理在实际应用中,图像识别系统获取的原始图像不是完美的,由于噪声、光照等因素的影响,图像的质量不高,需要进行预处理【2 4 ”,这有利于提取感兴趣的信息。其主要包括图像的增强和复原。图像增强可以改善图像的视觉效果,并把图像处理成为适于计算机分析或控制的某种形式。图像增强需要采取各种技术手段综合处理,而且针对不同用途,处理手段也大相径庭。图像增强包括的内容广泛,如去掉图像的噪声、抽取图像中一些目标的轮廓、图像的勾边处理、提取图像中的特征等。图像增强不考虑图像质量下降的原因,只将图像中感兴趣的特征有选择的突出,而衰减不需要的特征,目的是提高图像的可懂度。图像增强的方法分为空域法和频域法:空域法主要是对图像中的各个像素进行操作,例如灰度直方图修正、图像灰度变换、空域图像平滑和滤波处理、伪彩色增强等:而频域法是在图像的某个变换域内,对图像进行操作,修改变换后的系数,例如傅里叶变换、d c t 变换等的系数,然后硕士学位论文第一章绪论再进行反变换得到处理后的图像。图像复原的目的在于消除或减轻在图像获取及传输过程中造成的图像品质下降即退化现象,恢复图像的本来面目。退化包括由成像系统光学特性造成的畸变以及噪声和相对运动造成的模糊等情况。图像复原技术与增强技术不同,它需要了解图像质量下降的原因,首先要建立”降质模型”,再利用该模型,恢复原始图像。2 图像特征提取为了达到识别的目的,一般在分割后须提取对识别有效的图像特征。如果将图像看作是一个矩阵,则可以认为,图像的特征提取就是通过数学变换将二维图像转换成一个多维列向量。对于识别而言,由于目标图像的多样性及复杂性,寻找具有良好描述和分类性能的图像特征,以及如何提取这些特征就成为解决图像识别问题的关键。良好的特征应具有4 个特点1 6 , 7 :( 1 ) 可区别性对于属于不同类别的对象来说,它们的特征值应具有明显的差异。举例来说,如果对樱桃和苹果进行分类,直径就是一个很好的特征,因为樱桃和苹果的直径有显著区别。( 2 1 可靠性对同类的对象特征值应比较相近,且具有某种不变性。例如,对成熟程度不同的苹果来说,颜色是一个很好的特征。换句话说,青苹果与熟苹果颜色差别很大,尽管它们都属于苹果类。f 3 1 独立性所用的各特征之间应彼此不相关。水果的直径和重量属于高度相关的特征,因为重量大致与直径的三次方成正比。问题在于这两个特征基本上反应的是相同的属性,即水果的大小。虽然相关性很高的特征可以组合起来( 例如取均值) 以减少噪声干扰,但它们一般不应该做为单独的特征使用。( 4 ) 数量少模式识别系统的复杂度随系统的维数( 特征的个数) 迅速增长。尤为重要的是用来训练分类器和测试结果的样本数量随特征的数量呈指数关系增长。在某些情况下,甚至无法取得足够的样本训练分类器。总之,增加带噪声的特征或与现存特征相关性高的特征实际上会使分类器的分类能力下降,特别是在训练集大小有限的情况下。根据不同的特征描述可选择不同的特征提取方法,如果能选择具有高度准确描述能力的特征,无疑对图像的识别具有重要意义。到目前为止,用于图像识别的特征大概可归纳为如下四种:硕士学位论文第一章绪论( 1 1 灰度的直观特征;例如:图像中的边缘、轮廓、纹理和区域等。( 2 1 灰度的统计特征;例如:图像的灰度直方图特征、统计示性数特征,其中统计示性数特征包括均值、方差、峰值以及嫡特征等。( 3 1 变换系数特征;例如:用傅里叶描绘子对于图像轮廓描述、用傅里叶变换进行纹理特征提取。f 4 1 代数特征;由于图像可以表示为矩阵形式,因此可以对其进行各种代数变换,或者作各种矩阵分解。例如:k l 变换、矩阵的奇异值分解等。由于不同种类的图像,不同的应用场合,需要提取的图像特征是不同的,当然对应的图像特征提取方法也就不同,因此并不存在一种普遍适应的最优方法。3 图像识别在提取特征之后就是识别阶段。图像识别【1 , 8 , 9 】是模式识别的一种,就是把一种研究对象根据其某些特征进行识别并分类。对于图像识别系统来说,关键在于特征提取和特征判决模块的设计,根据选择有高度准确描述能力的特征的不同和判决准则的不同,决定了不同的识别方法:( 1 ) 统计模式识别:在早期模式识别研究中,模式的特征被表示为一个数组,它们是对原始数据进行各种统计所得的结果。这些数据可以解释为矢量空间中点的坐标,如果特征源自同一模式的物体,就特征空间点几何距离而论,其对应点总是很接近的。于是模式识别问题就变成为寻找特征空间中一些区域的问题,这些区域上的点来源于某个单一模式,这就是分类。由于解决这类问题的方法多数基于贝叶斯决策统计理论,所以称这类方法为统计模式识别。这种方法对选取的特征,按着不同的准则( 如贝叶斯最小误差准则,最大最小准则等) 在决策空间确定决策平面,识别即通过特征空问中的位置决定识别类。这是一类在模式识别中应用广泛而且成熟的识别方法,但这种模式识别方法的大量工作在于正确而有效地抽取图像的特征或决定统计参数,但对图像来说,特征抽取很困难,而且这种方法也没有考虑事物本身的结构特点。( 2 ) 句法结构模式识别:在6 0 年代后期,这一困难把许多研究者引导到一个不同的方法上,即句法结构模式识别。这种方法的基本思想是将一个复杂模式分化为若干个较简单的子模式的组合,而子模式又分为若干基元通过对基元的识别来识别子模式,最终识别该复杂模式。例如,汉字可以由笔画描述,这种递归描述与课文中短语通过单词描述十分相似,由于这一原因,形式语言中的许多方法都可以应用,但句法方法本质上是一种串行的操作,这一性质给句法方法的应用带来了很大的局限性,此种方法用一个文法表示一类,然后通过判断待定模式属于哪个文法来决定其所属类别。对于图像来说,它主要是利用图像结构上的相硕i :学位论文第一章绪论互关系,这种方法的缺点是没有考虑图像所受的噪声的干扰,必然使其元素成分结构关系带有一定的随机性。( 3 ) 模糊模式识别:句法模式识别是建立在二值逻辑基础上的,而在人们的日常生活中,普遍存在着模糊概念诸如“高矮”、”胖瘦”、”较重”、”较轻”、”长”、”短”等等都是一些既有区别又有联系的无确定分界的概念。模糊概念是客观事物本质属性在人们头脑中的反映,是人类社会长期发展过程中约定俗成的东西为了描述和分析自然界中各种模糊事物,近年来又出现了一种基于连续逻辑的模式识别方法一模糊模式识别法。这种方法既有其数学基础( 模糊数学) ,又更接近于人的思维方法。利用模糊似然推理及模糊方法等技术来实现模式识别是当前智能机器发展的方向之一。根据模式的特点确定隶属度,用隶属度将模糊集合分成若干个子集以相应于各类,然后根据最大隶属原则,或择近原则,或模糊聚类分析法来实现分类,此种方法的关键是隶属度和判决规则的确定非常困难。( 4 ) 神经网络方法:由于神经网络的高速并行处理、分布存储信息等特性符合人类视觉系统的基本工作原则,具有很强自学习性、自组织性、容错性、高度非线性、高鲁棒性、联想记忆功能和推理意识功能等,能够实现目前基于计算理论层次上的模式识别理论所无法完成的模式信息处理工作,所以,采用神经网络进行模式识别,突破了传统模式识别技术的束缚,开辟了模式识别发展的新途径。在某种意义上,网络本身的自学习就是实现模式变换与特征提取,即只要待识别的模式在所表示域里具有一定的差异,网络就可以通过自适应聚类学习,找到不同模式的特征信息进行识别。神经网络用于模式识别,其优点主要表现在:神经网络的特征内部表示能力使其可以在一定程度上,自动获取用常规的启发式和变换方法很难提取的目标特征:神经网络的泛化能力使其可以通过适当增加网络容量来获取目标信息的多模式分布特性,从而在一定程度上提高了系统对多场景的适应能力:神经网络对非线性连续函数的一致逼近能力使得神经网络识别系统可以提供简单易操作的训练算法,自动构造接近最佳的判别函数。由于上述这些优点,神经网络方法在图像识别领域得到了大量的应用,因此,本文采用神经网络方法来进行玻璃缺陷分类识别。1 2 研究的目的及意义目前国内生产厂家大多数采用人工检测方法,即将待检测的玻璃放在一个检测光源前,用眼来观测玻璃,找出缺陷,该方法有如下缺点:1 容易受到人眼分辨能力和易疲劳等主观因素的影响;2 人工检测速度较慢,自动化程度很低,不能适应现代化大生产的要求,且工人劳动强度比较大,长时间的操作人眼势必会产生疲劳,直接影响到检测的硕士学位论文第一章绪论准确性,无法保质保量地完成任务;3 检测数据的保存和查询不方便;国外己经开发出相应的玻璃缺陷检测设备,但是价格比较昂贵,且技术资料保密,售后维修的工作经常延迟,耽误生产的正常进行,且维修费用过高。国内目前也有少数几个研究所在进行玻璃制品在线检测设备的研究,但其开发的产品仅相当于国外八十年代的水平,缺陷检出率低,基本上不能作种类识别( 包括两个方面:1 根据识别的种类来判断玻璃的好坏程度:2 根据识别的结果来判断造成玻璃缺陷的原因) 。基于以上事实,本课题在分析了各种玻璃缺陷特征的基础上,分析研究了玻璃缺陷的特征提取方法以及分类器的设计,从而实现对各种玻璃缺陷的识别,为计算机图像处理及模式识别技术在工业生产实际中的应用开辟新的领域。在解决传统人工检测难题的同时,提高玻璃缺陷识别的准确性和自动化程度。1 3 玻璃缺陷识别的相关研究及问题的提出计算机玻璃缺陷识别技术是近几十年才逐渐发展起来的,现在逐渐成为科研热点。国内外很多机构都在进行这方面的研究,尤其在欧美一些国家。进入9 0年代,对玻璃缺陷识别的研究变得非常活跃,吸引了大量的研究人员和基金的支持,并且取得了巨大的成效。1 国外已有的玻璃识别系统国外在九十年代初就开始研制计算机视觉在线检测设备,他们凭借器雄厚的经济实力和不断成熟的技术为基础,至现在已经开发出多种玻璃在线检测机器。近些年来,由于建筑和汽车行业的高速发展,相应的推动了玻璃的制造和使用行业的快速发展,对于玻璃的质量要求也越来越高,因此国内外许多科研机构都在开展玻璃缺陷在线识别系统的研究,下面是其中的一些研究成果l l o , u :( 1 ) 德国l a s o r 公司浮法玻璃在线缺陷检测系统:l a s o r 公司是第一家推出浮法玻璃激光检测设备的公司,其产品在世界浮法玻璃生产线上安装的数量最多。l a s o r 公司近年又推出了新型的采用数字照相技术的浮法玻璃检测设备2 f 1装置。该系统采用先进的成像技术和智能光源,检测精度大大超过了激光检测系统,并且具有光学检测功能,可在同一台机器上实现对玻璃癖点和玻筋的检测。2 f 1 系统可以检测的玻璃缺陷包括气泡、结石、锡点、玻筋等,还可以对这些缺陷进行分类,以利于对这些玻璃质量的判别。所检测出的缺陷信息可以实时地显示在操作屏幕上,并能以多种图表形式向用户提供缺陷的统计信息。( 2 ) 丹麦制造的”结石检测器”。( 3 ) 法国s g c c 公司制造的m 1 型全自动多功能玻璃瓶罐在线检测机。硕一l :学位论文第章绪论但是,国外已经开发出的这些玻璃缺陷检测设备价格比较昂贵,且技术资料保密。2 国内的玻璃缺陷识别的方法大致可以分为两类:( 1 ) 基于几何特征的缺陷分类法 1 2 , 1 3 :玻璃缺陷由不同的类别组成,其缺陷的特征也各不相同,因此,对这些缺陷的形状和结构关系变化的几何描述,可以作为玻璃缺陷识别的重要特征。其基本思想是:先对玻璃缺陷图像进行降噪滤波等预处理,并对经过预处理的玻璃图像进行缺陷目标的分割处理,他们在实验中具体采用阈值分割、边缘检测的方法来提取缺陷特征,并通过缺陷i f l 标的面积、周长、伸长度、圆度等特征来对各种玻璃缺陷进行分类,基于形状的缺陷分类法很大程度上减少了输入的数据,但是用有限的特征点来代表玻璃缺陷图像,一些重要的缺陷识别和分类信息就会丢失。( 2 ) 基于模板匹配的缺陷分类法u3 j :为了在图象中检测出已知形状的目标物可以用这个目标物的形状模板与图象进行匹配,依据某种准则检测出图象中目标的方法,通常称为模板匹配法。对于玻璃缺陷来说,气泡在图象中基本呈现为圆形和椭圆形,而划痕图象为狭长和细长的形状。因此事先做好气泡和划痕的标准模板,就可以通过对缺陷图象进行模板匹配来确定缺陷的种类。其具体思想是:采用标准模板w ( i ,) 大小为朋n ,将该模板在待匹配的图象上平移,将模板覆盖下的图象称作子图f ,( f ,) ,其中( x ,y ) 为子图中心点坐标若模板和它所覆盖的图象完全一致,则两者之差为零,否则不为零。可以用下y j n 度来衡量其相似程度:d ( ,y ) :芝1 羔。( ,w ( j ,j 卜( 。,肋2 ,然后由模式分类的方法实现玻璃f ;01 - 0缺陷的识别。基于模板匹配的分类方法,分类前需预先做好大量的模板,运算量较大,检测时间较长,适应图像的收缩、倾斜方面效果不是很好。在本文的前期工作中,我们曾采用类似上述两种方法实现了玻璃缺陷识别,即基于几何特征的缺陷分类法和基于模板匹配的缺陷分类法,实验研究表明其精确性结果不容乐观。其识别率仅达到6 5 和6 8 左右。因此,寻求更高识别率的方法是值得我们深入研究的课题。矩特征具有平移、旋转和尺度不变性,若把二值图或灰度图看作是二维密度分布函数,就可把矩技术应用于图像分析中。这样,矩就可以用于描述一幅图像的特征,并提取出该图像的相似特征。近年来,由二维和三维形状所求取的矩值的不变特性已引起了图像界人士的高度重视。矩技术类型很多,现已被应用于图像分类与识别处理的许多方面,如景物匹配、直方图匹配【1 5 】、图像重建、目标识别“之叫和图像检索1 2 1 , 2 2 1 等。矩特征方法是玻璃缺陷识别领域中新采用的特征提取方法,也是目前该领域的主流方法,但缺乏识别率数据的报道。因此,本文的工作首先采用了矩特征提取方法进行了实验分析。硕:i :学位论文第一章绪论近些年兴起的小波变换是一种图像分析的重要工具,小波变换具有多分辨分析的能力,它既能反映目标的局部信息又能反映全局信息【2 ”,其多尺度分解特性更加符合人类的视觉机制,与计算机视觉中的由粗到细的认识过程十分相似,更加适合图像的信息处理。小波变换能给出信号完全而稳定的表示,能够得到不同尺度下信号的形式。从特征提取的角度来分析,其变换后的信号正包含了信号的主要特征,如大致形状、变化位置及幅度等。二维小波变换分量具有方向选择性,可将原始图像分解成平滑子图、水平子图、垂直子图和斜向子图。所以,无须经过复杂的特征提取,就可以得到图像缺陷的结构特征分量。小波分析在字符识别领域得到了非常广泛的应用,w u n s c h 和l a i n e l 2 4 】在19 9 5 年描述了一个字符识别系统,它依赖于小波算子对字符的形状进行多尺度分析。著名的h a a r 小波结合快速算法可以很好的用于线段的局部检测和光栅结构的整体检测。l e e 2 5 1 等人于1 9 9 6 年提出了一种基于h a a r 小波的方法,对字符图像进行不同尺度上的阐述,提出了以系数矩阵形式表示的多尺度分析。因此,我们可以借助于图像识别领域中的小波分析来实现玻璃缺陷的特征提取,从而进行玻璃缺陷的分类识别。1 4 玻璃缺陷的分类及特点玻璃外观缺陷检测是玻璃质量检验的重要方面之一。在浮法玻璃的生产过程中会产生一些缺陷,如气泡、结石、裂纹、划痕、麻点以及表面形状尺寸偏差等。常见的玻璃缺陷主要有以下几种表现形式 2 6 - 2 9 1 ,对应的玻璃缺陷如图1 2 所示:1 气泡:玻璃中的气体夹杂物,呈圆形、椭圆形和点状等。它是在玻璃融化过程中及玻璃成型过程中形成的:2 夹杂物:一种比较普遍的玻璃均匀性的缺陷,表面看它的性质与玻璃很相近,实际上在化学组成和物理性质上( 折射率、密度、粒度、表面张力、热膨胀、机械强度,有时包括颜色) 与玻璃主体不同;3 结瘤:玻璃中的固体物质,有原料结石、耐火材料结石、析晶结石等,较小的结石称砂粒;硕士学位论文第章绪论图1 - 2 玻璃缺陷库中的部分样本一8 一硕士学位论文第一章绪论1 5 本文研究内容及主要工作玻璃缺陷识别主要包括玻璃缺陷的特征提取和特征的分类。因此,本文的主要工作主要集中于如何提取缺陷的特征,并根据提取的特征进行分类。在玻璃缺陷特征提取方面,本论文中重点讨论利用小波分析方法来提取缺陷特征。我们对直接利用小波系数作为特征以及小波包分析对缺陷进行分析,提取特征进行了分类试验。我们也讨论了利用矩分析提取特征,更加突出了小波变换时频窗自动调整的优点。在利用各种方法进行实验时,我们都是采用了b p 神经网络作为分类器。在论文的结尾,我们对上述几种方法与传统的玻璃缺陷识别方法进行了比较,并得出了相关的结论。1 6 本论文的内容和组织结构论文章节安排如下:第一章绪论,主要介绍图像识别系统的构成、论文的背景、玻璃缺陷识别技术的相关研究及问题的提出、论文的主要研究内容、章节安排。第二章基于矩分析的特征提取,本章重点介绍了矩的概念以及实现算法,并采用七个矩特征来实现特征提取。第三章基于小波分析的特征提取,重点介绍了小波分析、小波包分析的基本理论及算法实现,最后本文根据上述算法,采用小波系数和小波包分析进行玻璃缺陷的特征提取。第四章基于b p 网络的玻璃缺陷识别,首先介绍了工神经网络基础,并在此基础上详细介绍了b p 网络的结构、算法以及存在的问题及其改进。最后具体介绍了基于上述三种方法的实验结果分析及性能分析。第五章总结和展望,主要是对本文的研究工作进行了全面的总结,并对进一步的研究工作进行了展望。硕二l :学位论文第二章基于矩分析的特征提取2 1 引言第二章基于矩分析的特征提取基于矩分析的特征提取方法是玻璃缺陷识别领域中新出现的特征提取方法,也是目前该领域的主流识别方法,但缺乏识别率数据的报道。因此,本文从矩特征提取方法的实验研究开始。矩是一种非常重要的表示目标总体形状的特征量。由于它不受待识别物体的大小、位置、方位的影响而在图像特征提取方面得到了广泛的应用1 3 “。二维图形的几个关键特征均直接与矩有关,如图像的大小、形心和旋转情况等。不变矩由于概念清晰,识别率稳定,对具有旋转和缩放变化的目标有良好的不变性及抗干扰性,能有效地反映图像的本质特征。因此,本章将图像的不变矩作为识别特征,并且在不变矩的基础上,给出了h u 矩 3 3 , 3 4 1 作为识别特征。计算机系统在识别图像时,应具有的一个重要特性是对图像的平移、旋转及比例变换具有不变性。一个最直观的方法是要求图像特征本身具有”不变性”,即尽可能寻求图像本身的”不变性”特征,因此,不变性特征的研究一直是感知科学和计算机视觉的研究重点。不变矩算法就是一种通过提取具有平移、旋转和比例不变性的数学特征,从而进行图像识别的方法。近年来,2 - d 和3 一d 物体矩不变性的研究引起了越来越广泛的关注。大体上说,不变矩可分为代数不变矩和积分不变矩。线性变换的代数不变矩理论起源于解析几何中的问题,并首先由c a y l e y 和s y l v e s t e r 提出。在这两种数学方法基础上,h u 于1 9 6 1 年发表了第一篇关于应用图像2 一d 矩进行模式识别的论文,在这篇论文中,h u 首先提出代数不变矩的概念,并给出了一组基于通用矩组合的代数矩不变量。这些矩具有平移、尺度和旋转不变性,被称为h u 矩。随着研究进一步深入,人们推导出一些其他的代数不变量,如l e g e n d r e 矩p ”、z e m i k e矩、旋转矩 3 6 , 3 7 】以及h u 矩的些变形,均可用于2 一d 和3 一d 的图像识别。下面我们介绍矩和不变矩的基本理论及h u 矩。2 2 不变矩概述2 2 1 几何矩对于连续灰度函数厂( x ,_ y ) ,它的p + q 阶二维原点矩0 。的定义为硕:t 学位论文第二章赫于矩分析的特征提取0 ,= li x p y q 八x ,y ) d d yp ,q = 0 , 1 ,2( 2 - 1 )1 段设f ( x ,y ) 为分段连续的有界函数,并且在x ,y 平面上雨限区域内有非零值。根据唯一性定理,它的各阶矩存在且唯一地被f ( x ,y ) 确定,反过来,f ( x ,y )也唯一地被它的各阶矩确定。此外,还可以定义f ( x ,y ) 的p + q 阶中心矩。为:。= f ( x z ) ( y y ) 9 ( x ,j ,x d ,p , q :0 , 1 ( 2 - 2 )其中( ;,歹) 为图像厂( x ,y ) 的重心坐标:;= e 矿( z ,y ) e e i ( 剐p )y + = y e , f ( x , y ) e e m ,)归一化中心矩r l 。为:5 等( 2 _ 3 )其中,:掣,p + g :2 ,3 以上是连续的情况,而数字图像都是经过离散化的,因此需要计算离散情况下的p + q 阶矩相应的原点矩和中心矩公式如下:mn0 。= x yf ( x ,y )( 2 - 4 )x = ly = lmn。= ( x - - x ) 9 ( y y ) 9 f ( x ,y )x = iy = l重心坐标为2 2 2 矩的物理意义1 零阶矩( 2 - 5 )( 2 6 )( 2 7 )力r“。问d力矿。一m d=一x力x“。埘d力“。州m dj jy硕上学位论文第二章基于矩分析的特征提取根据矩的定义,图像f ( x ,y ) 的零阶矩m 。定义为0 旷,( x ,y ) d ,d ,可见,如果f ( x ,y ) 为灰度图像,则0 。表示图像灰度值的总和,为物体的质量;当f ( x ,y ) 为二值图像时,0 。表示图像的面积。2 一阶矩图像厂( x ,y ) 的两个一阶矩0 。和0 。用来确定图像的灰度重心。为:( 2 8 )也可以看作其重心坐标三:盟y 一:堕( 2 9 )0 0 00 0 0根据中心矩的定义,我们可推导出中- 1 3 矩“。和风。均为0 ,即:, u l o = 风203 二阶矩图像的二阶矩有三个:0 2 。、0 0 2 和0 也称之为惯性矩( m o m e m so fi n e r t i a ) ,它们可以确定物体的几个重要的特性,具体特性描述如下:( 1 ) 主轴二阶中心矩常用来确定目标的主轴,目标的主轴通常有一对长轴和短轴,分别代表最大二阶矩和最小二阶矩的方向,根据矩理论,主轴方向角曰可按下述公式计算:口:! t a j l 一兰生一( 2 1 0 )21 2 0 一, u 0 2公式中秽为主轴与坐标轴的夹角,其范围在 一三,争。( 2 ) 图像椭圆由一阶、二阶矩可以确定一个与原图像惯性等价的图像椭圆。所谓图像椭圆是一个与原图像的二阶矩及原图像的灰度总和均相等的均匀椭圆。如果图像椭圆由其长半轴和短半轴表示,则有:掣垫丝地!二型笪】ila( 2 1 1 )= i l l ,z o o6 : 坐吐丝堑堕兰巡】1 2 ( 2 - 1 2 )0 0椭圆的灰度由下式确定:,:坐生( 2 1 3 )硕士学位论文第二章基于矩分析的特缸提取可将椭圆中心与图像灰度重心重合,使其主轴方向与图像主轴方向重合,这样更便于分析图像的性质。4 三阶矩对于三阶,使用图像在x 轴或y 轴上的投影比使用图像本身的描述更方便。两个三阶中心矩,。、。描述了图像投影的扭曲程度。扭曲是一个经典统计量,用来衡量关于均值对称分布的偏差程度。图像投影在x ,y 轴的扭曲系数为:2 2 3 矩的相关变换( 2 - 1 4 )( 2 - 1 5 )矩的褶关燹换如f :1 平移变换若图像f ( x ,y ) 分别在方向上平移a ,b ,则平移后的新图像f ( t y ) 为:f ( x ,y ) = f ( x 一口,y b )( 2 - 1 6 )则平移后f ( x ,y ) 的矩定义为:0 。一= jj ( x + 口) 9 ( y + 6 ) 9 ,( x ,y ) a ,d ,( 2 - 1 7 )在数字化的图像中,上式可以改写为:0 一= o + 口) ( y + 6 ) 9 f ( x ,y )( 2 - 1 8 )平移前后的矩m 。_ 此1 。有如下关系:。1 m = 砉鲥”w ”帆p 聊我们也可以通过把图像的重心平移到坐标系的原点来对图像实现平移归一化处理。归一化处理后的矩称为图像的中心矩。因此,图像f ( x ,y ) 的p + q 阶中心矩。为:。= 薹;妻( : : c x 一;,p 一叶c y 一;,口一 ,。c z z 。,塑膨堕硌j |=t0硕士学位论文第二章基于矩分析的特征提取一一或。= ( x - - x ) 9 ( y y ) 9 ( x ,y ) a ,d ,则平移变换前后有:i z + 一2 。( 2 2 1 )f 2 - 2 2 )若图像函数f ( x ,y ) 在x ,y 方向上比例( 尺度) 变换为口,倍时,则变换后像厂( x ,y ) y , j :,( w ) = ,( 形,y 石p ) ( 2 - 2 3 )则变换后的矩0 m 与变换前的矩0 。有如下关系:0 w = 口“9 7 ”0 月t 2 ( 2 - 2 4 )0 月= 2 2 + p + q o m口= ( 2 2 5 )通过令0 。= 1 ,对图像实现比例归一化处理。对于二值化图像或灰度平均值为1 的灰度图像来说,即把图像的面积设置为l 。实现比例归一化的尺度因子为:p :芸( 2 2 6 )p ”2 两u 之6 归一化后的原点矩为:。_ ( 爿”。p z ,所以,通过上述的l c n o a - - 化处理方法,可以得到具有比例不变性的中心矩为:”由噩”妒沪砌w m d ,( 2 - 2 8 )3 旋转变换若图像绕坐标原点逆时针旋转后,即:f + ( x ,y ) = f ( x c o s o y s i n o ) ,( x s i n 0 + y c o s o ) ( 2 2 9 )则变换后的矩为:0 。一= ( x c o s 0 一ys i n 臼) ”( x s i n o + y c 。s6 ) ) 9 ( x ,y 矽,d ,( 2 3 0 )对于数字图像硕士学位论文第二章基于矩分析的特征提取0 w = ( x c o s 口一y s i n o ) 9 ( x s i n 0 + y c o s o ) 9 f ( x ,y )( 2 - 3 1 )j,旋转变换前后的矩o 。、o w 满足如下关系。,- = 粪娄( : ( : c 一,- 一5c c 。s p ,t ,一,+ j ,c s ;n p ,c - 一j ,。,+ ,一,+ ,c z ,z ,此处,采用主轴法来实现矩的旋转不变性。该方法是基于这样的观测:对于一组唯一的分布主轴,我们可以计算出它的各阶矩。并且这些矩在分布方向上具有不变性。我们可以通过旋转中心矩的方向使。= 0 来得到主轴矩。主轴角目( 与x 轴向的夹角) 可以由公式( 2 2 5 ) 求得。归一化后的标准矩( r m i ) 定义如下:c r m i ,= 骞薹( : ( : c 一,9 一c c 。s p ,一一,+ j ,c s ;n 口,c - + ,一j ,。,+ 。一,+ ,c :,s ,4 反射变换若图像f ( x ,y ) 对x 轴做反射变换,即:,( x ,y ) = 厂( 一工,y )则反射变换前后的矩o 。、0 w 满足如下关系:0 。月= ( 一1 ) 0 。同样,若图像对y 轴做反射变换,即:0 月= ( 一1 ) 9 0 月5 增强变换若整幅图像f ( x ,y ) 增强口倍,即:厂( x ,y ) = 可( 一x ,y )则增强变换前后的矩0 。、0 一满足如下关系:0 月= 月陀- 3 4 )( 2 - 3 5 )( 2 3 6 )( 2 - 3 7 )r 2 - 3 8 )硕士学位论文第二章基于矩分析的特征提取2 3 h u 矩2 3 1 图像的不变矩特征表示实践表明,直接用原点矩或中心矩作为图像的特征,不能保证特征同时具有平移、旋转和比例不变性。事实上,如果仅用中心矩表示图像的特征,则特征仅具有平移不变性;如果利用归一化中心矩,则特征不仅具有平移不变性,而且还具有比例不变性,但不具有旋转不变性。因此,要同时具有平移、旋转和比例变换不变性,直接使用原点矩或中心矩是不行的。为此,m k h u 在1 9 6 1 年首先提出了不变矩,他给出了连续函数矩的定义和关于矩的基本性质,证明了有关矩的平移不变性、旋转不变性以及比例不变性等性质,具体给出了具有平移不变性、旋转不变性和比例不变性的七个不变矩的表达式。七个不变矩由二阶和三阶中心矩的线性组合构成,具体表达式如下:吸= ( 7 2 0 一2 ) 2 + 4 7 j= ( 玎3 0 一3 7 1 2 ) 2 + ( 3 呷2 l 一7 1 0 3 ) 2阡- = ( 7 + 叩1 2 ) 2 + ( 叩2 l + 7 0 3 ) 2巧= 妇。匍2 ) 如。+ 霸2 ) 瞧。蝴扩1 3 魄:+ 秽】峨广玛3 ) 电。+ 穆3 ) d ( 珞o + 臻扩锄。+ 礓拥= ( 仍。一编2 ) 【慨o + 碾2 ) 2 一( 仍l + 3 ) 2 + 4 确l ( 仍o + 研2 ) 2 ( 叩2 l + 3 )孵= ( 3 侥l 一3 ) o 五。+ 啊2 ) 【电o + 吼2 ) 2 3 ( 健。+ ,j b j 2 】+ ( 珐。一3 强2 ) o 五。+ ,) i x 珐o + 礓2 ) 2 一( 悒l + 7 ) 2 】( 2 - 3 9 )图像的归一化的中心矩叩。由公式( 2 5 ) 可得。2 3 2 对图像不变矩特征的修正要使特征表示具有很好的效果,我们必须解决比例因子的影响。在具体讨论解决的方法之前,我们作如下处理,由于七个不变矩的变化范围比较大,为了便于比较,可利用取对数的方法进行矩特征值变化范围的压缩:同时考虑到不变矩有可能出现负值的情况,因此,在取对数之前先取绝对值,实际采用的不变矩为:w := l g l w kk = 1 , 2 7( 2 4 0 )硕士学位论文笫二章基于矩分析的特征提取2 4 基于矩分析的特征提取本章的特征提取步骤如下:1 先对玻璃缺陷图像进行预处理:2 根据公式( 2 - 3 9 ) ,我们可以提取出玻璃缺陷的七个不变矩特征;3 根据公式( 2 4 0 ) ,我们对图像不变矩的七个特征进行修正,以达到更好的实验效果。2 5 本章小结本章详细地介绍了几何矩、h u 矩等几种传统不变矩的概念、性质及其在图像识别中的应用前景,并对矩的变换性质及其物理意义进行了详细的描述和

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论