(电路与系统专业论文)小波矩在旋转不变模式识别中的应用研究.pdf_第1页
(电路与系统专业论文)小波矩在旋转不变模式识别中的应用研究.pdf_第2页
(电路与系统专业论文)小波矩在旋转不变模式识别中的应用研究.pdf_第3页
(电路与系统专业论文)小波矩在旋转不变模式识别中的应用研究.pdf_第4页
(电路与系统专业论文)小波矩在旋转不变模式识别中的应用研究.pdf_第5页
已阅读5页,还剩55页未读 继续免费阅读

(电路与系统专业论文)小波矩在旋转不变模式识别中的应用研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

塑矍 ! :鲨笙垄墼堑至壅堡鉴望型主塑堡旦竺塞 摘要 本文针对城市地形图自动输入系统,在提取特征的准确性和有效性、快速识 别和图文分割等方面进行了研究,并取得较为满意的结果。这些工作作为地形图 自动输入的基础研究,对地形图的自动输入研究具有重要意义。 近几十年来,随着计算机科学的飞速发展,工程图纸等文档的自动输入研究 就具有重要实际应用价值。城市地图的自动输入作为一个重要研究方向,对特征 的平移、缩放和旋转不变性都提出了更高的要求。本文简要回顾了图符特征提取 的发展历程,并介绍了特征提取与图符识别方面的一些基础知识,包括特征提取 基本概念与特点、特征的性能分析、图符对象的分割等。 在前人工作的基础上,本文探讨了采用小波提取图符矩特征的方法。小波矩 除了具有矩特征的平移、缩放和旋转不变及抗噪性强的特点,还具有了小波对图 象结构精细特征的把握能力强的优点。我们结合f f t 变换的优点提出了改进的离 散傅立叶一小波矩,并由所提取的小波矩特征与最小距离分类器结合形成一个图 象识别系统,成功实现了对精细复杂汉字图符的识别。 考虑到小波矩特征的计算量,为了提高系统识别速度,我们设计了一种利用 小波矩求取字符旋转角度的算法,并以该角度为基准方向提取文本字符串,经角 度旋转变换后,再利用空域算法进行识别。这样既发挥了小波矩的优势,又最大 限度的在识别中采用了空域算法,减少了运算量,提高了识别速度。 为了更有效的从混合图文中提取识别的图符,我们将金字塔算法运用到图符 分离系统,设计了个降低分辨率的图符提取算法。与传统算法相比,该算法显 著减少需要分析的连通分量数量,减少了字符包围盒形成所需要的扫描时间开销 和内存需要。 在以上工作的基础上,本文在v c 十+ 环境下设计了个小波矩图符识别系统, 从城市测绘地形图标准图式中选择了6 0 种常用图符制作成标准图符集,研究了 这些图符的小波矩特征抽取方法。同时,我们并在m a t l a b 环境下设计了一个金 字塔图符分离算法的演示系统,并对部分扫描输入地图进行实验,结果表明有效 地提高了复合识别系统的运行效率。 文章最后对所做工作在城市测绘地形图自动输入研究中的地位和作用进行了 总结,从地形图自动输入的要求角度展望了图象分割和特征提取的未来发展,并 分析了目前存在的亟待解决的问题。f 一一 一一 。, 重,翱_ t 。l 馑懿, l 繇; a b s t r a c t s o m e r e s e a r c h e s o n t h e ,w a v e ,l e t m o m e n t s a p p l i c a t i o n o nt h er o t a t i o n - i n v a r i a m r e c o g n i t i o n a b s t r a c t t h i sd a p e rd i dr e s e a r c ho nt h ew a v e l e tm o m e n tf e a t u r ee x t r a c t i o n ,i m a g ed i v i s i o na n d r e c o g n i t i o ns y s t e ma n da c h i e v e ds a t i s f a c t o r yr e s u l t a st h ef u n d a m e n t a lr e s e a r c ho f m a p a u t o m a t i ci n p u t t h e s ew o r kp l a ya ni m p o r t a n tr o l ei nt h er e s e a r c ho f m 印i n p u t a l o n gw i t ht h ef a s td e v e l o p m e n to fc o m p u t e rs c i e n c er e c e n t l y , m a n yp r a c t i c a l a c h i e v e m e n t sh a v eb e e nr e a c h e di nt h er e s e a r c ho f a u t o m a t i ci n p u to f p r 。j e c td r a w i n g a sai m p o r t a n ts t u d yd i r e c t i o n ,t h ea u t o m a t i ci n p u to fc i t ym a pr e q u e s t st h a t t h e t r a n s l a t i o ns c a l i n ga n dr o t a t i o ni n v a r i a n tf e a t u r e se x t r a c t e df r o mt h es y m b o l a r em o r e s t a b l e t h i sa r t i c l et o o kab r i e fr e t r o s p e c t i o no nt h eg r o w i n gc o u r s eo fe x t r a c t i n g f e a t u r e sf r o mi m a g es y m b o l ,a n di n t r o d u c e ds o m eb a s i ck n o w l e d g eo ft h ef e a t u r e e x t r a c t i o na n ds y m b o lr e c o g n i t i o n ,i n c l u d i n gt h eb a s i cc o n c e p to f f e a t u r ee x t r a c t i o n , t h ef e a t u r e sc h a r a c t e r , t h ei m a g ed i v i s i o na n ds oo n t h e s ea r et h eb a s i sa n dp r e m t s e o f t h ew o r k si n c l u d e di nt h ea r t i c l e b a s e do nt h ep r e v i o u sw o r k ,w ed i s c u s s e dt h em e t h o do fa p p l y i n gt h ew a v e l e t t o e x t r a c tt h em o m e n tf e a t u r eo ft h e s y m b 0 1 b e s i d e sh a v i n g t h ei n v a r i a n tt ot h e t r a n s l a t i o n ,s c a l i n g a n dr o t a t i o n ,t h ew a v e l e tm o m e n th a s t h em u l t i r e s o l u t i o n p r o p e r t i e s s oi ti ss u i t a b l ef o rc l a s s i n gt h ev e r ys i m i l a ro b j e c t s c o m b i n i n gf f t t r a n s f o r m w ep r o p o s e dt h er e f o r m a t i v ed i s c r e t ef f t - 鼢p e l e tm o m e n t u s i n ga m i n i m u m d i s t a n c ec l a s s i f i e rt o g e t h e rw i t ho u rf f t w a v e l e ti n v a r i a n tm o m e n t w e c o n s t r u c t e dar e c o g n i t i o ns y s t e mw h i c hs u c c e e di nc l a s s i n gt h ev e r yl i k e nc h i n e s e c h a r a c t e r c o m p a r i n g w i t ht h e g e o m e t r i c a l m o m e n t ,t h e c l a s s i f i c a t i o n r a t e , r e c o g n i z i n ge f f i c i e n c ya n d a n t i n o i s ec a p a b i l i t yh a v eb e e ni m p r o v e d t or e d u c et h ec a l c u l a t i n gt i m eo ft h ew a v e l e t m o m e n tr e c o g n i t i o ns y s t e m ,w e i n t e g r a t e t h ew a v e l e t m o m e n tm e t h o da n dt h es p a c e * r e c o g n i t i o nm e t h o d i n t oa c o m p l e xs y s t e m t h es p a c e - r e c o g n i t i o nm e t h o dh a s b e e na p p l i e di nm a n ys y s t e m c o m b i n i n gw i t hs p a c e r e c o g n i t i o nm e t h o d ,t h ec o m p o u n ds y s t e mn o to n l yh a v et h e a d v a n t a g eo f w a v e l e tm o m e n t ,b u t a l s oh a v eh i g he f f i c i e n c yo f s p a c e r e c o g n i t i o n t oi m p r o v et h ee f f i c i e n c yo fe x t r a c t i n gt h et e x tf r o mt h em i x e dt e x t g r a p h i c s i m a g e ,w ea p p l yt h ep y r a m i ds t r u c t u r e t o d e s i g n am u l t i r e s o l t i o nt e x t e x t r a c t i o n m e t h o d t h ep y r a m i d sh e l pt oi d e n t i f ya n dl o c a t ew o r d so rp h r a s e si nt h ei m a g e e f f i c i e n t l ya n dq u i c k l y t h es y s t e m i st h u sa b l et oi s o l a t et h et e x tf r o mt h eg r a p h i c ss o t h a tt h ep r a c t i c a le l e c t r o n i cv e r s i o n so fe a c hk i n dc a nb et r e a t e da n dp r o c e s s e d i n d e p e n d e n t l y t h ep y r a m i dm e t h o dc a ns p e e dt h et e x t 。e x t r a c t i o np r o c e s s i n g a n d r e d u c et h em e m o r yi nd e m a n d b a s e do nt h ep r e v i o u sw o r k ,u n d e rv c + + e n v i r o n m e n t ,t h ea r t i c l ed e s i g n e da w a v e l e tm o m e n te x t r a c t i o nd e m os y s t e m ,w h i c hc a ne x t r a c tw a v e l e tm o m e n tf r o mt h e s y m b o la n d a tt h es a r n et i m e ,6 0k i n d so fc o m m o ns y m b o l sw e r es e l e c t e d f r o m s p e c i f i c a t i o n sf o rc i t yt o p o g r a p h i cs y m b o l st o c o n s t i t u t et h e s t a n d a r ds y m b o ls e t ,o fw h i c ht h em e t h o do fw a v e l e tm o m e n tf e a t u r ee x t r a c t i o nw a s s t u d i e d u n d e rt h em a t l a be n v i r o n m e n t ,w ed e s i g n e dat e x te x t r a c t i o ns y s t e m u s i n gp y r a m i d t h ee x p e r i m e n t a l r e s u l t ss h o w e dt h a ts y s t e mw e r ee f f i c i e n tr e l a t i v e l y i nt h ee n do f t h ea r t i c l e ,t h ep o s i t i o na n dr o l eo f t h ew o r ki t s e l f i nt h er e s e a r c ho f a b s t r a c ,t ,s o m e r e s e a r c h e s o n t h e w a v e l e t m o m e n t s a p p l i c a t i o n o n 一t h e r o t a t i o n - i n v a r i a n t r e c o g n i t i o n a u t o m a t i ci n p u to fc i t ym a pw e r es u m m a r i z e d ,t h e f u t u r ed e v e l o p m e n to fm a p a u t o m a t i ci n p u tw a sp r o s p e c t e d f r o mt h e a s p e c t o fi m a g ed i v i s i o na n df e a t u r e e x t r a c t i o n ,a n de x i s t i n ge x i g e n tp r o b l e m w a sl i s t e da n da n a l y z e d i i i 第一章绪言 小波矩在旋转不变模式识别中的应用研究 第一章绪言 1 1o c r 系统简介 字符光学识别系统( o c r ) 是自动模式识别领域中最重要和最成功的应用之一 1 。从本世纪5 0 年代中期开始,o c r 系统就是一个活跃的研究领域。现在o c r 系 统的研究重点在于那些非标准字符的识别,包括退化字符、手写体字符和旋转字符 的识别。同时,如何降低误识率和拒识率,如何加快系统的识别速度也是人们的关 注重点 2 ,3 ,4 。一个o c r 识别系统,主要包括学习( 训练) 与识别( 匹配) 两 个过程。其中每个过程都包括预处理、特征提取与选择两部分。通常,学习( 训 练) 过程是在一定的摸板( 标准) 样本基础上,依据某一分类规则来设计分类器; 而识别( 匹配) 过程是将未知的模式与已训练好的分类器进行匹配来识别未知模式 的分类过程,整个o c r 识别系统的流程如图l 一】 5 : 图1 - 1 模式识别过程原理图 实际中一个典型的o c r 系统包含下列步骤: ( 1 ) 合适精度的灰度扫描,一般是3 0 0 1 0 0 0 d p i ; ( 2 ) 分三步进行: ( a )设定域值,利用全局或局部适应算法进行二值化。 ( b ) 分离和提取字符 ( c ) 对提取的字符图象进行适当处理,例如细化或提取轮廓。( 这一步可 以选择) ( 3 ) 特征提取: ( 4 ) 利用一种或多种分类器进行识别; ( 5 ) 后处理。 第一章绪言 小波矩存旋转不变模式识别中的应用研究 1 2 特征提取 为了使识别系统具有较高的识别准确率和较快的识别速度,其基本条件就在于 提取和筛选出好的特征。考虑到大量的特征提取方法,我们常常面临着一个问题: 哪一种特征提取方法适合于特定的应用? 回答这个问题需要衡量各种特征提取方法 从而筛选出性能最优的方法。一个优秀的特征提取算法需要考虑从提取特征的速度 和有效性等方面来综合衡量。另外,所提取特征的有效性还与所采用的分类器有 关,不同的特征提取方法适用于不同的分类器。分类器的分类规则固然重要,然 而,如果所得到的模式特征没有包含足够的待识别客体的信息或未能提取反映客体 特征的结构信息,那么,识别的结果也将面目全非。所以浇,在设计分类器之前必 须找到能快速、准确、有效的提取反映客体的结构信息特征的方法 2 d 图象识别系统除了字符识别而外还有很多用途,例如航天器识别、机件识 别和医学图象组织识别。o c r 系统所采用的特征提取算法也应该适用于这些应用。 d e v i j v e r 和k i t t l e f 定义特征提取算法为:“从原始数据中提取有利于分类 的信息,它们应该具有最小的类内距离和最大的类间距离” 5 。不同的特征提取 算法根据不同的应用和原始样本,在不同程度上适应满足这个条件。适用于某种应 用的算法不一定能在另一领域也具有良好表现。 由于从理论上说我们能从样本中提取的独立特征是有限的,并且必须要考虑应 用中可能出现的模糊、噪声和变形等情况,同时还要尽量将识别所需的特征数限制 在较小的范围内,从而避免维数爆炸的问题。针对实际应用中可能出现的字符方 向、尺寸、模糊程度和类别( 标准体还是手写体) ,一个合适的特征提取方法是具 有很大挑战性的。 特征提取是提高o c r 系统性能的重要一步,然而系统中其他步骤性能对于整个 o c r 系统的性能也是十分重要的。特征选择算法决定了所需的预处理。一些特征选 择算法适用于字符灰度图象,而另一些适用于四连通或八连通的原始二值图象或细 化图象。进一步的,提取的特征还必须满足所选择的分类器的要求。 1 3 不变性特征及其局限 为了能识别一个字符的不同样本,提取的特征必须具有对不同的样本有一定的 不变性。针对样本中可能出现的平移、缩放、旋转或镜像的情况。缩放不变性可以 利用对单个字符的分割来大致确定字符的尺寸和位置,在经过进一步的分析就可以 得到精确的不变特征。如果要识别可能非定向的字符串,就需要特征具有旋转不变 性。然而,除非能事先确定旋转的角度,否则仅依靠旋转不变特征无法区分出 “6 ”和“9 ”,n 和“u ”等特殊情况,这就需要增加先验限制。相同的情况也 ,。一疆藕 、 第一章结吉 小波矩在旋转不变模式识别中的应用研究 出现在尺寸不变性中,例如必须加以尺寸限制才能正确区分“”,“0 ”和 “0 ”。所以我们需要根据不同的需要选择不同的特征,而且在实际识别系统中, 一般需要结合各种特征才能达到最优的识别效果。以下我们将简要介绍现在常用的 一些特征提取方法。 1 3 1 模板匹配 简单的模板匹配方法的一个最大特点是省略了特征提取这一步骤,直接将整个 字符图象本身作为一个特征向量。在识别阶段,计算模板t 与图象z 的相似度, 寻找具有最高相似度的模板t 。,如果相似度超过了阈值,则图象z 就属于第k 类,否则,图象就被拒识别( 在计算差异度的系统中,则是寻找最小差异度的模板 t 。,再根据阈值确定图象是否属于第k 类) 。常用的差异衡量算法是采用均方距离 d 进行比较 6 ,7 : d ,= ( z ( x y ) 一l ( 一,删2 ( 1 1 ) 仁l 需要注意的是,应用该公式必须保证模板与图象具有相同的尺寸m 。式一也常 写为: d :e :一2 r :7 ,+ 局, ( 卜2 ) 其中: e := ( z ( z y ) ) 2 ( 1 3 ) = 1 只矾= ( z ( x y ) l ( x y ) ) ( 1 4 ) i ;l e - = ( 1 ( t ,y ,) ) 2 ( 1 5 ) ,= l e :与e t j 表示图象和模板t j 的能量,表示图象与模板的相关性,可以用来衡量 图象之间的相关度。但p r a o t ”指出z 的能量对r 。有很大的影响,所以人们进一 步利用z 的能量对r ”。进行归一化:r 研= r :d e :a 然而在应用识别中,目标是 寻找最适合输入图象z 的模板,因此改进算法为利用模板的能量对r :,。进行归一 化,具体公式为:r :日= r 幼e 。这种方法已经在o c r 系统得到广泛应用。 由于式( 卜2 ) 的计算量偏大,针对二值图象,人们研究了另外一些相似度衡量 函数 8 。设n ,为满足模板象素值为i ,而图象该位置处象素值为j 的象素数量: 第一章绪占 小波矩在旋转l ;变模式识别中的应用研究 = 6 。( f ,) 删: : o ,1 ) ( 1 _ 6 ) m 代表象素的位置。t u b b 的研究表明j a c c a r d 距离和y u l e 距离表现最优。 d ,= 玉一 j a c c a r d 距离 。 聆l l + 肝l o + ”o l d ,:刍! 坠二鱼鱼y u l e 距离 。 n l l , t 0 0 + n l o n0 l 这种方法的算法简洁,需要的计算量较小,然而的鲁棒性不佳,当样本存在轻微变 形时,识别的准确率就会出现大的波动。为了解决这个问题,t u b b 引入权值的概 念,式( 1 6 ) 相应的变形为: 上 ,2 。= p m ( k i ) 8 。( f ,) ( 卜7 ) = 1 p ( k j ) 为当模板x k 第m 个象素为i 时,输入图象y 匹配x 。的相应概率。先验概 率p 。( k j ) 可以由在第m 个象素处和模板x k 具有相同值的模板数和总的模板数的 比例确定。加入权值在一定程度上可以提高识别的鲁棒性,然而当样本变形情况较 多而先验概率无法考虑所有情况时,识别精度仍然难以保证。 总之,作为一种较为成熟的算法,利用模板进行识别的算法在o c r 系统已经得 到了广泛的应用。模板匹配算法较为简单,对标准文档具有较高的识别准确率和速 率,然而当文档存在旋转、缩放等非标准字符时,模板匹配算法就无法正确应用, 这就大大限制了模板匹配算法的在实际中的应用范围。 1 3 2 拓扑特征 拓扑学研究图形不受畸变变形( 不包括撕裂或粘贴) 影响的性质。区域的拓扑 性质是一种描述区域全局特点的有效特征,这些性质即不依赖距离,也不依赖于基 于距离测量的其它特性。对一个给定平面区域来说,区域内的i l 数h 和区域内的 连通组元的个数c 都是常用的拓扑性质,它们可被进一步用来定义欧拉数( e u l e r n u m b e r ) e :e = c h ( 1 - 8 ) 欧拉数是一个区域的拓扑描述符,全由直线段构成的区域集合可利用欧拉数简 便地描述。 1 3 3 从轮廓提取特征 字符的轮廓可以看成是由一段闭合曲线构成,对外围轮廓的参数方程进行函数 第一章绪言小波矩在旋转小变模式识别中的应用研究 拟合,得到的各阶近似参数就可以作为曲线的特征。由于曲线闭合,所以适合应用 周期函数进行分析,这也是提各种描述子概念的基础。在这个方面应用的最广的是 傅立叶描述子 9 。 傅立叶描述子是在频域里提取形状特征。我们利用区域边界的轮廓线,试图 提取更多的信息。区域的边界一般是一条封闭的曲线如图所示。如果在曲线上任 选一点作为起始点s ,并且延曲线逆时针移动一动点s ,s 的坐标变化则是个周 期函数。通过规范化以后,这个周期函数可以展开成傅立叶系数。显然,傅立叶级 数中的一系列系数与边界曲线的形状有关,可以用作形状的描述。当增加级数的项 数使系数取到足够多的阶次时,几乎可把形状信息完全提取出来,并且可以通过这 些系数重建原来的几何形状。由于边界曲线上的象素点可以用以弧长为函数的曲线 切线角表示,也可以用复变函数5 :r “,勺er 来表示,因此,傅立叶级数的展开 形式不是唯一的,而是多种的。下面仅取复变函数的表示形式。 假定目标区域为r ,它的轮廓线c 通常是一条简单的封闭曲线。占白,是一 个固定的起始点,s 是反时针移动的动点,l 是从s 到动点s 之间的弧长,并且, 用l 表示闭合曲线的周长。 动点s 的坐标与弧长1 有关,可以表示为s ( x ( 1 ) ,y ( 1 ) ) ,曲线的参数方程为 u ( 1 ) = x ( 1 ) + y ( 1 )( 1 9 ) 它是一个周期函数,周期为l ,即 u ( l + i ) = u ( 1 )o 1 l( 1 1 0 ) 令参数t = 2 z c l l ,则u ( t ) 是以2 丌为周期的周期函数,它的傅立叶展开式 为: u ( ,) = 只g = r + ( 只p + 只。e 一”7 ) 口f t 蔓纫( 1 一l 1 ) 一 n = o 式中的傅立叶系数为: 1j 只= 圭r u ( t ) e 1 “d t n = o ,l ,2( 卜1 2 ) 7 e ” 为了提高傅氏描述子的运算速度,k u h i 与g i a d i n a 对傅氏描述子作了改进 1 0 , 曲线参数方程进一步近似为: 王= a o + 多= c o + c o s t 2 n n t 州n 孚j8 t n8 1 “丁i c o s 丁2 n m “s i n 孚f三 ” 上f l 表示轮廓曲线的周长,当寸。时,膏sz ( ,) ,歹sj ,( ,) 。式中的各项系数为 i 。硪 l r l r。掣d 第一章绪言 小波矩在旋转不变模式识别中的应用研究 a = 彳1 x ( t ) d t c 。= 亭p o ) a t ”争m s 孕出 驴珈坶n 芋折 铲手c o s 芋加 以= ;m s i n 芋加0 1 因为实际中我们处理的x ( t ) 和y ( t ) 是离散的,所以、瓯、c n 、瓯的离散表 示为: 吼:i 鲁 a x 。庐,一。“ 吼2 丽备i 【c o s 妒,1 0 8 州 6 。= 孬t 台m 瓦出1 s i n 妒, - s i n 圳 铲嘉莓等呻s 。s 扎, d 。= 五t z 争百a y f , s i n ,一s i n 方程中各项参数定义如下: 痧= 2 ”乃孑, 丁= ,。= 兰, a x ,= x ,一z ,ja y ,= y ,一y ,一1 f j = 肛百矿卜窆, 傅氏描述子可以随着拟合精度n 的增加,记录下曲线从低频到高频的所有特征,从 而在傅氏谐波的基础上实现多分辨率分析。但这种方法由于条件限制仅适用于闭合 曲线分析,当图符由一个以上的连通分量组成时,该方法就无法很好适用。同时, 作为特征的系数依赖于最初点5 阮的选取,应用于旋转图符时,这就时一个非 常大的局限,所以汶巾时傅氏描林子存宴际中商用右隅的厦1 夭i :t 囊端 第一章绪言小波矩在旋转不变模式识别中的应用研究 1 3 4 矩特征 如果希望了解一个图象区域的内部细节情况,最普遍采用的特征是矩特征。自 从h u 在6 0 年代第一次提出应用图象矩识别2 d 模式以来 1 1 ,不变矩理论已经取 得了很大的发展。作为2 d 形状的特征,利用不变矩对2 d 图象进行识别很早就得到 了人们的重视,基于矩的思想已经得到了广泛的应用。r e s i s 修正了一些理论证 明。s i n 比较了一些不变矩理论和傅立叶一梅林变换之间的关系。以下我们将简要 介绍这常用的几种矩特征,并简略分析它们的优缺点。 ( 1 ) 几何矩特征 h u 首先在模式识别中引入了几何矩特征的概念 1 1 ,他提出的具有平移、缩 放和旋转不变性的正交矩特征已经得到了广泛的应用。在h u 工作的基础上,人们 对矩特征进行了许多改进 1 2 ,1 3 ,成为识别中使用的良好的候选特征。 矩特征的定义;a t :设图象区域函数是分段连续的,则图象的( m + n ) 阶矩定 义为: m 。= lp y 坝x ,y ) c l v d y 只要f ( x ,y ) 在x y 平面的有限部分中为非零值,则上式定义的各阶矩都存在。 并且,集合 m 一 由f ( x ,y ) 唯一确定,反之,f ( x ,y ) 也可以由集合 m 。 唯一确定。但是由于 m 与坐标的位置有关,不具备平移变换的不变性,所以 不适合作为特征使用。 考虑到矩特征的上述的缺点,人们对矩特征就加以质心限制提出了改进的中心 矩 1 4 ,1 5 ,它具有平移不变特性,具备良好的识别特性: 鼍 “。,。2 jj ( x x o ) ”( y y o ) ”厂( x ,y ) d x “ ( 卜1 5 ) 一2 m t 。m 。 其中: 【y 。2 m 。m o o m m 与“一的离散形式为: m 。= z yf ( x ,y ) 。 ( 卜1 6 ) “。= ( z x 。) ”( y y 。) “f ( x ,y ) j y ( 1 - 1 7 ) 第一章绪言小波矩在旋转不变模式识别中的应用研究 由于矩特征是与图象f ( x ,y ) 中的所有象素相关,所以矩特征,特别是低阶矩特 征具有明确的物理意义,例如,零阶矩m 。= f ( x ,y ) ,当f ( x ,y ) 描述 物体的密度时候,则m 。表示物体的质量,而相应由式计算的x 。与y 。便是物体质 量中心( 质心) 坐标,直接表示图象区域的灰度重心坐标。 不大于3 阶的中心矩为: ,0 0 = m o o ,o l = 1 l o = 0 1 1 1 = m 1 i x o m o l = m 】l y o m l o ,2 0 = m 2 0 x j m 0 0 ,0 2 = m 0 2 一y ;m 0 0 ,1 2 = m i3 一x o m 0 2 2 y o m i i + 2 y ;m l o ,2 】= m 2 1 - y o m 2 0 2 x o m i i + 2 x2 0 m o i ,3 0 = m 3 0 一3 x o m 2 0 + 2 x :m 0 0 ,= m 0 3 3 y o m 0 2 + 2 y :。吖o o 为了使中心矩标准化, 可以利用公式。= 7 乞品, 式中 r = m _ + n ,十月= 2 , 3 。标准化的中心矩不光具有平移不变性,而且还具有比例 变换的不变性。为了得到平移不变性,h u 利用标准化的2 阶和3 阶中心矩导出不 变特征的集合: 矽l 2 l 2 o + “o 2 妒2 = ( “2o 一0 , 2 ) 2 + 4 “2 3 = ( “3 ,o 一3 u ) 2 + ( 3 “2l 一0 , 3 ) 2 4 = ( “3o + u l 2 ) 2 + ( “2 l + 0 , 3 ) 2 妒u 陬3 o - 3 砘u 1 2 激一+ i , 叩2 k 帆u 3 , 0 + 矿u l , 2 ) :2 ) 2 _ - - 3 ( u 2 , 1 3 u,崔甜 。 ( 2 1 一“o ,3 ) ( “2 ,l + “o 3 ) l 3 ( “3 ,o + “u ) 2 一( 甜2 ,j + “o3 ) 2l 驴旷姥拦麓f 嚣”) 2 + 矽,:( 3 “z 厂( “3 0 + 帆+ 2 3 ( u 2 j + 训2j _ ( “3 ,o 一3 u ) ( “引+ u o , 3 ) l 3 ( 甜3 ,o + z i , 2 ) 2 一( 甜2 ,l + “o 3 ) 2j 第一章绪占 小波矩在旋转不变模。识剐中的腑用研究 从矩特征的定义和计算公式可以看出 的统计基础上的,是一种细节性的描述。 态特点,是物体形状的一种描述。 它们是建立在对一个区域内部象素分布 它们从不同角度反映区域中的客体的形 l i 不仅重新定义了h u 的七种不变矩,而且介绍了一些新的高阶不变矩 1 6 。 然而,h u 的不变矩有一些缺陷。一个缺陷就是随着阶数的增加,矩的复杂度有显 著的增加;另一个缺陷就是矩不是从正交函数系中推出,所以对图象的描述有大量 的信息冗余。 ( 2 ) z e n i k e 矩 t e a g u e 假设基于正交多项式的正交矩结合标准矩理论来克服这些问题 1 7 。 人们提出许多图象矩如几何矩、l e g e n d e 矩、z e r n i k e 矩、p s e u d o z e r n i k e 矩、 f o u r i e r m e l l i n 矩 1 8 ,1 9 ,分析并估计了它们在噪音敏感性、信息冗余和图象 的描述能力,其中z e r n i k e 矩的表现最优。k h o t a n z a d 和h o n g 比较了h u 的不变矩 和z e r n i k e 矩在字符和形状的旋转识别方面的能力,z e r n i k e 矩表现出了明显的优 势 2 0 ,2 1 。根据这个结果,正交矩特征在阿拉伯数字识别方面已经得到了应用。 在k h o t a n z a d 和h o n g 提出的z e r n i k e 矩算法中 2 0 ,是利用一组特定的正交 多项式吃“,为基,将空间图象在这组j 下交基上进行投影。“,y j 定义 为: ( x ,y ) = 尺。( x ,y ) p “z 1 这里= 4 :- 1 ,n o ,mj n ,n j mj 为偶数, dh 、”- f m l l 72 ( 一1 ) ( x 2 + y 2 ) “2 1 1 ( n j ) ! r m z y 2 萎:i ;i i i 丑i j 鬻s 忙。 一( 二二二上二_ 一s ) ! ( 兰上二一1 1 对于数字图象1 3 阶z e r n i k e 矩的m 次迭代定义为: 爿。= 掣厂( x , y ) ( w ) r 公式中x ,y 需要满足x 2 + y 2s 1 ,符号“ ”表示复数共轭。需要注意的是,原始 图形必须要事先归一化到单位圆x 2 + y 2s 1 内。由于“,j ,j 为一组正交基, 所以原始图象可以根据a 。重建: 厂( w ) = 熙4 。嘣w ) 9 第一章绪占 小波矩在旋转小变模式识别中的应用研究 a 。的模值la 。i 具有旋转不变性,从而z e r n i k e 矩就成为旋转不变特征。同 时借助0 阶标准矩和缩放预处理来事先平移、缩放不变性。 从以上的简单介绍可以看出,一幅图象的矩特征是该图象整个空间特性的集 成,一幅图象可以被它的所有阶数的矩特征唯一确定 2 2 ,2 3 ,2 4 1 。低阶矩e e 高阶 矩相对稳定,然而几何矩和z e r n i k e 矩对数字化错误、细微的形状损毁、投影的误 差十分敏感,并不适用于被随机噪声污染的图象的分类 2 6 。当样本类别之间的区 别比较细微时,几何矩和z e r n i k e 矩识别的准确率也会很大程度的下降。如何解决 这个难题成为矩特征应用的一个关键。 1 4 本文工作 在已有文档自动输入的研究工作中,已经发展出了多种特征提取方法,在实用 化方面也已经取得相当成果。但由于图符的多样性和复杂性,图符的快速分离和特 征提取方面在满足实际要求方面仍存在许多困难。 针对目前地形图输入系统的不足,本文在图符的特征提取、快速识别和混合文 档中图符的快速提取方面做了有益的探讨研究。 o 第二章小波矩及其离散改进 小波矩在旋转不变模式识别中的应用研究 第二章小波矩及其离散改进 2 1 引言 在h u 矩、l i 矩、z e r n i k e 定义式 2 7 1 基础上,我们可以容易的看出h u 矩、 l i 矩、z e m i k e 矩提取的都是图象的全局特征。可以看出,h u 矩、l i 矩、z e r n i k e 不变矩是在整个图象空间上计算。假设我们有两个相似的物体,它们相应的矩 分别为| | f 。i i + d h f 。l i 。在无噪音的情况下,i i f 。| = i | f ,。i i + a 。,a 。为细微的区别。 而当存在数字化时或随机的高斯噪声时,相应的关系成为: 忙p q i = i i f p q 1 1 + p q + n o i s e p q 。因为图象在h u 矩、l i 矩、z e r n i k e 矩上的差距十分 细微,然而n o i s e 。的模为全图象的噪音影响叠加,所以常常大于p q o 结果忙,。| | 和i 限。f f 的值的变化区域可能相互重叠,从而无法e 确区分。这是利用全局性质 的矩区分仅有细微差别的物体一个很难纠正的问题。 如果能寻找一种函数能有效分辨图象的局部特征,其相应的归。i l l l i e 。| | 是 从局部图象提取出来的值,则它们之间的区别d 。就可能要大一些,而n o i s e 。的 模必然会减小,这样f f f 。f f 和f 嘛。 f 的值的变化区域不太可能相互重叠,鲨星造竖 尘这变拯丛图筮主握塑适当险麴鳆丕变缒的二尘苤毽星婺 2 】! 2 2 小波简介 由于小波理论的迅速发展,小波分析作为一种新兴的理论,对工程和数学 都产生了深远的影响。从原则上讲,凡是采用传统的傅立叶变换的地方,都可 以用小波变换取代。小波变换适于局部频率分析的关键在于它对不同的频率可 以开不同的时间窗,低频的时间窗长而高频的时间窗相应较短。并且小波变换 提供了多分辨率分析,可以实现从粗糙逐步到精细的匹配。对不同差异的样本 可以采用不同的分辨率匹配,由于粗糙匹配仅需要较少的系数,这样可以大大 的提高识别效率。多分辨率的理论简介如下:定义尺度函数: ( x ) = 4 2 :h k ( 2 x k ) z( 2 - 1 ) 利用尺度函数可以定义一族小波函数: 妒( x ) = 2 g 。声( 2 x 一) g 。= ( 一1 ) h ,一。 ( 2 2 ) q 盈l ( 盈q 盈l 图2 - 1 小波多分辨率分析 第二章小波矩及其离散改进 小波矩在旋转不变模式识别中的应用研究 从而实现对空间进行多分辨率分析。虽然这样得到的小波函数可能无法显示表 示,但一旦系数丸得到,则整个函数的性质就确定了。 多分辨率是在佃j 函数空间内,将函数,描述为一系列近似函数的极限, 每一个近似都是函数的平滑版本,而且具有越来越精细的近似函数。这些近似 是在不同尺度上得到的,因此称为多分辨率分析。图2 1 表示了多分辨率的基 本过程:c ? 表示函数,在第j 次尺度空间的第k 个基上的投影,d :表示函数厂 在第j 次小波空间的第k 个基上的投影。这就是m a l l a t 金字塔算法 2 9 ,最初 的c o 就是输入的信号空间,c 和d 1 为相应的平滑分量和高频分量。 利用多分辨率小波变换可以实现局部分析,与传统的短时间傅氏分析不同 的是,小波变换同时提供了在时域和频域的局部分析,对低频采取稍微粗糙的 时域或空域步长,对高频则采取逐渐精细的时域或空域步长,从而可以聚集到 分析对象的任意细节。小波的这个性质使它十分适合提取图象的局部特征。小 波变换目前正与图象信号处理的实际应用结合。1 9 9 6 年,c h c h u a n g 与j a yk u o 提出了针对平面曲线的小波描述子 3 0 1 。c u a n g y ic h e n 在1 9 9 8 年利用傅氏变换 改进了模式识别的小波描述子f 3 1 1 。基于小波变换的优点和日益成熟的应用, 我们选择利用小波矩是因为它除了具有矩特征的优点外,还具有实现对近似模 式的分类识别的能力。 2 3 小波矩及其离散改进 2 3 1 小波矩构造简介 为了得到旋转不变矩,我们采用极坐标表示方法: = f f ,( x ,y ) g ,( ,弘w 9 咖d 目,昂似是关于半径,的函数,p 、q 为整数参数。容易 证明,0 。9 = 扣i 忑了( + 代表复数的共轭) 具有旋转不变性 3 2 。为了减小从二维 图象中提取一维特征序列的难度,我们把特征提取分离为在相位区域 o 朔立种 和径向区域 o g r 9 1 ) 内依次进行:第一步为& ( r ) = 陟( ,o ) e 朋d o ,可见昌是关 于变量r 的一维序列;第二步根据。=

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论