(通信与信息系统专业论文)基于gabor滤波器和rbf神经网络方法的手写体笔迹识别.pdf_第1页
(通信与信息系统专业论文)基于gabor滤波器和rbf神经网络方法的手写体笔迹识别.pdf_第2页
(通信与信息系统专业论文)基于gabor滤波器和rbf神经网络方法的手写体笔迹识别.pdf_第3页
(通信与信息系统专业论文)基于gabor滤波器和rbf神经网络方法的手写体笔迹识别.pdf_第4页
(通信与信息系统专业论文)基于gabor滤波器和rbf神经网络方法的手写体笔迹识别.pdf_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独 立进行研究所取得的成果。除文中已经注明引用的内容外,本论文不 包含任何其他个人或集体己经发表或撰写过的科研成果。对本文的研 究作出重要贡献的个人和集体,均已在文中以明确方式标明。本人完 全意识到本声明的法律责任由本人承担。 论文作者签名:丑兰! 色日期: 上埘r 、i3 关于学位论文使用授权的声明 本人完全了解山东大学有关保留、使用学位论文的规定,同意学校 保留或向国家有关部门或机构送交论文的复印件和电子版,允许论文 被查阅和借阅;本人授权山东大学可以将本学位论文的全部或部分内 容编入有关数据库进行检索,可以采用影印、缩印或其他复制手段保 存论文和汇编本学位论文。 r 保密论文在解密后应遵守此规定1 敝作糍:娅导师签澎日 山东大学硕士学位论文 中文摘要 本文通过对多通道g a b o r 滤波器( m g f ) 和r b f 神经网络有关理论的研究 结合对手写体笔迹形成机制和特征的分析,提出了一种基于g a b o r 滤波器和 r b f 棒经潮络技术靛手写体笔迹谈甏方法。该方法蓄先黠纛始的手写体鹜豫避 行归化处理生成统的文本块,以减小不同字距和行距等蹦素对纹理的影 响;然后利用m g f 技术从归一化的文本块中提取纹理特征;最后,采用径向基 函数( r b f ) 神经网络来完成分类判别。为了检验本方法的有效性,对建立的 手写 拳群本数撼疼遗行了实黢,著搀实验缝象与荻瘦共尘短黪( g s c m ) 特薤提 取方法进行了比较。熬个实验过程是刹用m a t l a b 编程实现的。实验结果表明, 本文提出的这种方法艇有良好的可行性。 关键溺;手写体识别,纹理分手厅,妇一化,g a 胎r 滤技器,r b f 神经网络 山东大学硕士学位论文 a b s t r a c t t h isp a p e rf o c u so ns t u d yo ft h em u lti - c h a n n e lg a b o rf ii t e r s ( 滋f ) t e c h n i q u ea n dt h er a d i a lb a s i sf u n c t i o n ( r b f ) n e u r a l n e t w o r k ,a n a l y t h ef o r ma n df e a t u r e so ft h e h a n d w r i t i n g ,p u t f o r w a r dai d e n t i f ym e t h o do fh a n d w r i t i n gb a s e do ng a b o rf i i t e r s ( m g f ) t e c h n i q u ea n dt h er a d i a lb a s i sf u n c t i o n ( r b f ) n e u r a l n e t w o r k 。f i r s t l y ,t h eh a n d w r i t i n gi m a g en e e dt ob en o r m a l i z e d t or e d u c et h ei n f l u e n c eo fd i f f e r e n tw o r ds p a c i n ga n dv a r y i n g 1 i n e s p a c i n g s e c o n d l y ,t h em u l t i c h a n n e lg a b o ri su s e dt o e x t r a c tt e x t u r ef e a t u r e sf r o man o r m a l i z e dh a n d w r i t t e nt e x t b l o c k f i n a l l y ,t h er a d i a lb a s i sf u n c t i o n ( r b f ) n e u r a ln e t w o r k i sa d o p t e dt of i n i s ht h ee l a s s i f i e a t i o n 。a sac o m p a r i s o n 。w ea l s o u s e g r e y s c a l e c o o c c u r r e n c em a t r i c e s( g s c m )f o rf e a t u r e e x t r a c t i o n a l lo ft h i sw o r ki s p r o g r a m m e db y 淞t l a b t h e e x p e r i m e n tr e s u l t si n d i c a t et h a t t h i sm e t h o dh a ss u b s t a n t i a l f e a s i b i l jt i e s k e yw o r d s :h a n d w r i t i n gr e c o g n i t i o n :t e x t u r ea n a l y s i s n o r m a l i z a t i o n :g a b o rf i l t e r s :r b fn e u r a ln e t w o r k 4 山东大学硕士学位论文 m g f :多通道g a b o r 滤波器 g s c m :狄度共生矩阵 r b f :径向基函数 h p p :水平投影剖面 符号说明 山京大学硕士学位论文 第一章等l言 目前,图像谈剃技术已经在许多领域得到了广“泛的应用,并崖正越来越s | 超 人们豹高度重视。例如,程复杂背景下军攀目标的识别、字符识别、手势识别、 表情识别、车牌自动识剐、人脸识掰、指纹识别等。 多年以来,在图像处理和模式识别领域中,囊份识别一直是一个非常热门的 研究课题l f l 。其醋的就在于能够檄据从爵标图像中提取出的统计特征,对目标避 行自动的身份识别,因此,它正越来越受别学术界和工业界等各方面的广泛关注。 爵游迸彳亍的身份谈荆技术中所采用的人体特征主鬻有两翼:生理学特征( 例如面 部特征和指纹) 和行为特镪( 例如声音和手迹) 。慕于手写体的个人身份识别是一 种行为特 藏识剐方法。与其它特征稽眈,手写体瑟容荔褥到,并髓不同的入有不 同的手迹。在安全、法庭、财务到考古学等许多相关的应用中,这种身份识别技 术鄂有菲常广泛静应用蕊豢。 目前,尽管人们一直在不断进行着各种努力和探索,但身份识别仍然是一个 富有撬藏後鲍阁题。在安全帮有关静应蠲中,大们习寝予逶遥一份手写藩来谖剐 书写人身份。目前许多己知的基于手写体的身份识别大都假设所筲的文本是固定 懿( 铡鲡:鬏据个签名来逶嚣书写太懿隽份谖弱) 。钛这耱意义上来说,签名识 别也可以被称为一种基于文本的书写人识别方法。这些方法提取些特征,例如: 书写速度、方惫、麓度、宽凄、黻爨角等等。这整主要绞羧予交互定寝秘有关文 本信息的分割等技术,但要真正实现起来却是非常困难的。使用某些固定文本柬 遴行隽侩浚剩,_ 挲在谗多不是之懿;蓄囊,一些簿擎豹戮定文字缀容爱被模莹, 这就使得对书写人的识别极易被伪造:另外,这种基于固定文本的身份识别在许 多重要熬突嫁应愆中是不霹懑豹,例如,怼基经露楼豹手写文档懿书写人粒识别, 法庭上犯罪嫌疑人的身份识别等等。在这些应用中,对一份手写体作者的身份识 别透豢由专业豹手写体鉴别久员( 帮笔校家) 象进行。尽管在这些应用中,某些 人为介入有时候怒有效的,但这种方法耗资较大,并且鉴别人员很容易疲劳,从 聪使识别酌减功率下薅。 因为身份识别的目的是识别份手写体的作者,因此没有必矮知道所写的文 本是竹么。至今为止,书写人身份识别大部分研究工作还仅仅只是一个开端,并 不能真正令人满意。身份识别困难较多,其中一魑如下: o ) 个人的手迹不怒一成不变的,随着某人心情、所处环境、劳逸稷度等条 件的不同,他的手迹也会肖所差辫,因此,严格的特征酝配方法往往并不一定能 山东大学硕士学位论文 娄效: f 2 ) 徐手体在大小、覆嚣、纸爱分毒等鹚:多方嚣撵在羞夔异,对不变健谈 别提出了较高的要求: f 3 ) 识鄹对象磐果不熬羧裁,裁是庞大豹人心数,困| 迦一般醭宠都键慰套袋人 群。 实鼯兹书霉入赛份识别,不嫂要扶糖变育噤约文档强缀中对塑振徽出不变性 识别,逐要具有较高的识别率和处理速度,因此是一件非常困难的工作。识别率 秘速瘦酌提裹,蔫不开灏思想毅算法靛引入,叛愚想掰算法也就藏为身论识别磺 究的重点。 二维g a b o r 涵数能较好地撼述哺季l 渤物初级视觉系统中一对简单视觉享申经元 的感受翳特性。在人类视觉皮屡图示信恩的处璎过程中,包括一系列并行和准依 黩机制域者可用繁通滤波嚣来摸仿的皮层通道。无论从室间域的起伏特性上、方 向选择上、空间一频率域的选择,还是正交相位的关系上,二维g a b o r 滤波器与皮 层简单细胞的二维感知城的模型都相互吻合。种种事实都说明,二维g a b o r 变换 在图像分析中是非常有用的。 径向基函数( r b f ) 神经网络是一种典型的局部逼近神经网络,和b p 网络相 眈,r b f 网络在道近能力、分类能力和攀习速度等方面筠其有更好的往髓。 本文通过对多通道g a b o r 滤波器( m g f ) 和r b f 神经网络有关理论的研究,结 含对手葛体笔迹形成税翻和祷征的分拆,提窭采用g a b o r 滤波器方法和r b f 幸孛经 稠络技术来对手写体笔逊图像进行分类识别。论文共分五章: 第一章g | 吉; 第二章手写体笔迹概论;对手写体笔迹的肖关理论尤其是销迹形成的科学机 露稻笔浚特征遴萼亍了分j 薅; 第三章手写体文本图像的分析与识别;详细介绍了图像预处理的具体方法以 及丽予纹瑾鼙稼特薤挺敬豹m g f 帮g s c m 嚣释方法;怼r b f 耪经瓣络方法豹模式分 类与i a t l a b 实现做了较为详细的说明; 第鞫章实验与讨论; 第五章结束语。 氆东大学硕士学位论文 第二章手写体笔迹概论1 2 1 2 1 笔迹与书写习惯 笔迹避手写文字耱号的表现形式,是书写动捧的反应。笔迹从其形成的要素 来稽,使人们根据文字符号的书写幼作规范,运用书写工鼹,为了达到菜种目的, 表达一定的意向,书写运动器官的书写动佟遗留在纸面上的动态痕迹。 笔迹与书写习惯是两个根本不问的概念,但窀们之闯是有内在联系的。书写 技髓是人类的重要技能活勰之。它是指人们书霹文字符号“自动化”动作系统 的“自动化”程度葶矸完善化程度。久彳f j 在书写文字符号时所表现滋来静与婉范静 书写动作不同的种种特点,就是书写动作习惯。笔迹鉴定所运用的笔迹特征,就 是书写习。睽的反应。即书写习惯怒通过笔迹特征反映出来鹣。 笔迹特征与书写习惯的关系,是客体的反映形象与客体物自身的关系。笔迹 特征是书写习惯的反映形象,书写习惯是客 奉物麓蠡身。书写习馁羟鸯逶遵笔醯 反映其种种特点才会被人们感知和理解。所以,没有笔迹就无从考察书写习惯, 谈谈书写习惯必须欲研究笔迹入手。 广义一l 二讲,书写习惯包括三个方面。第一是书写动作习惯,反映在手写文字 上就是笔滚特征。第二是簸文字瓣书写形式土反映出柬懿文字蠢髑习馁。第三楚 从文字的内容上反映出来的书面语言习惯。在手写文字中,笔迹、文字布局和书 甏语言三蛰怒密蛹联系懿,杰令文字鞘多翡文书物 正上,三者往往会嗣时爨瑰。 书写动作习惯是构成个人书写习惯总和的主要方面,是笔迹学研究的主骤内容, 蔻笔迹签定谈定文律书写入豹主要傣撂。其它嚣令方瑟豹习馁是椽戏令人书写习 惯总和不埘忽视的方面,是笔迹学研究的附属内容,是笔迹鉴定认定文件书写人 蕊壤劲莰爨。 2 。2 誊写习蠼的科学基础 书写活动是人类独有的特殊机能活动。书写活动是夜大脑皮层有关中枢与书 写运动器襄豹协调配合下实现懿。现代科学骈究波明,大脑皮层各个部分是一个 统一的整体,互相交织,协同配合,实现各种机能活动。但各个部分在鼹体机能 上又毒搬对分工,郎规体的各个中抠在皮层上有定位关系。在生理学上称为大脑 皮层机能定位学说。依据大脑皮屠各部位机能的性质,大脑皮层分为许多重要中 枢。其中主要豹礴l o 个:躯体运动中枢、躯体感觉中枢、视觉中枢、听髓中枢、 啖觉和味髓中枢、管理内脏活动的皮层中枢、运动性语言中枢、晰觉性语言中枢、 视觉性语誊中抠以及书写中枢。 山东大学硕士学位论文 在以上的1 0 个中枢中,与笔迹学研究书写习惯有关的主要是运动性语言中 枢、听觉性语言中枢、视觉性语言中枢和书写中枢。人的书写活动主要是在这些 中枢的支配和相互调节下进行的。 人的语言活动中枢和书写活动中枢,丌始在两半球都有基础,以后( 一般认 为1 2 岁以后) 在一侧半球逐渐发展形成语言和书写的优势半球。善于用右手书写 的成年人,大脑左半球是优势半球。如大脑左半球受伤,会发生语言机能和书写 机能障碍,而且很难在右半球再建立语言书写机能。 每个人的书写机能都反映出特有的书写习惯。书写机能和书写习惯都是在长 期的书写实践活动中同时形成的,是一种条件反射锁链系统,即书写动力定型, 也就是条件反射经过多次强化而获得巩固的暂时神经联系。动力定型具有两个明 显的特点。一方面它是一呻 自动化了的锁链系统,各个动作之间环环紧扣;另一 方面实现这种自动化动作时受意i i 控制的成分极小,主要靠反射系统的自动功能。 机能和习惯都是由于经过练习而获得巩固的行为方式,都是动力定型的表现。 条件反射是书写机能和书写习惯形成的基础。人的一切活动都是条件反刺活 动。书写活动是一种精细复杂的条件反射活动,是经过长期的书写实践活动逐步 形成的。即经过反复的书写练习,书写动作在大脑皮层有关中枢和书写运动器官 之间,所建立的神经联系不断强化并获得巩固的结果。 书写习惯形成的全过程,大致可分为识字描摹、练习提高和书写动作自动化 三个阶段。经过几个阶段之后,参与书写活动的各个机能系统联合成为一个有机 的整体,大脑皮层各个中枢与书写运动器官高度协调配合,条件反射系统全部巩 固,书写动作自动化体系全部建立起来。书写时,在具体书写动作的方式上受意 识监督控制的程度极小,而是通过条件反射锁链系统自动实现。表现在笔迹上是: 笔迹熟练程度较高,独特的书写风格已经形成( 字体、书体、字形已定型) ,书写 动作规律性强,书写习惯的特殊性已经明显的显现出来。短时期内,书写技能和 书写习惯一般不易受到主客观因素的影响而发生较大的变化。这些书写动作反映 在书写面( 如纸张等) 上就是笔迹。书写动作习惯反映在笔迹上就是笔迹特征。 2 3 书写习惯的特殊性与稳定性分析 一、书写习惯的特殊性 每个会使用文字和书写文字的成年人,书写习惯都具有特殊性。书写习惯的 特殊性是指每个人的书写习惯总和都是特定的,与其他任何人不会相同。即人与 人之间书写习惯体系绝对不同。书写习惯的特殊性,是笔迹学家、生理学家、心 理学家和医学家通过研究实验,并经过1 0 0 多年笔迹鉴定实践的检验所证实的科 山采大学硕士学位论文 学真理。书写习惯的特殊性是笔迹学鉴定的重要依据。 书写习髅豹持殊性,楚由于簿个人在其习撄形成过稷中鳇一系列特殊条l 牛决 寇的。主要有: l 、 个人生理因素髑心理爨素麴差髯; 2 、外部条件的影响; 3 、 形成书写习惯自动化锁链系统豹特定翻豢。 总之,书写练习时由于每个人的内部因素和客观条件有一定的差别,在建立 书写动作爨动化系统过程中接受的信号刺激是特定的,处理书写信号刺激的方式 也是特定的,这种特定性反映在笔迹上就是书写动作特点( 笔迹特征) ,一定的动 作特点总和,就题书写习惯的特殊本质。在笔迹学鉴定中,根据笔迹特,谯可以识 剐各种伪装,可以判明伪装的手法,可以分射认窿文件的书写入。 :、书写习惯的稳定性 书写习惯一量形成以后,其特性能在定的时期内保持稳定而不发生徽本改 变。书写习惯的稳定性是笔迹鉴定又一个不可缺少的科学依据。书写习惯相对稳 定的原嗣主要有: 1 、 任何动力定型都具有稳定性; 2 、 条 孛爱羹| 的强度藏露; 3 、 书写动力定型锁链系统本身的特点; 4 、意恚力、注意力对书麓活动羧箍匏霄隈经。 除此之外,语言文字本身的稳定性,也是书写习惯保持相对稳定的一个外部 条俘。诿言文字静稳定径楚缀大楚。出予一个人长鬻反笺镬蹋帮书写圈耱语言 和文字,因而书翳习惯能不断的得到巩固。 雯癸,天懿书写习镤在发震变纯过程皆,其稳定程发楚不一榉戆。影鹇书写 习惯稳定的因素很多,如生理因素、心理因素、病理因素、书写技能高低、职业 条搏、兴趣爱好、书写入主鼹动撬等,以上季孛静瓣豢都可引起毒 鬟韵终发生变纯, 佩只要不是一次性书写的文字极少,一般都能反映出个人书写习惯的特殊性。这 秽毅变不楚书写习摸豹改变,嚣是书写动捧鲍錾瓣改变,疰正卷黪条件下纛骞的 书写习惯鼹可以恢复的,仍能反映个人书写习惯的特殊性。 惑之书写习惯豹穆季孛特牲决定了一个人豹笔遮是独一茏二的,笔迹怒每令人 的影子。从另一个角度看,由于镰迹的本质是自我的再现,因此各类伪凝、模仿 蛇最终效慕都是德劳豹。豳越,我们根撂每令人的手写体孛所包含豹纹理特性, 缀过一些相关处瑕,便可以由此来识别一份手写体是否为某人所写,这正是本文 嬲要研究熬课题。 0 由衰夫学鞭士学位论文 第三章手写体文本图像的分析与识别 3 1 图像预处理与纹理特征分析 模式识裂怒鑫2 0 毯纪6 9 年代疆柬,疆豢计募秘辩学豹发矮瑟愚逮残长起寒 的一门新兴学科。它主溪通过获得的大量信息对复杂过程进行学习、判断和寻找 烧律。攘式识别豹数学方法主要有硬秘:统诗决策方渡以及句法或续掬方法。统 计决策方法基于多元统计学、代数学及运筹学等;而句法或结构方法则是基于形 式语言簿。本文掰磅究麴是一静绞计模式谖别方法。 基于统计方法的图像识别聚统主要由四个部分组成:图像预处理,图像分割, 特 王提取,疆标识剽。具髂参见圈3 一l 。 墨 专蔓 势娄嚣敬 i | 竺! 里止堕n ! 到e 一| 鬯:兰兰蛩 图3 。1 幽像识别系统基本结构 一、醋像预楚璇 狭义的图像预处理( p r e p r o c e s s i n g ) 1 3 l 是指将原始图像进行增强或复原,以 使于盾续静分丰厅处理。广义的图像预凳理是指所有的那些便于瑶续分耩的处瑾方 法,例如二值化、归一化等等。 圈像增强力求改善鹜像的联耋,在不了簿图像降霞蔡蟀漂戮豹祷溅下,鼋试 探方式对图像进行加工,使得一方面在视觉上产生更清晰的目标,另一方面为目 标分割和谈翔撼供更奄效豹分类空阂。楚理方法主要懿摇获瘦髂歪、瑟像平瀑、 图像锐化、图像非线性滤波等。 ( 1 )灰爱罄正方法主要有壹方强绣餐、获凄豹线整交换秘菲线髅变按等, 在图像信号较弱时使用。 ( 2 )銎豫乎潺方法奏是部平均法、低逶滤波法强及多梭平均法等,瘸予弱 像噪声较大时。 ( 3 )塑像锐证方法皂瑟空润域熬锐纯鞠羧域熬窝频提舞滤波,主要在曩臻 轮廓不清时使用。 啦衰夹擘矮掌位论文 ( 匐强缘 线往滤波有中 蠡滤波、选嚣乎稳法秘热歉乎鹭法嚣,蠲予去臻 噪声同时更好地保持边缘。 图像复原怒指试图利用退化过程的先验知识馒图像愀复,以图像保真为目的。 鎏豫运纯靛是豢鑫于藏稼系绫受到蠢耱于撬,懿成落系绫戆鼗焦、戏豫系绞与嚣 标的相对遥璐、成像器件的围脊缺陷隧及外部予抗等,从而引起的图像蔟爨下降。 典型斡黧缘复蹶方法有:遵滤波、w i e n e r 滤波、k a l m a n 滤波等。 归一化处瑕方法| 4 主要j 夔用于文本图像的纹理分析中。经过仔绷观察,我们不 难发现对于用任何一种语畜书写出的文本块,都明显具有一定的纹理性。不同人 静手遽会攫示爨不霾靛纹璎。这整绞理特征熬麓剿皇要楚崮字夔筑臻程疫以及笔 画走向的变化所决定的。出予每个人书写风格鲍不同,学写体图像会存在明显的 差异,魏舒闼躐、字闯隔、炎边空囊等等。 对暇始的文本图像不能童接避行纹理分乖斤,因为图像的纹理特缝会受剐不同 的文字空问和变化的线性空问等因索的影响,通过归一化处理,可以将这魃因素 豹不利影嘲海到最,、。| 超一纯蕊辕入通誊为 壬手写文本豹二避制鞫豫。该手写 文本可隧包含不同尺寸的行、不同行雅、字和字符。通过归一讫处遴,将行和字 的间隔以及受边空白设成预定大小,不完整妁行 j j 文本避行填充,最后生成统一 的文本黼像。 对幅文本图像进行l 罔化处理可大致分为以下几个步骤: ( 1 ) 、击噤处理 瓣务释方法所得到静文本图像中茸能包含篓斑点或者其毽麓噤声鬻像,它 们会对文本行灼耀关处理遥成不利影韵,必须对其进行去噪处理。去嗓方法多种 多样,憾最终瓣銎的就是躐能清除无关静噪声,弱薅又缝最好的豫篷文字豹笔禹 特征。热体的去噪方法要根掇实验效果比较而定。 ( 2 ) 、文本行定位 蓄兜褥骧始豳像左右溪 餮l 懿夏逑空自蘩| | 豫。褥浆豢鬻像计雾蠢手霉落文本秘 水平投影削面( h p p ) i “,削面阁中的尖峰就对艨着每个文本行的中心,丽山谷的 竞褒弱袋示了薅个文本孬之溪豹空弱阉隔。裂藤渡裁磁笺霹疆诗雾褥割每个文本 行的行商,即为两个尖峰最高点或瀚两个山谷嫩低点之间的宽度。 ( 3 ) 、归一化行,字距 文楼中每礴令文本牙之润貔阕瓣霹戆不露,溺襻,令文率嚣中薄令字懿润 隔也有箍肆,这些都会影响到图像的纹理特征。利用上步中得到的行距参数, 将露个文零行之阕豹阕骚设戏鞭定壤,蘑畦秘除多众熬窆塞季亍。瓣理,对麓一行 文本,通过对一行中后面文本的前移操作,将其中的字间距设成预定大小。 幽东大学颂士学位论文 ( 4 ) 、文本嚣填态 输入的文本图像中可能包台不完熬的文本行。而风有些文本行的行首缩进也 不囊,嚣先褥繇有文零 亍靠焘对齐,孬髑文字壤 方法涛每一翱:文本壤宠享| 、齐。 ( 5 ) 、提取文本块 扶经过归一位处理篮豹塑像中照搬提取不逐叠豹豫素块,黠这些块进行纹理 分析。 = 、纹理特征分析 目标识别系统均包含特征提取部分,其主残目的就是从检测到的嗣标图像中 抽取出少量具有代表佳的国像瀚本质特征,筑丽降低特征空闻的维数,以稠予詹 续的分类匹配过程。特征提取一方面要去除图像冗余信息以简化和加快计算和识 澍过程,另一方面又要让提取的特征具青充分瞧和完备佳酸僳诞识剐的正确率。 因而,提取的特征是否充分反映目标图像特征和属性是自动目标识别( a r t ) 成败的 关键,献另一个角度淡也就是遗敏骨么特征的淘蘧。 特征提取是为了获得最能反映和代表目标的本质特征。提取的特征有从图像 中矗接检测或计算出豹特征,粕点特馥、线褥程帮区域特征,也包括辩已舂蛰挺 进行选择或变换得到的特征,如代数特征。 在壬葵式谈鞭镶蠛中,不变性识嗣”3 楚鹜像蠢橼谈裂豹项纛簧工穆,宅要求砖 目标的位置、方向、大小及合理范围内的变形不敏感。实现不变性识别般有两 蕈孛途径:一是分类器鑫鑫吴嘉不变莲识裂髓力,二是撼敬斡特链其有否交链,一 般后一种方法采用较多。 区域蒋援楚援一裳霆缘区域掰吴鸯戆特 蒌,它主要毽捶纹灌特援和嚣域形状 特征。关于图像纹理并不存在严格的一般定义,但图像纹理的概念对我们来说是 锓熟悉l l 孽,纹残表现为舞觋察到懿塑像予基域黥获度交佬援律,铡翔超遥感图像 中,沙漠图像的灰度空问分布性质与森林图像的灰度分布性质有着明臌的区别。 踅外,些翱然表瑟可能具有与方囊桶关戆纹避信息。我们把灰度分套性质或图 像表面望现出的方向信息称为纹理结构,它有助于区别不同的黼像区域。 一般来说,纹理图豫中灰发分毒爨骞菜秽周期性,即使灰度变化楚随规驰, 它也具有一定的统计特性。从这一观点出发,我们可以直观地认为图像纹理结构 具有以下三个特性:一是某静髑部豹黪判性在该序列鬟大的区域内不断重复;二 是该序列由非随机排列的基本部分组成;三魑纹理区域内大都戆均匀的统一体, 图像往往显示擞重复梭结构。 用各种观测系统获得的图像很多怒纹理型的,对于纹理圈像,通道纹理分析 由东大学硕士学位论文 所获得的纹理特犍往往可以很好地表征目标或目标的特定区域。s k l a n s k y 咖认为如 果塑像中蔡一区域的局部绩计特缎或其他局部特德保持不变、缓慢变化戏周期性 变化,那么这一醚域就表现出均匀的纹理特征。纹理不仅取决于莱一给定象素的 灰度值,嚣且还取决于该象素邻域的灰度值分布。根据获锝纹理特征豹方法不同 可将纹理特征大致分为:麓于算予的、基于统计的、基于变换域的、基于模型的、 基于结构的以及其他类的纹理特缝。基于算子的纹理特授是由给定的算予和图像 谶行运算获得的;基于统计的纹瑷特征蹙依据纹避统计特性来提取的;蘩予变换 域的纹理特征是对图像进行变换,在变换域提取虢得的。k u c k u e k ”1 曾用付立时变 换技术将手写文本当作纹理来处瑷,所摄敬出的特性要么由每带宽频谱平均值序 列组成,要么是多项式拟合系数,或者题这些系数的一个线性影像;基于模型的 纹理特徭灌帚适当的模篓来播述纹理,幽模型参数作为纹理特征,最常爝的三个 梭型为分形模型、马尔可夫随机场( m r f ) 模型、自回归( a r ) 模型:基于结构的 纹理特征楚扶结翰他纹理蓬像撮敬获得酶,结稳亿纹瑾潮像是撑出一些绞瑾基元 按一定的排列规则不断重复排列而成的图像,由于自然界的大部分纹理图像缺乏 这释纹理分布静严格“嫒羽”毪,敌这类特短只髓获一婆入工合成纹理鬻像提取 获得。 鬏据纹理结褥豹不圈,撞取或分割餮缳熬一楚蓬域,吸了解整像鞫戏为嚣戆 的图像分析,就称为纹理结构分析。纹理结构信息包含在图像有限范围内的灰度 分布戆健疆中,戮照在纹理结构分瓠中弓l 避了予辫豫壤念,印其鸯与整个鍪豫相 比相当小,而与像素相比又相当大的子图像。如何从这一子图像中抽取出表示每 个像素或整是表示空阗获凄努蠢瓣特征鬃,然轰缀摄嚣援取兹绞毽结构僚怠怼蹶 图像进行一些其他的分析和处理,就是纹理结构分析中所要解决的主要问题。对 予簦舞一葶孛纹理缡筠分褥方法,葜基本内容是棂撵菜秘憝够描述空潮分蠢黝模型, 给出纹理特征的定量估计。 3 。2g a b o r 滤波嚣方法 1 9 6 4 年g a b o r 博士提出了可以达到时频测不准关系下届的函数 如,= 志摄p 卜蔷+ 歹瓣) 1 瞧, 它实际土是搿簸函数在频壤孛豹平移。 时频测不准必系是信号处理中一个j # 常一般性的问题:如果信号的特性在时 竣串是藜常确定懿,郡么,它在频蠛中赣 # 塞不确定;菠之,强榘它在簇域中 山东大学硕士学位论文 常确定,那么,它在时域中就非常不确定。信号的时频测不准关系,就琢基本粒 子豹波鞍二穗牲一样,一慰共轭豢之闲存羟羞测不准关系。 g a b o r 函数是唯一能够达到浏不准关系下届的函数,它能够很好地同时在时域 秘频域中蒺颞对傣号分橱艇分辨搴要求。g a b o r 函数的这一特性使褥它在信号处理 中获得了广泛的应用。 当g a b o r 函数在时频域中采样阉隔之织小于2h 时,g a b o r 酗数掏成l 2 ( r ) 中 的一个完备的函数系,但该函数系是非磁交的和冗余的。而且,它的对偶函数甚 至缺少时域中的连续性。近年来,人们对g a b o r 函数的蓉数计算进行了深入地研 究,如z a k 变换、双讵交变换等。虽然,g a b o r 丽数不具有构成乐交基的优点,但 是,它在时频测不准关系上的息好性能和它对生物初级视觉简单神经元感受野特 性的数学描述,使得人们对g a b o r 函数晌研究一赢保持蕾浓厚韵兴趣。 将一维g a b o r 函数推广到二维函数空间,可得n - - 维g a b o r 函数: 时。忙赤唧雠州册胀哪,卜。, 二维g a b o r 函数较好地描述了哺乳动物初级税觉系统中一对简单视髓神经元 女感受野特性。襁觉系统中一对麓单细腿具有耀阉的空间淑向积调谐频率,但是, 它们对予相同模式的光刺激,其响应大约有2 的相位整,g a b o r 函数可以完熬 她撼述这手中感受辨特性。= 维g a b o r 函数是二维高斯函数在两个频率轴上都发生 了平移之后的结荣,二维高斯函数是一个二维平滑函数,而二维g a b o r 函数是一 个二维带通滤波器。 在人类视觉皮层图示信息的处理过程中,龟括一系列并行和准依赖税制或者 可用带邋滤波器涞模仿的皮层通道。无论从空间域的起伏特性上、方向选择上、 空间频率域的选择,还楚正交相位的关系上,二维g a b o r 滤渡器与皮屡简单细稳 的二维媾知域的模型都棚互吻合。种种攀实都说明,二维g a b o r 变换在阁像分析 中是菲常有用的。二维g a b o r 滤波器酶数学模墅筲表示翰下: h ( x ,罗) 一g ( x ,y ) e x p - 2 李( 掰。x + v o y ) j ( 3 。3 ) 其中g ( x ,y ) 是一个2 - o 褰袋滋数;蕻表达式是: 由衷大学硕士学位论文 删= e x ( 一等) 限。, 关于皮层通道的一个简单的计算模型在参考文献”。中律了描述。简单遣用代数 式表示,每个皮层通道可以用一组f l a b o r 滤波器瑰( x ,y ;f ,毋) 和h o ( 薯“f ,回来模 仿。这两个g a b o r 滤波器互相对称,表达式如下: h e ( ,y ;f ,目) = g ( x y ) c o s ( 2 可( x c o s o + y s i n 目) ) , 噍,( r ,y :f ,p ) = g ( x ,y ) s i n ( 2 矿( x c o s o + y s i n 学) ) ( 3 5 ) 上式中的厂和0 分别表示g a b o r 滤波器的两个煎要参数是径向频率和方向角, 它们决定了频率平露上遥遵靛霞霞。两所用频率遥常为2 的鞲,在参考书”3 中漭到, 对任一尺寸为n * n 的图像,重要频率成分应满足:厂n 4 周期度。下图就是0 = o 度时c a 3 0 r 滤波器的示意图。 图3 - 20 度方向的g a b o r 滤波器 本文中,对前面预处理后生成的文本块图像,带g a b o r 滤波器从中褥敬纹理 特蔹。首先计算公式( 3 ,5 ) 中两个滤波器的付立叶变换,然后利用f f t 得到结果 输出图像。例如,如果吼为奇滤波器输出,那么: 擘。( 茗,y ) = j j f 7 1 【p ( # ,v ) h 。( # ,v 】( 3 6 ) 其中,p ( u ,v ) 为输入图像p ( x ,y ) 的付立叶变换( f t ) ,日。( “,v ) 是滤波器 1 6 , o 0 帕 山东大学硕士学位论文 。( x ,3 ,;,臼) 的付立叶变换。用公式( 3 7 ) 将两个滤波器的结果合并,便可得到 图像每个像素的单个值“。 q ( x ,y ) = g ;( z _ y ) + g :( z ,y ) ( 3 7 ) 3 3 灰度共生矩阵方法” 共生矩阵( 又称灰度相依矩阵) 是图像灰度变化的二阶统计度量,它是表述 纹理图像结构性质特征的基本函数。根据两个像素点位置的联台概率密度函数可 以建立纹理图像的共生矩阵。概率函数p ( ( x ,n f ) 表示图像函数f ( x ,j ) 在位置 ( ,y ) 上,其强度,的概率。由于在图像的二维平面上不存在严格的位置顺序, 显然不能将一维概率的位置概念直接推广至二维或更高维的场合。p ( ( x ,r ) ,厂) 的密 度函数为p ( ( x ,j ) ,) ,若不考虑点位置( x ,3 ) ,则有边缘概率p ( 厂) ,我们直接将p ( 、) 作为图像强度的概率密度幽数。两个像素点的二阶联合概率密度函数为 p ( ( ( x ,3 ,_ ) ,( ( z ! ,心) ,j ) ) 此式表示事件一= f ( x ,_ ) 和正= f ( x ! ,j 二) 联合出现的概率密度,它有四个 变量,其中两个变量是空间位置,另外两个变量是对应空间位置的强度。因此, 该密度函数域的大小是这些变量集合的笛卡尔乘积。例如,对于给定一个具有m 级灰度的大小为n n 的图像,其概率密度函数域共有n 2 x m n 2 m 个元素值。 在实际应用中,像素位置之间的关系往往加以约束、简化或者不予考虑,采用简 单的概率密度函数( p a f ) 作为纹理图像的局部描述。因此,图像的共生矩阵的元素 是在假定相应空间坐标点之间的关系下的概率密度函数p ( :,正) 。 设j = ( 血,a y ) 7 是( x ,y ) 平面上的一个矢量,我们用占来产生纹理图像两像素 点强度共生的统计度量。选取j 为某个指定值( 在下面的例子中占= ( 1 ,o ) 7 ,即水 平方向) ,于是对于具有1 1 1 级灰度值的纹理图像,得到一个m 删矩阵。,它反映 了图像中出现在相距占的两像素点上灰度值共生的联合概率 h 。= h a ( i ,川 上式中,矩阵元素h ( f ,j ) 是图像平面上两像素点分离为时,灰度值i 和j 的联合的度量。在实际计算中,通常是取为空间采样的整数倍,并计算两像素 点分离为时灰度i 和j 同时出现的次数。该次数就是共生矩阵h 。的第i 行j 列 的元素。 图3 3 给出了一组简单的4 * 4 纹理图像( m = 2 ) 。现在计算这些图像的共生矩 山东大学硕士学位论文 阵,因为m = 2 ,故共生矩阵是3 * 3 矩阵 3 3 所示纹理图像的共生矩阵。 o o 0ll01o 并将= ( ,) 7 记作胪图3 4 给出了图 1l110 ol1 0011l0l00oooo 0l1 0110 1100 ( a ) 1111 000 0 ( c ) 图3 - 3 简单的纹理图像( 4 * 4 子区域,灰度级m :2 ) 1l00 1lo0 * 十一 ( a )( b )( c )( d )( e ) 图3 - 4 图3 3 所示纹理图像的共生矩阵 ( a ) ( e ) 是图3 - 3 中( a ) 、( e ) 在( a 。) 情况下的共生矩阵 从图3 4 的计算结果可以看出,共生矩阵具有以下特点: ( 1 ) 比较平滑的纹理对应着其值集中在对角线上的共生矩阵,这意味着值 小于纹理空间变化量,相反如果纹理小于,则的值将均匀的分布在整个矩阵。 ( 2 ) 对相同强度分布( 如用同一个直方图描述) 的纹理子区域,可以利用共 生矩阵来区别。图3 - 4 中( b ) 、( c ) 说明了这种情况。 共生矩阵日反映了图像灰度分布关于方向、局部邻域和变化幅度的综合信 息。在计算灰度空间共生矩阵时,为了避免众多灰度级给分析带来庞大的计算量, 往往是先将原图像的灰度级进行缩减,一般取m = 8 或1 6 ,这里不是线性缩减,而 是用概率量化方法缩减,这样可以最佳近似表示原图像,又能对原图的对比度加 以规范化。本文中,由于原始的文本图像只有两个灰度级( 0 和1 ) ,因此在实验 中不必对原图像进行灰度处理,直接用其共生矩阵就可以了。 3 4 图像纹理特征的有效性评估 用来提取纹理特征的方法有很多,那么提出一种衡量方法的有效性标准是非 o o l 1 )帅帅 0 0 l l o 0 b 1 l 山东大学硕士学位论文 常有必要的。从对目标的识别率上虽然可猷直观地看出来,但是,采用芋写体笔 迹图像的纹理特征的样本不变性“”来判断一种纹理特征提取方法的有效与否,可 麓更为合理和有效。手写体笔迹图像羲撵本不变性计算公式定义如下: 样本不变性= 面面s d 其中:s d 和m e a n 分别代裁手写体笔迹图像样本特征值的标准差和均值。 3 ,5r b f 神经网络方法与m a t l a b 实现 匹配识别是指根据所提取的特征对目标进行分类,它包括分类器的设计也称 分类器的学习,以及用分类器进行图像目标的分类判决。目前较常用的分类比较 方法有很多,蜘如:欧几县德距离、k n n 分类器、m a h a l a n o b i s 距离最大似然分类 器、非线性弹性匹配、费希尔判鄹( f i s h e r ) 、神经网络分类器等。 人类对张经网络的研究已有较长的历史,早在i 9 4 3 年,心瑾学家# m c c u l l o c h 和数学家w ,p i t t s 首先提出了兴奋与抑制型神缀元模型,从而开创了神经科学理 论研究的新纪元。虽然在7 0 年代初神经网络研究度陷入低谷,但1 9 8 2 年,随 着著名的“h o p f i e d ”模型理论的发表,神经网络的研究热潮再次掀起,各种神 经网络的应用也交褥越来越广泛。人工享孛经网络是在现代季枣经生理学和心理学豹 研究基础上,仿真人的大脑神经元结构特性丽建立的一种菲线性动态网络系统, 对人脑的某些基本特性进行低层次仿真,从而具有联想、记忆、推理能力。人工 神经网络由于具有很强的学习能力而受到广泛的煎视和研究。 神经嘲络有许多并行运算的功能简单的单元组成,类似于生物神经系统中的 单元。神经网络豹特色在于信息黪分布式存储和并行穆阕处理,虽然单个丰串经元 豹结构简单、功髓有限,但大量神经元组或的网络系统爨藐实现的行为却是丰塞 多彩的,宅其有集体运算能力和自适应学习能力。此外,它还具有很强的容错性 和鲁棒性,善于联想、综合和推广。神经网络模型各种各样,它们炬从不同的角 度对生物神经系统不同层次的描述和模拟。有代表性的网络模型有感知器、多层 藏馈b p 网络、r b f 网络、双向联想记忆( b a t , i ) 、h o p f i e l d 模型等。利用这些跨络 模型可以实现函数逼近、数据聚类、模式分类、优化计算等功能。 另外,从神经网络的结构而言,可分为前馈神经网络和反馈神经网络。神经 网络控制主要应用神经网络的醋数逼近功能,糟从这个角度,神经网络可分为全 山东太学硕士学位论文 弱遥运聿牵经隧络帮搿部逐遴 睾经蠲络。鳃莱网终蠡冬一个或多令投氆或蠡逶疲霹调 参数在输入空间的每一点对任何个输出都有影响,则称该网络为全局逼近神经 网络。多层前馈网络使全局逼近网络的典型例予。对予每个输入输出数据对,网 络豹每一个投篷均震要蹋整,鼠嚣嚣致全髑逢遮嬲终学习速度缀漫。装慰羧入空 阃的某个局部区域,只青少数几个数值影响网络的输如,则称网络为局部邂近网 络。对予每个输入输出数据对,只裔少量的权德需要调整,钛蔼使局部i 蓟霞两络 具有学习速茨茯鹃优点,这一点瓣予控翻采说至荚重簧。较淘基璐数( r b f ) 事率经 网络“”是种典型的局部逼近神经网络,和b p 嗣络相比,r b f 网络在邋近熊力、 分类能力和学习速度等方面均舆有更好的性能。其结构如圈3 - 5 所示: i n p u t r a d i a lb a s i sl a y e r 已、=! ,、羔兰, d j t 删 锚棚l w 娃簪# # ? # := 趔州& ”纯w :o l 曲: w h e r e 矗= r i u m b e r0 1 8 瓣m $ 蹦s 聃 n p u tv e c l o r s i ;n u m b e o 谴v 嘏 c = f r d r d l 弛ro l a y e t2 “l i s f l he l e m e m 0 舭w h e r ei w 4j bav 牲研r 廿l n 如癌血ej 1 hr o wo f ,w i 1 图3 - 5 径自基邋数网络结构图 它豳三鼷组成:输入瑟、隐崖( r a d b a s 层。含s 1 个季申经元) 和输毒滋( p u r e l i n 层,含s 2 个享率经元) 。输入层节点只传递输入镕号到黪层,隐单元变抉函数为高 斯核函数,其数学袭达式为:r a d b a s ( n ) = # ”,涿意图如熙3 - 6 所示: l 奄 疆s 0 o 7 ! ? 。k 氇8 3 3丰0 8 3 3 a 。r a d b a s l n j r a d i a lb a s i sf u n 洲o n 图3 - 6 径向綦函数 山东大学硕士学位论文 此函数对输入信号在局部产生响应,即当输入信号靠近基函数的中央范围时, 隐层节点将产生较大的输出,也就是说,网络具有局部逼近的能力,是一种典型 的局部逼近神经网络。随着参数w ( 权值) 和p ( 输入) 之间距离的不断减小,神 经元输出逐渐增大。因此,径向基神经元相当于个监测器,只要输入矢量p 等 于它的加权矢量w ,那么神经元的输出即为1 。其中的阀值参数b 允许对径向基神 经元的灵敏度进行调整,例如,当阀值为o 1 时,那么对于任何一个与权值矢量w 的距离是8 3 2 6 ( 0 8 3 2 6 b ) 的输入矢量p ,径向基神经元的输出均为0 5 。隐层 的作用相当于对输入模式进行一次变换,将低维的模式输入数据变换到高维空间 内,以利于输出层进行分类识别。隐单元的变换作用实际上也可以看作是对输入 数据进行特征提取。输出层节点是线性函数,隐层节点输出的结果经过输出层的 线性变换得到最后的输出。 r b f 网络的计算框图如图3 7 所示 h d u l n 置 s : 尺 、! j d = r a d l l a s ( w - p i i6 ) 图3 - 7 有r 个输入的径向基函数神经元 r a d b a s 的输入为输入矢量与权值矢量的距离乘以阀值b 。训l 练网络时,r b f 网络先初设各权值系数的大小,再给一组输入样本,这组训练样本要保证其准确 性和充分性,这是网络训f 练成功的前提,并给出期望的输出。当样本输入网络后, 分别计算卡尔曼增益矢量与训练样本逆相关矩阵,再通过内部的竞争机制得到输 出,更新后得到的连接权矢量的值,并计算累积误差。重复上述过程直到误差满 足要求为止。 山东大学硕士学位论文 第四章实验与讨论 4 1 手写体图像样本库的建立 为了验证本文提出的方法的有效性,实验中建立了手写体笔迹图像的样本数 据库。总共选择了作者1 0 名同事的手写体样本作为样本图像。每个样本都是在一 张1 6 开复印纸上书写完成,然后用惠普彩色扫描仪( 型号为h p 5 4 0 0 c ) 扫描生成 黑白位图图像( $ ,b m p ) 。扫描仪工作在缺省模式、高亮,分辨率设定为l o o d p i , 将扫描区域定为整个1 6 开纸大小,最终扫描图像尺寸为l1 7 0 8 5 0 像素。图4 1 是他们的手写体图像块示例。 图4 11 0 个人的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论