(计算机应用技术专业论文)基于小波变换的汉字签字鉴别方法研究.pdf_第1页
(计算机应用技术专业论文)基于小波变换的汉字签字鉴别方法研究.pdf_第2页
(计算机应用技术专业论文)基于小波变换的汉字签字鉴别方法研究.pdf_第3页
(计算机应用技术专业论文)基于小波变换的汉字签字鉴别方法研究.pdf_第4页
(计算机应用技术专业论文)基于小波变换的汉字签字鉴别方法研究.pdf_第5页
已阅读5页,还剩62页未读 继续免费阅读

(计算机应用技术专业论文)基于小波变换的汉字签字鉴别方法研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

山东大学硕士学位论文 摘要 汉字签字具有稳定的行为特征,同一个人的签字具有一定的不变性,而不同人 的签字具有其独特性,签字的获取又具有非侵犯性( 或非接触性) 。因此,使用汉 字签字进行身份识别不仪受到法律的认可而且得到了广泛的应用。汉字签字鉴别就 是通过对于写人的笔迹进行分析,得出字迹是否足由某特定人书写的结论。由于不 同人的签字其特征是不相同的,我们可以从其签字信息中抽取 _ _ 5 最有效的签字特征 来区分真假签字。日前常用的计算机汉字签字鉴别方法主要有三类:结构模式鉴别 方法、统计模式鉴别方法和人神经网络方法。成型的方法有:w a l s h 、f o u r i e r 变 换、h o p f i e d 神经网络等。以上几种方法要么操作极端繁琐,要么鉴别率低、容易 造成几何性质的丢失。 在计算机汉字签字鉴别系统中,特征的抽取是整个过程中最为重要的环节。稳 定特 i f 的抽取是整个鉴别系统的核心,它直接决定了鉴别系统的性能。小波变换是 目前田际上公认的最新n , j 间一频率分析工具,由于其“自适应性”和“数学显微镜 性质”而成为许多学科共同关注的焦点,并在信号处理、信息处理领域中起着至关 重要的应用。 本文采_ j _ f 小波变换相关理论对联机汉字签字鉴别进行了研究,并取得了有效的 研究结果。本文中的小波分解与重构是建立在对签字的每个笔划进行小波变换的 基础上。先对签字的每一笔划通过多分辨率分析的小波分解公式进行复信号小波变 换,在小波变换过程中作者利用b 一样条函数的优良性质设计了适合系统特点的四 阶样条小波。然后对变换后的各笔划的数据信号利用作者提出的一组新的特征公式 进行合成,抽取了具有旋转、平移及尺度不变性的签字特征,这些特征值既保留了 签字的总体特征,义更注意了签字的细节特征,从而使鉴别效果大大提高。 同时,为了形成稳定有效的签字样本库,本文在样本库的形成过程中采h j 了学 刊机制,进一步提高了鉴别效果。 本文所采用的汉字签字鉴别方法既具有统计方法的良好的鲁棒性和抗干扰抗 噪声的特点,义具有结构方法所特有的对结构特征敏感、区分相似字能力强的特点, 经验证这种特征抽取方法具有良好的稳定性与可靠性。 关键字:小波变换、特千j j :抽耿、样条函数、多分辨率分析、k l 变换、闽值 a b s t r a c t c h i n e s es i g n a t ur eh a s l o n gb e e nl e g a l l ye s t a b l i s h e da n dw i d e l ya c c e p t e da s au s e f u lm e a n so f v e r i f y i n g ap e r s o n s i d e n t i t yb e c a u s ei t r e m a i n sc os o m e d e g r e eu n c h a n g e dt h r o u g h o u to n e s l i f ea n di s a c c e p t a b l ea n dd i f f e r e n tf r o m a n o t h e r c h i n e s es i g n a t u r ei d e n t i f i c a t i o ni st od r a wac o n c l u s i o nw h e t h e rt h e s i g n a t u r ei sw r i t t e nb y as p e c i a ls i g n e ra c c o r d i n gt ot h eh a n d w r i t t e nc o n t e n t w e c a ne x c e p tt oe x t r a c ts o m ee f f e c t i v e s i g n i n gf e a t u r e st oc l a s s i f yas i g n a t u r ea s e i t h e ra u t h e n t i co rf o r g e d n o wi nt h i sf i e l d3k i n d so ft h e o r i e sa r ew i d e l ya p p l i e d i n c h i n a ,t h a ti s ,t oi d e n t i f yt h es i g n a t u r ea c c o r d i n gt o i t ss t r u c t u r e m o d e , a c c o r d i n gt oi t ss t a t i s t i c a lm o d e o rb yt h em e a n so far t i f i c i a ln e u r o n a ln e t w o r kb y n o wm a n ys p e c i f i cm e t h o d sh a v ec o m ei n t o b e i n g ,s u c h a sw a l s h ,f o u r i e r t r a n s f o r m ,h o p e f i e l dn e u r a ln e t w o r k s b u ta l lo ft h e s eh a v es o m es h o r t c o m i n g s u c ha st h ed i f f i c u l t yt op e r f o r m ,t h el o wi d e n t i f i c a t i o nr a t ea n dt h et e n d e n c yt o l o s eg e o m e t r i c q u a l i t i e so ft h es i g n a t u r e t h ee x t r a c t i o no ff e a t u r e si st h em o s t i m p o r t a n ts t e pi nt h ew h o l ep r o c e s so f c h i n e s es i g n a t u r ei d e n t i f i c a t i o nt h en u c l e u si st oe x t r a c ts t a b l ef e a t u r e ss i n c e t h i s d i r e c t l y d e c i d e st h ep r o p e r t yo ft h ew h o l ep r o c e s s w a v e l e tt r a n s f o r mi s i n t e r n a t i o n a l l yr e c o g n i z e du pt ot h em i n u t et o o l sf o ra n a l y z i n gt i m e f r e q u e n c y i t i s c h i e f l yd u et ot h e “a d a p t i v ef e a t u r e a n d “m a t h e m a t i c a lm i c r o s c o p ef e a t u r e ” w a v e l e tt r a n s f o r mi s b e c o m i n g af o c u sp o i n to f m a n ys c i e n c e s i t p l a y sa n i m p o r t a n tr o l ei nt h es i g n a l i n f o r m a t i o np r o c e s s i n g t h em e t h o di nt h i sp a p e rd e a l i n gw i t hw a v e l e td e c o m p o s i n ga n ds y n t h e s i s i sb a s e do nt h e a p p l i c a t i o n o fw a v e l e tt r a n s f o r mt oe a c hs t r o k eo fc h i n e s e s i g n a t u r ef i r s t l y t h em e t h o da p p l i e sw a v e l e tl r a n s f b r mt oe a c hs t r o k ea c c o r d i n g t ow a v e l e t d e c o m p o s i t i o nf o r m u l ao fm u l t i r es o l u t i o na n a l y s i s i nt h i ss t e p ,a u t h o r d e s i g n s4 - s p l i n e w a v e l e tw h i c hi sf i tf o rt h es y s t e mb yt h eg o o dp r o p e r t yo f b s p l i n ef u n c t i o ns e c o n d l y ,i ts y n t h e s i z e t r a n s f o r m e dd a t ao fe a c hs t r o k e a c c o r d i n gt o an e ws i g n a t u r ef o r m u l ad e s i g n e di nt h i s p a p e r t h e n i te x t r a c t s o m er o t a t i n g i n v a r i a n t t r a n s l a t i n g i n v a r i a n ta n dd i l a t i n g i n v a r i a n tf e a t u r e s o n t h eo n eh a n d t h e s ev a l u e sr e t a i nt o t a l s i g n a t u r ef e a t u r e s o nt h eo t h e rh a n d , t h e yr e t a i ns l i g h tf e a t u r e s ,t h e ni m p r o v e a ni d e n t i f i c a t i v ee f f e c t w h a t sm o r e ,i no r d e rf op r o d u c eas t a b l ea n de r i e c t i v ep a t t e r nl i b r a r y t h i s 4 山东大学硕士学位论文 p a p e ra d o p t ss t u d y i n gs y s t e mo fo r g a n i z a t i o nw h i c hm a k ef u r t h e ri m p r o v e m e n t o nt h ei d e n t i f i c a t i v ee f f e c t t h em e t h o dd e a l tw i t hi n t h i sa r t i c l ei sa s y s t e m a t i c c o m b i n a t i o no f2 t r a d i t i o n a li d e n t i f i c a t i o nm e t h o d s ,t h a ti s ,t oi d e n t i f yc h i n e s es i g n a t u r ea c c o r d i n g t 0i t ss t r u c t ur a im o d eo ri t ss t a t i s t i c a im o d e t h e r e f o r et h en e wm e t h o di sa r m e d w i t hs t r e n g t h so ft h e2o r i g i n a lm e t h o d s o no n eh a n d ,i th a st h ea d v a n t a g eo f r o b u s ta n t i d i s t ur b a n c ea n da n t i n o i s eo ft h es t a t i s t i c a im e t h o d o nt h eo t h e r h a n d ,i te n j o y st h es t r u c t u r a la d v a n t a g eo fb e i n gs e n s i t i v ea n da b l et oc l a s s i f y s i m i l a rs i g n a t u r et h i sm e t h o dh a sg o o ds t a b i l i t ya n dr e l i a b i l i t yt ot h ee x p e r i m e n t k e y w o r d s :w a v e l e t t r a n s f o r m ,e x t r a c t i o no ft h ef e a t u r e ,s p l i n ef u n c t i o n m u l t i r e s o l u t i o na n a l y s i s ,k lt r a n s f o r m ,t h r e s h o l d 一5 - 原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师的指导卜,独立 进行研究所取得的成果。除文中已经注明引用的内容外,本论文不包含 任何其他个人或集体已经发表或撰写过的科研成果。对本文的研究作出 重要贡献的个人和集体,均已在文中以明确方式标明。本人完伞意识到 本声明的法律责任由本人承担。 论文作者签名:赵丞鱼日期:2 垃乏堡兰 关于学位论文使用授权的声明 本人完全了解山东大学有关保留、使用学位论文的规定,同意学校 保留或向困家有关部门或机构送交论文的复印件和电子版,允许论文被 查阅和借阅;本人授权l | j 东大学可以将本学位论文的全部或部分内容编 入有关数据库进行检索,可以采用影印、缩印或其他复制手段保存论文 和汇编本学位论文。 f 保密论文在解密后应遵守此规定) 论文作者签名:赵盘丝导师签名 秤日期:遄产 山东大学硕士学位论文 符号 y r d ( r ) h h ( c o ) r y r e x ) c , 五1 , 2 _ m f s , s 。 爵 d ( x ,力 瓦 符号说明 解释 基小波 模式空间维数 特征宁间维数 尺度函数 对应于尺度函数的脉冲响应 h 的传递函数; 白相关函数 信号x 的均值向量 信号x 的均值向量 x 的协方差矩阵 c ,的本征值 第i 类样本平均值 第i 类类内离散度 类内样本总离散度矩阵 类问样本总离散度矩阵 两点x 和y 之间的距离 分类域值 6 - 山东大学硕士学位论文 1 引言 1 1 课题提出的背景和意义 汉字已有数千年的历史,也是世界上使用人数最多的文宁,对于巾华民族灿烂 文化的形成和发展有着不可磨灭的贡献,并将继续发挥重要的、其它文字无法替代 的作用。虽然汉字的类别极多、字形结构复杂,但每个人所写的汉字其笔迹是一种 稳定的行为特征,签字的获取具有非侵犯性( 或非接触性) ,易为人所接受。币是 由于这些特正l ,汉字签字早己作为一种身份鉴别的手段得到法律的承认。汉字签字 鉴别,义称为笔迹鉴别,是根掘手写笔迹来判断书写人身份的一门学科和技术。汉 字签字鉴别有2 种方式:一种是直接比较2 份手写笔迹,确定它们是否为同一人所 写;见一种是从不同人书写的参考笔迹( r e f e r e n c eh a n d w r i t i n g ,又称样本) 中 找出o j 检验笔迹( t e s th a n d w j ft i n g ,又称检材) 的书写风格最接近的样本f l l 。对 f 如何进行汉字签字鉴别有着厂泛的应用前景,特别是在电子商务、财务管理、信 用i 卡签字及崮家安全方而更是如此。 签字笔迹能反映人的书写习惯,这在正常情况下是不言而喻的。书写人有多高 的书写技能,有什么样的书写习惯,就会以相应的方式表现丁笔迹之中,这是有心 理学依据的。心理学研究表明,人们经过学习、训练能逐渐达到熟练地掌握与应用 _ = ;写技能。虽然这是逐步建立条件反射的过程,但它不是若干条件反射的简单堆砌, 而是从整体上被调节着。某个单束0 激所引起的兴奋都可以成为下一个活动的动 因,使反应活动好像按预先编定的程序自动化进行一样,从而使书写动作按一定的 压力、方向、l 峙度、间隔及速度的历时性变化节律自动地进行。即使在有意改变或 有不利书写条件的影响下,签字笔迹发生了变化,由于动力定型( 人的连锁式的条 仲反射系统) 是个“自动化”系统,意识便丽_ 以启动它,制止它,或干扰它,但 不能任意摆布它。书写习惯也会不同程度地反映在笔迹中。书写者对所写字符的熟 练程度越高,习惯就越容易流露出来。这些书写习惯为笔迹鉴别提供了强有力的心 理学依据。 汉字签字鉴别有着非常悠久的历史,很早就有根据笔迹来确认身份和调查案什 的记载。但刘十用计算机进行汉字签字鉴别的研究则是近三十年的事。1 9 6 6 年前苏 联的几名研究者首先发表了用电子计算机进行笔迹鉴别的研究报告【2 】,从此也掀起 了研究汉字签字鉴别的热潮,在汉字签字鉴别的方方面而提出了许多理论和方法。 但出r 当时受到技术水平的限制,汉字签字鉴别主要是在实验室中进行的,鉴别结 果并未达到实际应用的要求。以至于到了7 0 年代,重视程度的不够、技术水上f 的 山东大学硕士学位论文 不高几乎导致汉字签字鉴别技术的发展处于停滞状态。8 0 年代初,计算机技术得到 很人的发展,训算机的性能价格比有了很大的提高,计算机的应用领域也门益f 泛。 随着办公自动化的普及应用和电子商务的要求,汉字签字鉴别的研究被重新提卜议 事h 程。w a l s h 、f o u r i e r 变换、h o p f i e l d 神经网络等很多鉴别乃法已经走出实验室, _ j 1 :始投诸于一定范围的应用。总的来说,汉字签字鉴别技术发展很快,方法很多, 但从实验效果来看与实际应用仍有一定的差距。现在人们迫切需要一种在攀别方法 和技术上获得突破的新技术。 汉字签字鉴别与汉字识别同属于模式以别中的重要分支,都是对字符图像的冉 认识。两者的区别是:汉字识别关心的是手写字迹的内容,其目的是识别出具体每 个字是什么,析签字鉴别关心的是签字是真是假,即是山伺人书写的。因而所依据 的特征和判据不同。根据书写信号录入计算机的方式,汉字签字鉴别技术可分为联 机( o n 一1 油e ) 手写汉字签字鉴别技术和脱机( o f f 。l i n e ) 手写汉字签字鉴别技术两 人类。联机手写汉字签字鉴别技术是“一种人工实时地把汉字输入计算机的方法,输 入计算机的是以举标点序列表示的笔尖移动轨迹,因而被处理的是一维的线条( 笔 划) 串,这些线条串含有笔划数目、笔划走向、笔顺和书写速度等信息,而脱机手 写汉字签字鉴别技术的对象是写在纸上的字符,通过光电扫描仪和摄影机转化为计 算机能处理的信号,该信号是二维的汉字点阵图像,是汉字签字鉴别领域中最后 个卜分困难的问题,目前仍然处于实验室研究阶段。科学研究中人们总是遵循从易 到难的规律,从简单的问题入手来寻求突破口。由于自由手写汉字签字鉴别太难, 本文主要对手写印刷体汉字签字进行联机攀别。所谓手写印刷体是指书写工整的楷 _ _ 5 于写体,要求书写者:i + 整书写,尽量少连笔。 汉字签字鉴别的 要目的就是把形形色色的伪造签字与真实签字相区别。为了 便j 二说明本系统的汉字签字鉴别过程,我们把提供参考笔迹样本的人称为同一认定 对象,所留下的笔迹称为参考笔迹;把受检验的人称为供同一认定刑象,其签:字= 称 为待鉴别笔迹。联机汉字签字鉴别的一般做法如卜- :首先把各被同。认定对象提供 的参考笔迹录入计算机,建立样本库,并为每个人的参考样本库建立一个特定的标 号,以区别1 i 同的被认定对象;当待鉴别签字输入后,就将它与参考样本进行比较, 以鉴别其真伪。联机伪造签字根据其产生的不同条件可分为以f 四类p j : 1 ) 随机伪造:伪造者随手写下,并没有任何企图模仿其他人的字体或改变自己 的书写习惯。 2 ) 简单伪造:伪造者试图模仿参考签字,但模仿过程并不熟练。 山东大学硕士学位论文 3 ) 熟练伪造:伪造者经过较长时间的模仿练习,所伪造的答宁与参考签字非常 相像。 4 ) 临摹伪造:伪造者以参考签字为监本,一笔一划描出的签字。 很显然,不同的伪造签字与参考签字的相似度会有很大的差异,鉴别的难度也 随之变化。随机伪造签字和简单伪造签字与参考签字在概虢特征上就有可能出现明 显的差异,因而比较容易鉴别。而熟练伪造签字及临摹伪造签字,尤其是临摹伪造 签字,由于在概貌特征上与参考签字非常相像,因而要把它们区分出来,必须依靠 更精细的、难于模仿的特征。 作为模式识别的。个重要分支,汉字签字鉴别是汉字识别的姊妹篇。汉字签字 鉴别i j 以选择4 i 同的特征或基元( p r i m i r i v e ) ,每种特征或基元又有不1 刊的抽耳义 方法,这就使得判别方法和准则以及所用的数学工具不同,形成了种类繁多、形式 备别的汉宁签字鉴别方法。总的来说,不i 刊的特征抽取和分类器的设计方法决定了 签宁鉴别系统采用不同的处理方法,通常可以分为结构模式签别方法、统计模式鉴 别方法以及人t 神经网络方法等1 4 j 。 ( 1 )结构模式鉴别方法 结构模式鉴别方法是人们最初用来进行手写汉字签字鉴别研究的方法, 般需 要先抽取笔段或基本笔划作为基元,由这些基元再构成部件( 子模式) ,由部件的 组合来进行汉字签字鉴别。现在,有些研究人员放弃了抽取笔划或笔段作为基元然 后进行鉴别推断的思路,采用汉字轮廓结构信息作为特征,这一方案的鉴别结果优 于基 :基j e 抽取的方法,但鉴别方法需要进行松弛迭代匹配,耗时严重,而且对于 笔划较模糊的汉字图像,抽取内轮廓会遇到极大困难,外轮廓的抽取也不太稳定。 也有些学者采用抽取汉字图像中关键特征点来描述汉字,汉字的关键特征点包括端 点、折点、交点、歧点、背景特征点、局部曲率最大点等,但是特征点的抽取易受 噪声点、笔划的粘连与断裂等影响。 ( 2 )统计模式鉴别方法 与结构法相比,统计法具有良好的抗噪卢、抗:r 扰的性能,其鲁棒性主要体现 在统计特征的抽取和模式匹配方法上。根据特征抽取区域的不同,统计模式鉴别方 法可粗略地分为全局统计特征和局部统计特征两大类。 1 ) 全局统计特征 全局统计特征是将整个汉字点阵作为研究对象,从整体卜抽取特征,主要包 括: 务大学硕士学位论文 全局变换特征:对汉字图像进行各种变换,利用变换系数作为特征,常用 的变换有f o u r i e r 变换、h a d a m a r d 变换、d c t 变换、w a l s h 变换、r a d jd 变换、k l 变换等。 不变矩( m o m e n t ) 特征。 笔划穿透数目特征。 全局笔划方向特征:这种特征反映了在整个汉字点阵中笔划的复杂度、方 向及连接关系。 背景特征:汉字图像的空白部分( 即背景) 和周围笔划的关系也含有一定 的结构信息,提取背景点在各个方向的笔划密度作为背景特征,通常町选 取位于汉字图像两对角线上的背景点。 2 ) 局部统计特征 局部统计特征是将汉字点阵图像分割成不同区域或网格,在各个小区域内分别 抽取统计特征,主要包括: 局部笔划方向特征 细胞特f 相补特征 方向线素特征 g a b o r 特征 四角特征 根据抽取特征的不同,可以选用不同的匹配方法,常用的统计匹配方法有模板 匹配、相关匹配、树分类器等。常用的距离度量有欧氏距离、城市块距离、马氏距 离等。 ( 3 ) 人丁神经网络方法 基于串行符号处理的数字电子计算机在人工智能等研究领域遇到了一定的困 难,促使人们以更大的兴趣去研究以并行处理模式为特征的神经计算机。八十年代 初,在美围、同本和欧洲都掀起了一股研究神经网络理论和神经计算机的热潮,各 个先进国家相继投入巨额资金,制订出强化研究计划,并开展了对脑功能和新型智 能计算机的研究。人工神经网络的主要特征是:大规模的并行处理和分布式信息存 储,良好的自适应性、自组织性,以及很强的学习功能、联想功能和容错功能。目 前的研究重点是将人工神经网络原理应用子图像处理、模式识别、语音综合及智能 机器人控制等领域。 人工神经网络方法用于汉字签字鉴别的研究主要包括以卜几个方面: 山东大学硕士学位论文 神经网络用于特征抽取与选择:通常直接将字符点阵信息送入网络进行学 习i ) l f 练,由网络抽取得到的特征不具有明显的物理含义。 神经网络用于学习训练及分类器的设计:这是目前人工神经网络在签字鉴 别领域的主要研究方向,也是最为成功的应用。 神经网络用于单字识别后处理。 通常,用于签字鉴别的人工神经网络模型有:h o p f i e l d 神经网络、前向多层神 经网络( 如b p 算法、r b f 网络等) 、a r t 网络、自组织特征映射网络、认知器模 型等等。目前常用的做法是将神经网络方法和传统的识别方法结合起来使用,互相 以长补短,如先用传统的方法抽取较为稳定的特征,然后再用神经网络进行自组织 聚类学习并设计性能良好的分类器等。人们正以期盼的目光注视着人脑功能的揭示 和神经网络的进一步发展。 通过上述技术进行汉字签字鉴别取得了各种不同程度的成功。总的来说,离实 际应用距离越来越近,但总不能令人满意。以上所提及的方法其特征抽取大都建立 在对原始采样进行旋转、平移及尺度的归一化处理的基础上,但这种处理在实际应 用中有很大的误差,这在很大程度上影响了鉴别效果。小波变换是目前国际上公认 的最新时间频率分析工具,由于其“自适应性”和“数学显微镜性质”而成为许 多学科共同关注的焦点 “,对于信号处理、信息处理起着至关重要的作用。鉴于此, 本文采用小波变换相关理论和技术柬进行联机汉字签字鉴别的研究,并设计了联机 汉字签字鉴别系统w t v s s 。经实验验证,该系统有良好的可靠性与稳定性。 1 2 本文的主要工作与特色 1 2 1 主要工作 本文首先对当前流行的汉字签字鉴别技术进行了全面的阐述和横向的比较,对 目前的汉字签字鉴别的基本方法进行了分析研究,指出了各自的优缺点,并适时地 提出了本文所述的汉字签字鉴别系统w t v s s 。围绕这个中心详细论述了小波变 换理论及其数学基础,对f o u r ie r 变换、加窗f o u r i e r 变换和小波变换作了有机的 比较,对小波变换的核心多分辨率分析及其相关算法进行了全面的探讨,并结 合本文对签字的每一笔划进行小波变换的要求,利用b 一样条函数的优良性质提出了 适合系统特点的小波基函数及其对应的尺度函数。 原始签字首先通过手写板及输入笔等输入设备输入计算机。当人们书写字符 时,笔尖的运动轨迹可由它在板上的x 、y 坐标及落笔和抬笔状态来描述。抬笔状 态可把书写板上的运动轨迹分隔成一个个笔划,而每一笔划又可用组成它的点列来 些奎垒垒堕坠垫 表示。起始笔停顿、输入设备灵敏度较高等原因会造成输入信号中出现起始停笔噪 音、毛刺笔段等意外信息。要尽量减少误差就必须对输入到计算机中的二维信号 进行平滑、消嗓音等预处理,本文均提出了相应的快捷操作算法,同时也对签字笔 划的线性捅值等一系列汉字签字鉴别的预处理技术作了详细说明。为了使预处理后 的数摒信号能适应样条小波和快速二进小波变换中的循环卷积运算,本系统对每一 个笔划进行了曲线拟合,使每一笔划成为一个周期函数。预处理后的签字信号即在 尽量大的程度上减少了误差,又将原始签字信号转化成了可用来进行小波变换的信 息。 在汉字签字鉴别过程中,特征抽取与分类器的设计是整个系统中最为重要的环 节,稳定特征的抽取与良好性能的分类器的设计是整个鉴别系统的核心,它们直接 决定了鉴别系统的性能。复信号小波变换有着可以完全保持原有签字信号儿何特 征的特性,本文对构成签字的每笔划通过多分辨率分析的小波分解算法进行分 解,又提出了组新的重构公式对各个笔划的小波分解结果进行了整合,从而得到 了整个签字的小波变换结果。 为了验证鉴别方法的有效性和形成稳定的样本库,本文在晟小均方误差准则下 利用k l 变换对签字特征空间的维数进行了压缩,接着又用f i s h e r 线性判别方法 进行了筛选分类,只把符合f i s h e r 线性判别准则的签字放入样本库,舍弃不规范的 签字,从而形成了稳定有效的签字样本库。签字鉴别时,某一签字的小波变换结果 与三个样本库中的小波变换结果分别进行混合马氏距离匹配,进而就可正确区分主 人与模仿人的签字。 文巾的w t v s s 系统设计思想如下:获取原始信号时记录下笔尖运动时的位置信 息、时问信息及落笔和抬笔状态,从而可以记录下每一个笔划的位置时间序列和笔 划数m :- ,。( f ) = x 。,( r ) + i y 。( r )( 其中m 表示该签字的笔划数,m = 0 ,1 ,m 一1 ,x 。,( f ) , y 。( f ) 表示该签字的第m 个笔划在t 时刻横纵坐标的位罱;六,( ,) 为关于时间的一个 复信号嘲数) 。然后对该签字信号进行预处理:消除起停笔噪音和非平滑噪音,并 对预处理后的签字信号进行线性插值和周期性拟合。接着利用本文所构造的小波基 函数对签字的每一个笔划工,( ,) 进行离散w a v e l e t 变换,得到其j 个不同层次的小 波表示: ( ( 爿,“ 。( 女) :k = o ,1 ,2 。7 n ) , 山东大学硕士学位论文 ( d ,“,( k ) :j = - j ,- j + 1 ,一1 :k - 0 ,l ,2 7 n ) m 2 0 ,1 ,m - 1 ) 以上只是得到了构成签字的每一笔划的小波分解结果。为了得到整个签字的小 波变换结果,作者设计了一组新的特征公式,通过该特征公式对构成签字的每一个 笔划的离散小波变换结果进行了有机整合,从而抽取出了整个签字的有效特征,该 特征具有旋转、。f 移及尺度不变性。接着又用k l 变换和f is h e r 线性分类方法对 小波变换结果进行了压缩和筛选分类,进而选择了有效的样本库。签字鉴别时,某 一签字的小波变换结果与三个样本库中的小波变换结果分别进行混合马氏距离匹 配,从而就可f 确区分主人与模仿人的签字。 实验中,通过以上所述的样本库抽取方法从主人与两模仿人签的“赵”字中各 选取2 0 个规范的“赵”字组成样本库,两模仿人随意或者刻意模仿主人签字,将 该签字的小波变换结果分别与三个样本库的小波变换结果通过混合马氏距离进行 匹配鉴别,鉴别正确率达到9 2 。 本文的汉字签字鉴别系统的总体设计步骤为: 原始签字信号的获取 原始签字信号的预处理 签字信号的w a v e e t 变换及特征抽取 样本库的形成 分类器的设计 签字匹配鉴别 1 2 2 本设计的特色及创新 ( 1 ) 本文给出了一种基于小波变换技术的汉字签字鉴别系统,该系统最大特点 是在特定的检材笔迹中,能抽取出代表每个人书写风格的特征值,通过特征值的比 较判断出签字的书写人,而且本系统运算简单,鉴别率相对较高。 f 2 1 本文提出了一组新的重构公式对各个笔划的小波分解结果进行整合,使鉴 别效果大大提高。在计算机汉字签字鉴别过程中,特征的抽取是整个系统中最为重 要的环节。稳定特征的抽取是整个鉴别系统的核心,它直接决定了鉴别系统的性能。 以往利用小波变换的签字鉴别大都建立在把整个签字当作图像,再对整幅图像通过 m a l f a t 塔式算法进行小波分解与合成的基础上,所提取的签字特征中总体特征相对 较多,细节特征较少。本文中的小波变换是建立在对签字的每一个笔划进行操作的 基础上。先对整个签字的每一笔划进行小波分解,这样可以得到每一个笔划的小波 分解值;再对小波分解后的各笔划的数据信号利用作者提出的一组新的特征公式进 山东大学硕士学位论文 行合成,这样就抽取了具有整个签字特征的签字特征值。这些特征值既保留了签字 的总体特征,又更注意了签字的细节特征,从而使鉴别效果大大提高。 ( 3 ) 本文基于b 一样条函数的性质设计了四阶样条基小波。小波变换的基本原 理是寻找一组小波正交基系,原始信号可以按此基小波展丌,最后再按定方式合 成。因此,基小波的性能优劣是小波变换效果好坏的关键,而结合具体的应用对象 考虑最优綦小波的选择对小波变换更有意义1 6j 。实验证明:在多分辨率分析的理论 框架下,利用b 一样条函数存在着的递推性、局部f 支撑性、线性叠加性和最小支 撑等性质,由b 一样条函数构造b 一样条小波更适用于计算机图形中的曲线或者曲 面的多分辨率分析,作者利用b 一样条函数的性质设计了四阶样条基小波。由于本 文是对签字的每一笔划进行小波变换,且经过预处理后的笔划信号是封闭曲线信 号,因此利用该基小波进行小波变换可以抽取出更有效的签字特征。 ( 4 ) 本文所采用的鉴别方法对两种传统的汉字签字鉴别方法结构模式鉴别 方法和统计模式鉴别方法进行了有机整合,因此既具有统计方法的良好的鲁棒性和 抗干扰抗噪声的特点,又具有结构方法所特有的对结构特征敏感、区分相似字能力 强的特点,经实验验证这种鉴别方法具有良好的稳定性与可靠性。 f 5 1 系统在样本库的形成过程中采用了学习机制。签字鉴别的基本原理是:首先 把各被同认定对象提供的参考签字录入计算机,建立样本库。当待鉴别签字输入 后,就将其特征值与样本库中签字的特征值集进行比较,以鉴别其真伪。因此样本 库的优劣也是左右鉴别系统效果好坏的关键因素之一。尽管人的签字书写很稳定, 但也会随着时间及书写环境的变化而变化。为了形成稳定有效的签字样本库,本文 首先对主人与两模仿人的若干签字进行小波变换,然后在最小均方误差准则下利用 k i ,变换对主人与两模仿人的签字特征空问的维数进行压缩,最后又用f i s h e r 线 性判别方法进行了筛选分类,只把符合f i s h e r 线性判别准则的签字放入样本库, 舍弃了不规范的签字,从而形成了更加稳定有效的样本库,提高了鉴别效果。 ( 6 ) 在计算机汉字签字鉴别过程中,分类器的设计也是重要环节之一,分类器 的好坏也直接决定了整个鉴别系统的性能优劣。本系统在设计分类器时,将距离匹 配技术中的欧氏距离与混合马氏距离进行了有机的比较,并用实验验证了混合马氏 距离有着更加符合系统特点的特性。由于本系统用混合马氏距离将签字特征值与样 本库中的特征值集进行距离匹配,从而进一步提高了鉴别难确率。 f 7 1 联机输入的原始签字信号由于书写人书写停顿、笔划不平滑等原因会造成很 多误差。为了尽量减少联机输入引起的误差,必须对原始采集的信号进行相关预处 山东大学硕士学位论文 理。系统利用本文提出的相关快捷算法对原始签字信号进行了有效的预处理,从而 在尽量大的程度上消除了原始误差。 ( 8 ) 小波变换是一种技术先进且理论难度极大的时间一频率分析工具。本文按 照科学研究的普遍规律一从易到难的原则,对f o u r i e l - 变换- - g a h o r 变换一加窗 f o u r i e r 变换一小波变换进行了有机的阐述和合理的比较,这样可以更容易地对小 波变换有个仝面的理解。 1 3 本文的组织结构 本文首先说明了课题提出的背景和意义,对汉字签字鉴别的发展现状和有关技 术进行了论述,并概括说明了本文所采用的汉字签字鉴别方法及其优越性。第二章 阐述了小波变换的起源、发展与分类,说明了多分辨率分析的原理及尺度函数的构 造方法,并利用b 一样条函数的性质设计出了适合系统特点的f 交小波基,给出了 有限离散信号的分解与合成算法。第三章中首先说明了联机汉字签字的原始信号获 取方法。为了能更有效地对签字信号进行复信号小波变换,又对数据的预处理技术 如:起始停笔噪音的消除和非平滑噪音的消除进行了讨论,并对每一个笔划进行了 线性插值和周期性拟合。这样就把原始签字信号的每一个笔划转换为一封闭曲线, 每一封闭曲线转换为5 1 2 个点,可以方便地对其进行复信号小波变换。第四章是本 文的中心,先详细说明了如何对构成签字的每一个笔划进行复信号小波变换的特征 抽取,然后设计了一组新的小波重构公式,并利用该公式对各个笔划的特征进行了 有机整合,从而产生了整个签字的具有旋转、平移及尺度不变性特点的特征。第五 章先阐述了签字特征维数压缩的原因及方法,再对k l 变换的有关理论进行了讨 论,说明了kl 变换在特征维数压缩中的重要性并给出了相应算法,最后用k i 变换对签字特征值进行了特征维数的压缩。第六章对f i s h e r 线性分类判别方法进 行了阐述,给出了相应的快捷算法,利用该算法求出了每两者之间最佳分类方向, 将签字特征值分别向该分类方向上投影得到了相关的投影点,通过选取的合适闽值 对签字进行了分类,并只把符合f i s h e r 线性判别准则的签字放入样本库,进而选 取了稳定有效的样本库。本章最后说明了距离判别的原理及如何用混合马氏距离进 行签字分类鉴别。最后一章说明了本文技术方法的发展应用方向,并对本设计己取 得的成果和不足进行了总结。 些东大学硕士学位论文 2 正交小波基的构造和信号的分解与合成 2 1 小波变换的起源与发展 小波变换( w a v e l e tt r a n s f o r m ) 是目前世界上公认的最新时间频率分析工 具,由于其“自适应性”和“数学显微镜性质”而成为许多学科共同关注的焦点。 它已成为众多科技工作者爱不释手的分析工具,世界各国的学者和工程技术人员都 在努力对其进行研究。小波变换实质是用一组相对带宽相等而中心频率可变的带通 滤波器对信号进行尺度滤波,从而得到信号不同频带内的成分。带通滤波器的带宽 随着中心频率的变化而自动调节,中心频率越低其带宽越窄,反之则带宽越宽。这 一性质对分析信号的局部特性有着重要的意义。局部化与多尺度分析是小波变换的 精华,使小波变换成为+ 种较理想的时频分析工具。小波变换在处理突变信号和非 平稳信号方而所显示的优越性使其应用领域日渐广泛,特别是对于信号处理、信息 处理起着至关重要的作用。 w a v e l e t 源起于j o s e p hf o u r i e r 的热力学公式。傅利叶方程式在十- 九世纪初期 山j o s e p hf o u r i e r ( 1 7 6 8 1 8 3 0 ) 所提出,为现代信号分析奠定了基础。在h l 到二 卜世纪的基础数学研究领域也占了极重要的地位。f o u r i e r 提出了任方程式,甚 至是画出不连续图形的方程式,都可以由一单纯的分析式来表示。小波变换是近几 年来才发展起来的数学理论,是傅利叶方程式的延伸 7 1 。 小波变换方法的提出可追溯到1 9 1 0 年h a r t 提出的小波规范币交基及1 9 3 8 年 【,i 1e w o o dp a l e y 对f o u r i e r 级数建立的l p 理论,即按二进制频率成分分组 f o u r i e r 变换的相位变化本质上不影响函数的形状与大小。小波变换的概念是由法 国从事石油信号处理的工程师j m o r l e t 在1 9 7 4 年首先提出的,通过物理的直观和 信号处理的实际需要经验的建立了反演公式,当时未能得到数学家的认可喁1 。f 如 1 8 0 7 年法国的热学工程师j b j f o u r i e r 提出任一函数都能展开成三角函数的无穷 级数的创新概念未能得到著名数学家j l “ , a g r a n g e 、p s l a p l a c e 以及 a m i , e g e n d r e 的认可一样。幸运的是,早在七十年代,a c a l d e r o n 表示定理的发 现、h a r d y 空唰的原子分解和无条件摹的深入研究为小波变换的诞生做了理论上的 准备,而且j 0 s t r o m b e r g 还构造了历史上非常类似于现在的小波基;真正的小波 热丌始于1 9 8 6 年,当时著名数学家y m e y e r 创造性地构造出具有一定衰减性的光 滑函数甲,其二进制伸缩与平移 甲,女( f ) = 22 、壬,( 2 1 f k ) :j ,女z 山东大学硕士学位论文 其中z 表示整数集,构成三2 ( r ) 的规范正交基。在那以前,人们或许认为具有如此 好性质的小波函数是一个数学神话,而对其存在性发生动摇。事实上,d a u b e c h i e s , g r a s s m a n 和m e y e r 在此之前做的工作是研究函数甲及数- q 6 。与使函数系 1 i a 0 i w ( a 。,一”一k b 。) 构成r ( r ) 的框架条件。1 9 8 7 年,m a l l a t 巧妙地将计算机视觉 领域内的多分辨率分析的思想引入n d , 波分析中,小波函数的构造及信号按小波变 换的分解与重构进一步理论化、系统化,从而成功地统一了在此之前的s t r o m b e r g 、 m e y e r 、l e m a r i e 、b a t t l e 提出的具体小波函数的构造,研究了小波变换的离散化 情形,并将相应的算法现今称之为m a l l a t 算法有效地应用于图像分解与重构 【州。与此同时,d a n b e c h i e s 构造了具有有限支集的正交小波基。从此,小波分析的 系统理论初步得到建立,小波变换的研究与应用才开始真正蓬勃发展起来。小波变 换与f o u r e r 变换、窗口f o u r i e r 变换( g a b o r 变换) 相比,它是一个时i

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论