(信号与信息处理专业论文)基于支持向量机的离线中文签名验证的研究.pdf_第1页
(信号与信息处理专业论文)基于支持向量机的离线中文签名验证的研究.pdf_第2页
(信号与信息处理专业论文)基于支持向量机的离线中文签名验证的研究.pdf_第3页
(信号与信息处理专业论文)基于支持向量机的离线中文签名验证的研究.pdf_第4页
(信号与信息处理专业论文)基于支持向量机的离线中文签名验证的研究.pdf_第5页
已阅读5页,还剩51页未读 继续免费阅读

(信号与信息处理专业论文)基于支持向量机的离线中文签名验证的研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

西华大学硕士学位论文 摘要 签名是被社会普遍接受的一种身份验证方法。由于其易模仿性,因此成为了伪造的 对象。签名验证是通过分析手写人书写风格的一种判断书写人身份的方法。在日常生活 中,签名验证发挥了很大的作用。如果鉴别正确率高,将对社会各行业起到关键作用, 同时在国家发展中发挥重大作用。签名验证成为计算机与模式识别领域的热门研究,并 且具有良好的应用前景。 本文针对离线签名,研究了一系列行之有效的离线中文签名验证方法,首先,介绍 了中文签名验证的概述及国内外研究现状;其次,阐述了离线中文签名验证系统的流程; 最后,深入研究了离线签名图像采集、预处理、特征提取与选择和分类鉴别技术,并进 行了一系列实验。 针对中文签名的特点,对签名图像进行了一系列预处理,包括平滑去噪、图像二值 化以及骨架提取等。在预处理中,用遗传算法阈值分割进行二值化,与常用的最大类间 方差法进行比较,经过仿真,效果更好。在特征提取时,为了弥补单一特征的不足,使 其能够准确、全面的反映签名的特点。本文提取的是静态特征、伪动态特征特征,并且 采用多特征融合的方法。 目前,许多学者将支持向量机学习方法用到签名验证中,并取得了一定的研究成果, 但是,对于高维数的签名数据,支持向量机签名验证存在训练时间长、测试速度慢等不 足之处。 针对以上不足,在特征提取后,本文采用粗糙集约简属性的特征选择方法,将冗余 特性删除,达到降低特征维数的目的,这种方法不但避免了特征提取中维数灾的问题, 还有效改善了训练时间。 比较决策阶段,本文用适用于有限样本、泛化能力比较好的支持向量机进行分类, 但是核函数的选择直接影响着支持向量机的分类性能,针对这一不足,选择全局优化能 力强,且不易陷入局部最优的遗传算法来优化参数,获取最优分类参数,采用粗糙集属 性约简后的特征向量,通过学习,构建出具有最大分类间隔的分类器。实验表明,该算 法可以获取较好地鉴别效果。 关键词:离线中文签名;特征提取;粗糙集;支持向量机 基于支持向量机的离线中文签名验证的研究 a b s t r a c t n es i 班a t u r ei su i l i v e r s a l l ya c c 印t e db yt h ep u b l i co fa l la u t h e n t i c a t i o nm e 吐1 0 d b e c a u s e o f i t se a s yi 觚t a t i o n ,t h u sb e c o m eaf 酞eo b j e c t s i 印a t i 鹏i sah n do f m e 廿1 0 dw 1 1 i c hd e c i d e st h e i d e n t 时o fw r i t e r st h r o u 曲t h e 锄a l y s i so fh 锄d w r i 血gv 嘶6 c a t i o n i nd a i l yl i f e ,s i 印狐l r e v 嘶f i c a t i o nh a sp l a y e dal 鹕er o l e i ft h ei d e m i f i c a t i o na c c u r a c yi s1 l i g l l ,i tw i l lp l a ya k e yr o l e i n 吐1 ev 撕o u ss e c t o r so fs o c i e 妙,a l s oi nm en a t i o n a ld e v e l o p m e n t s i g n a t u r ev 甜f i c a t i o nh a s b e c o m et l l eh o tp o ti i lm e 丘e l do f l ec o m p u t e ra n dp a _ t t 锄r e c o g 血t i o 玛a l l dh a sag o o d 印p l i c a t i o np r o s p e c t t m sd i s s e n a t i o ns m d i e das 甜e so fe f j t i v eo 作l i i l ec l l i n e s es i 印a n 鹏v 舐f i c a t i o n m e t h o df o rd i r e c t e ds i 弘a t u r e ,f i r s t l y ,i 1 1 臼o d u c et 1 1 eo v e r v i e wo fc e s es i 印a t u r ev e r i f i c a t i o n a n dr e s e a r c hs 切咖sa th o m e 锄da b r o a d ;s e c o n d l y ,e x p o u n dm eo 仃1 i n ec h i i l e s es i 萨a t l l r e v 嘶6 c a t i o ns y s t e mn o w ;f m a l l y ,m a d ead e 印咖d yo ft 1 1 eo 尽1 i i l es i 驴a t u r ei i n a g ec o l l e c t i o 玛 p r e p r o c e s s i n g ,f e a t u r ee x t r a c t i o 玛s e l e c t i o na n dc l a s s i 丘c a t i o ni d e n t i f i c a t i o nt e c l l i l o l o g y ,a n d m a :k eas 嘶e so fe x p e r i n l e n t s a c c o r d i i l gt ot l l ec h a r a c t 嘶s t i c so fc h i l l e s es i g n a t u r e ,t 1 1 es i 鲫a t u 】r ei i i l a g eu n d e r t o o ka s 丽e so fp r e 仃e a n :i l e m ,i i l c l u d i i l gs m o o m i n g ,i i n a g e so ft h e 似ov a l u e sa sw e ua l st h es k e l e t o n e x 仃a c t i o n h lp r 印r o c e s s i n g ,u s i n gg e n e t i ca l g o r i t l l mb i n a r a z a t i o i l ,a n dc o m n l o i l l yu s e do t s u m e t l l o da r ec o m p a 舱db ys i l u l a t i o l l ,t h ee f f ti sb e t t e r t h ef e a t u r ee x 删i o 玛i no r d e rt om a l 【e u pf o rt i l ed e f i c i e l l c yo fs i n g l ef e a n l r e ,w l l i c hc a na c c u r a t e l yr e n e c tt l l ec h a r a c t e r i s t i cs i 印a t u r e i i l 廿l i sd i s s e r t a t i o 玛t 1 1 es 枷cc h a r a c t 嘶s t i c sa r ee x 仃a c t e d ,p s e u d od y n a n l i cf e a t u r e s ,a n du s i n g m u l t i p l ef e a t u r e 如s i o nm e t l l o d a t p r e s e n t ,t 1 1 es u p p o nv e c t o rm a c h i l l e ( s u p p o r t v e c t o rm a c l l i n e ,s v m ) l e 锄曲玛m e t h o d w a su s e db ym a i l ys c h o l a r si nt 1 1 es i g n a n l r ev 耐f i c a t i o nf i e l d ,a i l dm a d es o m ea c l l i e v e m e m s h o w e v e r ,f o rt 1 1 e1 1 i 曲d i l i l e n s i o n a l 时o ft 1 1 es i 印a t u r ed a t a ,s 、州s i 印a t u r ev e r i f i c a t i o nh a s l o n g 仃a i 疵! l gt i l l l e ,t e s ts p e e da l l do t h e rd e f i c i e n c i e s i nv i e wo ft h ed b o v e ,i nt h ef e a t u l ee x 仃a c t i o n ,t h i sd i s s e n a t i o nu s e sr o u 曲s e ta c t i i b u t e f e a t u r es e l e c t i o nm e t l l o dt om n o v em ec h a r a c t e r i s t i c so fr e d u i l d a i l c y i no r d e rt oa c l l i e v et 1 1 e p u 印o s eo fr o d u c i n gf e a t u r ed i i i l e i j l s i o n t 1 1 i sm 甜1 0 dc a nn o to i l l ya v o i dt h ed i i l l e r l s i o nd i s a s t e r p r o b l 锄m m l b e r f e a t u r ee x 廿a c t i o i l b u ta l s oi n l p r o v em e 仃a 洫i 1 1 9t i l i l e c l 嬲s i f i c a t i o nd e c i s i o ns t a g e ,m i sd i s s e n a t i o ni ss u i t a b l ef o rf t es a m p l e s ,b 甜e r g e l l e r a l i z 撕o na b i l i 够o fs u p p o r tv e c 白0 rm a c h i i l ec l a s s i f i c a t i o n b u tm ec h o i c eo ft h ek 锄e l 劬c t i o n 也a td m 笼t l ya f r e c tt h es v mc l a s s i f i c a t i o np e 南n n a n c e t os 0 1 v et 1 1 i sp r o b l 锄,s e l e c t 9 1 0 b a l0 p t i 血z a t i o nc a p a b i l i 劬锄di t se 嬲yt o 脚li i l t ol o c a l 叩t i i n a lg e n e t i ca 1 9 0 r i t i 瑚t 0 o p t i l i i i z et h ep a r 锄e t e r s ,t oo b t a i nt l l eo p t i i l l a lc l a s s i f i c a t i o np a r 锄e t e r s t or e d u c et l l ef e a _ t u r e i i 西华大学硕士学位论文 v e c t ( 鹏f 0 r 饥曲i 1 1 9b yl e 踟1 i n g ,柚de s t a b l i s ham a x i m 2 l lm a r g i nc l a u s s i f i c 撕o nc 1 嬲s i 6 e r e x p e r i m e n t a lr e s u l t ss h o w 1 她t h ea 1 9 0 r i t l l i nc 锄0 b t a i nb e t 衙i d e n t i f i c a t i o ne 仃e c t k e yw o r d s :o 昏l i l l ec h i n e s es i 弘a n 啪;f e a :t l 鹏e x 仃a c t i o n ;r d u 曲s 鸭s u p p o r tv e c t o r m a c h i n e m 西华大学硕士学位论文 1 绪论 1 1课题研究的目的和意义 随着社会经济与信息技术的飞速发展,人类生产和生活方式发生了急剧变化,网络 时代的到来更是为人们的生活、工作,以及社会的发展注入了强大的动力,也成为人们 生活不可或缺的一部分。然而,在它为我们带来方便的同时,信息安全隐患也随之愈加 凸显出来。在我们身边,信用卡密码被盗,各种证件被盗用等造成的个人、集体遭受重 大损失的事件比比皆是。因此,如何正确判断每个人的身份成为现代社会迫切需要解决 的问题【l 】。这就需要一种准确、高效、实用的个人身份验证技术。而签名是一种具有法 律效力,日常接触多,并被大众普遍接受的一种身份验证方式,在社会生活中占有重要 作用【2 】o 签名,就是把自己的姓名通过书写的方式反映在书写的承受客体上。一般来讲,签 名代表书写者对某一行为或者对某一事件的认可或承诺,它既是社会信誉的担保,又是 对承担相应法律义务的承诺。签名作为一个生物特征,是现在身份验证中被广泛接受的 一种属性,与我们日常生活、工作密切相关【3 】。在日常所涉及到的签署合同、公证、提 款、订立协议、处理单据等活动中,签名是必不可少,并且具有相应的法律效力。因此 我们会认为,签名已成为社会生活中的身份标志。同时,由于签名被作为同意或授权的 标志,已长时间成为伪造的对象,特别是在信用卡和银行支票的时代【4 】。所以,提高个 人身份验证的速度和准确性对社会发展和经济进步有着重大的意义,它可以更有效地防 止犯罪。 1 2 中文签名验证概述 中文签名是个人生理特点与后天长期积累的总和,在一定时间内有相对的稳定性【5 】, 并且每个人的笔迹都有自己独特的书写特征【6 】,且采集笔迹对人们来说不存在侵犯隐私 权的问题,易被人所接受,所以多用于身份验证中【3 j 。 中文签名早就在社会生活中占有重要的地位,它是同意、授权、责任和验证的象征。 伪造签名实质上是为了得到经济上的利益。随着社会经济发展,许多应用领域迫切需要 一种可靠、快速、准确的身份验证系统。身份验证方法多种多样,但概括起来可以分为 两大类:间接验证方法和直接验证方法【7 】。间接验证方法是通过如口令,身份验证号或 持有的某种物品( 如身份证,钥匙等) 来验证其身份,这种验证方法在安全性上存在缺陷, 如口令有可能被遗忘,物品则可能丢失。直接验证法则通过一些生物统计特征和人的生 基于支持向量机的离线中文签名验证的研究 理特征【8 9 】来辨识其身份,这类方法在安全性上有着一定的优势,但其数据采集和分析 过程则较为复杂。 根据数据获取的方式不同,签名验证系统可分为两类:在线( o n - l i i l e ) 签名验证系统 和离线( o 昏l 硫) 签名验证系统【io 】。在线签名验证是指通过专用的数字板或数字仪实时采 集书写信号,提取签名的特征,它主要提取签名时的书写力度和书写速度,分析笔的移 动,因此又称为签名力学辨识。提取的特征包括运笔速度、加速度、压力、字迹形态等。 而离线签名验证则需要首先用扫描仪或摄像机将写在纸上的签名图像转化为计算机能 处理的信号,再进行处理分类,因此它只能从签名的外在来判断签名的真伪,提取的特 征包括签名的位置、形状、笔划方向、笔划间的搭配等。相对而言,在线签名验证的准 确率较高,因为离线签名验证,仅仅依靠签名图像的静态信息,而书写过程的动态信息 几乎完全丢失】,因此,离线签名验证的难度相对来说较大,准确率也相对较低,至今 仍然没有实用价值的产品面世。 近年来,不少学者对在线签名验证作了很多研究工作。相比之下,对于离线签名验 证的研究则要少的多,一方面是由于签名过程本身的复杂性,虽然在签名中可以观察到 某些不变性,但签名不是一个可重复的过程。同一个人在不同年龄、不同精神状态下的 签名有很大不同,即使是同一人连续签下的两个名,也不可能完全相同。因此,选择一 组既能表达出书写者特有的书写风格( 即类间差别) ,又能容忍每次签名的自然差异( 即类 内差别1 的特征,这是问题的关键和难度的所在;另一方面,离线签名验证要比在线困 难得多,其主要原因在于离线的签名图像可以很容易地被模仿,而在线验证系统普遍采 用的运笔速度、加速度、压力等动态信息【1 2 】,在静态图像中保留的不多。相比较在线验 证,离线签名验证要困难得多,这主要是由于离线签名验证处理的是静态图像,缺乏在 线签名所具有的时序信息,以及签名速度、加速度等动态信息。但离线签名验证不需要 特别的输入设备,如在线签名时的输入器,因此更人性化,具有更广泛的应用前景。 1 3 国内外研究现状 签名验证有很好的应用前景以及大的商业价值,因此各国学者及研究机构都表现出 了非常大的兴趣。签名验证作为模式识别的前沿课题,受到国内外研究者的广泛关注。 在签名验证方面,国内外做了大量的研究工作,并且国外对签名验证的研究有四十 多年的历史,签名验证一开始是从离线开始研究的。在上世纪六十年代,a j m a - n c 耐 提出了手写签名作为身份验证的可能性,并发表了题目为“利用签名进行个人鉴别的可 行性研究”,标志了签名研究的开始,但是初期研究的效果并不理想。 与离线签名的相比,国内外研究学者对在线签名比较重视,从签名图像数据的采集 到预处理。鉴别算法等都相对比较成熟,并且一些国外的大公司都取得了很好的研究成 西华大学硕士学位论文 果。上世纪七十年代,m m 公司,n m h e r b s t 、c n l i u 设计【1 3 】了一枝签名笔,它可以 通过检测书写时的压力以及x ,y 方向上的加速度,将它们作为信号得到高的鉴别率。 此外市场上也有几种签名产品出现,主要有:p 甜p h e r a lv i s i o no f n e wy o r k 产的p e l l o p , 配置到计算机的系统上,用户必须通过签名才可以登陆注册;另外一种产品为s i 觚o n 产品,可以植入各种软件,使用时用签名才可进入系统,它运用了签名图像的加速度、 笔画角度、起始的笔尖压力等因素来获得认证结果,并且它在签名样本上加入了一个签 名参照模板,验证结果分为三种:真实、伪造以及不确定。 相对而言,国内起步比较晚,但也取得了许多很好的研究成果。吉林大学所承担的 手写签名鉴定技术的应用产品研制开发,使用计算机将手写签名的图像、笔画、速 度以及压力等信息和真实签名进行比对,实现实时鉴别中文签名真伪,标志我国在线中 文签名鉴定达到国际水平。2 0 0 5 年,清华大学与公安部第二研究所共同研制的“计算机 笔迹鉴别系统”经公安部组织的技术鉴定,该鉴定系统已经被用于国家重要安全项目。 此外,国内有许多公司都致力于签名鉴定系统的开发,也取得了一些成果,但真正投入 到实际应用中的还很少。 离线签名的研究,目前主要集中在国内外的高校中,因为离线签名是对于静止图像 的,缺少动态信息,因此鉴定起来相对困难很多,鉴定率也相对较低。但是离线签名有 在线签名系统无法相比的优势,不受应用范围限制,因此具有更广泛的市场前景,并且 成本也比较低。在离线鉴别方面,国内外都取得了一定成果,如多通道g a b o r 滤波法、 基于支持向量机文本无关字迹鉴别系统、笔划匹配都在一定程度上提高了签名鉴定的正 确率。 近年国内研究者在离线签名鉴定方面的重大研究成果: 国外方面: n e m e c k 和l i n 【1 4 】提出了第一个对于简单伪签名的离线认证研究。在研究中,通过 h a d 删变换从图像中提取静态特征,根据分类器的不同配置,类型i 错误在1 1 到 2 3 之间;类型i i 错误在2 7 到4 1 之间。 b r o c “e h u r s t 介绍了一个完全自动化的系统,利用数据检测技巧来将签名编码成7 个特征。系统接受此时的真实签名达到1 0 0 ,能检测出大多数简单伪签名。 a m m a r 【1 5 】提取了签名图像的倾斜特征、高灰度特征和参考模式特征,采用最小距 离法分类验证,对一些熟练伪签名的鉴别取得了较好的效果。并且高灰度特征常被用在 离线签名鉴别。 q i 和h u i 】吣【1 6 】提出签名图像的全局特征、局部网格特征,用它们进行签名验证。用 加权欧式距离分类器进行分类,对一般伪签名和熟练伪签名均取得了较好的效果。 基于支持向量机的离线中文签名验证的研究 n a b e e la m u r s h e d 及f l a v i ob o n o l o z z i 等 1 7 ,1 8 】提出了模糊神经网络的离线签名鉴定 方法,它是将签名图像分块,用触汀m a p 神经网络分别对每块儿进行判别,最后对输 出进行判别。 胁n e s h 和m t ) r 在文章中首次运用了四种特征:基于矩的表示、几何特征、包络特 征及结构小波特征,用遗传算法对各个特征的模式特征赋权值,这种分类器对真实签名 鉴别率达到9 0 ,熟练伪签名达到7 0 以上,拒绝率约为1 5 2 0 。 m i z u k a 加j 等提出应用位移函数来鉴别,最佳位移函数是通过对签名中函数的最小 化提取出来的,函数可以定义为签名的欧氏距离和位移所需要的平滑补偿项之和,该方 法得到的最小错误率为2 4 9 。 m 锄a m m a r 通过提取签名的倾斜特征、高浓度特征和参考特征来鉴定熟练伪签名, 取得了很好的效果。 r 0 b e ns a b o u r i n 及g i i l e t eg e n e s t 提出用基于视觉的新形式,从形态学角度提取签名 的形状特征,用近邻法及最小距离法进行分类,对伪签名的鉴定取得了很好的效果。 国内方面: 林峻和李介谷的“离线中文签名鉴别的特征提取及预处理”,错误率较低,只为2 5 , 但是提取的有些特征存在疑问,而且签名数量非常有限。 柯晶、乔谊正等【l9 】提出将签名静态特征、伪动态特征( 灰度级分布、笔划宽度分布 的概率直方图) 相结合的方法,经过计算距离来鉴别,对熟练伪签名的鉴别达到接近9 0 的正确率。 蔡洪滨、施泽生等提出了一种基于小波变换的用于提取手写签名笔划坐标时间曲线 拐点的手写签名认证方法,该方法首先采用以高斯函数的二阶导数作为小波基的小波变 换技术来进行拐点提取,取得了较为满意的结果:误拒率约为9 ,误纳率为0 。 刘成林、戴汝为等提出基于多通道分解匹配的笔迹识别方法,首先将二值化的签名 图像按笔划方向性进行方向分解,然后将各方向上子图像进行频带分解,使用分解后的 采样信号作为签名特征,用特征匹配法进行签名识别,取得了很好的实验效果。 左文明在文献【2 0 】中提出了一种结合静态特征和动态特征的新的鉴别方法,结合两类 特征形成1 6 维特征向量,建立一个包含2 9 0 个真伪签名的签名库进行验证的系统,系 统的f a r 和f i 汛分别达到了7 2 5 和9 3 0 。 程析、侯义斌提出模糊模式识别离线签名认证技术,主要是用模糊模式识别法,构 建特征隶属度函数广分别是:水平方向重心、垂直方向重心、高度及宽度比、笔划与图 像面积比、签名正倾斜度、签名各独立部分间的间隔和签名图像总宽度之比,对于简单 伪签名可以达到8 8 的正确认证率。 西华大学硕士学位论文 陈刚等提取不变矩和形状描述子特征,采用两个距离权重分类器对签名图像进行识 别,然后再将两个分类器的输出作为证据,用改进证据理论合成公式进行融合得到最终 识别结果。 我们不难发现图像处理的一般范畴,都采用结合汉字结构及书写的特征,继而用各 种特征提取方法提取出特征量,进行鉴定。但是,没有达成统一共识,也没有统一、公 认的判断、鉴定标准。 1 4 离线签名验证系统流程 图1 1 为签名验证系统的简单框图,它主要包括签名图像获取、预处理、特征提取 与选择、分类器设计和分类决策五部分组成。 d 藤。;i 签名图像获取 图1 1 签名验证系统框图 f i g 1 1d 堍衄s i 鲷a 血矾v e 商c a n s y s t e m 在离线签名验证系统中,签名图像获取一般是将写在a 4 纸上的签名,用扫描仪扫 描获得的。得到的签名大都含有噪声,因此并不能直接进行特征提取,这就需要进行相 关的预处理。 预处理阶段主要是针对中文手写签名的特点,对签名定位、去除背景,去噪等一系 列操作,预处理需要尽可能降低干扰,并且最大程度保留签名的有效信息。预处理的一 般包括签名图像去噪、二值化以及细化等步骤。 签名图像的特征提取与选择是签名验证的关键问题。如何通过尽可能少的特征准确 全面的反映出签名的特点,是特征提取与选择的关键所在。在签名图像处理中并不能得 到所有特征,只能通过研究哪种特征对于分类的效果更好些,同时又可以通过计算得到。 在提取特征时,还需要考虑字体、大小噪声对于所提取的特征的影响:特征选择则是从 一组特征挑选出最有效、最具代表性的特征,达到降低特征空间维数的目的。 分类器设计( 学习、训练阶段) :用特征选择出来的特征向量确定分类判别规则, 使得对待测签名进行分类时错误率最小。 基于支持向量机的离线中文签名验证的研究 分类决策:对未知的测试样本真实签名或伪签名,先进行预处理、特征提取与 选择,最后利用分类判决规则对被鉴定对象进行分类。 1 5 课题主要的研究内容及论文组织 由于离线中文签名的简单、易模仿性,成为了伪造的目标。因此提高签名验证的质 量和速度是一项具有重要现实意义的高科技应用研究,它对探索和发展人工智能、信息 处理也有着重要的理论价值和实用意义。 本课题是基于基于支持向量机的离线中文签名验证方法的研究,着手分析研究离线 签名的内在特性,提取出反映个人签名的本质特征,以期获得鉴别率较高的离线中文签 名系统。 论文内容安排如下: 1 、绪论。针对离线签名验证的实现方法,首先介绍了离线中文签名验证的研究目 的及意义,引入了中文签名验证的概述,详细介绍了国内外的研究现状,最后阐述了离 线签名验证的系统流程。 2 、签名图像采集与预处理。本章先介绍了签名图像的采集过程,然后详细阐述了 签名图像的预处理过程,本文采用了一系列签名图像预处理方法,包括截取签名区域、 平滑去噪( 数学形态学平滑) 、二值化、数学形态学骨架提取、提取灰度图像。主要研 究了基于遗传算法的阈值分割二值法,与常用的最大类间方差法进行比较,得到了较好 的二值图像。 3 、签名图像特征提取与选择。本章首先介绍了特征提取的方法,然后详细介绍了 基于粗糙集属性重要性的特征选择法。本文在预处理基础上提取了静态特征、伪动态特 征,采取特征融合的方法,并将提取的特征用基于粗糙集属性重要性约简算法对特征进 行选择,删除冗余特征。 4 、支持向量机分类决策法。本章首先介绍了分类决策常用的方法,然后详细阐述 了能很好的解决小样本问题的支持向量机的基本理论和分类算法,由于参数对分类的影 响,重点介绍了遗传算法的基本理论,以及用遗传算法进行参数优化的算法和操作流程。 5 、系统设计与实验结果。本章首先介绍了支持向量机离线签名验证系统的设计流 程,然后阐述了离线签名验证系统的实验评价指标、实验条件,最后对实验结果进行了 详细的分析、比较,在相同的特征情况下,采用粗糙集约简属性的分类方法,可以得到 较好的验证结果。,。 西华大学硕士学位论文 2 签名图像采集与预处理 在签名验证系统中,首先需对采集到的签名图像进行预处理。因为签名图像是用扫 描仪将书写在白纸上的签名输入到计算机中的,扫描过程中存在干扰,对图像进行预处 理,去除背景,减少冗余信息对验证结果的影响,为特征提取与选择做准备。正确有效 的预处理方法可以提高系统的准确率和运算速度,得到理想的鉴别效果。 2 1 签名图像采集 图像采集是利用一些设备将签名样本转化为数字信息输入计算机。采集到的签名样 本的质量的好坏直接影响到签名系统的验证性能。 本课题,采集了2 0 个志愿者的中文签名。这2 0 个志愿者每人间隔一至两天,使用 黑色中性笔在a 4 打印纸上【2 1 1 ,每次书写1 0 个签名,每个签名者书写自己的签名4 0 次, 总共得到8 0 0 个真实签名。对于伪签名,每类签名找两个自愿者各模仿1 0 次,总共有 4 0 0 个伪签名,总计有1 2 0 0 个签名样本。因为伪签名是模仿真实签名得来的,因此通过 这些签名验证本文研究的系统,更能体现出系统的验证性能。 本文用c 觚o nm 鄹2 8 扫描仪,将签名样本存储到计算机中。通常人们所用的扫描精 度有:1 0 0 d p i ,3 0 0 d p i ,6 0 0 d p i ,扫描精度越高,签名图像的清晰度越高,得到的信息 量就会越大,相应的计算量就会越大,直接影响到计算机的鉴别速度。1 0 0 d p i 精度的签 名信息量太少,本文扫描了3 0 0 d p i 和6 0 0 d p i 两种,进行比较,3 0 0 d p i 的可以满足要求, 并且6 0 0 d p i 精度的鉴别率几乎没有提高,但是相对的处理速度会比较慢,因此综合考虑, 本课题选择3 0 0 d p i 扫描精度进行扫描。 图2 1c a n o n 蜮3 2 8 扫描仪 f i g 2 1 c 锄0 nm x 3 2 8s c 粗n e r 基于支持向量机的离线中文签名验证的研究 马小建马曲,壶 础勇景勇 徐穆乡乡余矽劫 ( a ) 真签名( b ) 伪签名 图2 2 签名样本 f i g 2 2s i 弘矾鹏s a 加【p l e s 2 2 签名图像预处理 签名图像进行预处理主要是为了去除签名中存在的干扰,为后续的特征提取做准 备。经过扫描仪直接得到的签名图像,存在噪声,文字粘连等影响,所以一般我们不直 接采用设备得到的图像,而是对其进行相应的预处理。签名图像的预处理一般是去除干 扰、加强有效信息。预处理的方法一般包括平滑滤波、二值化、细化等。本课题的特征 提取主要是在灰度图像、二值图像、细化图像上进行提取的,因此选用平滑去噪、二值 化,形态学骨架化等进行预处理。 2 2 1 截取签名区域 签名图像周围的空白存在大小不一的情况,对特征提取有影响。因此,我们要去除 签名图像周围的空白区域。 签名图像进行平滑去噪处理后,从上到下,从左到右依次寻找灰度图像中非背景点 的边缘:,x 哪,y 曲,y 眦,依据坐标对签名图像进行切割,去除其空白区域。切割后, 签名图像的高度为y 一一y 血,宽度为一。截取签名区域后的效果图如下图。 8 图2 3 截取签名区域后的效果图 f 培2 3i n t e r c e p d o ns i 弘a t u r ea r e ae 行e c tc h a n 2 2 2 平滑去噪 为了提高图像质量,消除各种噪声,需要对图像进行平滑处理【2 2 1 。图像去噪的目的 是消除图像上的噪声,衰减高频,增强低频。有效地去噪方法,主要分为:空间域滤波、 频率域滤波【2 3 1 。空间域滤波主要有【2 4 】:线性平滑滤波、非线性平滑滤波、线性锐化滤波、 非线性锐化滤波。频率域滤波主要有:低通滤波、高通滤波、带通带阻滤波。签名图像 在处理过程中不可避免的会产生噪声,为了提高图像质量,消除噪声,需要对图像进行 平滑处理。图像转变成二值图像的过程中,不可避免的也会产生一些噪声,它们对特征 的提取造成一定的影响,因此要对二值图像进行平滑。本文采用形态学平滑对二值图像 进行平滑,去除小的枝权。 形态学是利用结构元素对图像进行探测,以实现保留细节、消除噪声的目的。用形 态学实现简化数据,保持图像形状的目的。结构元素的选择十分重要,应该选择在几何 上比签名图像简单,并且有界的结构元素【2 5 】。 形态学处理二值图像,需要构建结构元素,它通常是一些小的集合。在图像中不断 移动结构元素,填放结构元素在图像内部,对适合放入的位置做标记,从而得到图像信 息。构造不同的结构元素,可以完成不同的图像分析,继而得到不同的分析结果。形态 学方法最基本的是腐蚀、膨胀。 ( 1 ) 腐蚀 设f 为输入图像,g 为结构元素,则,对于g 的腐蚀和膨胀定义为: 内g = 杪:g + 厂cf ) ( 2 1 ) 腐蚀即用结构元素对图像进行检测,找到每部可以放下结构元素的区域。它是消除 边界点,使边界收缩的过程。用来消除小而无意义的物体,对于消除笔画间的粘连比较 有效。 9 基于支持向量机的离线中文签名验证的研究 腐蚀运算方法:首先扫描二值图像,找出第一个像素为1 的点,然后将设定好的形 状以及结构元素的原点移至该点,判断结构元素覆盖范围内的元素是否都为1 ,如果是 则将腐蚀后相同位置上的像素置1 ,如果不是全为1 ,则腐蚀后相同位置上的像素置o , 对二值图像中所有像素值是1 的点进行结构元素重复检测。 ( 2 ) 膨胀 设f 为输入图像,g 为结构元素,则f 对于g 的腐蚀和膨胀定义为: fog = 旷c 0 一g c 】( 2 2 ) 其中,c 表示f 的补集,一g 表示g 的对称集。 膨胀是边界向外扩张的过程,经常用来填补签名图像中的孔洞或者小裂缝。它可以 通过将相对结构元素的所有点进行平移输入图像中,再计算并集得到。 膨胀的具体方法:将设定好的形状以及结构元素的原点移至图像中可包容的全部像 素点,然后判断结构元素覆盖范围的像素点是否全为0 ,如果不是,则将膨胀后与结构 元素原点位置相同的点得像素置1 ,如果该范围内所有像素为o ,则将膨胀后该相同位 置的像素置0 ,对二值图像中所有像素值是1 的点进行结构元素重复检测。 本实验是将膨胀、腐蚀联合使用的。用同一结构元素先腐蚀再膨胀的运算称之为形 态学开运算,先膨胀再腐蚀称之为形态学闭运算。本文是对二值图像先进行膨胀,填补 签名图像中的孔洞或者小裂缝,再进行腐蚀,消除小而无意义的噪声,及笔画间的粘连, 最终实现对灰度图像的平滑去噪。采用数学形态学平滑法对签名二值图像去除小的枝 杈,效果图如图( 2 4 ) 所示。 西华大学硕士学位论文 ( a ) 平滑前效果图 ( b ) 平滑后效果图 图2 4 数学形态学平滑效果图 f i g 2 4 m a t h 舳觚c a lm o 啦0 l o 西c a l 锄。砌j i 玛e 虢c tc h a r t 2 2 3 二值化 图像阈值分割又称图像的二值化,二值化处理主要是把感兴趣的物体和背景分成两 部分,采用阈值将灰度图像分割成只有0 和1 两个灰度值的二值图像。二值化的主要目 的是将签名从背景中分离出来。 设厂( x ,j ,) 为灰度图像中像素点灰度值,g ( 工,y ) 为变换后二值图像像素点的值,则二 值化过程可以表示为: 如川= 器嬲三; 他3 , 通常阈值分割可以分为:全局阈值法、局部阈值法以及动态阈值。用像素点的灰度 值确定的阈值方法为全局阈值法。全局阈值法常见的有:o t s u 算法、平均灰度值法等。 局部阈值法是通过像素点灰度值及其周围点局部灰度来确定的阈值法。b 咖s e n 是典型 的局部阈值法。常见的动态阈值法有最大类间方差阈值法、共生矩阵法等。最大类间方 差法无论图像有无明显的双峰直方图,都可以得到较满意的结果,但是在确定多阈值时, 计算量相对比较大,而基于遗传算法的图像分割,相比之下效果有所提高。 么么一 基于支持向量机的离线中文签名验证的研究 1 、最大类间方差法 最大类间方差阈值法也称作大津阈值法,是日本的大津展之于1 9 8 0 年提出的,对 阈值分割有较好的效果。 将直方图在某一阈值分割为两组,当被分成的两组间的方差达到最大时,得到阈值。 设一签名图像的灰度值为1 以级,灰度值j 的像素值为m ,此时有: 像素总数: m :y 小, ( 2 4 ) j 二- 一, 每个灰度值的概率为: p :兰 ( 2 5 ) 然后用t 将其分为两组c 0 = 1 一丁) 和g = 1 + 丁一,z ) ,产生的概率如下: c 0 产生的概率: w o = p j = w ( 丁) ( 2 6 ) c 1 产生的概率: m = p ,= 1 一w o ( 2 7 ) c 0 的均值: 风= 喜等= 器 趵 j = io 、, c l 的均值: 舻熹。鲁= 篇 ” ,= r + l l 7 1 , 其中,:主勿j 是整体签名图像的灰度均值;而( 丁) = 之彦j 是阈值为t 时的灰 度均值,故全部灰度均值为: 两组方差为: = w 0 鳓+ i ( 2 1 0 ) 艿2 ( 丁) = w 0 ( o 一) 2 + w l ( 1 一) 2 = w bw l ( “一) 删( 丁) 一( 丁) 】2 ( 2 11 ) = 一 w ( r ) 1 一形( 丁) 】 西华大学硕士学位论文 改变t 的值,求上式为最大时的t 值,即为万2 ( 丁) 为最大时的丁值,这时的丁+ 值 即为阈值。而称占2 ( 丁) 为阈值选择函数。 2 、基于遗传算法的阈值分割 遗传算法( g e i l e t i c 舢g o n t l 皿,简称g a ) 是建立在自然选择基础上的模拟生物进 化的搜索算法【2 6 1 。依据达尔文的进化论学说,生物只有能适应环境的变异才可以生存下 去,否则将会被淘汰,这就是所谓的生存竞争。遗传算法是基于自然选择与遗传学的方 法,通过复制、交叉、变异等,进行不断的迭代计算,最后使得群体最优值逼近最优解, 从而达到全局最优。遗传算法是针对参数编码得到基因的,同时它可以并行处理群体中 的n 个个体,因此具有好的全局搜索能力。遗传算法主要由染色体编码与解码、适应度、 遗传算子( 选择、交叉、变异) 组成。 遗传算法阂值分割具体流程: s f 印1 :针对图像编写代码,将图像编码成0 和1 构成的字符串; s f 印2 :初始化,种群大小为1 0 ,交叉概率为0 7 ,变异概率为o 4 ,最大进化代数为 1 5 0 : s 印3 :通过像素的灰度值,计算个体f 的适应度值厂( f ) ,对其进行排序; s 印4 :选用精英选择,对于小于5 0 代时用上一代适应度值大于当前代的个体,随 机代替当前代中的任意个体;当大于5 0 代,小于1 0 0 代的,则用上一代适应度大于当前 代个体的适应度值代替当前代中最差的个体;而对于进化大于1 0 0 代后,则用上一代中 优秀的一半代替当前最差的一半,加快速度; s 印5 :交叉运算,是产生新个体的主要操作,采用单点交叉,交叉概率设为0 7 , 但是当进化代数进行到7 5 代以后,调整交叉概率为0 3 ; s 卸6 :变异概率是产生与上一代有较大差异的个体,使其在搜索中摆脱局部最优, 变异概率为o 4 ,当进化代数进行到7 5 代以后,调整变异概率为o 3 ; s 卸7 :终止到最大代数,终止运算。 基于支持向量机的离线中文签名验证的研究 图2 5 f i g 2 5 图2 6 遗传算法阈值分割效果图 f i g 2 6 g 以ca l g 面吐眦t h r e s h o l ds e 鲫嘶o nm 印 从上面阈值分割效果图可以看出,基于遗传算法的阈值分割,效果更好,因此本文 用基于遗传算法的阈值分割进行二值化处理图像。 2 2 4 数学形态学骨架化 有些形状特征是在骨架上面提取的,需要对图像骨架化。本文在二值图像基础上运 用形态学骨架化对图像骨架处理,将图像减小为单个像素的线,得到细化图像。 p 的骨架s ( p ) 可以用腐蚀及开运算来表达,表达式如下: 置 s ( d = u 瓯( d ( 2 1 2 ) 七= 0 或者是: 置 s ( 尸) = u ( 户嘲) 一【( 尸| 瞻q ) 。q 】) ( 2 1 3 ) i = o 其中q 是结构元,删是q 对尸的连续七次腐蚀。而足是尸被腐蚀为空集前的迭 代次数。 上两式可以看出,s ( 即可以由最( 一的并集得到。尸可以通过下式重构: 1 4 一曼一 一竺够 余 余 西华大学硕士学位论文 足 p = u ( 最( 9 0 尥) 七= o 而式中最( q ) o 坦是q 对足( d 的连续七次膨胀,式子如下: ( 瓯( p ) o 尥) = ( ( ( 足( p ) oq ) oq ) o 一) 0q 本文在二值图像基础上进行数学形态学骨架化,效果图如下: j ; 图2 7 数学形态学骨架提取效果图 f i g 2 7m a 血锄a t i c a lm o r p h 0 1 0 百c a ls k e l 酏o n 懿畹c t i o ne 觚tc h a n ( 2 1 4 ) ( 2 1 5 ) 2 2 5 提取灰度图像 在提取签名特征时,有些特征是基于灰度图像的,但是经灰度化得到的图像,含有 噪声,因此需要提取去掉噪声的签名灰度图像。本文是在平滑二值图像的基础上提取灰 度图像的,这样在去除噪声的基础上,可以更好的保留灰度图像的信息。 在得到的平滑二值图像上,从上往下,从左往右进行扫描,如果一像素点是二值图 像的背景像素点,则令这点的灰度像素值为2 5 5 ;如果是二值图像的前景像素点,令该 点的像素值等于截取签名图像相同位置的灰度值。提取的灰度图像如下所示: 基于支持向量机的离线中文签名验证的研究 ( a ) 有干扰的灰度图像 麓度图蕾 ( b ) 去除干扰的灰度图像 图2 8 提取灰度图像效果图 f i g 2 8e x 协l c tt h eg 娜,s c a l ei m a g c 瑚d 耐n g s 2 3 本章小结 预处理的好坏直接关系着系统的验证效果,因此需要针对离线中文签名的特点,对 签名图像进行预处理,去除掉噪声和一些干扰信息,尽可能的保留图像的原始信息,为 后续处理做准备。本章首先阐述了签名图像的采集,然后重点介绍

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论