(模式识别与智能系统专业论文)基于hmmdtw相结合的二级签名认证算法的研究.pdf_第1页
(模式识别与智能系统专业论文)基于hmmdtw相结合的二级签名认证算法的研究.pdf_第2页
(模式识别与智能系统专业论文)基于hmmdtw相结合的二级签名认证算法的研究.pdf_第3页
(模式识别与智能系统专业论文)基于hmmdtw相结合的二级签名认证算法的研究.pdf_第4页
(模式识别与智能系统专业论文)基于hmmdtw相结合的二级签名认证算法的研究.pdf_第5页
已阅读5页,还剩67页未读 继续免费阅读

(模式识别与智能系统专业论文)基于hmmdtw相结合的二级签名认证算法的研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 随着计算机网络技术、电子通讯技术的同益普及和发展,信息安全的重要 性越来越突出。如何准确快捷有效地识别个人身份、保证信息的安全已成为现 代社会生活、经济、政治、军事中亟待解决的问题。基于生物特征的身份识别 克服了传统身份识别方式的很多缺陷正日益引起科研工作者以及全社会的关 注,并开始逐步应用于现实生活中。基于在线手写签名的身份认证方式是生物 特征识别的重要研究领域之一,相对于其他的生物特征识别方式来说,基于手 写签名身份识别作为一种非侵入性身份识别方式,更易于被人们接受。本文利 用中国科学院合肥物质科学研究院开发地f t a b l e t 签名信息采集平台采集的签 名数据,提出了一种基于h m m d t w 相结合的二级签名认证算法,得到很好的 签名认证效果。论文的主要内容有: ( 1 ) 介绍了生物特征识别与手写签名认证技术的相关研究背景和发展现 状。 ( 2 ) 将两种通用签名状态划分方法结合起来使用,并用一种基于统计学的 方法对类内签名状态划分的分界点进行匹配。实验证明,该方法能够有效地保 证类内签名状态划分的一致性。 ( 3 ) 提出了一种基于h m m d t w 的二级在线手写签名认证方法,使用签 名的字形信息、速度信息、以及力信息对签名的效果进行验证,并给出签名认 证效果最好情景下的实验依据。 ( 4 ) 从签名认证的准确性和计算的复杂性对文中提出的签名算法进行了分 析,给出了相关的分析结果。 ( 5 ) 设计了一个基于手写签名的身份认证的电子病历演示系统。对基于在 线手写签名认证在电子病历方面的应用做了一些有益探索工作,并对本论文的 研究工作进行了总结和展望。 关键词:在线手写签名认证,d t w ( 动态规整) 、h m m ( 隐马尔科夫模型) 、 统计方法 a b s t r a c t _ 一一_ - 一 a b s t r a c t w i t ht h er a p i dd e v e l o p m e n t so fc o m p u t e rn e t w o r k s a n dc o m m u n i c a t i o n t e c h n o l o g i e s ,i n f o r m a t i o ns e c u r i t yi s s u e s f a c e m o r ea n dm o r ec h a l l e n g e s i t sa n u r g e n ta n dh i g h e rt a s ki nt h em o d e m s o c i a ll i f e 、e c o n o m i c 、p o l i t i c sa n dm i l i t a r ya s h o wt ov e f i f yi d e n t i f i c a t i o na n de n s u r ei n f o r m a t i o ns e c u r i t yt h eb i o m e t r i c sh a sa s i g n i f i c a n ta d v a n t a g eo v e l t r a d i t i o n a la u t h e n t i c a t i o nt e c h n i q u e sa n d i sa t t r a c t i n gm o r e a n dm o r es c i e n t i 丘cr e s e a r c h e r s a t t e n t i o na n db ea p p l i e di n t or e a l i t y i d e n t i f i c a t i o n b 硒e do no n l i n eh a n d w r i t i n gi sa l li m p o r t a n tr e s e a r c h a r e ai nt h eb i o m e t r i c s r e c o g n i t i o n c o m p a r e dw i t ho t h e rb i o m e t r i c a u t h e n t i c a t i o nm e t h o d s ,i ti sr i o - i n t r u s i v e , c o n v e 砸a l ta n dm o r ee a s i l ya c c e p t e db yp e o p l e i nt h i st h e s i s ,w eu s ef - t a b l e tw h i c h i sd e v e l o p e db yc h i n e s ea c a d e m yo fs c i e n c ec o l l e c t i n gt h es i g n a t u r e st r a j e c t o r y d a t aa sw e l la sf o r c ei n f o r m a t i o n b a s e dt h e s es i g n a t u r e ss a m p l ed a t a , w ep r o p o s e d a n e wa l g o r i t h mw h i c hu s i n gh m mc o m b i n e dw i t hd t w t w o - l e v e la r c h i t e c t u r et o v e r i f ya u t h e n t i c a t i o na n dg e t av e r yw e l lr e s u l t t h em a i nc o n t e n to ft h et h e s i s c o n s i s t so f f i r s t l y , w er e v i e w e dt h ec u r r e n ts t a t ea n db a c k g r o u n do f t h ea r ti nh a n d w r i t t e n s i g n a t u r e v e r i f i c a t i o n s e c o n d l y , w ep r o p o s e dt o u s et h et w og e n e r a ls i g n a t u r es e g m e n t sm e t h o d s y n t h e t i c a l l y , a n dt h e ni n v e n t e d an e ws i g n a t u r es e g m e n t sm a t c hm e t h o db a s e d s t a t i s t i cp r i n c i p l ew h i c hc a ne f f e c t i v e l ye n h a n c et h em a t c ha c c u r a c yi nc a t e g o r y t h i r d l y , w ep u tf o r w a r dt oa n e wa l g o r i t h m i co fs i g n a t u r ev e r i f i c a t i o nb a s e do n h m m d t wt w o 1 e v e la r c h i t e c t u r ea n dc a r r y o u to u rs i g n a t u r ev e r i f i c a t i o n e x p e r i m e n t su s i n gt r a j e c t o r y , v e l o c i t ya n d f o r c ei n f o r m a t i o na st h ef e a t u r ep o i n t s ,a n d t h e ng i v et h er e q u i r e m e n ti nt h eb e s tr e s u l t f o u r t h l y , w ea n a l s yt h ea l g o r i t h m sc e r t i f i c a t i o na n dc o m p u t a t i o nc o m p l e x i t y t h e nt h er e l a t e da n a l y s i sr e s u l tw a sg i v e n f i n a l l y , w ed e s i g n a l le l e c t r o n i cm e d i c a lr e p o r td e m ob a s e d0 1 1 o n 。l i n e h a n d w r i t i n gr e c o g n i t i o n , a n dm a k es o m er e s e a r c hw o r k o nt h ea p p l i c a t i o no f h a n d w r i t i n gr e c o g n i t i o ni ne m r a n d t h ef u t u r er e s e a r c hd i r e c t i o n sw e r ee x p e c t e di n t h e e n d k e yw o r d s :o n l i n es i g n a t u r ev e r i f i c a t i o n ,d ”h m m ,s t a t i s t i c sm e t h o d i i i 论文原创性和授权使用声明 本人声明所呈交的学位论文,是本人在导师指导下进行研究工 作所取得的成果。除已特别加以标注和致谢的地方外,论文中不包含 任何他人已经发表或撰写过的研究成果。与我一同工作的同志对本研 究所做的贡献均已在论文中作了明确的说明。 本人授权中国科学技术大学拥有学位论文的部分使用权,即: 学校有权按有关规定向国家有关部门或机构送交论文的复印件和电 子版,允许论文被查阅和借阅,可以将学位论文编入有关数据库进行 检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。 保密的学位论文在解密后也遵守此规定。 第一章绪论 第一章绪论 1 1 基于生物特征的身份认证 随着计算机网络技术、电子通讯技术的同益普及和发展,使得信息安全问 题的重要性越来越突出。如何准确鉴定个人身份、保护信息安全是亟需解决的 问题。现在关于个人隐私及身份信息的安全问题正日益引起社会群体的广泛关 注。 目前的身份认证方式主要包括传统的身份认证方式和基于生物特征的身份 认证方式。传统的身份认证方式主要是基于身份标示物来实现的,主要有身份 标示物和身份标示知识两种类型。身份标示物是个人的持有物,比如钥匙、证 件、i d 卡等:身份标示知识则是个人所掌握的信息,比如账号、卡号、密码等 等。这些传统的身份认证方法存在着明显的缺点:个人拥有的物品容易丢失、 破损或易被伪造,个人密码口令等容易遗忘或被破解。因此一旦这些信息被泄 露,就会给信息的持有者造成不可估量的损失。 与传统方式不同,所谓生物特征识别技术就是通过计算机与各种传感器和 生物统计学原理等高科技手段密切结合,利用人体固有的生理特性和行为特征, 来进行个人身份的鉴定。生理特征与生俱来,多为先天性的;行为特征则是习 惯使然,多为后天性的。将生理和行为特征统称为生物特征,它提供了一种较 传统方法更安全、可靠、便捷身份识别方式。常用于身份识别的生理特征有: 面容、虹膜、指纹、手形、掌纹、d n a 序列、耳廓、肤色等,行为特征:步态、 笔迹、签名、声音等。选择用来做为身份认证的生物特征应该具备以下条件: 1 ) 普遍性:即必须每个人都具备这种特征。 2 ) 唯一性g 即任何两个人的特征是不一样的。 3 ) 可测量性:即特征可测量。 4 ) 稳定性:即特征在一段时间内不改变。 由于生物特征识别具有不宜丢失、不易伪造、“随身携带”、无须记忆等 特点,生物特征识别技术正日益引起科研工作者以及信息安全部门的关注,一 部分基于生物特征识别的相关产品已被推广应用。目前生物特征识别技术的应 用领域主要包括:公安和安全部门、金融管理和服务、企业资源管理系统和办 公自动化系统等。随着技术的成熟和产品成本的不断降低,生物识别技术将越 来越多的走近人们的生活,为人们提供更加方便、安全可靠的应用。 第一章绪论 1 2 签名认证概述 古今中外以来,手写签名一直被作为一种身份识别的有效手段,尤其是在 政治或是经济活动中人们已经习惯于使用自己的签名来代表自己的身份行使权 利,比如在商务活动中各种合同、票据等都离不开手写签名。这使得签名认证 相比较其他认证方式更容易被大众所接受,作为身份认证有着更为广阔的前景。 1 2 1 手写签名的认证原理 每个人写的字都有自己的特征,自古以来我国就有根据笔迹进行身份鉴定 和案件调查的记载。手写签名是人脑通过视觉反馈和力反馈控制书写笔相对纸 张运动的结果。手写签名识别就是通过对签名特征的提取和分析,判定预测签 名与真实签名之间差异的程度。在1 9 世纪的欧洲形成了笔迹学,注重笔迹与人 体机能的控制关系,并用科学系统的方法分析和提取笔迹特征,它认为书写过 程受大脑神经( 心理) 和身体器官( 肌肉和关节) 控制,是一种长期训练形成 的条件反射,称为动力定型( m o t o rp r o g r a m ) 。因此笔迹特征反映了人的身体能 长期形成的书写习惯,具有个体性( i n d i v i d u a l i t y ) ,可以用于身份鉴另t j ( l o l i v i r a e ta 1 2 0 0 5 ) 。 1 2 2 签名认证的分类 手写签名认证主要有离线签名认证和在线签名认证两种形式( a k j a i ne t a l ,2 0 0 2 ) ,( r p l a m o n d o ne ta l ,1 9 8 9 ) 。离线签名主要是将事先写在纸上的签名通过摄 像机或是扫描仪输入到计算机中将其转化为签名的图像信息,在这种签名认证 中,手写签名的信息更多的是被作为图像来处理,而几乎没有任何书写的动态 信息。而对在线手写签名,签名的信息用一组时间序列来表示,当然这需要特 殊的输入设备例如d i g i t mt a b l e t 手写输入设备。d i g i t a lt a b l e t 能将签名的运行过 程用一组等采样的采样序列来表示。它记录下了签名的每一个采样点的x ,y 坐 标使得签名过程不仅具有时间序列性,而且还可以根据签名的这种时间性得到 许多其他签名的信息如方向信息、时间间隔信息、速度信息、加速度信息、笔 的倾角信息( i n a k a n i s h ie ta l ,2 0 0 3 ) 、签名的夹角信息、书写力信息等( e f a n ge t a l ,2 0 0 5 ) ,( h d c r a n ee ta l ,2 0 0 3 ) 等等。正是因为有了这么多丰富的签名动态信息, 在线签名进行签名认证相对于离线签名认证来说能够获得更好的认证结果,但 也并不能就此否定离线签名认证的意义,在当今还不能实现无纸化办公地时代, 离线签名认证仍然有着重要的研究价值。有的在线输入设备还可以采集到签名 的压力信息、三维书写力量信自, ( p f a n ge ta l ,2 0 0 5 ) ,( h d c r a n ee ta l ,2 0 0 3 ) 等。在 这样的情形下即使签名伪造者达到签名的字形上很高的逼真程度,然后对于这 2 第一章绪论 些不可见的动态信息来说也要模仿惟妙惟肖,那就相当困难了。离线手写签名 在进行处理的时候必须按照图像的背景对签名进行块的分割,而对于在线手写 签名来说利用签名的笔段特性以及起落笔等特性可以轻易地将签名进行分割。 在不久的将来随着无纸化办公推广应用,在线手写签名将是手写签名认证的主 要发展方向,本文的研究是属于在线手写签名的认证的范畴。 1 2 3 签名认证系统 在线签名的认证系统如图1 1 所示,一般包括签名注册和签名认证两个环 节。签名注册包括注册签名样本的采集、预处理、特征提取和签名特征的存储 等四步操作。在签名注册中,借用特殊的数据采集设备采集签名的字形信息, 书写压力信息,速度信息,加速度信息以及书写的倾角信息等。其次对签名的 进行预处理,包括去除噪声,字形的归一化,书写角度的矫正,断点插值等; 接着从预处理后的签名样本中提取个性化的书写特征生成签名模板;最后将签 名模板与签名对应的用户i d 存储到签名的模板的数据库中。 图l - 1 签名认证的系统结构 签名的认证环节包括五步操作,即预测签名数据信息的采集、数据的预处理、 签名特征提取、数据库中模板签名的分析、比较、结果判定。采集的预测签名经 过预处理后,系统将依据数据库中模板签名的特征提取规则以及签名认证算法对 预测签名进行认证,若计算得出的结果大于给定的判别阈值,系统将此预测签名 判定为伪造签名;否则,将预测签名判定为与该i d 签名的相匹配的真实签名( 方 平,2 0 0 6 ) 。 3 第一章绪论 虽然每个人的自身签名的特性具有某种稳定性,但是这种稳定性也是相对 的,因为签名过程中并不是一个非常精确的可以完全重复的过程。一个人的两个 签名尽管非常相似,但也是不可能完全一致的,当签名人的居住地、年龄、时间、 爱好、心理以及身体的生理状况发生变化时候,签名也往往会发生较大的波动, 因此注册签名库随着时间的推移也要不断的更新以适应签名用户书写风格的变 化( 张丽萍,2 0 0 6 ) 。 对于签名者的签名来说哪些部分是独特而又稳定的,如何抽取出这些特殊的 信息,这些信息在全局或是局部特征中又是如何反映出来的,这使得手写签名认 证系统的关键点与难点在于特征的选择和提取。 1 2 4 签名认证算法的- 陛能评价 签名认证属于典型两类分类问题,即对于一个预测签名来说它对应着签名 数据库中某个i d 的签名信息匹配只有两种结果:真实签名和伪造签名。伪造签 名根据与被伪造签名的相似程度又可以分为随机伪造签名、简单伪造签名和专 业伪造签名。随机伪造签名是指任意书写一个签名作为伪造签名;简单伪造签 名是在知道签名内容而不知道签名书写风格的情形下所书写的签名;专业伪造 签名是指在知道签名书写内容和签名的书写风格的情形下,尽可能的逼真的模 仿真实签名的签名。简单伪造签名和随机伪造签名与真实签名差别较大,很容 易去除,因此对一个签名认证系统效率的测试要以专业伪造签名认证效率为标 准。 在线签名认证算法的性能评价一般通过对签名数据库中已知签名的认证试 验进行,即利用算法对已知真实签名和伪造签名进行分析鉴别,将算法鉴别的 真伪结果与签名的实际情况进行比较,分析其正确分类能力。签名认证算法一 般根据模式的概率将签名特征空间q 分为两个子区域q 和q ,即: q 。u q ,= q ,q n q ,= ( 1 1 ) 其中为空集。当s q ,则判s g 类;当s q ,时,则判决s f 类。这 时可能会发生两种错误,一种是把是属于q 类的模式判为属于q ,发生这种错 误的原因是属于q 类的模式在特征空间中散布到q ,中,从而将其判定为q ,类, 即真实签名被判为伪造签名,称为误拒率( f r r ) ;另一种错误是把是属于q ,类 的模式判为属于q ,即伪造签名被判为真实签名,称为误纳率( f a r ) ,如图 1 2 所示,计算公式如式1 2 : 删:甓:监笔一枷。 2 , 第一章绪论 一旆f p ( s g ) :燮糍裂笋枷。 3 , 图1 2 错误分类的示意图图1 3f a r 与f r r 随着匹配条件的变化 其中p ( sg ) 表示真实签名的概率分布,p ( sf ) 表示伪造签名的概率分布。 若签名的鉴别能力一定的时候,f r r 与f a r 是相互制约的,即当放宽真实 签名的判定条件时,f r r 将下降,而f a r 将上升,更多的伪造签名将被接受。 反之,当真实签名的判定条件更加严格化时,被接受为真实签名的伪造签名的 数目减少,即f a r 降低,同时更多的真实签名将会被拒绝,即f r r 将上升。如 图1 3 所示,横坐标表示签名匹配条件的变化趋势,两条曲线分别表示f r r 和 f a r 随着匹配条件变化而发生变化;在匹配条件的变化中,f a r = f r r 时的点被 称为相等错误率点,即e e r ( e q u a le r r o rr a t e ) 点。由于f a r 和f r r 的相对变 化关系,很多签名认证研究中采用e e r 点的错误概率来分析算法的认证性能( 孟 明,2 0 0 5 ) 。 另一种常用的签名认证效率的分析曲线是r o c 曲线( r e c e i v eo p e r a t i n g c u r v e ) ,如图1 4 所示。r o c 曲线能够很好的反映两种错误率之间的相对变化 关系,该曲线以f a r 为横坐标,f r r 为纵坐标,曲线上的点表示在某一个给定 的匹配阈值下得到的误拒率和误纳率。当两个坐标采用相同的比例时,从原点 出发的4 5 0 直线与曲线相交的点即为e e r 点。虽然已经给出了认证系统的评价 指标,但在实际应用中,对签名认证系统的评价仍是一个复杂的问题。首先, 由于不可能获取足够的签名样本,尤其是伪造签名样本,因此难以对错误率进 行准确的估计;其次,伪造签名样本的类型也直接影响对系统性能的评价,使 用随机的伪造签名与使用通过长期模仿练习得到的熟练伪造签名作为测试得到 的性能指标会有很大的差别。而且大多数研究者都是用自己的建立的签名样本 数据库进行研究,缺乏一个标准的样本库,这也使得签名认证研究中对认证系 统性能比较缺乏一个统一标准( 方平,2 0 0 6 ) 。 第一章绪论 阳r 图1 4r o c 曲线示意图 1 3 在线签名研究的发展历程 1 3 1 在线签名认证研究的对象 最早的在线签名认证研究可以追溯到1 9 世纪6 0 年代( r p l a m o n d o ne ta l , 2 0 0 3 ) ,早期的签名认证研究受到签名采集设备的限制,一般通过自行研制的设 备采集签名信息进行签名认证研究,其中多数为各种笔设备,采集的签名信息 不外乎下面一种或几种:签名书写的字形信息、书写速度信息、加速度信息以 及书写力信息( r b a r o na n dr p l a m o n d o n ,1 9 8 9 ,h d c r a n ee ta l ,1 9 8 3 ) 等。随着w a c o m 手写板技术的成熟和应用,2 0 世纪9 0 年代后的签名认证研究绝大多数使用该设 备采集数据,采集到的信息有字形、压力和书写笔的倾角信息等。在使用这些 信息之前首先要对采集到的签名信息进行预处理工作。签名信息的预处理主要 是为后续的特征提取提供准确的签名数据,一般包括两个方面:一是针对采集 的签名数据进行各种去除噪声的操作,如高斯滤波、维纳滤波以及采用小波算 法等;二是保证签名特征的提取和比较具有一致的基准而进行的操作,包括字 形大小归一化处理、签名书写起笔点坐标归一化、以及签名数据点的重采样等。 1 3 2 有关在线签名认证研究的动态和方法的综述 签名特征的提取一般与所使用的签名认证算法密切相关,其中在签名认证 算法中使用最广泛的是( d y n a m i ct i m ew a r p i n g ) 算法( r m a r t e n sa n dl c l a e s e n ,1 9 9 8 ) , 该算法直接使用所采集的各种时间序列信息,或是按照时间顺序从其中提取一 定的点作为签名特征函数,由于签名序列中包含了各种动态签名特征,因此该 算法取得了较好的认证效果,但是由于存储的签名的序列信息,签名模板存储 空间要求较大。w i r t z ( 1 9 9 5 ) ,k a ih u a n g 和h o n gy a n ( 1 9 9 5 ) ,m a r t e n s 和 6 第一章绪论 c l a s e s e n ( 1 9 9 8 ) 等先后采用d t w 方法进行了签名认证研究。随着研究的深入, 很多研究人员对原有的d t w 算法提出了各种改进,并且得到了比标准的d t w 算法更好的签名鉴别结果。如陆玖,闻亮( 1 9 9 9 ) 提出了一种基于d t w 的波形 匹配算法。李胜春( 1 9 9 9 ) 等人认证算法采用的是加权d t w 算法,针对1 0 个 人写的1 0 0 多高签名数据,得到了9 2 的正确识别率。f e n g 和w a s h ( 2 0 0 3 ) 提出了一种新的基于特殊点的特征函数法( e p w ) ,与基本的d t w 算法使用所 有的签名点不同,e p w 算法首先提取签名中的特殊点,即波谷和波峰,然后利 用d t w 算法进行波谷对波谷和波峰对波峰的对齐运算,对匹配得到的点对之间 的笔画点进行线性伸缩,计算样本与模板之间的距离进行分类。 特征参数法通过从签名数据中提取个性化的特征参数进行签名认证研究, 特征参数法提取的特征参数包括书写时间,笔画数,书写力、书写速度,书写 加速度等的最大值,最小值,平均值,绝对值等;特征参数法由于存储的签名 模板为各种参数的分布,因此要求的存储空间较小,并且在签名中具有较低的 时间复杂度。由于不同签名书写人在不同参数特征方面一致性程度不同,因此 针对不同的签名书写人提取不同的特征参数集并根据一致性设置不同的判别权 重可以提高签名认证率。c r a n e 和o s t r e m 提取了4 2 个特征参数,得到的e e r 稍微大于1 ( h d c r a n ea n dj s o s t r e m ,1 9 8 3 ) 。l e e 等人提取了包括签名速 度,时间等4 2 个归一化的特征参数,算法采用基于大数定律设计的分类器,其 研究得到了2 5 的e e r ( l e ee ta l ,1 9 9 6 ) ,m am i n g m i n g ( 2 0 0 0 ) 等构建了基 于多个模型的在线签名自动认证系统,包括频域函数模型,形状相关的参数模 型和动态特征相关的参数模型,并基于参数模型的分类能力提出了个性化的特 征选择算法。刘俊和文颖等提出以手写汉字基本笔画为研究对象,抽取了其中 笔压力的变化特征,形成特征空间对签名进行认证( 刘俊等,2 0 0 3 ) 。合肥智 能所的孟明( 2 0 0 5 ) 、方平( 2 0 0 6 ) 在博士论文中采用签名时的三维力信息对 在线签名认证进行了研究。上述的工作对汉字签名认证进行了有益的探索,尽 管在理论和方法上没有实质性获得突破,但仍然具有比较重要的意义。 随着科学技术的发展,签名认证研究在签名的采集设备、预处理措施、特 征值提取和签名分段以及所使用的算法等方面呈现出多样化的趋势。模式识别 中涌现的各种新算法也迅速被应用到签名认证中,如遗传算法、小波分析、隐马 尔科夫模型等。y a n g ( 1 9 9 5 ) 等人提出采用局部改进的遗传算法来进行签名认 证,并通过简单的实验证明了算法的有效性。w i r o n t i u s ( 2 0 0 4 ) ,w s w i j e s o m a ( 2 0 0 0 ) 等人利用遗传算法对不同的人提取不同的个性化签名特征用于签名认 证。y o o n ( 2 0 0 2 ) 等人将字形信息x ,y 映射到极坐标,采用h m m 方法进行 签名认证,得到的e e r 为2 2 。m i t s u r u ( 2 0 0 3 ) 等人提取了签名中笔位置,压 第一章绪论 力以及笔倾角信息,采用基于贝叶斯的马尔科夫模型进行判别,得到了f r r 为 0 8 1 ,f a r 为o 8 7 。v e r g a r a ( 2 0 0 2 ) 等采用小波算法进行签名特征提取,得 到了3 0 的f r r 。 国内签名认证的研究相对较迟,开始于上个世纪9 0 年代。研究中主要采用 特征函数法中的动态规整算法,如华中理工大学金涌现( 1 9 9 9 ) ,清华大学的 李胜春( 1 9 9 9 ) 等,以及复旦大学的陆玖( 1 9 9 9 ) 等都给予签名点匹配或签名波形匹 配进行签名认证研究,中国电子系统工程研究所陈罡等采用数据场的思想进行 签名认证研究。哈尔滨工业大学的赵巍,张修勇,孟凡东,刘鹏等在硕士论文 中对在线签名认证做了相关的探索研究。合肥智能所的孟明( 2 0 0 5 ) 博士论文中采 用了h m m 模型进行力信息的在线签名认证研究( 魏铭旭,2 0 0 6 ) 。 1 3 3 与在线签名认证研究的有关的国际活动 随着个人数字处理的普及、掌上电脑的流行和微软平板电脑( t a b l e tp c ) 的发 售,手写输入技术越来越受到人们的关注,在线手写签名认证技术相应地也有 快速发展的趋势。2 0 0 4 年,香港科技大学举办了第一届国际签名认证竞赛 ( s v c 2 0 0 4 :f i r s ti n t e r n a t i o n a ls i g n a t u r ev e r i f i c a t i o nc o m p e t i t i o n ) 。举办方为参赛 者提供了两组训练和测试用的数据库。一组数据库只包含签名的坐标信息;另 一组签名除了签名的坐标信息外,还包含笔的方向角和压力信息,这两组数据 分别对应两个任务。全球9 个国家的研究团队参加了这次竞赛,参与第一个任 务的有1 5 支队伍,而参与任务二的有1 2 支队伍。对他们系统的评估进行两次, 一次在训练集上另一个是在测试集上。该测试集有6 0 个签名人,每个签名人的 样本包含了1 0 个真实签名和2 0 个熟练伪造签名。最后土耳其的团队在两个任 务中都取得了最低的等错误率,他们在两个任务上的测试结果分别是2 8 4 和 2 8 9 等错误率( 2 0 0 4 ) 。这次竞赛也是有史以来较为完整和公开测试结果的公共 在线签名认证的测试。相信随着s v c 的举办,用于科研的通用签名数据库也会 建立完善,而且也会推动在线手写签名认证研究的不断发展。 1 4 在线手写签名认证的步骤和方法 从在线手写签名认证的发展来看,各国研究人员运用了很多技术来解决在 线签名认证系统涉及的数据获取、预处理、特征提取与选择、匹配和性能改善 等方面的问题,只是侧重点不同。本小节将对几个方面所使用的方法进行一个 简单的总结。 8 第一章绪论 1 、数据获取:在线手写签名认证系统中数据设备主要有手写笔和手写板两种形 式,目i j 大多数的研究中都是采用商用手写板一般获取的签名信息包括笔迹 的坐标信息和书写的压力信息,有的能获取书写时的速度、加速度及三维书 写力等信息( e f a n ge ta l ,2 0 0 6 ,h s h i m i z ue t a l ,2 0 0 4 ,r b a r o na n d r p l a m o n d o n ,1 9 8 9 ,h d c r a n ea n dj s o s t r e m ,1 9 8 3 ) 。 在本论文中将采用中科院合肥物质科学研究院人机交互实验室开发出的具有 自主知识产权的f t a b l e t 手写签名采集设备来获取签名的信息。f t a b l e t 手写采 集设备能获取签名的7 维信息:三维力信息( f x ,f y , f z ) 和二维力矩信息( m x ,m y ) 以及签名轨迹的坐标信息x ,y 信息。根据采样时间的需要还可以获取到签名的 x ,y 方向的速度信息和加速度信息v ,v 们一:x a x a 毗) = 掣 讹) = 掣 圳= 掣 吖伊掣 ( 1 4 ) ( 1 5 ) 图1 5 是由f t a b l e t 手写获取的李白签名的三维力信息、x ,y 方向字形轨 迹信息,以及由x ,y 方向轨迹信息构成的签名图像。 李白签名的力信息示意图 图1 5f - t a b l e t 手写采集设备获取的李白签名的三维力信息图像 9 第一章绪论 1 加 印 t x 5 0 加 加 1 0 0 李白签名的字形信息示意图 0 5 0 1 0 0 1 5 0z m2 5 d3 0 0 t 图1 6f - t a b l e t 手写采集设备获取到的李白签名字形x ,y 轨迹图像 图1 7f - t a b l e t 手写采集设各获取到的李白签名图像 在分析已有的s v c 2 0 0 4 签名数据库结构的基础上,以s v c 2 0 0 4 数据库为参考 模板,构建了基于f t a b l e t 手写板的签名数据库,用于认证方法的实验和性能评 估。 f - t a b l e t 签名库设计采集内容分为两部分,即真实签名和训练签名,分别 对应书写人的真实签名和临时训练书写的姓名。我们选择了实验室3 4 个签名人参 与实验,包括8 名女性,年龄位于2 5 5 5 岁之间,每个签名人提供3 0 个真实签名, 共1 0 2 0 个真实签名,每个签名人对应采集2 0 熟练伪造签名,共6 8 0 个伪造签名。 2 、预处理:为了降低同一个人不同时刻签名的不稳定性因素,有效地减小同 类签名数据之间的差异,一般都要对原始签名进行一定预处理提高签名认证的 1 0 第一章绪论 准确性。预处理包括签名信号的放大、滤波、重采样、归一化、签名起始点和 结束点的检测、抬笔和落笔的检测、签名的分割等。 从输入设备采集的原始数据通常含有少量的噪声。这种噪声是设备自身的 噪声( 感应装置通常由模拟电路构成) 和数字化误差混合而成的,它们使得笔 迹出现快速抖动。通常采用多点平均、高斯滤波及小波算法等方法滤除这些噪 声减少他们对签名数据的影响( a k j a i na n dd g f r i e d e r i k e ,2 0 0 2 ) 。 预处理的另一项重要的步骤就是签名的归一化。在手写签名数据采集时, 签名字形的大小、位置和方向都会发生较大的变化,需要进行归一化处理。对 于签名的方向归一化,一般利用估计签名基线的方向来矫正笔迹倾斜( s j a e g e r e t a l ,2 0 0 1 ) ,这种方法对西方字母签名比较有效。而对中文签名合肥智能所的魏 铭旭等( 2 0 0 6 ) 给出了一种基于力信息的汉字字形矫正法。对于大小和位置, 通常是进行一些线性变换实现归一化( i n a k a n i s h ie ta l ,2 0 0 3 ) 。 预处理过程中还会涉及到签名数据的重采样、将样本的采样点进行等距离 重采样可以规范采样点数目,并压缩抬笔和落笔时的冗余采样点,但重采样会 丢失签名的部分信息。在基于样本识别单元的签名认证中,预处理阶段还要根 据所用基元的不同实行对签名的不同分割处理。认证方法不同采用预处理的步 骤也可以能不同。 针对f t a b l e t 手写采集设备采集到签名数据信息也进行了相关的预处理工 作保证预测签名采集信息具有很好的平滑性, 3 、特征提取和选择: 特征的提取与选择是签名认证过程中关键的步骤,直接影响到分类器的设 计和系统的性能。在线采集的签名数据中包含丰富的个人特征信息,人们从中 提取的具体特征在内容和形式都有很多类型。从描述形式上签名的特征可分为 两类:特征函数法和特征参数法。 特征函数法是将包含所有签名采样或经过计算获得的信号的时间序列堪称 重要的特征信息,从而认证算法的主要内容是被测签名和模板进行相应特征时 间序列的点对点的匹配比较。其难点在于如何解决不同时间序列的匹配问题。 常用的特征函数法有: 1 ) 位置( 坐标信息) ( 工( f ) ,y ( f ) ) :采集获得的原始横坐标与纵坐标的离散时 间序列,这也是大部分采用特征函数法的系统都会使用的信息。 压力信息以f ) :书写过程中笔尖对手写板的压力,通过特殊的压力传感器来 获取。配合其他特征函数,可以提高认证系统的性能。目前,随着手写板采样 技术的发展越来越多的系统都将书写时的压力作为一个重要的特征。 第一章绪论 2 ) 速度y ( f ) ,y ,( f ) ,y ,( f ) :它是表征签名动态信息的重要因素。它可以通过计 算伍( f ) ,y ( f ) ) 的一阶导数获得,也可以使用特殊设备获取。 3 ) 加速度口( f ) ,a ,( f ) ,a ,( f ) :根据书写的抛物线理论,加速度是重要的函数, 它和运笔时的速度也是伪造者最难以模仿的特征。它可以通过计算 ( f ) ,y ( f ) ) 的 二阶导数或y ( f ) ,y ,( ) ,y ,( f ) 的一阶导数获得,也可以使用特殊设备获取。 4 ) 力信息( f ) ,f a t ) ,l ( t ) :书写时的三维力信息也是在线签名的很重要的特 征,比较难以模仿。 特征函数法由于保留了所有采样点的信息,使任何局部或细节上的比较成为 可能。由于它含有很多丰富的个人资料需要的计算量和存储空间也比较大,但是 随着计算机硬件技术的发展特征函数法将会得到更多的研究与应用。特征函数法 存储的模板为全部签名信息或按一定规则提取的时间序列信息,信息比较充分, 其签名的鉴别率也比较高( 李胜春等,1 9 9 9 ,b w i r t z ,1 9 9 5 ) 。 特征参数法并不使用整个时间序列,而是由签名采样点的信号序列计算一系 夕0 签名的特征参数,形成特征向量,然后对相应的特征值进行比较。特征参数 法存储模板主要是签名的各种特征参数值,因此所需要存储空间较小,且 算法时间复杂度相对较低,其关键之处在于如何选择能够准确反映书写个 性特征的参数集。特征参数通常有全局特征和局部特征。 全局特征是以整个签名作为特征提取单元从中得到的特征参数。最常用的签 名原始数据的统计特征,例如签名持续时间、抬笔时间和书写时间、笔画数、抬 笔和落笔点数、长宽比、签名速度( 加速度) 平均值及方差、速度( 加速度) 极 大极小值、速度( 加速度) 的过零次数、平均压力等。全局特征一般具有较强的 抗干扰能力、匹配分类方便、但计算笔迹复杂、细节区分能力弱。 局部特征的提取单元有笔画( s t r o k e ) 、笔段( s e g m e n t ) 、特征点和采样点 等几个层次。其中笔画和笔段需要在特征提取前进行分割。常用的分段方法有根 据抬笔和落笔状态分段( q t o n ge ta l ,2 0 0 3 ) ,按固定曲线强度单元分段 ( v s n a l w a ,1 9 9 5 ) 、根据笔迹曲线曲率分段( j j b r a u l te ta l ,1 9 8 3 ) 、根据书写速 度的极值点分段( d s a k a m o t oe ta l ,2 0 0 1 ) 、根据小波变换过零点分度等( 蔡洪滨 等,2 0 0 3 ) ,然后从中提取一些统计特征,比如各段持续时间、曲线长度、起始 方向、各分段相对位置以及速度、加速度的均值、标准差、极大极小值等。以笔 画、笔段为特征提取单元,则比较容易受分段结果的影响。特征点则是笔画中的 起止点、转折点或利用小波变换等方法提取的采样点作为特征序列进行签名认 证,方法简单但数据量交大。 从签名数据中能够提取很多种类的特征来构成特征向量,a m d a r w i s h 和 g a a u d a ( 1 9 9 4 ) 发表的论文中就给出了2 0 0 种特征。因此如何选择有效特征子 第一章绪论 集对于在线签名认证也是一个重要的问题。利用f i s h e 线性可分准则来分别评价 每个特征的分类能力并加以选择也是一种简便可行的方法( l l l e e ,1 9 9 2 ) ,但 是好的单个特征组合起并不是意味着好的的特征自己。l e i 等人( 2 0 0 5 ) 贝j 从一 致性上对2 2 种常用的参数特征和函数特进行了评价,作为特征选择的依据,还 有一些其他方法如遗传算法( w s w i j e s o m ae ta l ,2 0 0 0 ) 等用于特征选择。但目 前还没有一个标准的特征计算和评价方法来进行特征的选择。 4 、 匹配: 一般来说匹配是通过计算两个签名之间的相似性( 或相异性) 来估计参数签 名和测试样本的匹配程度,从而在决策阶段将得到的匹配值与预先给定的阈值 进行比较来决定测试签名是否被接受或拒绝。因此对签名的效果并不是很好 的。动态时间规整( d t w ) 方法是一种更完善的方法,利用动态规划算法可以获 得参考样本和待鉴别签名之间的非线性匹配。它首先是用在语音识别领域,然 后由s a t o 和k o g u r e ( 1 9 8 2 ) 引入到签名认证中并得到了广泛的应用。另一种比 较常用的解决特征序列对其问题的方法是隐马尔科夫模型( h m m ) ,它是一个双 重的随机过程,通过计算方法描述特征向量序列的转换和分布,根据待认证签 名的特征序列对给定h m m 的输出概率来判定签名的真伪( l y a n ga n d b k w i d j a j a ,1 9 9 5 ) 。还有一些其他的方法如区域相关算法( r e 百o n a lc o r r e l a t i o n a l g o r i t h m ) ( n m h e r b s te ta l ,19 8 2 ) 、树匹配算法( t r e em a t c h i n g ) ( m p a r i z e a ua n d r p l a m o n d o n ,1 9 9 0 ) 等,但一般很少采用。对于特征参数法而言,在特征选择之 后就可以利用常规识别方法,如线性判别函数( l l l e e ,1 9 9 2 ) 、距离判别函数 ( h d c r a n ea n dj s o s t r e a m ,1 9 8 2 ) 或神经网络( c q u e k ,a n dr w z h o u ,2 0 0 2 ) 的方法来设计分类器。 1 5 论文研究的意义及主要内容 1 5 1 论文研

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论