(计算机应用技术专业论文)基于离线签名识别的身份认证技术研究.pdf_第1页
(计算机应用技术专业论文)基于离线签名识别的身份认证技术研究.pdf_第2页
(计算机应用技术专业论文)基于离线签名识别的身份认证技术研究.pdf_第3页
(计算机应用技术专业论文)基于离线签名识别的身份认证技术研究.pdf_第4页
(计算机应用技术专业论文)基于离线签名识别的身份认证技术研究.pdf_第5页
已阅读5页,还剩50页未读 继续免费阅读

(计算机应用技术专业论文)基于离线签名识别的身份认证技术研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 离线手写签名与在我国广泛使用的印章一样,作为一种公认的身份标志方式 已经有很长的历史了。这种身份标志至今仍在社会生活中扮演着重要的角色,在 商务、司法、金融、保险等众多领域中都有着广泛的应用。因此对离线手写签名 自动鉴别技术的研究具有很大的实用价值。 本论文首先回顾了传统的个人身份认证技术和基于生物特征识别的身份认证 技术,然后针对离线签名的计算机自动鉴别问题进行了有益的探索和研究,所完 成的工作主要包括以下几个方面: 1 ) 分析了离线签名鉴别的主要问题和难点,并对已有的离线签名鉴别方法从签 名表示和分类判决机制两个方面加以分类,总结其优点、缺点和性能。在此 基础上将我们的工作目标定位在简单伪造签名的鉴别上。 2 ) 在对隐马尔可夫模型应用技术大量调研的基础上,通过扩展隐马尔可夫模型 的结构和算法,解决了将其应用到离线签名鉴别中的问题。我们使用一种简 化的、处理多维离散观察符号的方法,为在一个模型中结合不同性质的签名 特征提供了简单的解决方案。通过动态训练技术解决了认证系统识别率随时 问推移而下降的问题,使认证系统具有良好的学习能力与自适应性。 3 ) 研究了适合于隐马尔可夫模型应用的离线签名特征提取,尤其是中文签名的 特征提取,并通过实验评估了几种签名的分类能力。 4 ) 完成了一个基于二维隐马尔可夫模型的中文离线签名认证实验系统。通过对 该系统的实验评估验证了本文的思想。该系统也可以作为下一步研究工作的 实验平台。 关键词:离线签名鉴别,隐马尔可夫模型 a b s h - a c t a b s t r a c t o f f - l i n es i g n a t u r eh a sb e e nu s e da sa na c c e p t e di n d i v i d u a li d e n t i t yf o rav e r yl o n g t i m e i nt h em o d e ms o c i e t yo f f - l i n e s i g n a t u r e s t i l l p l a y s a n i m p o r t a n t r o l ei n j u d i c a t u r e ,f i n a n c e ,i n s u r a n c e ,c o m m e r c i a la c t i v i t i e s ,a n dm a n y o t h e rf i e l d s t h i st h e s i sd e s c r i b e so u rs t u d yo fo f f - l i n e s i g n a t u r ev e r i f i c a t i o n t h er e s e a r c h w o r ki n c l u d e st h ef o l l o w i n ga s p e c t s : 1 ) w ef i r s tr e v i e wt h ee v o l u t i o no fi n d i v i d u a l i d e n t i t yv e r i f i c a t i o nt e c h n o l o g ya n d s u m m a r i z et h ep r o g r e s so far i s i n gt e c h n o l o g y , w h i c hi d e n t i f i e sh u m a ni d e n t i t y t h r o u g hb i o m e t r i c s t h e nw e a n a l y z et h em a j o rp r o b l e m sa n dd i f f i c u l t i e si nt h e i m p l e m e n t a t i o no f a no f f - l i n es i g n a t u r ev e r i f i c a t i o ns y s t e ma n d g r o u p t h ee x i s t e d t h e o r e t i c a la p p r o a c h e sf r o mt w oa s p e c t s ,d e s c r i b i n gt h e i rs t r e n g t h s ,w e a k n e s s e s , a n dr e l a t i v ep e r f o r m a n c e b a s e do nt h e s ew o r k , w ed e t e r m i n et of o c u so u r s t u d y o nt h ev e r i f i c a t i o no f s i m p l ef o r g e r i e s 2 ) a p p l yt h eh i d d e nm a r k o vm o d e l ( h m m ) t o t h ep r o b l e mo fo f f - l i n es i g n a t u r e v e r i f i c a t i o n t h r o u g has i m p l i f i e d m e t h o do fd e a l i n gw i t hm u l t i p l ed i m e n s i o n o b s e r v i n gs y m b o l s t h ed i s c r e t eh 删c a na c c e p tm o r e t h a no n ek i n do ff e a t u r e s a to n et i m e c o n c e r n i n gt h ed e c l i n i n gr e c o g n i t i o nr a t ea st i m eg o e sb y , w e u s ea m e t h o df r o ms p e e c hr e c o g n i t i o nt oe n h a n c et h es e l f - a d a p t a b i l i t yo ft h eh m m s y s t e m 3 ) t o p r o v i d ea p p r o p r i a t ef e a t u r e v e c t o r st oh m m ,w e s t u d yt h ef e a t u r ee x t r a c t i o no f o f f - l i n e s i g n a t u r e s ,e s p e c i a l l y c h i n e s e s i g n a t u r e s , a n d t e s tt h ec l a s s i f i c a t i o n a b i l i t i e so f s e v e r a lk i n d so f f e a t u r e s 4 ) d e v e l o p a2 - d i m e n s i o nh m i v lb a s e dc h i n e s eo f f - l i n e s i g n a t u r e v e r i f i c a t i o n s y s t e m a n dp r o v et h ep e r f o r m a n c eo fo u rm e t h o dt h r o u g he x p e r i m e n t st h e s y s t e mc a n a l s ob eu s e da sa i le x p e r i m e n t a l p l a t f o r mi nf u t u r es t u d i e s k e y w o r d s :o f f - l i n es i g n a t u r ev e r i f i c a t i o n ,h i d d e nm a r k o v m o d e l i i 第一章绪论 第一章绪论 生活中我们常会遇到这样的情况:出入某个单位、去银行取款、登陆计算机 系统或者进行网上交易时,都被要求证明自己的身份。这就是身份鉴别。 身份鉴别根据目标的不同分两种类型:身份鉴定和身份识别。所谓身份鉴定, 就是要确认用户声称的身份与其真实身份是否一致,回答“他是某人吗”的问题。 而身份识别,则是要从众多候选中指出用户的真实身份,回答“他是谁”的问题。 不过习惯上人们并不严格区分二者。本文所讨论的问题部属于身份鉴定的范畴。 在现代社会中,随着计算机和网络技术的高速发展,信息安全越来越显示出 前所未有的重要性。身份鉴定则是保证系统安全的必要前提。在金融、国家安全、 司法、电子商务、电子政务等应用领域,都需要进行准确的身份鉴定。比如某人 是否有权进入安全系统、是否有权进行特定交易、是否是合法居民,为部门的计 算机网络设置口令和密钥进行保护,等等。 传统的个人身份鉴定是通过把身份认证问题转化为鉴定标识个人身份的事物 来实现的。所使用的事物主要有两类:一种是信物,如证件、印章;另一种是知 识,如口令、密码等。这类身份鉴定方式最严重的闯题是“认物不认人”:证件、 印章等一旦被盗取,不法分子就可以利用这些信物为所欲为;同样的,口令和密 码也可以破解、被坏人利用。 通过鉴定标识性事物来鉴定个人身份这种方法除不安全之外,还给我们的生 活带来了诸多不便:证件、印章等物品不易携带、会丢失、使用过多或者使用不 当会造成损坏:使用口令和密码则使我们在生活中需要记忆越来越多的东西,比 如信用卡号、银行帐号、身份证号、网络登录号,等等,我们可能会被这些东西 搅得心烦意乱。因此传统的个人身份鉴定技术正变得越来越不适应现代科技的发 展和社会的进步【l ,2 】。 生物特征识别技术( b i o m e t r i c s ) 的兴起为安全、高效、简单的身份鉴定提供了 新的途径。所谓生物特征识别是指通过计算机利用人体所固有的生理特征或行为 特征进行个人身份认证【l ,2 ,3 】。生理特征和行为特征统称为生物特征。人的生 理特征多是与生俱来、先天性的,如指纹、基因、眼部特征( 视网膜、虹膜) 等; 行为特征则是习惯使然,多为后天的,如说话声音、步态、笔迹等等。 第一章绪论 人们可能遗忘或丢失他们的卡片或密码,却不可能遗忘或丢失自己的生物特 征。而且生物特征可以“随身携带”,随时随地使用。最重要的是,生物特征具 有良好的防伪性能,既不能盗取,也不易模仿。正是由于具有这些优点,基于生 物特征识别的个人身份鉴定作为一种安全、可靠、有效的新代身份鉴定技术, 正越来越受到人们的重视,并逐步进入社会生活的各个领域。 基于离线手写签名的身份识别也属于生物特征识别的范畴,不同的是,离线 手写签名作为一种公认的身份标志已经有很长的历史了,就像在我国广泛使用的 印章一样。这种身份鉴别方式如今在社会生活中仍然扮演着重要的角色,比如在 商务、司法、金融、保险等众多领域中都大量使用到离线手写签名。在今后一段 时间内,离线手写签名鉴别仍然会作为一种重要的身份鉴别手段在这些领域继续 使用。因此对离线手写签名自动鉴别技术的研究具有很大的实用价值。本论文就 是针对离线签名的计算机自动鉴别问题进行了有益的探索和研究。 这一章我们首先介绍生物特征识别技术,然后讨论离线签名鉴别的基本问题 和技术难点,再简要分绍和分车厅已有的典型璃线签名鉴别算法,最后是本文所傲 的工作和文章的组织结构。 i i 生物特征识别的现状和发展趋势 曩摹。举 图ll 些典型的生物特征 0 。 对于其他的i - i m m ,可能有= 0 ( 对于一对或多对i 。j ) 。 4 ) 状态j 的观察概率分布口= 6 ,种) ) ,表示状态j 输出相应观察值的概率,其中 b j ( ) 2 p v k a t t l q t = s j ,1 j s n l s k s m 。 第二章使用隐马尔可夫模型进行签名鉴别的理论基础 5 ) 初始化状态分布”f = p q l = 马) ,1 i n 。 这样一个h m m 就可以记为 旯= ( ,m ,石,a ,口)( 2 4 ) 或简写为 五= ( 石,a ,曰)( 2 - 5 ) 上面所述i - i m m 的三个关键元素实际可以分成两部分,其一为m a r k o v 链, 由丌、a 描述,另部分是一个随机过程,由b 描述【3 3 】。根据b 的不同,h m m 可分为离散、连续、半连续三种类型。 离散 n 棚m ( d i s c r e t eh m m ,o r n v t m ) ,其观察输出概率是基于一套码书的离 散概率分布:连续h m m ( c o n t i n u o u sd e n s i t yh v l i v i ,c d h m m ) 的观察输出概率是 连续概率密度函数( 一般是高斯混合密度函数) :半连续h m m ( s e m ic o n t i n u o u s h m m ,s c h m m ) 则是d h m m 和c d h m m 的折中。与d i - i m m 相似,其输出为一 套码书,但每个码字均为一个连续概率密度分布函数,这一点又与c d h m m 相 近。 2 12 3h 噬的三大问题 1 ) 给定观察序列0 = 0 1 0 ,d t 和模型 = 轵,b ,口) ,计算e ( o l x ) 。这是评估问题, 也就是给定模型和输出观察序列,如何计算从模型生成观察序列的概率。也 可以把它看作是评估一个模型和给定观察输出序列的匹配程度。后一种观点 是非常有用的。可以用来在一系列候选对象中选取最佳的匹配。 2 ) 给定观察序列0 = 0 1 0 ”西和模型丑= a ,8 ,月) ,求在某种有意义的情况下最优 的相关状态序列q = g l q 2 q t 。这个问题可以理解为对输出观察的最佳“解 释”,它试图揭示模型的隐藏部分,比如说查找“正确”的状态序列。必须弄 清楚的就是几乎所有的退化模型都没有所谓“正确”的状态序列。所以在应 用中,通常都使用一个优化策略来最大可能的解决这个问题。关于这个问题 的应用有研究模型的结构,查找连续语音识别中最优的状态序列,或者计算 单独状态的平均统计数据等等。 1 7 第二章使用隐马尔可夫模型进行签名鉴剐的理论基础 3 ) 如何调整模型参数2 = 似,b ,z ) ,使得p ( o i ) 最大? 这是模型的训练问题,它 试图优化模型的参数来最佳的描述一个给定的观察序列是如何得来的。 在下面一节中我们将针对签名鉴别应用讨论涉及到的问题及其在数学上的 解决方案。以下介绍都是针对离散型h m m 。 2 1 3 与h m m 签名认证系统相关的两个问题的求解算法 所有的身份自动鉴定系统都有大体相同的工作原理和工作过程: 1 ) 采集样本,如指纹、签名、人脸图像、声音的数字化描述等: 2 ) 进行特征提取,根据样本所具有的独特和唯一的特征,用一种算法为其 建模,这可以是一个特征代码,也可以是一系列模型参数,所得的特征 代码或模型参数被存入数据库: 3 ) 当需要鉴定某人的身份时。再用某种特征匹配算法将存入数据库的此人 的特征代码或模型与被识别人的特征相匹配,从而鉴定其身份。 同样的,基于h m m 的认证系统也应包括训练和鉴别两部分。我们使用h m m 进行签名认证时,有两个关键问题需要解决:训练问题和打分阿题。给定观察序 列集5 ,需要寻找一组最优模型参数,使得模型对观察序列的输出概率p ( 6ia ) 最大,这就是训练需要解决的问题。打分问题就是在给定模型参数五的情况下, 计算模型输出观察序列d 的概率。 下面我们首先介绍打分算法,然后介绍训练算法b a u mw e l c h 算法。 2 1 3 1 打分算法 打分问题就是在给定模型参数a 的情况下,计算模型输出观察序列d 的概 率。可以使用前向算法或后向算法。 如果希望计算给定模型参数情况下输出序列o = 0 。0 :五的出现概率,比如 说p ( ol 五) ,比较好的方法就是直接列举所有的概率,递推计算出最终的概率。 观察如下状态序列q 1 8 塑三童堡璺堕呈堑旦查堡型壅堑篷墨鉴竺! 塑些笙兰些一一 g = q l q 2 - q t ( 2 6 ) 其中,吁1 表示初始状态。在状态序列( 2 6 ) 出现的情况下出现观察序列o 的概率 可以如下计算 p ( o 旧 ) = 兀| lj p 暇j q t , 五) ( 2 7 一1 ) f = i 这里假设观察符号之间是统计独立的,进一步得到下式 p ( o j q ,= b q , ( d 】) ,( 0 :) b 。( d r ) ( 2 - 7 对于状态序列q 的出现概率,计算如下 p ( q l 五) = 万k 口缸铂口缸叮| a 秆一,朴 ( 2 - 8 ) 这样。和q 的联合概率,也就是。和q 同时出现的概率可以由上面两个公式简 单推出 p ( o f a 五) = p ( o f q 丑) j d ( 9 f 工) ( 2 - 9 ) 由此,当绘定模型后,观察序歹i j0 出现鲍概率裁是针对所有可能的状态序列的 这样的联合概率的和: p ( 。 舢 = 尸( d i q 2 ) p ( ql五)(2-10) “f q = 6 。( d 1 ) 。k ( q ) 口。b ,( q ) 吼,玑一秆 最终可以得到公式( 2 1 0 ) ,这个就是需要韵结果a 必须考虑的一个问题就是复杂度的问题,从计算过程来看,需要( 2 t - 1 ) n 7 次 乘法和n t 1 次加法这是很难应用的,比如说对于n = 5 ,t = 1 0 0 ,就需要1 0 ” 次计算。 这里有一种更加有效的方法,就是前后向( f o r w a r d b a c k w a r d ) 算法,它的 复杂度可以是2 丁次。 首先介绍前向算法。定义前向变量如下, “f ( f ) ;p ( 0 1 0 2 0 t ,q t = s i1 4 ) ( 2 - 1 1 ) 也就是给定模型的情况下,到时间t 时输出观察序列为q o :。,_ d 。,并且时刻t 的 1 9 第二章使用隐马尔可夫模型进行签名鉴别的理论基础 状态是置的概率。可以通过下面公式递推计算: 1 ) 初始化: 口l ( i ) = l r j b e ( d 】) ,1 i 2 ) 递推: “( ) = 【芝:口,( 0 a f 】6 ,( q + 1 ) ,1 ,t - l ,1 ,s n i = l 3 ) 终止: p ( o i 五) = 铆o ) j 2 i 其中递推是整个算法的核j 0 。 掌t 钕 毒_ , 蕾“沁 t 辱l 口i t ; 删 馘r 婚吼t 图2 2 ( a ) 前向变量计算;( b ) 使用网格法计算前向变量 第一步表示初始化时间1 时状态s i 和观察o l 的联合概率。 ( 2 - 1 2 ) f 2 - 1 3 ) f 2 - 1 4 ) 第二步则从t 时刻的前向变量推导t + 1 时刻的前向变量,前向变量d 。表示 2 0 第二章使用隐马尔可夫模型进行签名鉴别的理论基础 时间t 时,状态是s i 、观察是0 1 o t 的概率,g i l o f , ( i ) a i i 则表示了t + 1 时刻状态 是s j 、t 时刻状态是s i 的所有概率。这个从图22 ( a ) 可以看出。把所有的这样的 乘积加起来,就是时刻t + 】时状态是s j 的概率,再乘上s j 时输出o t + t 的概率, 就是时刻t + 1 的前向变量值。 最后,第三步得到计算最终结果的公式,结果显而易见,对于n = 5 ,t - - - - - 1 0 0 的同样规模问题,只需要3 0 0 0 多次计算就行了,节省了6 9 个数量级。图2 2 ( b ) 使用网格结构解释了为什么前向算法会如此有效。因为不论观察序列有多长,问 题都简单隐藏在了n 个状态节点中。 后向算法和前向算法性质上是样的,只是递推方向不同。定义后向变量: 反( f ) = p ( 0 i + 1 0 。,- 0 riq ,= s ,且) ( 2 - t 5 ) 也就是给定模型参数,当时刻t 的状态是置的时候,从时刻t + 1 到序列结束的 输出观察序列为0 f + ,仍。五的概率,同样,可以使用递推的方法计算属o ) ,如 下: 1 ) 初始化: 屏o ) = t , 1 j s n( 2 - 1 6 ) 2 ) 递推: 3 ) 终止: n 厉= 屯( o f + ,) 屈+ 。( _ ,) f 1 t = t 一1 ,t 一2 ,1 ( 2 1 7 ) 1 f e ( o i 五) = 届) 2 1 3 2 模型训练算法 ( 2 - 1 8 ) 给定观察序列o ,需要寻找一组最优模型参数,使得模型对观察序列的输出 概率p ( d 1 最大,这就是训练需要解决的问题。 模型训练是最困难的个问题,实际上,根本没有解决这个问题的最优方法。 2 1 第二章使用隐马尔可夫模型进行签名鉴别的理论基础 我们只能调整参数使得尸( 0 , ) 局部最优,这里可以使用一些循环的方法,比如 说b a u m w e l c h 方法。 首先定义给定训练序列d 和模型a 时,t 时刻m a r k o v 链处于状态i ,t + l 时刻 出于状态j 的概率 靠( i ,) = p ( q t = s ,g = s ,1 0 , )( 2 - 1 9 ) 可以推导出 鼻( ,) ;型毪掣(220)0 残i a ) 、 口r ( o a 口b ,( o t + 1 ) 层十1 ( ) 2 百百一 a ,( i ) 。f 6 ,( d 。) 岛+ l ( ,) 在上式中,分母其实就是p ( o l ) 。 那么t 时刻m a r k o v 链处于状态i 的概率为 磊o ) = 芝:毒o ,) = q ( f ) 肛o ) p ( o 且) j 。】 这样从状态i 转移出去的次数的期望就是 t - 】 鼻o ) r = l 而从状态i 转移到状态j 的次数的期望值就是 ( 2 2 1 ) r 2 2 2 ) ( 2 - 2 3 ) 这样使用上面的公式就可以得到一个方法来反复评估参数,一组合理的对参 最= 时刻1 时系统处在状态s ,的频率( 次数) = 苜( f )( 2 2 4 1 ) 一从状态s ,转移到s ,的次数萎参以 ,) 5 秀磊而辜裕i 袤丢丽蕊。专:广( 2 - 2 4 - 2 ) ” 系统处于状态态s 的次数 曼苜( ,) u 。z j - 力,u,t n 日 笙三童堡旦堕兰笙里壅堡型壅堡箜墨鳖型塑堡笙茎型 一一 驰,= 堕糍铲 鲫,- ,) 一旦0 i = n 量o ) 扛l ( 2 - 2 4 3 ) 可以看出,上面的公式就是统计意义上用频率近似概率的方法。 如果定义当前h m m 为a = 口,b ,万) 。然后使用它得到新的参数a = ( 4 ,b ,万) 。 根据b a u m 和他的伙伴们研究得到的结论: 1 ) 两者对于o 有着同样的适应程度, 2 ) 五比五给适合0 ,揣i p ( o i - ) p ( o i 五) ,也就是说已经找到了比原来模 型更加近似的新模型, 那么反复进行上面的过程,逐步改进模型参数,直到p ( dj 五) 收敛,即不再明显 增大,此时的五就是i - 1 m l v l 的最大相似性评估。 2 2h m m 算法在实际应用时的问题 2 2 1 模型的选择 有了前面的训练和打分算法,实现中剩下的任务就是选择合适的m a r k o v 链 形状、模型状态数和观察符号。 几种典型的m a r k o v 链形状如图2 3 所示。图2 3 ( a ) 所示m a r k o v 链从任意状 态出发,在下一时刻可以到达其它任何状态,对应的a 矩阵没有零值。图2 3 ( b 1 则不同,a 矩阵含有零元素。2 3 ( c ) 和2 3 ( d ) 是两种特殊形式的m a r k o v 链,其特 点为:必定从状态1 出发,沿状态序号增加的方向转移,最终停在状态4 。这种 m a r k o v 链构成的m f m 一般称为左一右模型( 1 e f t - t o r i g h tm o d e l s ) 。很明显,自 左到右的模型很适合描述那些随着时间变化的信号,比如说语音。 由于签名是自左向右书写的,因此我们也可以把它看成一种类似语音的时变 信号。这样在建立实际h m v l 签名认证系统时就应该选择左一右型h m v l 。在实 际的语音处理应用中左右模型也被广泛采用,尤其是在孤立词识别中取得了较 好的效果。 第二章使用隐马尔可夫模型进行签名鉴别的理论基础 关于模型状态数的选择、观察符号选择( 离散的还是连续的,单个的还是多 个混合的,观察参数的选取) 这些工作,并没有一个简单的、理论上的正确的方 法。实际应用中只能根据具体问题做出决定。 ,一、厂:、 ) 1 23吐 c d ) 图2 3 几种典型的m a r k o v 链 ( a ) a 矩阵没有零值的( 全连接) m a r k o v 链 ( b ) a 矩阵有零值的m a r k o v 链 ( c ) 、( d ) 左一右形式的m a r k o v 链 2 2 2 使用多个签名样本训练模型 为了建立尽量精确的模型来描述某个签名者的签名,在实际应用中我们需要 采集多个真实样本,从中获得多个观察值序列,用这多个观察值序列训练h m m 。 因为模型状态的瞬时性质决定了对于任意状态只能出现很少数目的观察( 直到转 移到一个后继状态) ,为了得到足够多的数据来进行可靠的评估,必须使用多观 察序列。 当用l 个观察值序列训练h m m 时,要对b a u m w e l c h 算法的重估公式乜2 4 ) 2 4 第二章使用隐马尔可夫模型进行签名鉴别的理论基础 加以修正。设l 个观察值序列为d “,= 1 , a ,l ,其中0 ”= d ”,a ,0 川t 假定各 个观察值序列独立,此时 e ( o ;0 = 1 7 p ( o 。4 )r 2 - 2 5 ) 由于重估公式是以不同事件的频率为基础的,因此l 个训练序列的重估公式相 应修正为 巧= 口m ) 屏”( i ) p ( o 。枷i n ( 2 2 6 1 ) f = 】 ln 一1 一口j ”( o a f q ( o _ ) 联 ( - ,) j p ( d a ) 嘞= 旦上1 了一,1 f ,_ ,n ( 2 2 6 2 ) 口( f ) 。( i ) p ( o “4 ) 1 = 1t = l l 力一i 口j 。( j ) f l j o ( j ) p ( o “五) = l 丑一i 口j ”( _ ) 厨”( j ) p ( o ) 2 2 3 计算中的下溢问题 1 _ ,n ,1 k m ( 2 - 2 6 3 ) 在前后向算法和b a u m - w e l e h 算法中,都有前向变量口。( ,) 和后向变量肛) 的 递推计算,因为所有的量都小于1 ,所以口。( f ) 和屈o ) 分别随着t 的增加和减少迅 速趋向于0 ,产生下溢( u n d e r f l o w ) 问题。解决这种问题的方法是增加缩放( s c a l i n g ) 因子,对相关算法加以修芷 3 3 1 。 第三章使用t i m m 的签名认征方法 第三章使用i - i m m 的签名认证方法 这一章我们将讨论使用h m m 的签名认证方法。首先是h m m 签名鉴别系统 的工作原理、工作流程,然后详细讨论各阶段面临的主要问题和解决办法,如在 数据准备阶段的特征向量量化、系统建模阶段模型的选择和训练、签名认证阶段 决策边界的确定等等。由于在建立实际系统时,我们可能需要将两种或更多种签 名特征结合使用,这些特征在意义和度量上是没有可比性的,这样在建立h m m 认证系统时就不宜放在一个特征向量中,而应分别考虑。这就是多维特征问题i 此外,在实际应用中还存在真实训练样本不足、没有伪造签名样本的问题,签名 者的字体随时间推移而发生变化也会导致系统的识别率下降。我们也将针对这些 问题讨论相应的解决方法。 3 1l 】i 签名鉴别系统的工作原理 在签名认证中,应用h m m 包含两个大的步骤:一是训练,一是识别。在进 行训练时,用由真实签名样本得到的观察序列训练模型,每一个模型对应一个人 的签名。在识别时,计算由要识别的签名得到的输入观察序列在特定模型下出现 的概率,由概率值判断待识别签名是否属于该模型所表示的签名者。 一个典型的h m m 签名鉴别系统的工作流程如下图: 图3lh m m 签名鉴别系统的工作流程 这里前面几个步骤对扫描的签名图像的预处理、提取签名特征、建立观 察符号序列,都属于h m m 的输入数据准备阶段:将签名样本转化为观察值序列, 第三章使用 m n “的签名认证方法 供模型训练和鉴别过程使用。 训练过程使用b a u mw e l c h 算法,通过调整模型参数使训练序列出现的概率 最大。由此得到模型参数的最大似然性评估。在模型训练之前,还要选择合适的 模型,包括m a r k o v 链和观察符号。 鉴别过程包含两步。首先是计算输入观察序列在该h m m 下出现的概率,可 以使用前后向算法。然后使用一定的决策方法根据此概率值给出判决结果。 3 2h m m 的输入数据准备 3 2 , 1 预处理 我们搜集的签名样本是用统一粗细的签名笔书写在白纸上的。墨水的颜色是 蓝色或黑色。在提取签名特征前,首先要把扫描的签名图像二值化,然后对其做 以下两方面的规范化处理: 第一,在水平方向压缩签名。中文签名大都包含甄个以上的汉字,汉字和汉 字之间、水平的部首与部酋之间往往都有空自。虽然这种空自在某种程度上能反 映作者的书写风格,但也很不稳定。因此我们把图像进行水平压缩,去掉这种空 白。如下图; 图3 2 预处理:水平方向压缩签名 第二,以压缩的签名图像的质心为中心,将签名统一正放在4 0 0 * 2 0 0 象素的 矩形区域内。 3 2 2 特征抽取 对于一个使用离散h m m 的签名认证系统而言,模型的输入信号必须是取自 签名图像中的离散特征序列。这就要求我们对签名或签名所在的区域做某种形式 第三章使用h m m 的签名认证方法 的划分。比如把签名图像划分成若干列,从每一列中提取签名的局部特征,得到 一个特征向量,然后把这些特征向量连在一起得到特征序列。 有两种思路可以建立这种离散特征序列:一种是通过对签名图像的分析定义 有意义的“元笔划”,然后通过适当的签名切分算法将签名划分成元笔划序列, 作为h m m 的输入特征序列;另一种是不按语义切分,只简单的把签名所在的图 像区域划分成如干部分,把从每一部分提取的特征合在一起组成h m m 的输入特 征序列。签名书写的任意性使得“元笔划”的划分非常复杂。因此很难找到合适 的定义和切分算法。另一方面,如同在1 4 节中所指出的,针对随机伪造签名和 简单伪造签名的鉴别,不需要使用复杂的结构化签名表示法,通过对所有签名建 立一种统一的全局或局部的形状描述就可以获得较好的性能。因此我们选择基于 签名图像区域划分的特征提取方式建立h m m 的输入特征序列。 关于签名特征提取这部分内容,在下章介绍一个实际的h m m 中文签名认 证系统时将详细讨论。 3 2 3 建立观察符号序列 由特征提取阶段得到的特征矢量序歹! l 中都是连续的浮点型矢量,需要将其离 散仡- 转换成离散h m m 需要的特征矢量类,每一类用一个符号表示。这个从特 征矢量序列到观察符号序列的过程就是矢量量化1 3 4 | 。 为了实现这一步,首先要建立观察符号集,即训练码书。在这里,我们为每 个人的签名建立一个码书。 码书的训练使用l b g 算法。l b g 算法是矢量量化的一个基本算法,只要确 定了失真测度和初始码书,就可以使用l b g 算法进行聚类了。 这里我们就使用最简单的平方失真涣5 度 a ( x ,y ) = x - y i l 2 = ( x ,一只) 2 ( 3 - 1 ) j 来描述矢量之间的距离。 在l b g 算法中,初始码书的选取对最佳码书设计有很大的影响,所以需要 通过预处理确定较优的初始码书。为此,我们酋先取训练样本集7 、的子集磊,在 五上使用分裂法得到初始码书。然后茅用初始码书在训练样本集r 上设计最佳码 第三章使用h m m 的签名认证方法 书。 要获得较好的聚类效果,每一个码字所代表的胞腔必须在训练集中拥有足够 数目的特征向量 3 5 】。因此小的训练集就需要小的码书,其码字个数要根据应 用中的实际情况确定。 3 3h m m 建模 3 3 1 模型选择 模型五= ( 厅,a ,b ) 的选择主要考虑两方面的问题:一是m a r k o v 链,包括其基 本形状和状态数:二是观察符号的选择。因为我们使用的是离散h m m ,因此只 要考虑使用单个观察符号还是多个混合的观察符号就可以。 3 3 1 1m a r k o v 链的形状 (a)(” 0n nn ( c ) 图3 3 几种左一右型m a r k o v 链 前面已经提到过,中文离线签名的自左而右的书写方式同语音信号的时变特 征之间存在着很多相似之处,因此最适宜使用从左到右的m a r k o v 链,典型的左 一右型h m m 有几种形式,如上圈3 3 。 3 3 ( a ) 的m a r k o v 链从每一个状态都可以一步转移到后续任何状态。33 ( b ) 的 第三章使用酬的签名认证方法 形状比较特殊,从左到右有多条转移路径。这两者都是跨越型的m a r k o v 链,也 就是说从某个状态i 可以不经过状态i + l 而直接转移到后面的状态。3 3 ( c ) 则是一 种无跨越、两转移的h m m 。 我们在特征提取阶段提取的是统计特征两非结构特征,不存在结构元素的冗 余或丢失情况,而且同一个人书写的签名的整体结构是很稳定的,因此将采用无 跨越、两转移的模型结构,如上图3 3 ( c ) 所示。 由于不同人的签名复杂程度各不相同,因此对不同的签名者应当使用不同状 态数的h m m 建模。假设某h m m 的输入观察序列的平均长度为,。则模型的状 态数忍= 1 1 0 l ,n 通常在2 到4 之间。 3 3 1 2 观察符号 观察符号的选择是与所使用的特征密切相关的。假如只有种签名特征那 么显然h m m 的一个状态就对应一个观察符号。这就是普通的离散h m m 的情形。 如果想要多种特征结合使用时,这些特征之间在意义和度量上不可比较,这时建 立h m m 认证系统时就不宜放在一个特征向量中,而应分别考虑。这样h m m 的 每个状态就对应多个观察符号。 连续m 口“的情形下,一种对多维观察符号建模的方法是使用混和高斯概率 密度函数。选定一个合适的混合度,高斯混和密度函数可以接近任何连续概率密 度函数。当每一维观察值都是统计独立的时候,则可以用一种简化的方法。这时 多维h m m 的观察输出概率可以用每一维信号的观察输出概率的乘积来计算 【3 6 1 。 我们使用这种简化的方式来表示多维离散i - i m m ;它具有和普通h m m 相同 的状态转移概率矩阵,不同的是,它使用多个观察概率矩阵,每个观察概率矩阵 描述了一类观察符号的概率分布情况,比如一个二维离散h m m ,就可以用四元 组z = ( 彳,置,b :,力表示。 3 3 2 模型哥l l 练 这里只讨论使用多维观察符号的h m m 。 第三章使用h m m 的签名认证方法 必须修改原先的h m m 基本算法以处理多维观察符号的情况。前面讲过,对 于多维观察符号,在假定每一类特征相互独立的情况下,多维h m m 的输出概率 可以用每一维信号的输出概率的乘积来计算。在这个假定下,基本h m m 的前后 向算法和b a u mw e l c h 算法就可以作相应的修改。 假设有g 维观察符号,记时刻的观察符号为0 ,= 【0 ,( 1 ) ,o ,( 2 ) ,ao ,( 只) 】,则 前向变量的计算公式改为: ini r a t + l ( j ) = ( f ) i n 6 ,( 口+ ,( 伪 ( 3 2 ) l 1 = 1j ,;l 类似的,后向变量变成: l n j r 屈( ,) = i 屈。( j ) 1 2 l b , ( o 。( ,) ) ( 3 3 ) lj = ll i = 1 多维h m m 的训练也是通过调整模型参数使观察序列出现的概率最大得到 的。在各维观察符号相互独立的假定下,b a u mw e l c h 算法的初始概率和状态转 移概率矩阵的重估公式不变,而r 个观察概率矩阵的计算改为: 可似) = c o u n t ( k ”fj ) c o u n t ( j )( 3 ,4 ) 这里c o u n t ( k ”i ) 表示状态j 下出现第,个观察符号集中符号k 的次数的期望, 1 = 1 ,2 r 。 有了上述扩展的前后向算法和训练算法,我们就可以训练模型、对观察值序 列打分了。 3 4 决策过程 h m m 训练之后,输入一个观察符号序列得到的输出是一个概率值,系统还 必须根据输出概率确定签名的真假属性,这就是决策过程。决策过程包括两步: 输出概率的归一化处理和确定决策方法。 在前面确定的预处理和特征提取策略下,我们没有对签名大小迸行归一化, 因此对同一个人的不同次签名提取的特征向量序列的长度是不等的。由于输入观 察序列越长,h m m 的输出概率就越小,而且两者呈指数关系,因此在决策之前 需要对输出概率作后处理: 第三章使用删的签名认证方法 芦( 。i 兄) :l o g p _ ( o 一 a ) ( 3 - 5 ) 由于在训练过程中我们只有真实签名样本,没有伪造样本,因此无法使用一 般的确定真伪签名决策边界的方法确定真实签名输出概率与伪造签名输出概率 的界限。只能使用认知的方式对真实签名建立描述,在判决时,根据签名的输出 结果与该描述是否符合来判断真伪。 假定所有训练样本的输出概率为( 磊,芦:,。) ,我们用其均值芦和方差盯来 确定模型的决策边界: p = 芦+ 口口( 3 - 6 ) p 2p o o l( 3 7 ) 在认证过程中,当输出概率在上述两个值之间时就确定该签名为真,否则为假。 这里控制参数口的选取对系统的误识别率有很大的影响:其值越大,表示决策闽 值越宽松,系统对伪造签名的误识别率就会越大;反之,系统对真实签名的误识 率就会越大。实际应用中需要根据系统的要求折中取值。 3 5 处理小训练集与字体变化的影响 一个i - i m m 含有多个待估计参数,因此要得到满意的模型,必须有很多的训 练数据。当训练数据集比较小时,一些出现次数较少的观察值没有包含在整个训 练数据中,这就会导致训练出的h m m 参数中有一些为0 的概率。二维 h m m 五= ( a ,e ,玩,力因为包含两个观察概率矩阵,待估计参数更多,因此对训 练数据的需求量更大。丽在实际应用中,一个签名者注册时往往只采集几个签名 样本。另一方面,人的字体会随时间改变。因此随着时间的椎移,模型将逐渐不 适应字体的变化,识别率会越来越低。 为此,可以通过在模型使用过程中动态增加训练样本的方法来解决这个问 题:将在模型使用中鉴定为真的签名作为新的谶练数据,用它对以前的模型进行 修正,使新模型能同时反映原训练数据和新训练数据的特性。在模型修正过程中 决策边界也要作相应的重估。 假定原训练集为d 。,新训练集为d 。,一个直接的处理方法就是把二者合在 第三章使用h m m 的签名认证方法 一起,重新训练模型。但是在实际应用中可能并不保留训练数据集d 。,因为这 会占用很多存储空间。另一种方法就是以由见得到的模型屯为初始模型,用新 训练集d 。通过重估公式得到新模型。这样做的话,显然这个新模型只能反映数 据集d 。的特性,不能同时反映d o 的特性。因此这种方法也不宜采用。 语音识别中对不同说话者的影响的处理方式 3 3 】为我们的问题提供了一种 解决思路。由b a u mw e l c h 算法的重估公式( 2 2 4 - 2 ) 和( 2 - 2 4 3 ) 可知:在迭代中,l 个训练序列的信息是由这些训练序列分别计算出的转移次数、矢量数、状态数通 过分子分母分别相加反映在迭代后的新模型参数中的。那么把d 口和d 。作为l 个 训练序列分成的两部分的话,对新训练数据集d 。,用b w 算法产生相应的模型 五。,并保留各参数重估公式中的分子、分母值,与原模型训练过程中相应的分 子分母分别相加,就可以得到反映见+ 见的特性的模型参数。 通过这种方式对模型进行补充训练,就可以逐步增强模型的描述能力,同时 。 l 使模型具有良好的自适应性和学习能力。 3 6 性能评估 本文采集了l o 组中文离线签名作为实验数据。每组对应一个人的签名包 括2 0 个真实样本和1 0 个简单伪造样本。2 0 个真实样本中有l o 个用作训练集, 另外1 0 个与简单伪造样本一起,作为测试集。真实样本采用如下的采集策略: 每个签名者每天书写3 到4 个样本,周内采集2 0 个样本,这样可以使数据库 尽可能反映不同时间的字体变化。采集的所有签名数据都按照3 2 1 节的方式处 理,统一处理之后的签名图像高2 0 0 象素,书写线平均宽度为3 象索左右。 系统评估使用三个参数:误接受率,即把伪造签名误识别为真实签名的比率, 记为f a r ( f a l s ea c c e p t i n gr a t e ) ;误拒绝率,即把真实签名误判为假的比率,记 为f r r ( f a l s er e f u s i n gr a t e ) ;平均误识别率,即f a r 和f

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论