(通信与信息系统专业论文)基于纹理分析的笔迹鉴别方法研究.pdf_第1页
(通信与信息系统专业论文)基于纹理分析的笔迹鉴别方法研究.pdf_第2页
(通信与信息系统专业论文)基于纹理分析的笔迹鉴别方法研究.pdf_第3页
(通信与信息系统专业论文)基于纹理分析的笔迹鉴别方法研究.pdf_第4页
(通信与信息系统专业论文)基于纹理分析的笔迹鉴别方法研究.pdf_第5页
已阅读5页,还剩68页未读 继续免费阅读

(通信与信息系统专业论文)基于纹理分析的笔迹鉴别方法研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

武汉理工大学硕士学位论文 中文摘要 笔迹鉴别是根据手写笔迹判断书写人的一门技术。笔迹鉴别的计算机化 是减轻文检人员的工作负担、促使笔迹鉴别技术推广普及的一个重要步骤。 计算机笔迹鉴别的研究经历了近4 0 年,取得了不少成就。近年来,社会需 要对计算机笔迹鉴别的研究提出了新的要求,模式识别和人工智能等相关学 科的进展为计算机笔迹鉴别的发展提供了新的契机。在这样的背景下,本文 通过综合已有笔迹鉴别方法,研究提出了一种基于整数小波系数的笔迹鉴别 方法。论文的主要内容有: 详细介绍了基于生物特征的身份鉴别技术,比较了1 2 种用于身份鉴别 的生物统计特征。介绍了笔迹鉴别的应用背景和发展历史及计算机笔迹鉴别 的技术状况,分析了笔迹鉴别问题的性质,提出了计算机笔迹鉴别系统的实 现方案。指出实用的计算机笔迹鉴别系统是人机结合的、机器粗分类和人工 专家最终判决的系统。 纹理分析是在图像处理、分析和识别中广泛应用的一种方法。文章总结 了几十年来,人们提出的许多纹理分析的方法。其中小波变换具有良好的时 频局部化、尺度变换和方向特征,更容易适应人类视觉系统,它已成为纹理 分析的一个有力的工具。 在笔迹图像的特征提取上,文章把笔迹图像当作纹理图像来看待,创新 地提出用( 2 ,l o ) 整数小波变换来分析笔迹图像,即主要用( 2 ,1 0 ) 整数小波变换 分析纹理图像,用纹理图像的整数小波系数来表征笔迹图像的特征向量,文 章定义了一个1 8 维的特征向量。( 2 ,1 0 ) 整数小波变换能够很好地提取图像的 高频部分,高频部分在图像中表现为细节,面对纹理图像的分析主要是对细 节的分析。用小波系数作为图像的特征,可以对纹理图像进行多分辨率分析, 以便更好地反映纹理细节特性,达到初步识别减少文检专家工作量的目的。 采用2 7 个人的中文笔迹( 内容相同) 进行实验,包含每人两到四幅笔迹。 字符存在于上下文中,而不是书写同一个字因此对于现实生活中的笔迹具 有代表性。在m a t l a b 6 5 环境下,选用不同的特征字及组合,进行了鉴别实 验,取得了较好的效果,在文本依存的情况下,识别率达到了9 8 6 0 。 关键词:笔迹鉴别文本依存纹理分析整数小波变换小波系数均值 i 武汉理工大学硕士学位论文 a b s t r a c t w r i t e ri d e n t i f i c a t i o n ( w i ) i sa d i s c i p l i n ew h i c h a i m st od e c i d et h ei d e n t i t yo f w r i t e r sa c c o r d i n gt ot h eh a n d w r i t i n gs t y l e s t h ec o m p u t e r i z a t i o no fw ii st h e m o s ti m p o r t a n ts t e pt or e l a xt h eh e a v yb u r d e no fd o c u m e n te x a m i n e r sa n dt o a c h i e v et h eg o a lo f p r e v a l e n ta p p l i c a t i o n s t h er e s e a r c ho fc o m p u t e rw ih a sa h i s t o r yo f n e a r4 0y e a r s ,i ti sl o n gi nt i m ea n da c h i e v e m e n t si nw h i c h i sr e l a t i v e l y r i c h i nr e c e n t y e a r s ,s o c i a lb a c k g r o u n d su r g em o r ea c h i e v e m e n t si nc o m p u t e rw i , a n da d v a n c e si nc o r r e l a t e dd i s c i p l i n e ss u c ha sp a t t e r nr e c o g n i t i o na n da r t i f i c i a l i n t e l l i g e n c es u p p l yc h a n c e sf o rt h ed e v e l o p m e n to fc o m p u t e rw i u n d e rt h i s b a c k g r o u n d ,t h i st h e s i so f m a s t e r sd e g r e es t u d i e sa n dp r o p o s e sat e x t u r ea n a l y s i s m e t h o df o rh a n d w r i t i n gi m a g eb a s e do ni n t e g e r - t o i n t e g e rw a v e l e tt r a n s f o r mb y s y n t h e s i z i n gm e t h o d st h a tw e r ee x c o g i t a t e d t h em a i nc o n t e n t so f t h i st h e s i sa r e a sf o l l o w s f i r s t l yi d e n t i t y i d e n t i f i c a t i o nb a s e do n b i o l o g i cc h a r a c t e r s ( b i o m e t r i c i d e n t i f i c a t i o nt e c h n o l o g y ) i si n t r o d u c e d ,a n d1 2b i o l o g i cs t a t i s t i c a lc h a r a c t e r sa r e c o m p a r e d t h ea p p l i c a t i o nb a c k g r o u n d a n dh i s t o r yo fd e v e l o p m e n to fw i t e c h n i q u e s a r ei n t r o d u c e di ns u c c e s s i o n t h en a t u r eo ft h ew ip r o b l e mi s a n n l y z e d ,a n dt h e nt h es t r a t e g yo fb u i l d i n gc o m p u t e r w i s y s t e m i sp r o p o s e d i ti s p o i n t e d o u tt h a ta n a p p l i c a b l ec o m p u t e r w i s y s t e m i s h u m a n - c o m p u t e r i n t e r a c t i v e ,c o m p o s e do fr o u g hc l a s s i f i c a t i o nb yc o m p u t e ra n d f i n a ld e c i s i o nb y h u m a n e x p e r t s t e x t u r ea n a l y s i si sa p p l i e di nt h em a n i p u l a t i o n ,a n a l y s i sa n dr e c o g n i t i o no f i m a g e sw i d e l y , t h et h e s i ss u m m a r i z e sm a n y m e t h o d st h a tw e r ee x c o g i t a t e di n t h e s es e v e r a ld e c a d e s ,i nw h i c hw a v e l e tt r a n s f o r mh a sf a v o r a b l et i m e - f r e q u e n c y l o c a l i z a t i o n ,s c a l et r a n s f o r ma n d d i r e c t i o nc h a r a c t e r i s t i c ,a n di th a sb e e na c o n v i n c i n gt o o lf o rt e x t u r ea n a l y s i sa si t c a na d a p tm o r t a ls e e i n gs y s t e mm u c h e a s i l y l o nc h a r a c t e re x t r a c t i o n ,t h et h e s i sr e g a r d sh a n d w r i t i n gi m a g e sa st e x t u r e i m e g e s a n d e x c o g i t a t e sa n a l y z i n g h a n d w r i t i n gi m a g e sw i t h ( 2 ,1 0 ) i n t e g e r - t o - i n t e g e r w a v e l e tt r a n s f o r m i n n o v a t i v e l y , t h a ti s ,a n a l y z i n g t e x t u r e w 武汉理工大学硕士学位论文 i m a g e sw i t h ( 2 ,1 0 ) i n t e g e r - t o - i n t e g e rw a v e l e tt r a n s f o r mm a i n l y a n dd e n o t i n g e i g e n v e c t o r so fh a n d w r i t i n gi m a g e sw i t hi n t e g e r - t o i n t e g e rw a v e l e tc o e f f i c i e n t s , t h et h e s i sd e f i n e sa n18 - d i m e n s i o ne i g e n v e c t o r ( 2 ,1 0 ) i n t e g e r - t o i n t e g e rw a v e l e t t r a n s f o r mc a ne x t r a c tt h eh i g hp a s so f i m a g e se f f e c t i v e l y , h i g hp a s si st h ed e t a i l s o fi m a g e s a n da n a l y s i so f t e x t u r ei m a g e si s m a i n l yf o rt h ed e t a i l s u s i n gw t c o e f f i c i e n t sa st h ec h a r a c t e r so f i m a g e s c a nd om u l t i r e s o l u t i o na n a l y s i s ,t or e f l e c t t h ed e t a i l so ft e x t u r eb e t t e ra n dt og a i nt h ee n d so f r e l a x i n gt h eh e a v yb u r d e no f d o c u m e n te x a m i n e r s e x p e r i m e n t sw e r em a d eu s i n gc h i n e s eh a n d w r i t i n gf r o m 2 7d i f f e r e n t p e o p l e ,t h ec o n t e n t sa r e t h es a m e ,a n de v e r y o n eh a s2t o4s h a r e s ,t h e c h a r a c t e r sa r ei nt h ec o n t e x t si n s t e a do fw r i t i n gt h es a m ec h a r a c t e r , s ot h e yc a n r e p r e s e n th a n d w r i t i n g i ne v e r y d a yl i f e i nt h ee n v i r o n m e n to f m a t l a b 6 5 ,s e l e c t i n g d i f f e r e n tr e p r e s e n t a t i v ec h a r a c t e r st od ot h ee x p e r i m e n tg a i n sp r e f e r a b l ee f f e c t , d e p e n d i n g o nt h et e x t ,t h ei d e n t i f i c a t i o nr a t i oc a nr e a c h9 8 6 0 k e yw o r d s :h a n d w r i t i n g i d e n t i f i c a t i o n ,t e x td e p e n d e n t ,t e x t u r ea n a l y s i s , i n t e g e r - t o i n t e g e rw a v e l e tt r a n s f o r m , i n t e g e r - t o i n t e g e rw a v e l e t c o e f f i c i e n t s 1 1 1 武汉理1 二大学硕士学位论文 第1 章绪论 我们生活在一个信息飞速发展的社会里,计算机已成为替代人类工作的 重要工具,计算机的普及和网络的发展方便了我们的日常生活,使我们能获 得更多的信息,使在不同地域和拥有不同文化的人可以更加方便的交流。然 而我们在获得这些便利和帮助的同时往往会为科技发展的副面效应一安 全问题而担忧。信用卡号码和密码被窃取,身份证件被盗用等事件的不断发 生使我们认识到如何准确地判定一个人的身份已是一个十分重要的问题。随 着社会的不断发展,传统的身份鉴别方法( 如钥匙、证件、口令等等) 已经 不能满足社会的需要。基于生物特征的身份鉴别技术,为我们提供了一种更 加方便和可靠的方法,它早已引起国内外学术界和企业界的极大关注。 1 1 基于生物特征的身份鉴别 随着社会的不断向前发展,以知识为基础的新经济正在崛起,其两大主 流科技是计算机技术和生物技术。现在有一种技术,横跨这两大科技领域, 在国际上已经是繁荣昌盛,在国内却刚刚起步面临国际大厂商的冲击,那就 是“生物特征识别”。所谓生物特征识别( b i o m e t r i c s ) 技术是指通过计算 机利用人体所固有的生理特征或行为特征来进行个人身份鉴定。生理特征与 生俱来,多为先天性的:行为特征则是习惯使然,多为后天性的。我们将生 理和行为特征统称为生物特征。常用的生物特征包括:指纹、掌纹、虹膜、 脸像、声音、笔迹等。生物特征识别是一门计算机“模式识别”的高科技, 主要应用于安全保密、认证防伪、考勤打卡、刑事侦破等。如果你建设一个 数字化社区,就需要有一套安全可靠的门禁系统,是用钥匙? 用i c 卡? 还 是用指纹锁? 如果成本合适的话,我想大家都会选择指纹锁,因为指纹是“随 身携带”的,不用当心会丢失:指纹又是唯一的,全球6 0 亿人没有两个指纹 是一样的,安全可靠。其他的生物特征也与指纹有相同的特点,这就是生物 特征识别成为计算机行业“显学”的原因。 武汉理t 大学硕十学位论文 生物识别技术可广泛用于政府、军队、银行、社会福利保障、电子商务、 安全防务。例如,一位储户走进了银行,他既没带银行卡,也没有回忆密码 就径直提款,当他在提款机上提款时,一台摄像机对该用户的眼睛扫描,然 后迅速而准确地完成了用户身份鉴定,办理完业务,这是美国德克萨斯州联 合银行的一个营业部中发生的一个真实的镜头。而该营业部所使用的正是现 代生物识别技术中的“虹膜识别系统”。美国9 1 l 事件后,反恐怖活动已成 为各国政府的共识,加强机场的安全防务十分重要。美国维萨格公司的脸象 识别技术在美国的两家机场大显神通,它能在拥挤的人群中挑出某一张面 孔,判断他是不是通缉犯。 1 1 1 身份鉴别的定义 身份鉴别是指通过某种方法确定人的身份。从根本上说,身份鉴别的问 题可以划分为两类:身份验证和身份识别。身份验证是指确认个人声称的身 份是否与其真实身份一致,即回答“我是某人吗? ”的问题。身份识别是指 识别出个人的真实身份,即回答“我是谁? ”的问题。 身份鉴别的历史可以追溯到原始社会。当时的人类生活在小的部落中, 互相认识对方,身份鉴别显得十分简单。而现代社会是一个高度复杂的、信 息交互的社会,身份鉴别已经渗透到日常生活的每一个方面。同时,由于交 通、通信和网络技术的发展,人类的活动范围越来越大,身份鉴别的难度和 重要性也越来越突出。以美国为例,美国一年有上亿美元福利款被人以假冒 身份领取。据m a s t e r c a r d 公司估计,每年约有4 5 亿美元的信用卡诈骗案发 生,其中就包括利用丢失和被盗的信用卡犯罪,如果销售场所可以准确地鉴 别持卡人的身份就会大大减少这类诈骗案的发生。另外,由于使用盗窃来的 身份识别码( p i n ) ,而造成的移动电话通信的损失高达1 0 亿美元。据估计, 利用可靠的方法鉴别a t m 持卡人的身份,可以使全美国每年由于a t m 诈骗 案造成的损失减少3 亿美元,可靠地鉴别支票领款人可以减少上亿美元的冒 领金额。随着网络的发展,非法登录计算机的案件正呈上升趋势,有效的身 份鉴别技术可以防止这类案件的发生。另据美国移民局统计,如果在美国一 墨西哥边境采用身份鉴别系统,可以每天查出3 0 0 0 件非法入境案件。以上 的这组数据表明,有效地鉴定个人的身份有着重大的社会和经济意义,它可 以有效地防止犯罪和诈骗,提高办公效率,节约资源。 2 武汉理工大学硕士学位论文 1 1 2 身份鉴别的方法 鉴别人的身份是一个非常困难的问题,传统的身份鉴别方法把这个问题 转化为鉴别一些标识个人身份的事物,这包括两个方面: 1 ) 身份标识物品,比如钥匙、证件、a t m 卡等; 2 ) 身份标识知识,比如用户名和密码。 在一些安全性要求严格的系统中,可以将这两者结合起来,比如a t m 机要求用户同时提供a t m 卡和密码。这些传统的身份鉴别方法存在明显的 缺点:个人拥有的物品容易丢失或被伪造,个人的密码容易遗忘或记错。更 为严重的是这些系统无法区分真正的拥有者和取得身份标识的冒充者,一旦 他人获得了这些身份标识事物,就可以拥有相同的权力。 另外一种身份鉴别方法是基于人体自身所固有的生物统计特征,简称生 物特征。这种技术是通过计算机将人体所固有的生理特征或行为特征收集并 进行处理,来进行个人身份鉴定的技术。这些生物特征包括生理特征( 如指 纹、脸像、虹膜等与生俱来,先天性的特征) 和行为特征( 如语音、笔迹、 步态等后天习惯形成的特征) 。这种利用生物特征进行身份鉴别的技术称为 b i o m e t r i c s ( 生物识别技术) 。与传统方法中的身份标识物相比,生物特征的 优点是不会丢失、遗忘和伪造。b i o m e t r i c s 技术已经成为自动身份鉴别的重 要工具。 1 1 3 生物统计特征 随着网络技术、计算机技术的飞速发展,基于生物特征的身份鉴别技术 应用领域将更广泛。基于生物特征的身份鉴别技术的研究伴随着这一市场的 发展越来越深入,逐渐自成系统。据科学家介绍,能够用来鉴别身份的生物 特征应该具有以下的特点l 刈: 1 广泛性:每个人都应该具有这种特征; 2 唯一性:每个人拥有的特征应陔各不相同; 3 稳定性:所选择的特征应该不随时间发生变化; 4 可采集性:所选择的特征应该便于测量; 实际的应用还给基于生物特征的身份鉴别系统提出了更多的要求: 3 武汉理工大学硕士学位论文 1 性能的要求:所选择的生物统计特征能够达到多高的识别率,对 于资源的要求如何,识别的效率如何; 2 可接受性:使用者在多大程度上愿意接受基于所选择的生物统计 特征的系统; 3 安全性能:系统是否能够防止被攻击;是否具有相关的、可信的 研究背景作为技术支持; 4 可实用性:提取的特征容量,特征模板是否占有较小的存储空间; 价格是否为用户所接受;是否具有较高的注册和识别速度;是否具 有非侵犯性; 遗憾的是,到目前为止,还没有任何一种单独的生物特征可以满足上述 的全部要求。基于各种不同生物特征的身份鉴别系统都有各自的优缺点,适 用于一定的范围。目前一些主要的用于身份鉴别的生物统计特征包括: 虹膜 到目前为止,利用虹膜的身份鉴别的错误率是各种生物特征识别中最低 的。每个人虹膜的结构各不相同,并且这种独特的虹膜结构在人的一生中几 乎不发生变化口】。这个观点有两方面的依据:第一个依据来自于l 临床观察。 眼科学家和解剖学家经过大量的观察发现,虹膜具有独特的结构,即便对于 同一个人,左眼和右眼的虹膜区别也是十分明显的。经过进一步持续的观察, 科学家们发现,自童年以后,虹膜在人的一生中所发生的变化十分微小。支 持这一观点的第二个证据来自发育生物学。科学家发现,尽管虹膜的基本结 构是由内在的遗传基因决定的,但是,外界环境却对虹膜独特的细微结构起 着决定性作用。这种外部环境是指在生命初期虹膜形成之前的胚胎发育环 境。因此,自然界不可能出现完全相同的两个虹膜。发育生物学家通过大量 观察发现,当虹膜发育完全以后,它在人的一生中是稳定不变的,因而具有 稳定性。另外,由于虹膜的外部有透明的角膜将其与外界相隔离,因此,发 育完全的虹膜不易受到外界的伤害而产生变化。 4 武汉理工大学硕士学位论文 虹膜图像指纹及指纹识别技术的应用 图l 一1 指纹和虹膜 指纹 指纹是指人类手指上的条状纹路,它们的形成依赖于胚胎发育时的环 境。“没有两个完全相同的指纹”这一观点已经得到公认。指纹识别已经有 了很长一段历史。目前,全球范围内都建立了指纹鉴定机构以及罪犯指纹数 据库,指纹鉴定已经被官方所接受,成为司法部门有效的身份鉴定手段。 作为最传统、最成熟的生物鉴定方式,指纹有以下两个突出的优点:稳 定性一指纹具有很强的相对稳定性。从胎儿在6 个月时指纹完全形成到人 死后尸体腐烂,指纹的纹线类型、结构、统计特征的总体分布等始终没有明 显变化。独特性一一指纹具有明显的独特性。至今还找不出两个指纹完全相 同的人。由于皮肤表皮上的纹路是在j l 自 j k6 个月时形成的,因此,同卵双胞 胎的指纹也是不相同的。不仅人与人之间不同,就是同一个人的十指指纹也 有明显的区别。 随着指纹识别技术的发展以及产品产业化的推进,指纹识别系统不但广 泛应用于人们已经熟知的公安、破案、保安、金融等领域以及笔记本电脑和 手机等设备中,还将走入居民身份证。 红外温谱图 人的身体各个部位都在向外散发热量,而这种散发热量的模式就是一种 每人都不同的生物特征。通过红外设备可以获得反映身体各个部位的发热强 度的图像,这种图像称为温谱图。拍摄温谱图的方法和拍摄普通照片的方法 类似,因此,可以用人体的各个部位来进行鉴别。其数据采集方式也决定了 5 武汉理工大学硕士学位论文 利用温谱图的方法可用于隐蔽的身份鉴定。温谱图的另一个应用是吸毒检 测,因为人体服用某种毒品后,其温谱图会显示特定的结构4 1 。温谱图的方 法具有可接受性,因为数据的获取是非接触式的,具有非侵犯性。目前,已 经有温谱图身份鉴别产品问世,但是由于红外测温设备价格昂贵,该技术不 能得到广泛的应用。 脸像 在日常生活中,人们识别周围的人用的最多的是脸像,因而脸像识别是 一种最容易被接受的身份鉴定方法。另外,脸像识别也是一种非侵犯性的识 别方法。脸像会随着表情、年龄等的变化而发生改变,如何消除这些因素的 影响是脸像识别的难点所在。另外,背景和姿态的变化对于脸像识别的影响 也是一个需要解决的问题。 步态 步态是指人们行走时的方式,这是一种复杂的行为特征。尽管步态不是 每个人都不相同的,但是它也提供了充足的信息来识别人的身份。步态识别 的输入是一段行走的视频图像序列,因此其数据采集与脸像识别类似,具有 非侵犯性和可接受性。但是,由于序列图像的数据量较大,因此步态识别的 计算复杂性比较高,处理起来也比较困难。到目前为止,还没有商业化的基 于步态的身份鉴别系统。 语音 声音是个人所固有的特征,声音数据的获取具有非侵犯性,是一种可阻 被人们接受的生物特征。然而,若应用于大范围人群,声音并不能提供足够 的信息来进行身份鉴别。同时,声音属于一种行为特征,其他一些因素( 如 身体状况、紧张程度等) 会引起声音的改变。另外,基于声音的身份鉴别系 统的性能在很大程度上依赖于话筒、信道、数字化设备的精度。 笔迹 正如俗话所说的“字如其人”,每个人写的字都有自己的特征。笔迹是 一种行为特征,这是一个动态的过程,它受写字人的身体和情绪的影响很大。 有些人的笔迹变化很大,即使连续的笔迹都有很大的差别。此外,经过专门 训练,模仿出来的笔迹可以达到以假乱真的地步。尽管笔迹专家可以鉴定出 6 武汉理工大学硕士学位论文 笔迹的真伪,但是用计算机来描述笔迹的特征,自动地进行笔迹鉴别还是个 非常困难的问题。 随着计算机技术和网络技术的发展与普及,笔迹鉴别技术的应用领域更 为宽广,突破了原有的应用范畴,比如,计算机登录、信息网入网、信用卡 签字、电子商务等。从身份识别的角度看,笔迹是一种稳定的行为特征,笔 迹的获取具有非侵犯性( 或非接触性) ,易为人所接受。 除了以上几种生物特征以外,还有其他的些生物特征可以用于身份鉴 别,包括:耳形、d n a 、视网膜、手形、掌纹、体味等等。下表1 一l 为各 生物统汁特征的比较。 表1 1 :各种生物统计特征的比较 l 生物统 普遍性唯一性稳定性 可采 可接 计特征集性 准确性安全性 受性 脸形岛低 由 高低高低 指纹 由 局局中高中高 手形 由 中中向中中 中 虹膜高高i 曷 由 i 曷低高 视网膜向高中低高低高 笔迹低 低 低高 低高低 语音中低低 由 低高低 红外温谱高 局 低局中高 高 体味晶高局低低 由 低 步态中低低高 低 高中 耳形 中中高 由 中高中 d n a 高局高低高低低 每一种生物特征都有其优缺点和应用范围,迄今为止,还没有一个单生 物特征能实现完美无错的识别系统。另外,每种生物特征都有自己的适用范 围。比如:有些人的指纹无法提取特征,患白内障的人虹膜会发生变化。在 对安全有严格要求的应用领域中,人们往往融合多生物特征来实现高精度的 识别系统。数据融合是一种通过集成多知识源的信息和不同专家的意见以产 生一个决策的方法。将数据融合方法用于身份鉴别,结合多种生理和行为特 征进行身份鉴别,提高鉴别系统的精度和可靠性,无疑是身份鉴别领域发展 的必然。 7 武汉理工大学硕士学位论文 1 1 4 国内外基于生物特征的身份鉴别的发展状况 基于生物特征的身份鉴别技术已经成为人的身份鉴别的主流技术。据资 料显示,1 9 9 9 年在美国就有近1 5 0 家公司从事生物特征鉴定技术的研究、开 发和应用。其中,从事指纹研究的有8 0 家,声纹研究的有3 2 家,人像研究 的有1 2 家,签名研究的1 5 家,虹膜与视网膜研究的3 家,掌形与掌纹研究 的2 家。据业界专家的估计,包括这项技术的产业规模和市场销售额已经达 到了几十亿美元。而在中国,这个市场现在的潜力也不会小于几十亿人民币 川。 目前,国外许多高新技术公司正在试图用眼睛虹膜、指纹、面貌特征等 取代人们手中的信用卡或密码,并且已经开始在机场、银行和各种电子器具 上进行了实际应用。美国一家高技术公司研制出的虹膜识别系统已经应用在 美国德克萨斯州联合银行的三个营业部内。储户来办理银行业务,无需银行 卡,更没有回忆密码的烦恼。他们在取款机上取钱时,一台摄像机首先对用 户的眼睛进行扫描,然后将扫描图像转化成数字信息与数据库中的资料核 对,以对用户的身份进行检验。1 3 本三菱电机公司将“指纹认证装置”微型 化,并内置于公司推出的手机中。在使用者打电话时只要用手指触摸手机的 传感器部位,手机就能马上识别出指纹是否与使用者事先登记的指纹一致。 如哭与事先登记的指纹不相符合,电话就不能接通。这使手机用户再也不必 担心手机被人盗用了。 生物识别技术最有前途的地方或许是在电子商务领域。预计到2 0 0 5 年, 全球因特网用户将达到7 6 5 亿,与此同时,网络黑客的破坏活动也会层出不 穷跚。鉴于生物识别的可靠性,未来人们在网上购物或交易时,需首先在生 物识别仪上进行身份认证,可以保证网络管理机构有效地监督网络交易的参 与者,并大大减少不法分子对网络交易的破坏活动。 美国前总统克林顿曾签署了电子签名法案,使电子签名在美国获得与普 通书面签名一样的法律地位,从而进一步方便了企业和消费者在网上做生 意。而这项法案的签署,同时也促使美国各大生物技术公司加紧开发保证电 子签名安全的技术,其中主要包括验证个人身份的加密数字代码装置和附加 在计算机上的指纹或虹膜检查设施等。 8 武汉理工人学硕士学位论文 1 2 基于笔迹的身份鉴别 随着中国加入w t o ,经济的发展和国际交往的日益频繁,在金融界和 政界会有各种各样的协议书、合同、法规及支票等都需要当事人的签名。因 此,假如签名被模仿和伪造,将造成严重的社会后果和巨大的经济损失,严 重的更会破坏整个金融秩序和社会安定。因此,对笔迹进行可靠、有效、快 速地鉴定具有重要的社会价值和实用意义。手写体笔迹的鉴别是计算机视觉 和模式识别领域中的一个非常活跃的研究课题f 6 j 。作为一种身份鉴别的手段, 有许多优点。手写笔迹易于获取,而且不同的人通常有不同的笔迹。因此基 于笔迹的身份鉴别有着十分广阔的应用范围,它可以用于金融、保安甚至考 古学等领域。 1 2 1 笔迹鉴别的定义和用途 笔迹鉴别( h a n d w r i t i n gi d e n t i f i c a t i o n ) ,也称为笔迹检验( h a n d w r i t i n g e x t u n i n a t i o n ) ,它是根据人的手写笔迹( h a n d w r i t t e nh a n d w r i t i n g ) 判断书写 人身份的一门科学和技术。笔迹鉴别中的身份判断有两种方式:一种是直接 比较两份手写笔迹,确定它们是否为同一人所写:另一种是从不同人书写的 参考笔迹( r e f e r e n c eh a n d w r i t i n g ,又称样本) 中找出与检验笔迹( t e s t h a n d w r i t i n g ,又称检材) 的书写特征最接近的样本。前一种方式称为验证 ( v e r i f i c a t i o n ) 或鉴定,后一种方式称为鉴别( i d e n t i f i c a t i o n ) 或识别 ( r e c o g n i t i o n ) 。笔迹鉴别中假设参考笔迹的书写者是已知的,从而通过书 写特征就可以确定检验笔迹的书写者。 笔迹鉴别在社会生活中有着非常广泛的用途,可以说凡是需要身份鉴别 和安全保密的地方都用得着笔迹鉴别,如公安、司法部门的刑事调查和法庭 审判,金融、财会部门的签名对照,海关护照持有人身份的验证,计算机终 端访问人的认定,仓库保管员身份的证实,等等。在刑事调查中,笔迹是一 种重要的犯罪证据,笔迹检验是寻找和确认罪犯的重要手段。如匿名信的追 查,反动传单,标语书写人的调查等都是通过笔迹鉴别实现的。在金融领域, 信用卡的使用要求持卡人当场签字,并与卡上预留的签名进行对照,判断是 否为同一个人所写。此外,像保密问题,如计算机终端的访问除了口令以外, 还可以预先把特定使用者的签名( 或者约定的特定字符) 存在计算机里,开 机时机器提示使用者输入签名,并与存储的签名比较,从而接受或拒绝访问。 9 武汉理工大学硕士学位论文 从笔迹鉴别的用途可以看出,签名是一类非常重要的笔迹信号。鉴于签 名在安全应用中的重要地位和应用普遍性,学术界往往把基于签名的身份鉴 别和基于正常文本的身份鉴别区别开来,前者称为签名验证( s i g n a t u r e v e r i f i c a t i o n ) ,后者称为书写人鉴别( w r i t e ri d e n t i f i c a t i o n ) 。因此,笔迹鉴别 有两种不同的范畴。广义地说,笔迹鉴别就是利用手写笔迹的身份鉴别;狭 义的说,笔迹鉴别是利用手写文本( 不包括签名) 的身份鉴别。本文后面部 分如不作特别说明,所说的笔迹鉴别都是指狭义的范畴,即基于手写文本的 书写人鉴别。 1 2 。2 笔迹鉴别与相关领域的关系 笔迹鉴别与字符识别、签名验证、指纹鉴别以及人脸谚 别等问题之间既 有联系又:有区别,下面就简要阐述它们之间的关系。 1 2 2 1 笔迹鉴别与字符识别 提到笔迹鉴别,人们很自然地会联想到字符识别。其实,二者在本质上 和目的上都是不同的,只是在具体技术上有很多共同之处。它们的区别在于: ( 1 ) 字符识别是把具体的字符信号( 图像或书写过程) 与一个抽象的 符号( 文字类别) 联系起来,而笔迹鉴别是把字符信号与人的身份( 书写者) 联系起来。 ( 2 ) 手写笔迹中所含的信息可以分为语义信息( s e m a n t i ci n f o r m a t i o n ) 和奇异信息( s i n g u l a r i n f o r m a t i o n ) 6 1o 语义信息是文字的字面上的意义,是 一听十语言属性,而奇异信息则反映字符的书写风格、对应书写人的身份。因 此可以说,字符识别的目的是提取字符的语义信息,而排除或减少奇异信息 的影响;笔迹鉴别的目的是提取字符的奇异信息,而排除或减少语义信息的 干扰。 ( 3 ) 字符中的语义信息和奇异信息是相辅相成的,很难截然分开。字 符识别通过训练和学习可以从不同人书写的同一个字符中提取只与这个字 符类别有关的共同特征,从而达到手写字符识别的目的。而对于笔迹鉴别, 由少数的几个不同类别的字符很难看出书写风格的共性或差异来。克服这个 问题的办法是:要么从大量字符中提取反映书写风格的整体特征( 布局、字 符外形等) ,要么从检验笔迹和参考笔迹中选择相同或部分相同的字符进行 比较。 l o 武汉理j 二大学硕士学位论文 笔迹鉴别的信号预处理、特征提取、匹配等环节都采用了与字符识别类 似的具体技术,这是它们的共同之处。从历史的角度看,笔迹鉴别的研究不 仅在时间上晚于字符识别,在投入的研究力量和提出的方法上也都远远少于 字符识别。由于信息载体( 字符图像或书写过程一维信号) 相同,笔迹鉴别 和字符识别在与信号处理和分析有关的环节必然有很多相通的地方。字符识 别的发展为笔迹鉴别提供了很多现成的技术。当然,笔迹鉴别的深入研究也 会为字符识别提供借鉴。笔迹鉴别和字符识别技术的结合是很有必要的【7 1 。 1 2 2 2 笔迹鉴别与签名验证 由于签名在信用上的重要地位以及人们注重签名的个性设计的事实,签 名验证特别是联机签名验证的方法和系统开发受到了极大的重视【8 l 。这方面 的研究远多于笔迹鉴别,并有实用系统上市。 签名验证有联机和脱机两种方式,都有很广泛的应用背景。联机的方法 是通过专用的数字板或数字仪实时采集书写信号,提取笔迹的动态特征和静 态特征,动态特征包括:书写过程中的压力、速度、加速度、笔顺等,静态 特征主要包括字迹形态,笔迹比较的方法包括函数波形匹配和参数特征匹 配,验证的可靠性比较高。脱机的方法是通过扫描仪或摄像机将写在纸上的 字符转化为计算机能处理的信号,因此只能从字符的形态来判断签名的真 伪,提取的特征包括:签名的位置、方位、笔划的方向笔划间的搭配等。相 比较而言,联机签名验证技术的可靠性要高一些。为了进一步提高脱机签名 的可靠性,一些研究学者利用签名的灰度图像来提取书写过程的动态特征 ( 伪动态特征) 。伪动态特征主要用来区别熟练模仿的签名。 笔迹鉴别与签名验证比较,除了考察对象的不同( 文本和签名) ,它们 使用的方法也不一样。签名验证的书写人是经过注册的,而且登记的每一个 人都附有一个身份号码,验证时只需根据待验证者申明的号码调出相应的参 考签名进行比较即可。在注册过程中可以进行训练和学习提取有效特征并确 定最佳权值。 签名验证与笔迹鉴别在些具体环节( 如预处理、特征提取) 也是相通 的,签名验证的具体技术特别是脱机签名验证的技术和笔迹鉴别的技术可以 相互借鉴。 1 2 2 3 笔迹鉴别与指纹鉴别和人脸识别 和笔迹鉴别一样,指纹识别和人脸识别也是利用人体的自然属性鉴别个 1 1 武汉理工大学硕士学位论文 人身份的主要手段。它们在应用背景和实现方法上都有很大的不同。在应用 背景上,指纹和人脸的识别都要求建立所有嫌疑人的数据库,鉴别时把待检 验的指纹或照片与己注册的嫌疑人指纹或脸像进行比较,找出最相似者。笔 迹鉴别则不同,嫌疑人往往是没有注册的,只有通过案情分析确定嫌疑人, 并收集嫌疑人平时书写的笔迹或让嫌疑人当场书写笔迹作为参考样本后,将 检验笔迹与参考样本e e 较以确定作案人。由于没有注册( 建库) 过程,笔迹 鉴别不可能事先通过训练和学习提取特定书写人的笔迹特征和确定相应的 判定权值,这就增加了笔迹鉴别的难度。 指纹和人脸识别的处理对象( 指纹、脸部照片) 变化是有限的,指纹都 是由一个核心、一些交叉点和很多线条组成,虽说每个入的指纹都不一样, 但不同人的指纹组成是大致相同的,因此在指纹鉴别时可以相应地提取点、 线特征分别进行 e 较。入脸都有五官构成,不同人的脸部组成也都是不一样 的,只是布局不同,因而鉴别时也可以提取相应部位的特征和它们之间的相 互关系进行比较或对特定部位进行匹配。而笔迹鉴别面对的是成千上万不同 类别的字,字符的笔划组成和结构多种多样,这样在鉴别时提取字符特定部 位和特殊笔划的特征就比较困难。另外,从特征的稳定性考虑,笔迹在人一 生中的变化也大于指纹和脸像的变化,这也是笔迹鉴别很难的原因之一。当 然,人脸识别也有视角和表情不同带来的困难。在当今的社会生活中,指纹 鉴别系统已经进入实用,而人脸识别和笔迹鉴别问题尚未完全解决,这基本 上反映了三个问题的难度对比。 1 2 3 笔迹鉴别方法的分类 计算机笔迹鉴别按取样的方式主要分为在线( o n 1 i n e ) 和离线( o f f - l i n e ) 两类。离线笔迹鉴别的对象是写在纸上的字符,通过扫描仪和摄像机转化为 计算机能处理的信号;而在线的笔迹鉴别则通过专用的数字板或数字仪实时 地采集书写信号,它不仅可以采集到笔迹序列并转化成图像,而且可以记录 书写的压力、速度等信息,可为笔迹鉴别提供更为丰富的信息。因此与在线 识别相比,离线识别的难度较大,是我课题主要研究的对象。 计算机笔迹鉴别根据考察的对象和提取特征的方法可以分为两大类:文 本独立( t e x ti n d e p e n d e n t ) 方法和文本依存( t e x td e p e n d e n t ) 方法一j 。文本 独立的特征是从大量字符集中提取的,这里面的特征也有两类。一类是文本 的布局和排版特征( 行间、字间距等) ,另类是字符的大致形态( 圆形、 1 2 武汉理工大学硕士学位论文 扁形、长形) 、字位倾斜( 直立、偏左、偏右) 、笔划方向等,通过多数字符 的统计平均得到。文本依存方法从检验笔迹和参考笔迹中选择相同的单字 ( 称为特征字) 进行比较。因为是在相同字的基础上进行鉴别,因而提取的 笔迹特征是依赖于字符类别,也就是说依赖于文本内容的。与文本独立方法 相比,文本依存方法可以提取更多的反映书写风格的特征,除了上面提到的 字形、字位、笔划方向分布,还有笔划搭配、部首搭配、笔划形态( 起收笔、 曲率、转折等) 。此外,还可以直接用模板( 特征图像、子图像等) 匹配的 方法进行比较。文本依存方法可以提取更多的特征,允许对字符进行细致深 入的分析,因而可以得到比文本独立方法更高的鉴别率和可靠性。 1 2 3 t 文本独立方法 文本独立特征反映了一个人书写的布局特征和整篇节奏或大致形态、方 位等。特征提取的方法有变换法和直方图法。前者包括f o u r i e r 变换、w a l s h 变换、自相关等,后者包括游程直方图、笔段直方图等。 变换法( 谱分析法) 一幅图像的纹理基本上反映了一个人的书写风格,这种基本上与文本内 容无关的总体特征可以通过图像信号的频谱反映出来。 文献 1 0 】介绍了f o u r i e r 变换和自相关法在提取特征中的应用,在此基础 上的笔迹鉴别实验得到了较好的识别率。其方法如下:计算文件二值图像的 f o u r i e r 功率谱,用区域平均、l e g e n d r e 多项式或余弦函数拟合的方法对功率 谱系数进行数据压缩得到特征矢量。自相关法是计算图像的自相关值,取位 移较小的1 6 1 6 个值作为特征。用2 0 个人书写的8 0 0 ( 2 0 x 4 0 ) 份笔迹进行 了试验,用最小距离分类,平均识别率为9 0 ,其中自相关法的平均识别率 达9 5 。当自相关系数仅取1 6 个值时,识别率也达9 3 。 游程直方图法 文献 1 1 对笔迹图像进行水平方向和垂直方向扫描,计算白象素链游程 直方图,该直方图基本反映了书写整体特征。用水平游程直方图的差的绝对 值作为距离度量,同一人笔迹的距离归一化到1 0 0 ,则发现不同人笔迹之间 的最小距

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论