已阅读5页,还剩90页未读, 继续免费阅读
(机械制造及其自动化专业论文)基于笔迹的身份鉴别技术.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 笔迹鉴别是通过分析手写笔迹的书写风格来判断手写人身份的一门技术。随着应用 领域的不断扩展,笔迹鉴别技术已成为计算机视觉和模式识别领域一个十分活跃的研究 课题。本文研究目的主要是为计算机笔迹鉴别中涉及到的各种主要算法和技术进行有效 性分析和实现,为计算机笔迹鉴别系统的实现提供技术支持,推动笔迹鉴别自动化的进 程。主要研究内容如下: 1 ) 研究了笔迹图像预处理方法,主要包括对鉴别图像进行平滑去噪、二值化、倾 斜校_ j _ f 、行字切割、归一化以及细化等。本文给出一整套笔迹预处理算法,实验中取得 了良好效果。 2 ) 根据人对物体形状的整体感觉,提出了一种笔迹鉴别的形状特征法,利用矩表 示字符的形状特征并采用修正的街区距离来对特征字进行匹配。针对不同阶次和不同目 标的矩动态范围变化大导致不利于匹配的问题,提出了矩特征的归一化方法。实验表明 该方法具有对字符大小、位置和笔划厚度的不变性,因而很适合文本相关的笔迹鉴别。 本文还提出了利用改进的h i l d i t e h 细化算法提取端点、三交叉点和拐点等特征点,进行 笔迹鉴别的方法。这种方法不仅对特征字能有效的进行骨架提取并且能提高算法速度。 3 ) 将笔迹视为纹理图像,利用纹理分析的方法提取其纹理特征是目前笔迹鉴别研 究的热点。本文讨论了纹理分析的基本知识和常用方法,提出了一种基于g a b o r 滤波器 的笔迹鉴别算法。该算法与文本内容无关,避免了对笔迹文字进行分割的操作,符合笔 迹鉴别的习惯。该算法可提取表示每一个通道的书写人笔迹风格的特征向量一均值和方 差,它们表征每个通道笔迹图像纹理特征的重要信息。小波变换是一种纹理分析方法, 它具有良好的时频局部化、尺度变换和方向特征,更类似于人类视觉系统,己成为纹理 分析的一个有力的工具。本文用h a a r 小波对笔迹图像进行多分辨率分析,用小波系数 来表征笔迹图像的特征向量,文中定义了2 4 维的特征向量进行笔迹鉴别,达到了较好 的效果。另外,本文讨论了一种基于小波包最好基的特征提取方法,该方法在二维空间 上由h a a r 小波包基对笔迹纹理实施3 尺度小波包分解,在由香农熵为代价函数提取到 的1 2 个小波包最好基处对分解系数实行重构,用重构系数作为鉴别的特征,实验证明 这种办法具有纹理自适应匹配的能力。进一步,我们提出了一种基于多进制小波分析的 笔迹鉴别的构想。 4 ) 综合多种特征进行决策级的信息融合,进一步提高了笔迹鉴别的精度。指出实 用的笔迹鉴别系统需要文检专家的参与和最终判决。 最后为了f 确评价算法和特征的有效性,本文利用v i s u a lc + + 6 0 与m a t l a b 编程 工具实现。 关键词:笔迹鉴别图像处理小波变换特征提取信息融合 i i a b s t r a c t w r i t e ri d e n t i f i c a t i o n ( w i ) i sat e c h n i q u et h a ta i m st od e c i d et h ei d e n t i t yo fw r i t e r s a c c o r d i n g t ot h e h a n d w r i t i n gs t y l e s w i t l l t h e i m p r o v e m e n to fa p p l i e d f i e l d w r i t e r i d e n t i f i c a t i o nb e c o m e sav e r ya c t i v ea r e ao fc o m p u t e rv i s i o na n dp a t t e m r e c o g n i t i o n t h e m a i n p u r p o s e o ft h i sr e s e a r c hi s r e a l i z i n g m a i n a l g o r i t h ma n dt e c h n o l o g y w h i c h c o m p u t e r a i d e dh a n d w r i t i n g i si n v o l v e da n do f f e r i n gt e c h n i c a ls u p p o r tf o rc o m p u t e r h a n d w r i t i n gi d e n t i f i c a t i o ns y s t e m f u r t h e rp r o m o t i n gt h ep r o c e s so fh a n d w r i t i n ga u t o m a t i o n t h em a i nc o n t e n t so f t h i st h e s i sa r ea sf o l l o w s : 1 ) 1 1 1 ep r e p r o c e s so fh a n d w r i t i n ga r ed i s c u s s e d i tm a i n l yi n c l u d eg e e i n gr i do fn o i s e , i m a g eb i n a r y , i m a g ei n c l i n er e c t i f y , i m a g ei n c i s e ,i m a g es t a n d a r d i z ea n di m a g et h i n n i n g a s e r i e so fp r e p r o c e s sa l g o r i t h m sa r ep r o p o s e di nt h i sp a p e r , w h i c hm a k eg o o de f f e c ti nt h e e x p e r i m e n t 2 ) a c c o r d i n gt oh u m a n sf e e lo no b j e c t ss h a p e ,aa l g o r i t h mb a s e do nm o m e n tf o rw r i t e r i d e n t i f i c a t i o ni sp r e s e n t e d ,o fw h i c ht h em a t c h i n gf u n c t i o ni sm o d i f i c a t o r yb l o c kd i s t a n c e r i m i n ga tl a r g ed y n a s t i cr a n g eo fv a r i o u sm o m e n t s ,w eg i v ean o r m a l i z a t i o nm e t h o di nt h i s t h e s i s t h e e x p e r i m e n t sd e n o t e dt h a t t h i sm e t h o dw a sn o ts e n s i t i v eo nt h ec h a r a c t e r s s i z e ,p o s i t i o n ,a n dt h ed e p t ho fs t r o k e ,s oi ti sc o m p a t i b l ef o rt h et e x t d e p e n d e dh a n d w r i t i n g i d e n t i f i c a t i o n t h ea u t h o rp r o p o s e dam e t h o do fe x t r a c t i n gt h ec h a r a c t e r i s t i c ,s u c ha se x t r e m e p o i n t ,t h r e ei n t e r s e c t sa n df l e xp o i n t st od i f f e r e n t i a t et h ew r i t e r s ,w h i c hm a k i n gr i s eo fa l l a d v a n c e dh i l d i t c ht h i n n i n ga l g o r i t h m s n l em e a s u r e m e n tc a ne x t r a c tt h es k e l e t o no fc h a r a c t e r v a l i d l y , a n di tc a na c c e l e r a t et h ea r i t h m e t i c 3 ) t e x t u r ea n a l y s i si sah o ta p p r o a c hi na u t o m a t i ch a n d w r i t i n g - b a s e dw r i t e ri d e n t i f i c a t i o n i nt h i sp a p e r , b a s i ck n o w l e d g ea n dc o m m o nm e t h o d so ft e x t u r ea n a l y s i sa r ei n t r o d u c e da n da n a d v a n c e da l g o r i t h mu s i n gg a b o rf i l t e rt oe x t r a c tt e x t u r ef e a t u r e si sp r e s e n t e d t h i sa r i t h m e t i c i sat e x ti n d e p e n d e n tm e t h o d s ow en e e dn o ts e g m e n tt h eh a n d w r i t i n gt e x t t h ea r i t h m e t i c d e n o t e st h em e a na n ds t a n d a r dd e v i a t i o no fe a c hc h a n n e l w a v e l e tt r a n s f o r r ni sak i n do f t e x t u r ea n a l y s i sm e t h o d ,i th a sf a v o r a b l et i m e f r e q u e n c yl o c a l i z a t i o n , s c a l et r a n s f o r ma n d d i r e c t i o nc h a r a c t e r i s t i c ,a n di th a sb e e nac o n v i n c i n gt o o lf o rt e x t u r ea n a l y s i sa si tc a na d a p t m o r t a ls e e i n gs y s t e mm u c he a s i l y w eu s eh a a rw a v e l e tt od om u f t i r e s o l u t i o na n a l y s i so nt h e h a n d w r i t i n gi m a g e ,a n dg e tt h ee i g e n v e c t o r so fh a n d w r i t i n gi m a g e 砸也w a v e l e tc o e f f i c i e n t s t h et h e s i sd e f i n e sa n2 4 一d i m e n s i o ne i g e n v e c t o rt oi d e n t i f yt h ew r i t e r s ,a n dg a i n e dp r e f e r a b l e i i i e f f e c t i na d d i t i o n a2 一dw a v e l e tp a c k e tb e s tb a s i sc h a r a c t e r i s t i ce x t r a c t i o nm e t h o di s d i s c u s s e d ,t h em e t h o dd i r e c t l ye x e c u t e sw a v e l e tp a c k e td e c o m p o s i t i o no f h a n d w r i t i n gt e x t u r e u s i n gw a v e l e tp a c k e tb a s i sh a a ra ts c a l i n g3i n3 ds p a c e ,t h e nr e c o n s t r u c t st h ed e c o m p o s i t i o n c o e f f i c i e n to f1 2w a v e l e tp a c k e tb a s i sw h i c ha r et o o kb ys h a n n o ne n t r o p yc o s tf u n c t i o n , t h e nm a k eu s eo ft h er e c o n s t r u c tc o e f f i c i e n tt oc o m p o s et h ee i g e n v e c t o ro fh a n d w r i t i n g i d e n t i f i c a t i o n i th a sb e e np r o v e dt h a tt h em e t h o dh a st h ea d a p t i v ec a p a b i l i t yt om a t c ht h e t e x t u r e f u r t h e r , w e 酉v ea l li d e ab a s e do nm u l t i b a n dw a v e l e tf o fw r i t e ri d e n t i f i c a t i o n 4 ) d e c i s i o nb a s e di n f o r m a t i o nf u s i o ni si n t r o d u c e dt oc o m p r e h e n s i v em u l t i f o r m f e a t u r e s ,a n dt h ep r e c i s i o no fh a n d w r i t i n gi d e n t i f i c a t i o ni sh e i g h t e n e d i ti sp o i n t e do u tt h a ta n a p p l i c a b l ec o m p u t e rw is y s t e mi sh u m a n - c o m p u t e ri n t e r a c t i v ea n df i n a ld e c i d e db yh u m a n e x p e r t s i nt h ee n d ,f o rt h ec o r r e c t l ye s t i m a t i n gt h ev a l i d i t yo fa l g o r i t h ma n df e a t u r e s ,t h i sp a p e r m a k e su s eo f v i s u a lc + + 6 0a n dm a t l a bp r o g r a m m i n gt o o lt or e a l i z e k e yw o r d s : w r i t e ri d e n t i f i c a t i o n f e a t u r ee x t r a c t i o n i m a g ep r o c e s s i n g w a v e l e tt r a n s f o r m i n f o l i l l a t i o i lf u s i o n 独创性声明 本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得 的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中 不包括其他人已经发表或撰写过的研究成果,也不包含为获得河南工业大 学或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对 本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。 论文作者签名:蕴尘! 怨日期:筮:兰翌 关于论文使用授权的说明 本人完全了解河南工业大学有关保留、使用学位论文的规定,即: 学校有权保留送交论文的复印件,允许论文被查阅和借阅;本人授权河 南工业大学可以将学位论文的全部或部分内容编入有关数据库进行检 索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。( 保 密的论文在解密后应遵守此规定) 论文作者签名: 彝尘:也日期:趁墨挈 导师签名: i l f l 宁t 鹾 日期:! ! 垒f ! 刍塑 基于笔迹的身份鉴别技术 第一章绪论 随着信息科技的发展,人们的生活方式发生了根本的变革,凭借记载个人信息的卡 片、指纹、虹膜等认证信息,人们可以很方便的跨地域实时进行各种社会活动。然而, 由于对这种身份认证手段的过分依赖,身份的误判、拒判所造成的损失也与同俱增。如 何准确、稳定的鉴别一个人的身份已是一个十分紧迫的问题。由于笔迹特征相对其它生 物特征具有一系列的优点,基于笔迹的身份鉴别技术引起了国内外学术界和企业界的极 大关注,具有很好的发展前景。 1 1 笔迹鉴别的意义 笔迹具有唯一性、稳定性、可采集性、获取的非侵犯性等优点,笔迹是书写者自身 的生理特点和后天学习过程的综合反映。基于笔迹的内在特点,它已成为人们进行身份 鉴别的重要手段之一。笔迹鉴别技术本身可以广泛应用于公安、司法、考古、金融、电 子商务等领域。如公安、司法部门的刑事调查和法庭审判、金融、财会部门的签名对照, 海关护照持有人身份的验证,计算机终端访问人的认定,仓库保管员身份的证实,等等。 在刑事调查中,笔迹是一种重要的犯罪证据,笔迹鉴定是寻找和确认罪犯的重要手段, 匿名信、反动传单、标语书写人的调查等往往都是通过笔迹鉴别实现的。在金融领域, 信用卡的使用要求持卡人当场签字,并与卡上预留的签名进行对照,判断是否为同一个 人所写,从而接受或拒绝使用。在现代司法制度中,物证技术签定制度是一项最具有威 力的武器,在经济纠纷等民事案件中已越来越多地借助物证技术鉴定,而笔迹鉴定则是 物证鉴定的一个重要组成部分。在现有的技术条件下,如果能够摆脱书写内容的限制, 对笔迹进行高准确率、高效率的鉴别,那么笔迹鉴别将进入一个新纪元。随着计算机技 术和网络技术的发展与普及,笔迹鉴别技术的应用领域更为宽广,对可靠的笔迹鉴别技 术的需求也更加迫切。当今我国经济飞速发展,国际交往日益频繁,在金融界和政府界 有各种各样的协议书、合同、法规及支票等都需要当事人的签名,假如签名被模仿或伪 造,将造成严重的社会后果和巨大的经济损失,甚至会破坏整个金融秩序和社会安定。 因此,对笔迹进行可靠、有效、快速的鉴定具有重要的社会价值和实用意义。 因此,笔迹鉴别作为人工智能的范畴,其不论是社会应用上,还是工程和科研上都 具有深远的意义,对其进行研究是十分必要的。 河南- l 业人学硕士学位论文 l + 2 薹- 手生憋特薤的隽狳鉴别技寒撬述 所谓生物特征身份鉴别技术是指利用人体所固宵的生理特征戚行为特征来进行身 份鉴定。生理特征与生俱朱,多为先天性的。行为特征则是习惯便然,多为后天性的。 生理帮季亍为姆锰统豫为生携特薤。霉蠲瓣生兹特 歪惫旗摇绞、掌纹、虹罐、验豫、声音、 步态、笔迹等。主要应用予安全保密、认证防伪、电子商务、考勤髓录、刑事僚破等场 合。 巅曩生甥掌荽 歪寒鉴定鸯徐鲍援点是生物特征不会丢失、遗忘,著曼缀难镑逡。一般 说来能够臻来鉴别身份酌生物特征应该爨有以下的特点: 1 ) 广泛性:每个人都应具有这种特征; 2 ) 唯一瞧:每个人拥商的特征应备不相同: 3 ) 稳定被:所选择静特征应不随辩阉发生交讫; 4 ) 可采集性:所选择的特征应便于测量。 在实际的应用系统中,对基于生物特征的身份撩别系统还有以下的要求: 1 ) 淫戆瓣要衷:襞选择懿垒穆统 特薤戆够达爨多意静识爨攀,对于资源麓要求 如何,识别的效率如何; 2 ) 可接激性:使用者在多大程度上愿意接受基于所选择的生物统计特征的系统: 3 ) 安全瞧戆:系统楚露l 够防壹羧攻壹:是否爨骞辕关豹、霹薅夔疆究鸳最乍为 技术支持; 4 ) 可实用性:提取的特征是否占商较小的存储窳间;价格是否为用户所接受;是 否具有较高黪谈别速度;怒覆其有菲侵强j 睦嘲。 尽管生物特征多辩多样,但是每一静生物特征都露其伉缺点鞠瘫蔼范嚣,迄今为止, 还没有一个单生物特征能宓现完美无错的识别系统。比如:有些人的指纹无法提取特征, 患自内障的人虹膜会发生变化,在不同的成长阶段和不同的环境中,人们的语鸯往往会 有缀大戆差羚等等。在对安全有严穆要求懿瘟震矮躐中,天餐茬缓融合多生纺褥缝来实 现高精度的识别系统。数据融合是一种通过集成多知识源的信息和不同专家的意见以产 生一个决策的方法。将数据融合方法用于身份鉴别,结合多种生理和行为特征逃行身份 鉴嗣,握裹蘩裂系统戆壤发蠢可靠蛙,燹疑是身份羹翻领域发疑戆登然f l l 。 1 3 笔迹鉴别的概念及姆相关领域的关系 笔迹鉴爨( h a n d x v i f i n gi d e n t i f i c a t i o n ) 羲是逶过分摄、l 较手写笔迹懿风格窃薅薤 来确定书写誊的身份的一门科学和技术鸭它是人体生物特征辨识的有效方法之一。笔 2 基于笔迹的身份鉴别技术 逑鉴剐中黪鸯份裁甑枣懿静方式:一移楚直接比较、分援嚣傍手写笔迹,剿努玄靛是否 是同一入的手笔:另一种怒从多人笔避样本( 简称样本) 中找出与检验笔迹( 简称检材) 笔迹特征最接近的笔迹样本。前一种方式称为验证( v e r i f i c a t i o n ) ,后一种方式称为鉴 别或识别( r e c o g n i t i o n ) 。笔迹鉴别中锻设参考文传戆书写者身份己熟,从藤可以通过 笔迹特征的比较、分析采确定检验笔迹的书写者身份i 4 j 。 签名也炽一类非常重鬻的笔迹信号。鉴于签名柱寮全应用中的重要地位和臌用普遍 性,学术晃谯捷把基于觞名的身份鉴别和基于正常文本的身份鉴别区别开来,前者称为 签名验涯,麓者称为书譬入签裁,因藏,笔迹签爰鸯嚣耱不嗣豹菠薅。广义地说,笔迹 鉴别就是利用手写笔迹的身份鉴别;狭义的说,笔迹髅别是利用手写文本( 不包括签名) 的身份鉴别。在本文中谈到的笔迹鉴别郯指狭义的范畴,即基于手舄文本的书写人鉴别。 笔迹鍪蹋与字舞识剩在本矮上帮瓣豹主黎是不阏戆,蓑者愚瓣蘑警写内磐瓣誊: 澍, 而后者是对书写个性的识别,因而所依据的特征和剡据不同,字符识别是把具体的字符 信号( 图像藏书写过程) 与一个抽象的符号( 文字类别) 联系起来,而笔迹鉴别是把字 符售号与入瓣赛蹬( 书写蠹 联系起来。我锯可以将笔迹中癀食瓣售崽分为语义痿惠 ( s e m a n t i ci n f o r m a t i o n ) 粒奇异信息( s i n g u l a ri n f o r m a t i o n ) 。语义信息是文字的字面上 的意义,是一种语言属性,而奇异信息则反映字符的书写风格,对应书写人的身份。因 此可以说,字符识别的目的是提取字纷的语义信息,露接除或减少奇异信息的影睫;嘛 笔迹签羽浆嚣豹赠是摄取字符静奇雾僚患,蠢耨豫竣减少语义信戆觞于挠。毽它们两者 在笔迹信号预处理、特征提取、匹配等环节都采用了类似的技术f 5 i 。 1 4 笔迹鉴别的分类 计算机壤迹鉴别主要分为在线( o n 1 i n e ) 和离线( o f f - l i n e ) 两类【6 1 。离线滚迹鉴别 的对象是写襁纸上的字符,通过扫描仪和摄像机转化为计算机能处理的信号;两在线的 笔迹鏊裂瑟 j 逶遂专矮赘数寥叛或数字纹实薅采集书麓信号,它不搜可黻采集到楚迹痔歹l 并转化成图像,而且可以配录书写的臌力、速度等倍息,可为笔嬷鉴别提供更丰富的信 息。 笔迹签澍戆方法投攥繇考察戆辩蒙和提取的姆经霹分为嚣大类:文零狻立( t e x t i n d e p e n d e n t ) 方法和文本依存( t e x td e p e n d e m ) 方法f 1 1 。文本独立方法从大量字符集提 取与字符类别无关的特征。这里面的特征也有两类。一类是文本的布局和排版特征( 行 阍、字闻距镣) ,另一类怒字德的大致形态( 强形、扇形、长形) 、字位颇斜( 懑立、馕 左、穰右) 、麓翻方向等,通过多数字符熬统诗平均得巍。文本依存方法扶检验笔迹和 参考笔迹中选择相同的单字( 称为特锻字) 进行比较,这种方法可以提取更多的特征, 3 河南l 一业人学硕士学位论文 除了上面提到的字形、字位、笔划方向分布,还有笔划搭配、部首搭配、笔划形态( 起 收笔、曲率、转折等) 。此外,还可以直接用模板( 特征图像、子图像等) 匹配的方法 进行比较。与文本独立方法相比,文本依存方法可以对字符形状和书写风格进行深入的 分析,因此可以得到更高的鉴别率和可靠性。 1 5 笔迹鉴别的原理及可行性 要实现一个高质量的笔迹鉴别系统,首先要对笔迹的特点进行全面的把握,从笔迹 样本中找出最能反映不同书写者个性特点的一组特征向量,用经过优化选择后的特征向 量作为计算机笔迹鉴别的依据,存入特征数据库。之后的工作就属于典型的模式识别问 题,当我们需要对一幅笔迹进行鉴定时,提取同样的特征向量与特征数据库中的不同书 写者的特征向量进行比较,从而在一定范围内确定样本笔迹的书写者,然后再结合笔迹 攀别专家的意见给出鉴别结果。因此可以认为笔迹鉴别的关键问题是寻找一种从模式空 间( 笔迹空间) 到类空间( 书写者空间) 多对一的映射关系,如图1 1 所示【8 j 【9 j : 模式空间特征空间( 1 )特征空间( 2 )类空间 图卜1 笔迹鉴别原理 由上图可以看出,各个类的笔迹模式在模式空间中具有很大的随机性,难于聚类。 提取对分类有效的特征形成特征空间是笔迹鉴别的关键。人们往往通过一定手段使各模 式在特征空间中重新排列,实现更好的聚类。从模式空间到特征空间( 1 ) ,再到特征空 间( 2 ) ,就是特征模式的重组与提取过程。 笔迹鉴别之所以能成为- - f 3 学科,是因为它有自己稳定的研究对象,有专门的实践 领域,有科学的检验方法。笔迹鉴定的科学性和可行性,已被长期的实践所证明。笔 迹能够充分、客观地反映书写习惯。书写习惯如同人的工作、生活习惯一样,一经形成 是不容易改变的,书写习惯通过书写活动表现为笔迹。研究笔迹及其所呈现的变化,可 以研究人的书写习惯及其发展演变,而书写习惯在长期的发展演变中,虽然会产生自身 基于笔迹的身份鉴别技术 的差异,但具有相对稳定性,基本特征保持不变,它是书写者自身的生理特点和后天学 习过程的综合反映。同时,由于笔迹又表现出比较明显的个体差异性,笔迹虽然比较容 易伪造,但是有一些细节的特征却是极难模仿的,经过特殊训练的文检人员还是能够对 其进行正确的鉴别。因此笔迹的相对稳定性和个体差异性特征是笔迹鉴别的基本条件, 只要客观地、科学地认识笔迹的基本属性,掌握笔迹伪装变化的一般规律、笔迹自身演 变的规律以及笔迹特征价值的规律,笔迹鉴别这一研究的可行性是可以保证的。在具体 的研究中,可采用抽取多样本、多特征等方法,提高其鉴别可靠性。随着笔迹采集设备 的不断进步,笔迹鉴别水平日益提高,有些技术已经达到实用水平而进入市场,如签名 识别系统等。 1 6 笔迹鉴别的过程 在刑事案件的调查取证分析中,笔迹鉴别主要分为几个阶段【1 0 i 。首先要受理由委托 方提供的含有犯罪嫌疑人笔迹的检材,然后通过各种手段获取犯罪嫌疑人的笔迹样本, 作为确定作案人的重要参考。文检人员通过自己的知识和经验判断作为重要证据材料的 笔迹是正常笔迹还是伪装笔迹,然后在检材和样本中分别选取一定的特征字或者特征笔 划,比较二者在起笔运笔、书写形状、笔划搭配等方面的异同,做成特征比对表,分析 各特征的价值并充分考虑犯罪嫌疑人的文化背景、心理意图以及作案时的具体环境等因 素作出最终判别。由以上的过程我们可以看出,笔迹鉴别是一项非常复杂和细致的劳动, 笔迹鉴别的每个过程对文检专家的知识和经验都有很高的要求,没有专业训练的人是无 法胜任的。而且由人工专家去完成全部的笔迹鉴别工作时容易受文检人员的知识、经验、 心理、环境等主观因素的影响,对同样的笔迹检材和样本,不同文检专家的鉴别结果也 总是有差异的。当犯罪嫌疑人很多时,选取特征字以及制作比对表等更是一项艰苦的劳 动,在计算机信息技术高度发达的今天,在不影响鉴别的准确性的前提下,如何用计算 机去代替人们的劳动,提高笔迹鉴别的效率是一项亟待解决的技术。这需要我们充分了 解人工智能技术的发展现状,利用计算机使用方便、处理速度快、不易受环境影响的特 点,在技术水平和代价允许的范围内尽量用计算机完成更多的智能活动。在笔迹鉴别这 一研究领域中,可以利用计算机将检验笔迹与所有参考笔迹进行比较,计算笔迹特征相 似度,然后按相似度大小对嫌疑人进行排队,判定相似度最大者为检验笔迹书写人,或 保留部分相似度较大的嫌疑人作为重点嫌疑对象,然后再由人工专家进行分析认定。在 计算机笔迹鉴别系统中,主要的工作过程也可以分为明显的几个阶段,首先是笔迹材料 的获取,这可以通过扫描仪、摄像机等多种图像输入设备完成,接下来要对获取到的图 像进行预处理,进行整理加工、去伪存真、强化有用信息等工作,然后要从图像中抽取 河南j 业火学硕士学位论文 我蜘感兴趣毂、对鉴别缝鬃最毒徐篷黪姆,压【l l l ,著逡 予特征豹毒效裘达与表述,羧豢褥 到的特征向黧,选取合适的方法,进行决策和判别。熬个计算机笔迹鉴别系统的流程如 图1 2 所示。将计算机引入镰迹鉴别系统也有助于实现笔迹文件的检索、修改、增删等 嚣理,可以记录更全蘑的狐嚣嫌疑人倍怠,尤其是在辅终鼓术只羹发震鲍今天,可以方 便的实现 亍韭薄围内的资源共享,瓿丽大大克服人工镳渣鉴别豹缺点。然丽,入的智能 远远超过了机器的智能,我们无法用计算机去全面代替人类的活动,利用人和计算机各 目的优势和不足,为开发囊人机结合盼计算机笔迹撩别系统进行窍效的探索,弧是本 文豹簪 究蠹咎。 笔迹榉本 霆黧恒 设备( 扫播0 喇图像颈处瓒 仪缀像梳) | o 一 提取样本笔 避梅征 喜鬻一卜屯竺生h 竺皇竺篓h 竺孳竺步分析l l j l j l t 笔迹稔材 霎淼恒 设备 扫描r 1 删辫 强姆糍 仪摄像机) i 捷墩禳迹 特征 黼 一2 毒算橇撼缝篷裂系统的算法流程窝 笔迹特征 数据库 1 7 笔迹鉴别的研究现状 经遥多年瓣探索,国斑终豹专家黠笔迹签巍授术泌经有了一定豹研究,下搿扶提取 锻迹特征的两大类别的角度对目前的研究状况进行简单的介绍。 l + 7 1 文本狻鼗穷法 文本独立特征反映了个人书写文零的布局特征和大致形态、方位等。特征提取的 方法有变换法和直方图法【2 1 。由于在以下介绍的几种方法中有不少用到了纹理分析的思 憋,在越走对纹理的壤念送行麓单熬巍羁,在论文豹第蘸牵会霹绞遴分叛方法迸纾受深 入的介绍。在图像分析中,纹理可以描述为局部呈现不规则性而在宏观上又呈现娃j 一定 规律性的特性【i “。在笔迹鉴别中,我们也可以认为纹理怒笔迹像素值程空间的变化模式。 纹理基本上反映了一个人的书写风格,这藿申风格基本上是与文本内涔无关的恩体特 正。 6 基于笔迹的身份鉴别技术 1 7 1 1f o u r i e r 变换和自相关法j j 自相关法犹如两幅重叠的图像,上层图像是透明的,当上层图像沿着某个方向移动 时,这两幅图像重叠面积随移动距离增加而减少。自相关函数的参数分布与纹理基元的 大小和排列的方式相对应,当纹理基元较小时,随着两幅笔迹图像位移的增大,系数f 降得较快;当纹理基元较大时,随着位移的增大,系数下降得慢。如果纹理基元为有规 律的周期性排列,自相关系数随着两幅图像位移的增大也呈现周期性的衰减趋势,自相 关系数在频率域的伸展方向与空间域纹理基元的伸展方向是一致的。通过自相关函数的 f o u r i e r 变换可以得到数字图像的功率谱p ( “,v ) = i f ( u ,v ) 1 2 ,e ( u ,v ) 在复频域的大小和 方向与纹理基元的形状和排列规则有关,可以将p 似,v ) 转换成极坐标形式p ( r ,口) ,并在 此基础上统计不同频率幅值和方向的能量p ( r ) 和p ( 口) ,它们分别反映了纹理的基元形 状和排列的方向特性。对于粗的纹理,p ( ,) 低频分量较多,对于细的纹理,p ( r ) 高频 分量较多,而p ( o ) 的伸展方向对应纹理振荡波的伸展方向,与图像中的边缘方向垂直。 我们可以根据这样的特点进行来鉴别不同人的手写笔迹。 1 7 1 2 灰度游程长度直方图法 游程是图像中某一方向上具有同一灰度级或者灰度范围的连续像素集,是图像灰度 关系的高阶统计,在图像分析中,可以统计方向为口上的游程长度,得到游程长度矩阵 e o ( i ,) ,其中i 为灰度级,为游程长度,可以从游程长度矩阵g ( i ,) 中派生出一系列 的参数特征,如短游程优势、长游程优势、游程长度不一致性、灰度不一致性、游程百 分比等等。用这种方法进行笔迹鉴别时,可以对笔迹图像进行水平方向和垂直方向扫描, 计算白像素链游程长度直方图,从中提取特征参数进行鉴别,文献【h 峙艮道有较好的鉴别 效果。 1 7 1 3 笔段长度直方图法 该方法将每份笔迹图像分割成4 幅子图像。图像经细化后断开所有交叉点,成为巨 不相连的笔段。把笔段量化到8 个方向,然后对每个方向上的笔段长度进行直方图统计。 每个方向上的笔段长度取1 6 个值,这样直方图有8 1 6 = 1 2 8 个数据。对每个方向上1 6 个数据压缩到3 维,这样特征总共为8 3 = 2 4 维。再用不同的方法进行分类,识别率最 高达到9 6 3 1 5 1 。 1 7 1 4 多通道分解和匹配 字符图像的多通道分解是纹理分析的一种重要方法,多通道分解的结果是一种空问 7 河南上业大学硕十学位论文 域空闻凝域戆联合表示,这耱处理积表示夔器理接邋入移动锈孚麓疆赏专孛经元貔功瑟。 阁像的多通j i 妻分解是把图像分解成不同频带和方向的予图像,然后分别从各个子图像中 提取特征、进行分解或编码。g a b o r 变换和小波变换作为一种多通邋分解方法,非常适 会绞理分聿斤闻题,露为纹避跫一静有娥捧救灰度分东,矮有摄强的频率特性。如在图像 辅频域表示串,褪豹纹理辩应低频戒分,丽纹理承撵到方向也与颧域参数麓粹袋方向垂 赢,不同的纹理对应不同的频率和方向。通过g a b o r 变换和小波变换,使不同的纹理信 号分布在不同的频带,从而便于纹理分类,或者从中褥到纹理的结构信息。文献【l 哪选取 1 7 令人鳇笔逮,逶j 童g a b o r 滤波嚣撵毅特 歪篷,爱款式距离法遥抒分类,对于中文笔 j c 【! 识别达到了较高的水平。该方法对字符进行方向分解和频带分解,再用分解信号作为 镶迹特征,它最大的优点在于可以不限定汉字,大大提高了算法的适用范围和邋用性。 l 。7 2 文本依存方法 文本依存方法是从检材和样本中提取相同的特征字符进行鉴别,相对于文本独立特 征来澄,可玖堤取更丰富鲍信息,在实曝应用中也更嬲有效。文本依存特惩也可隧通过 疆交变换帮赢方图方法提取,此岁 ,文本依存方法还礴高阶相关法、弧模式频率法、标 准模板变形法、方向指数赢方图法等。 l 。7 2 。1 毫除撩关法 s l 该方法计算字符图像的一阶相关和两点连线上高阶相关函数作为笔迹特 正。对于二 值图像,相关鳓数的值表明镶迹图像中相隔一定距离的点之间的共存( 两个点都为黑点) 次数。袁遗稠荧瑟数篷意逡行港势解,爻了淡除字符笔怒犟疫霹援获蘧数篷戆影曝,还 嚣对谱分量避行归一化,进行特征向量的维数压缩看,求出两个特德字之间的距离,作 为笔迹相似程庶的度量。离阶相关法利用了笔划之间的相互关系特征,这种方法在一定 的榉本上鉴别率超过9 0 。德它们的特锻都是全局鲍,因此运算量嚣零大。 1 7 2 2 弧模式频率法 这种方法怒将不同长度、曲率和方向的圆弧分成2 ”个间隔,将弧上的2 “+ 1 个点与 经过二篷 乏蘑瓣笔渣藿豫鼷蒺酝,哭鸯警2 4 | 令患全部重台簿,该嚣嚣适配袋功。其 中月的个数决定了弧上匹配的点数( 也就是匹配的精魔) ,我们可以统计不同位鼹、曲 率和精度m = 0 ,l ,2 ) 的匹配成功的弧模式频率,归一化后作为笔迹撩别的特征。文献【4 l 对这秘方法遴行了改进,弧模式匹配不在暴字符图像上避行,恧在字蟹轮廓主遴行。这 裁要首次标出字符图像中的所有轮廓点,轮廓点是至少有一个四邻域点为白色的黑点, 基于笔迹的身份鉴别技术 并设定了6 7 种比较有代表性的弧模式,将字符图像点阵划分为2 x2 = 4 个子区域,四 个子区域的6 7 个弧模式类别的个数分别用一个阵列表示,置初值为0 ,对于一个弧模 式点阵,以每个轮廓点作为弧模式的起点,将相应的邻域子图像与弧模式匹配,若完全 符合,该弧模式类别的次数加1 ,其所在的1 4 子区域由弧模式的中心点决定,得到所 有的弧模式类别次数( 4 6 7 ) 后,得到2 6 8 维的特征向量,将其归一化作为特定书写 人的笔迹特征。 1 7 2 3 标准模板变形法 这种方法从字符相对标准模板的变形( 用像素位移表示) 中提取笔迹特征,文献【l 目 中将手写字符和标准模板点阵分成1 0 1 0 网格,在网格结点周围设定一个5 j 点的子 区域。将标准模板变形与手写字符尽量接近( 或反过来变形) ,接近的原则是使标准模 板和字符的对应子区域之间汉明距离最小。这样变形后得到各个子区域中心的位移共 1 0 0 个特征,经压缩后得到5 0 维特征向量;用b a y e s 方法或最小距离分类,对单个字 母的鉴别正确率为1 7 4 6 ( 字母复杂程度不同) ,利用9 个字母的组合得到鉴别率为 9 8 。如果我们直接用验材字与样本字进行匹配,而不是与标准原形匹配,这种方法就 可用于书写人和字符不定的情况。在匹配算法中可以考虑引如动态规划、松弛匹配等技 术。 1 7 2 4 矩特征法 4 1 8 1 反映不同人书写风格的字符笔迹特征有多各方面,其中字符的整体形状是一类重要 的笔迹特征,在计算机视觉和模式识别领域中广为应用的矩方法为我们提供了定量表示 形状特征的手段。矩是一种表示物体形状和进行不变性物体识别的重要方法,广泛应用 与飞行器辨识、物景匹配、纹理分割、字符识别等场合。在笔迹鉴别中,利用笔迹的相 对稳定性和个体差异性,用矩表示字符的形状特征( 如字符外形、字位倾斜、重心偏移 等) 可以比较有效地进行书写人鉴别。 1 7 2 5 方向指数直方图法1 1 9 j 方向指数是字符识别中常用的一种方法,这种方法根据笔划轮廓方向计算各个子区 域的方向直方图并经过空间平滑后作为鉴别的特征。因为特征是在子区域中计算的,它 相当于一种网格特征,因此这种方法可以看成是一种模板匹配。这种方法在确定字符图 像轮廓点的同时确定局部笔划的方向,然后将字符图像均匀划分为? 7 x 棚网格,计算每 个网格内四个方向上的轮廓点数,得到m x 脚个四维的直方图,再对该直方图在m m 网 格平面上进行空间平滑,平滑后对m x 聊网格进行采样获得一个特征向量,作为特征字 9 河南f 业大学硕士学位论文 之她的距离度爨。 1 7 2 6w i g n e r 分布 w i g n e r 分布表示的是图像的局部功率谱( 局部相关函数的f o u r i e r 变换) ,图像的 w i g n e r 分毒怒一耱空藤域窆闻频域懿袋会表示。瓷| 燕一讫盾字餮点薄翦w i g n e r 分布 作为笔迹特征进行特征字的比较。但w i g n e r 分布存在计算量大,对重复文字进行分割 的骚求高等问聪。根据经验,字符图像的频谱主要分布在水平、垂赢、左对角和右对角 翻拿方向上,嫠予这样戆鹣搴实,文献1 2 0 l 疑窭簿纯w i g n e r 憝笔迹臻尉方法。对秘一纯 后的笔迹图像上的每一点,计算水平、爨直、左对角和右对角四个方向上的局部相关, 然后对局部相关函数在空 】域进行平滑以降低分辨率和存储量,荐用f f t 计算功率谱 ( w i g n e r 分奄) ,用局部功攀谱的低频系数作为笔迹特征。该文对2 0 令人笔迹巾的单 字、5 个字结台、l o 令字络会、1 5 个字缀合、2 0 个掌结合翁 毒况分澍进 亍识翮,最大 的平均识别率达到1 0 0 ,这种方法的计辫量和存储量比较小,但只能对相同单字进行 比较。 1 7 3 各种笔遂濂剐方法的姥较与分析 对不同方法性能( 鉴别厩确率) 的比较,应考虑这么几个因素:算法复杂性、应用 便裂缝、样本数嚣襻本矮量、燕予挠蠖) 、霹理释( 鳞繇) 连、雄广瞧等l 引。综合起寒, 可以得出以下几点结论: ( 1 ) 文本独立方法和文本依存方法相比,后者的鉴别正确率要商褥多,但特征字的 选择蒸要人工予预,不适合大蘧基( 嫌疑人多) 应用。慈翥垂动纯穰度裹,若能徽到在 允许一定错误接受的条锌下旗本消除错误摊除,可用于大范围应嗣的粗分类。 ( 2 ) 文本依存方法中,对东方文字的嚣别率要比对两方文字的鉴别率高,因为东方 文字汉字结构笈杂,笔划多,键迹特征对字褥类别比较敏感,容易形成较多的书写风格。 ( 3 ) 基予多通遂分簇与强酝熬方法建一释绞瑾分褥静方法,把不阉人书写豹笔迹鹜 像当作不同的纹理看待,有助于挖掘更多的非直观意义上的特征,与其它方法相比,其 优瓣比较明显。 1 8 本文豹研究目的以及主要工作 从以上对笔迹鉴别技术的发展历史和研究现状的分析可以看出,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年新能源行业供应链风险分析与防范案例报告
- 企业业务流程改进辅助工具
- 企业员工培训计划制定框架工具
- 企业资产管理模板
- 农用地流转契约履约承诺函(7篇)
- 质量管理体系内审外审自查清单
- 客观评定事项保证承诺书(9篇)
- 《三角函数的图像与性质:高中数学教学设计》
- 户外活动安全防护责任承诺书(8篇)
- 家乡的风景写景篇8篇范文
- GB/T 12135-2025气瓶检验机构技术条件
- 销售心理培训课件
- 第2节 分式的运算教学设计-2025-2026学年初中数学沪教版上海七年级第一学期-沪教版上海2012
- 监狱结构化面试题库及答案
- 《传感器原理及应用》课件-第8章+光电效应及光电器件
- 统编版五年级语文上册第四单元拔尖测评卷(含答案)
- 2024正安县辅警招聘考试真题
- 宿管员基础知识培训内容课件
- 二十四节气知识竞赛考试试题与答案
- 医院强制报告制度培训课件
- 2026步步高六册同步物理必修3-第十章 1 电势能和电势
评论
0/150
提交评论