[硕士论文精品]签名鉴别技术_第1页
[硕士论文精品]签名鉴别技术_第2页
[硕士论文精品]签名鉴别技术_第3页
[硕士论文精品]签名鉴别技术_第4页
[硕士论文精品]签名鉴别技术_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要专业信息计算科学硕士生陈志城指导老师杨力华签名鉴别技术应用范围很广,是当前很受关注的研究领域。本文首先介绍了签名鉴别技术的历史、现状及其发展,同时对已有的鉴别技术的原理与方法进行了回顾与总结。构建了一个签名新的鉴别系统,包括数据采集、预处理、特征提取和鉴别决策等技术。在预处理阶段,通过实验,得到一套比较好的预处理方法。特征提取是整个系统的关键部分,经过多次实验,比较了形状特征、伪动态特征和纹理特征等,最后综合使用了这三种特征,同时由于每个签名图像提取的特征维数过高,会导致“维数灾难”,故考虑利用主成分分析法PCA降维。使用PCA降维后,得到了较低维数且更加有效的特征。在鉴别决策阶段,经过理论分析和多次实验比较,最终选择SVM作为分类器。最后引入了三个实验指标错误拒绝率、错误接受率、总正确率,综合评价签名鉴别方法的好坏。本文实现了一个离线签名系统,并在自己采集的小数据库上做了一些对比实验。实验结果表明,由于特征提取、降维方法选择得当,使得该系统的识别正确率从81提高到了84。该系统可具有一定的实用价值,但有一些不足之处,可进一步完善。关键词签名鉴别离线签名鉴别系统特征提取主成分分析法支持向量机姓名测试HTTP/WWWXINGMINGCESHIORGABSTRACTMAJORINFORMATIONANDCOMPUTATIONALSCIENCENAMECHELAZHICHENGSUPERVISORPROFYANGLIHUATHEWIDEAPPLICATIONOFSIGNATUREVERIFICATIONTECHNOLOGYATTRACTSMOREANDMOREPEOPLESATTENTIONINTHISPAPER,WEFIRSTINTRODUCETHEHISTORY,CURRENTSITUATIONANDDEVELOPMENTOFTHESIGNATUREVERIFICATIONTECHNOLOGYWEGIVEAREVIEWANDASUMMARIZATIONOFTHEPREVIOUSPRINCIPLESANDMETHODS,ANDTHENCONSTRUCTANEWSIGNATUREVERIFICATIONSYSTEM,MLUDINGDATAACQUISITION,PREPROEESSING,FEATUREEXTRACTIONANDIDENTIFICATIONOFDECISIONMAKINGINPREPROCESSINGPHASE,THROUGHTHEEXPERIMENTS,WEGETAGOODPREPROCESSMGMETHODSINCEFEATUREEXTRACTIONISAKEYPARTOFTHEWHOLESYSTEM,WEMAKESEVERALEXPERIMENTSTOCOMPARETHESHAPECHARACTERISTICS,PSEUDODYNAMICFEATURESANDTEXTUREFEATURES,ETCMOREOVER,SINCETHECHARACTERISTICSDIMENSIONSOFEACHSIGNATUREIMAGEEXTRACTIONISTOOHIGH,WHICHWOULDLEADTO”DIMENSIONDISASTER”,WECONSIDERUSINGPRINCIPALCOMPONENTANALYSISPCATOREDUCETHEDIMENSIONSWEOBTAINALOWERDIMENSIONANDMOREEFFECTIVEFEATUREBYUSINGPCAINTHEPHASEOFIDENTIFICATIONANDDECISIONMAKING,THROUGHTHEORETICALANALYSISANDASERIESOFEXPERIMENTS,WECHOSESUPPORTVECTORMACHINESVMASTHECLASSIFIERFINALLY,WEINTRODUCETHREEEXPERIMENTALINDEXFALSEREJECTIONRATE,FALSEACCEPTANCERATE,THETOTALACCURACY,TOGIVEACOMPREHENSIVEEVALUATIONOFOURSIGNATUREVERIFICATIONMETHODINTHISPAPER,WEIMPLEMENTANOFFLINESIGNATUREVERIFICATIONSYSTEM,ASWELLASCARRYINGOUTSOMECONTRASTEXPERIMENTSBASEDONASMALLDATABASEOFOURCOLLECTIONSOFSIGNATURESEXPERIMENTRESULTSSHOWSTHATASARESULTOFCHARACTERISTICSETRACTIONANDSUITABLEDIMENSIONALITYREDUCTIONMETHOD,THEACCURACYOFAUTHENTICATIONOFOURSYSTEMRISESFROM81TO84THESYSTEMHASCERTAINPRACTICALVALUEHOWEVER,THEREAREALSOSOLNESHORTCOMINGSWHICHREQUIREMOREIMPROVEMENTSKEYWORDSSIGNATUREVERIFICATION;OFFLINESIGNATUREVERIFICATIONSYSTEM;FEATUREEXTRACTION;PRINCIPALCOMPONENTANALYSIS;SUPPORTVECTORMACHINE学位论文原创性声明本人郑重声明所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的作品成果。对本文的研究作出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。学位论文作者签名嘶缶域日期为O年芗月9日学位论文使用授权声明本人完全了解中山大学有关保留、使用学位论文的规定,即学校有权保留学位论文并向国家主管部门或其指定机构送交论文的电子版和纸质版,有权将学位论文用于非赢利目的的少量复制并允许论文进入学校图书馆、院系资料室被查阅,有权将学位论文的内容编入有关数据库进行检索,可以采用复印、缩印或其他方法保存学位论文。学位论文作者签名砗刍氓导师签名日期如LO年5月人七饧F姓名测试HTTP/WWWXINGMINGCESHIORG第1章绪论11背景介绍111问题的提出第1章绪论随着经济和科技的迅猛发展、计算机和网络的普及,信用卡、网络银行的使用越来越普遍,随之而来的是安全问题,尤其是用户密码安全隐患。尽管随着密码技术研究的深入,人们提出了各种各样的加密算法,但是没有任何一种密码是牢不可破的。此外,密码还存在容易遗忘、泄密的问题。这些问题使得每年都有人因为信用卡或者网络银行被盗而损失巨大【L】。另一方面,传统的身份识别方法,如护照、身份证等,也已很难满足出入境管理、重要场所监控以及网上追查逃犯等社会实际应用的要求。所有这些社会的需求以及现有技术的缺陷刺激了生物模式识别的研究【2】【3】。所谓生物模式识另LJBIOMETRICS是指通过计算机利用人体所固有的生理特征或行为特征来进行个人身份鉴定的一种技术。生理特征与生俱来,多为先天性的;行为特征则是习惯使然,多为后天性的。生理和行为特征统称为生物特征。从生理学和行为学的角度看,每个人的生理和行为都是互不相同的,并且有很高的稳定性,因此人的生理特征或者行为特征可以唯一标识一个人的身份。当前,基于生理特征的一些鉴别系统已经比较成熟,例如指纹系统、虹膜系统都已在商业上得到应用,但复杂的图像采集设备极大地限制了其使用的范围。而作为行为特征的手写签名验证虽然起步较晚,但因其方便、有效以及经济使得它有广泛的应用前景。112生物特征识别所谓生物特征识另UBIOMETRICIDENTIFICATIONTECHNOLOGY是指利用人体生物第1章绪论特征进行身份认证的一种技术2】【3】。更具体一点,生物特征识别技术就是通过计算机与光学、声学、生物传感器和生物统计学原理等高科技手段密切结合,利用人体固有的生理特性和行为特征来进行个人身份的鉴定。相比传统的身份鉴别方法,基于生物特征的身份鉴别方法有着不会遗忘或丢失、防伪性能好、随时随地都可以使用的优点。生物特征识别技术是目前最为方便与安全的识别技术,它不需要使用者记住身份证号码或密码,也不需随身携带智能卡之类的东西。由于每个人的生物特征具有与其他人不同的唯一性和在一定时期内不变的稳定性,不易伪造和假冒,所以利用生物识别技术进行身份鉴别有着安全、可靠、准确的优点。现在发展起来的生物特征识别技术主要有人脸识别、视网膜识别、指纹识别、语音识别、签名鉴别等。人脸识别接受程度高,但是当前的识别准确率还比较低;视网膜识别会对使用者的健康造成一定危害,可接受程度低;指纹识别是当前得到最广泛应用的,但是也有不足之处,例如对指纹质量较差的人群如皮肤干燥、有疤痕、老茧、表面磨损严重和有病变的人无法取得好的识别效果,指纹使用接触式采集,传感器表面灰尘油污附着物等会影响识别,留在传感器上的指纹存在被盗取复制的可能性;语音识别要达到好的性能则实现起来非常复杂。相比之下,签名鉴别拥有诸多优点。首先,签名鉴别是日常生活中接触最多的一种身份识别方法,接受程度高。其次,每个人的笔迹动态范围变化大,即使同一个人在不同时期和精神状态下的笔迹也不会完全相同,因此个人签名能够标志一个人的身份。即使再好的伪造者,也不能伪造出和别人完全一样的签名。此外,签名鉴别还对硬件要求不高,因此成本较低。由此观之,签名鉴别具备广泛的应用前景。12签名鉴别概述现代人体运动学研究表明,签名这种运动是由人的神经一肌肉系统决定的,与个人的性格、体质和幼时的训练有关,每个人都拥有自己独特的书写风格,表现为不同的书写力道、笔划书写顺序、笔划连接方式、局部装饰笔划等。因此,签名虽然不属于个人固有的生理特征,而是一种行为特征,但是仍然可姓名测试HTTP/WWWXINGMINGCESHIORG第1章绪论以作为辨识个人身份的种有效生物特征,签名鉴别是建立在每个人的签名都有自己独特的理解和写法,并且相对稳定的基础之上的。签名不仅代表了签名者的信息,而且签名的某些内在的具有唯一性的特征与产生签名这一信息的特定生物力学系统有关。121签名鉴别技术的定义签名鉴别是一个综合多个学科的研究领域,主要涉及计算机、图像处理、模式识别、语言文字学、数学、人工智能和仿生学等学科。它属于生物特征鉴别的一种,通过对输入手写签名进行分析判断,得出签名是否是由其本人书写的结论。签名笔迹是一种相对稳定的行为特征,是个人身份的有效证明,是一种与内容无关的,公认的身份鉴别技术。1签名鉴别的分类及特点签名一般可以通过两种途径获得,即在线方式和离线方式。相应地,签名鉴别,也可分为在线签名鉴别和离线签名鉴别两种。在线签名是通过手写板采集书写人的签名样本,一般采集到的动态信息包括压力、速度、加速度等几种随时间变化的信号序列数据;除此之外,还采集书写点坐标、握笔的角度等,在线签名被表示成一种或几种随时间变化的信号序列,其中包含签名的动态信息,以输入信号的方式获得的,可以利用书写过程中笔尖运动的速度、加速度、压力等作为识别特征,因此在线签名鉴别也称为动态或联机签名鉴别。由于信息量充足,每个人的笔尖运动都有自己的习惯,不同人之间难以相互模仿,鉴别工作相对容易,识别率较高。离线签名是通过数码相机采集或扫描仪扫描原始签名,输入签名样本,签名图像经过适当处理后,提取有效的特征,包括签名的位置、形状,笔划的方向,笔划间的搭配以及伪动态信息等。离线签名由于书写过程中的动态信息几乎全部丢失,主要依据签名图像的静态信息,即每个人笔迹的特点和相对稳定性来有效反映签名的书写风格和书写习惯,其动态信息只能通过伪动态特征间接获得。所以,离线签名可用到的特征信息有限,鉴别的难度也比较高,识气第1章绪论别率相对较低。但由于离线笔迹鉴定本身具有更广泛的应用范围,如支票签名、合同签署及犯罪学上的笔迹鉴定都是离线的,离线笔迹鉴定具有更大的研究价值与意义,是本文主要研究的对象。2签名鉴别的优缺点签名鉴别的优点如下1共享性。由于签名是独特的,具有唯一性,每个人使用的签名各不相同。长久以来人们使用签名,并信任签名所代表的内涵。所以用户可以签署文件让代理人行使自己的部分权利,比如支票、合同等等。2容易采集和使用。在线签名鉴别需要的工具是便宜的或已经配备好的设备如电脑;离线签名鉴别需要的工具更为普遍如笔和纸。3签名作为一种用户的习惯行为,不会被遗忘。4具有广泛性,长期被用于法庭审判中。签名鉴别的缺点如下1高多样性。每个人写的签名存在差异,签名具有不稳定性。2易于伪造。尤其是熟练伪签名,给签名鉴别,尤其是离线签名鉴别带来困难。3比其他生物特征鉴别具有更高的错误率。4受身体状况和情绪状况的影响。即使是同一个人,在不同时间段的签名也会存在着或多或少的差异。5较难提取有效的特征。虽然现阶段有一定的研究成果,但是有效反映签名的本质特征的提取方法还不是特别完善。3离线签名鉴别的难点1签名的变化性和多样性生理特征在一段相当长的时间内是不可变的除非十分特殊的情况,如发育期、受伤、手术、基因突变等,而行为特征会随着人的习惯改变而相应发生或多或少的变化。手写签名鉴定作为基于行为特征的测定技术,由于用户的习4姓名测试HTTP/WWWXINGMINGCESHIORG第1章绪论惯特性并不稳定,在短时期内的若干样本会有所波动,长时期内也会在正常的范围中表现出细微的变化。这将给样本训练、认证和识别带来一定的困难,也使得系统难以长期适应用户签名习惯的变化。2可用样本少对于签名认证,一方面伪造签名样本不易获得。伪造签名的样本不能用统计的方法获得,只能用随机的样本,这就将造成所获得样本很多都是简单伪造签名,如果用它们来代替熟练伪签名进行性能评价,必然会引起对系统性能过高的估计;另一方面用大量的样本进行训练可能造成阈值选取的困难。对于签名识别,提供的有效样本越多,获得的有关签名的信息也就越多,识别效果也就越好;如果训练样本太少,则无法给分类器提供足够的分类信息,影响识别效果,但并不是说样本越多越好,因为样本过多不仅会增加运算量,增加分类器负担,还可能带来过多的冗余信息和干扰,反而无法突出有用信息。3特征集的区分度不够大在实际应用中,识别和认证的用户群相当大,用户间区分度足够大的静态形状特征和动态行为特征集合也相应的会很庞大,盲目追求鉴别率将耗费极大的代价。鉴于以上原因,中文离线签名鉴别至今还没有一种切实有效的方法可以达到较高的识别率。4中文签名鉴别与西文签名鉴别的区别1中、西文字客观上的差异。英文签名速度较快,在Y轴上变化幅度较小,中文则为一笔一划书写,速度较慢,坐标轴曲线较明显,汉字签名是以横、竖等笔划为基本结构的,而英文签名则是以曲线为主。中文主要由笔段构成,而西文以弧段为主,而且中文签名数目多,结构复杂,且字体变化多样,而西文签名则相对简单很多。2中、西方人签名的主观差异。西方人的签名,也包括中国人的英文签名,都是模式签名。西方人的签名意识较强,签名的机会也很多,所以西方人签名更多的是依靠已经建立的动力定型自动化书写完成。因而其签名的几何式样比较稳定,成为他个人唯一式样第】章绪论的签名。一般都是由比较快写的连贯的字母偶有断续组成,一些人的签名只不过是拐米转去的线条或错落有致的“峰线”构成。相较之下,中国人的签名意识较为薄弱,签名的随意性较强,为适应格式需要,既可以横向签,也可以竖向签,箍名人还可以凭借他的书写技能,在不同的场台和不同书写条件下变换其签名式样。例如,有时用楷书,有时则用行书甚至草书有时签名工整,有时潦草;有时用繁体字有时叉用简化字;具体情况往往园人而异,因情况而异,由此产生签名的多样性。122签名鉴别的历史大概在公元前3000年左右,苏美尔人使用复杂的密封件应用到粘土块楔形文字去验证他们的写作。公元前439年,罗马帝国人通过粘贴手写体到文件去验证文件。而1677年,英国政府为防止欺诈和伪证通过了一个法案,要求合同双方签署文件。1977年,第一次发表了关于离线和在线签名鉴别的算法研究,即NAGEL和ROSENFELD的“离线系统”IEEETCOMP,LIU和HERBST的“在线系统”IBMJRESDEV。随后就有了更多的研究,尝试了各种各样不同的特征提取和匹配的方法。90年前刻有名字的私人印章与手写的签名在法律上具有相同的效力。后来私人印章逐渐被手写签名所代替,对手写签名的鉴定一直以人工的文件检验为主要方式。但人工文件检验需要专门知识和长期的经验,限制了笔迹检验的推广应用。图卜1私章签名_一R恕。IK姓名测试HTTP/WWWXINGMINGCESHIORG第L章绪论文件检验的人才毕竟是有限,且近年来有关笔迹有关的刑事和民事案件越来越多,检验的任务越来越繁重。这些情况使文检部门感到不堪重负,迫切希望用机器来代替人的部分劳动,这就是当今研究和开发计算机笔迹鉴定方法和系统的动机所在。用机器鉴定笔迹不仅在工作量上使文检专家获得一定程度的解放,它还具有不受工作环境、身体疲惫和心理定势影响的巨大优势,能有效减少差错率。计算机笔迹鉴定的研究最早始于本世纪60年代。1966年苏联的研究者发表了用电子计算机进行笔迹鉴定的研究报告。他们的方法是从字符骨架中提取一些代表点作为特征,用字母“K“作为实验样本,得到了75的鉴定正确率。70年代末、80年代初,计算机笔迹鉴定的研究和开发形成了一个热潮。其中最有影响是前联邦德国刑事技术部主持研制的计算机联网笔迹鉴别系统。该项目投资大、历时长,有大量专家学者参加了研究,提出了一系列行之有效的方法。日本学者在这方面发表的文献数目最多,质量也都比较高。123签名鉴别技术的现状迄今为止,在签名自动鉴定方面,国内外已作了大量研究工作,但多数集中于在线签名鉴定的研究。对于离线签名鉴定的研究,虽然国内外已经取得了一定的研究成果,如多通道GABOR滤波方法、基于优化分割重建图像的文本无关笔迹鉴定、基于支持向量机的文本无关字迹鉴别系统、笔划匹配法都从某个方面一定程度的提高了笔迹鉴定的正确率。许多方法都值得我们借鉴。但由于离线鉴定本身的性质所决定的原因,还是存在着较多尚未解决的问题。由于外文签名与中文签名有较大的差别,外文签名常有的签名自动鉴定系统用来进行中文签名鉴定,效果不尽如人意。因此针对签名笔迹特别是离线中文签名笔迹鉴定的研究一直发展缓慢。90年代后,我国许多大学和研究机构开始对手写汉字签名认证进行了研究和探讨。主要有中国科学院自动化所的戴汝为、谭铁牛、王蕴红,清华大学电子工程系的丁晓青,中国科技大学电子科学与技术系的施泽生,华中理工大学计算机科学和技术学院金先级、裴先登以及该校图像识别与人工智能研究所的第1章绪论柳健等。吉林大学在此基础上,分别与清华同方股份有限公司、北京密安信息和通讯技术有限责任公司签订了合作开发协议【4】【5】6】。中科院自动化所文字识别实验室从1992年开始,与北京市刑事科技研究所合作,开始了这方面的研究【7】。1997年,刘成林、刘迎建、戴汝为发表的基十多通道分解和匹配的笔迹鉴别研究和简化的WIGNER分布及其在笔迹鉴别中的应用等文章提出了自己的新的识别方法,并取得了较好的效果81。2000年,谭铁牛提出的将笔迹、文字识别问题作为纹理识别来处理的方法,通过选取17个人的笔迹进行实验,也取得了较好的效果。2005年1月份,清华大学电子系与公安部第二研究所合作研制的“计算机笔迹鉴别系统“通过公安部组织的技术鉴定,该笔迹鉴定系统已应用于国家重要安全项目等。除此之外,国内有很多的公司都在致力于笔迹鉴定系统方面的开发,并取得了一些成果,但真正投入使用的到现在还很少。学者们也发表很多签名鉴定方面著作。中国人民解放军理工大学陈刚、李德毅基于数据场的笔迹鉴别研究首次将数据场的思想引入签名鉴别中,把鉴名所形成的四个时序序列点作为场中的数据点来看待,形成四类数据场,再从场中提取特征,在对中文签名的初步实验中得到了较好的实验结果。山东大学的于威威、乔谊正采用傅氏变换特征提取方法的脱机中文签名鉴定研究利用笔划特征进行傅立叶变换,将签名由时域换到频域,通过实验验证了傅立叶变换进行脱机手签名鉴定是可行的。柯晶、乔谊正【7】等提出了签名静态特征和伪动态特征相结合的方法,签名伪动态特征包括灰度级分布和笔划宽度分布的概率直方图,通过计算距离来鉴别,对熟练伪造签名达到了接近90的平均正确率。刘成林、戴汝为8】等提出了基于多通道分解与匹配的笔迹识别方法,将二值化的笔迹图像按笔划的方向性先进行方向分解,然后对各个方向上的子图像进行频带分解。用分解后的采样信号制作为笔迹特征,用特征匹配的方法进行书写人识别,取得了很好的实验效果。程析、侯义斌【10】提出了基于模糊模式识别的离线签名认证技术,其方法是利用模糊模式识别的方法,构造6个特征的隶属度函数,分别为水平方向重心、垂直方向重心、高度和宽度比、笔划面积与图像面积比、签名的正倾斜度、签名各个独立部分之间的间隔和图像总宽度之比。针对简单伪造签名得到了88的正确认证率。朱勇、谭铁牛11】姓名测试HTTP/WWWXINGMINGCESHIORG第L章绪论等提出了一种不依赖于文本的笔迹鉴别方法,他们将手写笔迹当作一种纹理来看待,使用多通道二维GABOR滤波器来提取纹理特征,并用加权欧氏距离分类器来完成匹配工作,取得了很好的效果。胡驰峰121等研究了中文签名中的角度矫正和汉字切分问题,提取的特征为HAUSDORFF距离,采用最小距离分类法,对签名进行识别。陈冈TL13等提取的特征为不变矩和形状描述子,构造了两个距离权重分类器对签名图像进行初步识别,然后将两个分类器的度量层输出作为证据,用一种改进的证据理论合成公式对其进行融合得到最终识别结果。由于签名鉴别具有良好的应用前景和巨大的商业价值,国外对其研究已有30余年的历史,取得了不少的成果,特别是在线签名的鉴别已相当成熟,现在某些发达国家己经有许多成熟的商用在线签名自动鉴别仪器。AMMAR14提取签名图像的倾斜特征、高灰度特征以及参考模式特征并采用最小距离法进行签名认证,对一些精心伪造的假签名的识别获得了较好的效果。此后,作为一种有效的伪动态信息,高灰度特征常用于离线签名鉴别。QI和HUNT15提出利用签名图像的全局特征和局部网格特征来进行签名认证。其中全局特征将签名轨迹视做一个整体,包括图像大小、图像的重心位置、倾斜角等;而网格特征则类似于放大镜,可提供各个层次上签名的细节信息,包括网格轮廓特征,ESC特征,包络线特征等。前者便于认证在外形上与真实签名存在较大差别的随机伪造,后者便于认证与真实签名极为相似的精心伪造。采用加权欧式距离分类器完成分类工作,针对一般伪签名和精心伪签名均取得了较好的效果。POTTIER16】提取签名的全局几何特征宽高比、主轴倾斜度等、PALNAISWAMI17提取签名的网格特征、DARWISH18提取签名的两种矩几何不变矩和ZEMIKE矩特征和拓扑逻辑特征,然后利用神经网络分类器进行鉴别,得到了比较理想的鉴别效果。NABEELAMURSHED19和FLAVIOBORTOLOZZ20等提出了模糊神经网络识别离线手写签名的方法,其做法是将签名图像分块,对每一块用模糊ARTMAP神经网络进行判别,再对输出进行判别。ROBERTSABOURIN和GINETTEGENEST2122提出了基于视觉的签名表示新形式,从形态学的角度表示签名的形状特征。分类采用了近邻法和最小距离法,对简单假签名的鉴别取得了很好的效果。ROBERTSABOURIN和JPDROUHAND23等利用签名的形状矩阵作为签名的混合形状特征,通过比较形状矩阵的相似度来识别简单的假签名。DENGES错误L未找到引用第L章绪论源。【24】对签名的轮廓进行小波变换来对签名进行识别。国外的签名验证技术从数据采集系统到处理、验证算法都已经相对成熟。许多公司都有专门的机构从事该项技术的研发与应用,包括IBMCYBERSIGN、美国智通、日本富士通等,其中美国智通公司在此领域的研究独树一帜。目前在国外市场上已有几种签名鉴别的有关产品出现,主要有以下几种由PERIPHERALVISIONOFNEWYORK生产的PENOP产品,据报导,它可以配置计算机系统,使用户通过签名来登录注册;另一种产品SIGNON,据称可以植入各种各样的软件,使用时用签名代替121令进入系统。SIGNON采用了签名的图像、加速度、笔划角度、开始和结束时的笔尖压力等因素来产生认证结果,它用6个签名样品加上一个最新认证接收的签名构成参照模板251。13主要研究方法介绍当前取得的成果分在线签名鉴别和离线签名鉴别两种,在线签名鉴别已经取得了较多成果,并且已经生产出成熟的商业产品。相对而言,离线签名鉴别在商业上成熟的应用产品还不多。这主要是因为离线签名鉴别相对在线签名鉴别会显得更难捕抓不到签名的动态特征以及样本较少。自20世纪70年代开始,就有大量的研究人员对手写签名鉴别技术进行研究,包括在线签名鉴别和离线签名鉴别。现在有大量的文章对签名鉴别技术的发展进行了总结,例如F26】4】27】28】。而近十几年签名鉴别技术更是得到了迅速的发展。下面我们分别对在线签名鉴别和离线签名鉴别的发展进行总结。131在线签名鉴别技术在线签名鉴别技术对硬件的要求比离线签名鉴别高因为要捕抓签名的动态变化以及信号处理等,所以早期的发展不如离线签名鉴别。但是从另一个角度,由于在线签名鉴别能够捕捉到签名者的动态信息,所以更容易鉴别签名的真伪。首先介绍签名设备的发展。早期二十世纪七十年代到九十年代初的在10姓名测试HTTP/WWWXINGMINGCESHIORG第1章绪论线签名鉴别采用一种特殊的笔来采集样本,因为当时并没有合适的硬件设备。随后出现了普通手写板,但是这种手写板不能采集签名者的压力等一些动态特征。随后又出现了一些可以采集压力信号的手写板,带LCD显示的手写板,以及可以采集签名者握笔的角度、书写速率等数据的采集设备,等等。其次简要介绍近十几年来发展的各种在线签名鉴别算法。1模板匹配算法。这种算法采用线性规划算法计算要鉴别的签名与给定模板之间的距离一般给定一个样本库,距离用欧氏距离。算法优点是简单,处理速度快;缺点是鉴别正确率不是很高29】。2统计方法。这类方法基于签名的形状等静态特征以及压力等静态特征,以这些特征为参数建立统计模型对签名进行鉴别,例如301。3动态时间规划算法DTW。动态时间规划DYNAMICTIMEWARPING是一种对两个序列信号之间进行优化的技术,可以用这种算法获得样本与要鉴别的签名之间的非线性匹配,因此能更好地捕捉不同签名的微妙区别,可参考3111321133。4隐马尔科夫模型HMM。隐马尔科夫模型HMM是一个双重随机过程,在语音识别已经得到比较成熟的应用,效果良好。而很多研究人员也将HMM应用到在线签名鉴别中,获得比较满意的结果,可参考【3411351。5人工神经网络ANN。人工神经网络特有的非线性适应性信息处理能力,使之模式识别领域得到成功应用,可参考3637】。6基于遗传算法、聚类分析等的算法。132离线签名鉴别技术离线签名鉴别对硬件的要求远远比在线签名鉴别低,但是随之而来问题是它不能捕抓到签名的动态特征,例如签名者的力度,加速度,书写的角度等。因此,尽管离线签名鉴别技术在20世纪七十年代起就得到大量的研究,已经发展了大量的离线签名鉴别技术,但是至今仍然很少有成熟的商业应用产品。下面我们简要介绍的离线签名鉴别的各种算法,这些算法的主要差异在于所提取第1章绪论的签名的特征以及如何分类。1NEMECK和LIN38在1974年提出了第一个签名鉴别的研究。他们通过HADAMARD变换后从图像中提取静态特征。根据分类器的不同配置,类型I错误即错误拒绝率在1L到23之间;类型II错误即错误接受率在27到41之间。21984年BROCKLEHURST设计了一个完全自动化的系统,在这个系统中,他利用数据检测技巧来将签名编码成7个特征。此系统接受的真实签名达100,同时能检测大多数简单伪签名。31986年SABOURIN和PLAMONDON采用统计中的BAYES和FISHER规则进行分类,将动态相关的特征与结构化特征相结合,用来剔除脱机系统中的熟练伪签名。分类结果很令人满意,准确率达到9297。41986年AMMAR14首先将签名图象的灰度统计信息作为一种伪动态特征用于脱机签名鉴定,此后,作为一种有效的伪动态信息,高灰度特征常用于脱机签名鉴定和识别。51994年,QI和HUNT15提出用签名图像的整体特征和局部特征联合起来对签名进行鉴别。整体特征即签名图像的整体几何特征,局部特征是签名图像的栅格特征。鉴别时采用加权欧氏距离法,实验结果表明,这种算法对付熟练伪签名错误率为53,处理简单伪签名的错误率则低至O。但实验使用的签名数据库较小,只有450个签名。61996年,林峻和李介谷【39】提出使用形状特征和重笔道特征的鉴别算法,采用加权的欧氏距离来度量特征向量与模板的距离来达到鉴别的目的。实验显示此方法的错误率为25。但使用的数据库很小,仅为150个签名。71997年HUANG和YAN40提出形状特征抽取算法,在灰度图像中提出了一些形状特性,而在签名鉴别使用的是全局几何特征和局部几何特征。分类鉴别时,HUANG和YAH使用了神经网络分类器,整个网络分为特征网络和决策网络两层。错误率大概为11。81997年BAJAJ和CHAUDHURY41使用了投影矩特征,包括峰度、倾斜度、相对峰度和相对倾斜度、相对垂直和水平投影。另外也使用了签名的包络特性。分类鉴别使用了基于前馈神经网络的分类器,网络的训练使用标准的BP算法。实验结果显示此方法的错误率低于10。姓名测试HTTP/WWWXINGMINGCESHIORG第1章绪论91999年RAMESH和MURTY42在其文章中提出了使用了几何特征、基于矩的表示的特征、包络特性和树结构小波特征,利用遗传算法根据各特征成分的模式特性化能力来赋予权值进行鉴别的算法。实验证明此混合分类器对真实签名的鉴别准确率达90,对于简单伪签名达98,鉴别熟练伪签名在7080,约1520的拒绝率。102002年,HUANG和YAH43提出了结构特征对应方法STRUCTURALFEATURECORRESPONDENCE,他们根据像素分布和结构布局构建了统计模型。实验结果表明鉴别成功率较高,错误率小于10。112003年,FANG44等提出了新的方法,用于解决同一个人不同签名之间的变化先统计签名者本人各签名之间的变化,然后对要鉴别的签名计算其位置位移,然后与统计结果相比较来决定其真伪。实验显示,此方法的平均错误率为181。14对各研究方法的分析和总结综观各种离线签名鉴别算法,我们可以看出离线签名鉴别算法的关键在于特征的提取以及分类算法。1各种鉴别算法所采用的特征基本是签名图像的外形特征以及其他的静态特征。例如QI和HUNT15提出首先采用签名图像的整体特征和局部特征;林峻和李介谷【39】提出使用形状特征和重笔道特征;HUANG和YAN40在灰度图像中提取形状特征;RAMESH和MURTY421在其文章中提出了使用了几何特征,等在盘寸O2尽管在离线签名鉴别中很难捕抓签名的动态信息,但是研究人员还是想方设法去捕抓其中的蛛丝马迹,想法提取签名的基于灰度变化的伪特征。例如,AMMAR首先将签名图象的灰度统计信息作为一种伪动态特征用于脱机签名鉴定。3其他的特征,像矩特征、利用小波变换提取的特征、GABOR滤波器提取的特征等等,都得到了使用。总之,随着签名鉴别研究的深入,人们已经由单纯提取简单的外形特征或其他静态特征,转向研究同一个人不同签名之间的变第1章绪论化以及简单的动态特征,使得系统提取的特征能尽量地反映各签名的个性特征。4脱机签名鉴别中分类的主要方法包括欧氏距离、加权欧式距离、神经网络方法、模糊判决法和H删隐马尔可夫模型等。此外,基于多分类器组合的分类方法和神经网络,聚类分析等也被用于签名的识别。15论文的组织结构本文内容分为五章第一章绪论。本章介绍了该课题的背景、研究意义、签名鉴别技术的国内外发展现状以及对各种研究方法进行了分析和总结。第二章签名鉴别技术。主要研究了签名鉴别的一般流程,包括图像数据采集、预处理、特征提取与选择鉴别决策以及性能评估等。第三章离线签名鉴别系统的设计与实现。具体地讲述了本算法的设计和实现过程。第四章实验结果及分析。介绍了本人在签名鉴别研究过程中的程序,对该方法进行了细致的分析。第五章总结与展望。该部分对本文主要研究成果进行了总结,并对本实验存在的问题进行了分析和展望。姓名测试HTTP/WWWXINGMINGCESHIORG第2章签名鉴别技术第2章签名鉴别技术21签名鉴别的一般流程所谓离线签名鉴别,就是根据离线签名图像对签写人的身份进行鉴别以确定其身份的真伪。依据的是每个人的签名的独特性与稳定性,从而使得一个人的签名能标识签写人的身份。因此,只要我们能够对个人的签名提取足够多的信息,以这些信息作为参照模板,就能鉴别签名者身份的真伪。从而,签名鉴别需要首先建立一个签名样本库,里面存储各种签名特征。当需要进行签名鉴别时,将带鉴别的签名与样本库的样本进行匹配以判定签名的真伪。故签名鉴别的一般流程包括签名数据采集、签名数据预处理、特征提取、与样本库模板。进行匹配鉴别、鉴别结论。如下图21所示45】。图21离线签名鉴别流程图22图像数据的采集签名数字图像的获取包括样本签名图像和待鉴别签名图像的获取等。在离15第2章签名鉴别技术线签名鉴定过程中,签名图像采集是指数据采集设备将签名图像的信息转化为离散的数字信息输入计算机。例如,利用扫描仪或高性能的数码相机将签名样本的信息。采集到的签名图像数据的质量对于今后处理过程和鉴定系统的性能具有重要的影响。如果对样本签名图像信息采集不充分或者不正确,则势必引起签名鉴别时匹配的错误率提高;同样,如果对待鉴别签名图像的信息提取不充分或者不正确,也会引起误判率的提高。应该看到,离线签名鉴别对采集设备的要求远远比在线签名鉴别低。离线签名鉴别往往用扫描仪或者高性能数码相机就足够了,但是在线签名鉴别需要用到更加精密的采集设备以捕抓动态信息。因此从经济的角度,离线签名鉴别更节省成本。23预处理签名图像不可避免受到噪音的干扰,例如采集设备的噪音,签名者的噪音等。因此需要对签名图像进行预处理以消除噪音的干扰。另外,输入计算机内的原始签名数字图像还不能直接用于系统鉴别,需进行相应的预处理,把签名图像规格化为特征提取所需要的状态,以方便后面进行特征提取。这些预处理主要包括签名图像的背景滤除、平滑、锐化、归一化、二值化、细化、轮廓提取等。平滑处理是为了消除签名图像中的噪声,提高图像质量。可以用中值滤波、小波等算法进行处理。图像的二值化就是对图像进行阀值化分割,将图像中目标和背景分离出来,是易于提取目标的一种图像处理技术。二值化方法可分为全局二值化、局部二值化和动态二值化。典型的全局阀值法有平均灰度值法、OSUT算法等。锐化的主要目的是突出签名图像笔迹的细节特征,加强字迹的轮廓。所谓锐化,就是将二值化的文字点阵逐层剥去轮廓边缘上的点,但仍要保持原来文字的骨架图形。而在二值签名图像中,对鉴定有价值的文字特征信息主要集中在文字骨架上,锐化后的文字骨架既保留了原文字的大部分特征,又有利于特征抽取,因此锐化方法是一个十分重要的预处理步骤。姓名测试HTTP/WWWXINGMINGCESHIORG第2章签名鉴别技术归一化的主要目的是为了避免签名大小差异对鉴定系统鉴别效果的影响。提取出的签名轮廓可以有效地减少计算机在处理签名笔迹及特征提取时计算量。此外,还可以提取出直接与轮廓有关的特征信息。但是经采样得到的毋X,Y的值域仍是连续的,因此X,Y并不是离散函数,而是离散空间上的离散连续函数。通过量化器的处理后产生了离散空间上的值域离散函数X,Y,这一过程叫做量化。量化是一个点处理过程,包括均匀量化和非均匀量化两类量化方式。采样实际上是一个空间坐标的量化过程,量化则是对图像函数值的离散化过程。采样和量化统称为数字化。24特征提取与选择特征选择和提取结果的好坏将影响系统的整体效果。一方面,我们希望能够尽量少地损失信息,因此需要提取尽量多的特征;另一方面,经过预处理后的签名图像,其特征数量非常大,处于高维的状态空间中,如果不加选择地将所有可用的特征都提取出来,那么数据量将非常庞大,并且还有可能引入冗余信息或者干扰信息,因此我们需要有选择地提取特征。通过对他们进行映射或变换的方法即可以用低维空间来表示样本,这一过程称为特征提取。映射后的特征称为二次特征,它们是原始特征的某种组合。特征选择是指从一组特征中挑选一组最为有效的特征,以达到降低特征空间维数的目的。可以运用小波的思想进行特征提取。通过用小波的伸缩和平移变换构造一族正交基,既可以使得各个特征相互正交,最大程度地减少冗余,同时只要选取的特征适当地多,就能使特征提取后损失的信息尽量少。因此小波在特征提取时效果非常好。小波变换是离线签名验证中的频谱分析方法常使用的方法。签名曲线的曲率在很大程度上受到噪声和镜像变换的影响,在这种情况下多分辨率常有助于问题的分析。小波变换常用来将弧线构成的签名分解为多分辨率信号。在文献【24】中,DENG提出了一种新的签名表示方法,并且用小波变换来分解和分析多分辨率信号。小波变换将一维的签名数据转换为多分辨率的数据空间,并在不第2章签名鉴别技术同的频率上提取所需要的特征。这种方法不依赖于签名的形状,可以有效的应用于西文字符和中文签名中。25鉴别决策特征提取后,就可以利用提取出来的特征来对签名进行鉴别,以判断待测签名是真是假。这一过程需要建立两种信息即参考特征库和待测签名特征信息。样本特征库就是系统利用预先获得的签名样本,经过预处理及特征提取后所建立参考特征库;它的作用在匹配过程中相当于标准模板。待测签名特征信息是由待测签名经过处理、特征提取后所建立的特征信息集合。然后将这两种信息按一定方式进行模式匹配比较,通过适当的判决准则进行鉴别,得出鉴别结论。判别决策的方法有很多,常用的有模板匹配方法,统计模式识别方法,神经网络方法,支持向量机方法,等等。模板匹配方法是最早的,最简单的判别方法。这种方法的思想是衡量待鉴别签名与样本库的差异以达到判别的目的。这种差异通过定义一个距离来衡量。不同的算法可以定义不同的距离,通过设定一个阀值,当两者距离小于阀值时则认为签名为真;当两者距离大于阀值时则认为签名为伪造的。常用的距离有欧氏距离,加权的欧式距离,HAUSDORFF距离,等等。统计决策将模式用特征向量表示,利用概率论和数理统计的方法计算待测样本和参考签名之间的相似度,根据相似度在错误概率最小的条件下判断真伪。人工神经网络是对人类神经系统的简化、抽象和模拟,它通过联接强度的调整,可表现出类似人脑的学习、归纳和分类特征,可以处理一些信息十分复杂、先验知识不明确的问题,但是,神经网络一般存在训练过程复杂,训练时间长等问题。支持向量机算法是CORINNACORTES与VVAPNIK在研究维数灾难和分类器的泛化能力时候提出了一种新的机器学习算法。该算法不仅具有坚实的理论基础与实现方便,且更值得一提的是其强大的泛化能力和优秀的推广性。正是由于它各方面的优点,支持向量机在最近十多年都一直主导着机姓名测试HTTP/WWWXINGMINGCESHIORG第2章签名鉴别技术器学习理论。尽管支持向量机的性能在许多实际问题的应用中得到了验证,但是该算法在计算上存在一些问题,包括训练算法速度慢、算法负复杂而难以实现以及检测阶段运算量大等等。26性能评价指标所有的签名鉴别系统都不可避免的存在着一定的误差,目前对于离线签名验证系统性能的评估缺乏公认的评估协议或方法。一般我们将误差分为两类错误拒绝误差FALSEREJECTIONERROR和错误接受误差FALSEACCEPTANCEERROR46。“错误拒绝”是将真签名误认为伪签名,“错误接受”是指将伪签名误认为真签名。这两种误差是签名鉴别系统的重要评价指标,我们一般通过计算错误拒绝率与错误接受率来衡量系统的性能。错误拒绝率,它是指真实签名被误认为是伪签名发生的比率;错误接受率,是指伪签名被误认为是真实签名发生的比率。理论上,好的系统能很好的拒绝伪签名,接受真实签名,即应该能够将这两种误差都减少到最低程度。本文选取了三组实验评价指标错误接受率、错误拒绝率、总正确率。这三个实验指标能够比较全面、科学地反映系统的综合性能。1错误接受率FARFALSEACCEPTANCERATEFAR主要考察鉴别系统对伪签名的检验能力,错误接受率越低,说明将伪签名当真签名的概率越低,即表明系统对伪签名的拒绝能力越强。其计算方法为FARNFT21NF其中,NFT是测试用的伪签名被误认为真签名的数量,NF是测试用的伪签名的总数。FAR反映了系统对伪签名的错误接受率。2错误拒绝率FRRFALSEREJECTIONRATEFRR主要考察系统对真签名的检验能力,错误拒绝率越低,说明系统越能准确的判别真实签名,即表明系统对真实签名的接受能力越强,计算方法为FRRNTF23NL其中NTF是测试用的真签名被误认为伪签名的数量,NT是测试用的真签名的总数。FRR反映了系统对真签名的错误拒绝率。第2章签名鉴别技术3总正确率ORROVERALLRIGHTRATEORR指标主要用于考察系统对真、伪签名的综合检验能力。理论上讲,一个优秀的签名鉴别系统不仅要能识别真签名同时也要识别伪签名,但实际中,不一定能保证FAR和FRR都好,一个系统对真实签名的识别率高不代表对伪签名的鉴别能力也强,反之也一样,因此我们需要综合这两方面因素,提出总正确率这个指标来判别一个系统的好坏。ORRNTTNFF24NLN其中,NT,NF分别表示测试集中真实签名和伪签名的个数,N1,II表示将真实签名识别正确的测试样本个数,NFF将伪签名识别正确的测试样本个数。ORR指标就不管真是签名还是伪签名,是整个测试集的正确识别率,当然ORR越大越好,表示系统的识别率越高。姓名测试HTTP/WWWXINGMINGCESHIORG第3章离线签名鉴别系统的设计与实现第3章离线签名鉴别系统的设计与实现离线签名鉴别,顾名思义就是根据脱机的签名图象对签名人的身份进行识别,其依据是每个人的签名都有着自己独特的风格根据日常经验,不同的人写字有不同的特点和习惯,我们可以根据书写风格去判断某个签名是由谁签写的,而且这些蕴藏在签名中的书写特点相对稳定,因此能代表签名人的身份。设计离线签名系统就是要根据离线签名图像去鉴定真伪即判断签名是否由本人签写。离线签名鉴别技术广泛应用于试卷、票据、法律文书的签名、法庭字迹的鉴定等领域。离线签名鉴别系统包括签名鉴别的图像数据采集、预处理、特征提取与选择、分类识别等部分。31数据采集离线签名鉴别系统的数据采集是指利用某种装置将签名样本的信息转化为离散的数字信息输入计算机。它是离线签名鉴别系统设计的第一步。数字化得到的签名样

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论