(模式识别与智能系统专业论文)基于频域分析法的离线手写签名纹理特征提取和验证.pdf_第1页
(模式识别与智能系统专业论文)基于频域分析法的离线手写签名纹理特征提取和验证.pdf_第2页
(模式识别与智能系统专业论文)基于频域分析法的离线手写签名纹理特征提取和验证.pdf_第3页
(模式识别与智能系统专业论文)基于频域分析法的离线手写签名纹理特征提取和验证.pdf_第4页
(模式识别与智能系统专业论文)基于频域分析法的离线手写签名纹理特征提取和验证.pdf_第5页
已阅读5页,还剩69页未读 继续免费阅读

(模式识别与智能系统专业论文)基于频域分析法的离线手写签名纹理特征提取和验证.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

哈尔滨工程大学硕士学位论文 摘要 手写签名验证是一种根据手写笔迹判断书写人身份的一门科 学和技术。近年来,由于手写签名验证技术在金融、法律等领域得 到广泛的应用,它正逐步成为模式识别领域中一个十分活跃但难度 较高的研究课题,中外学者对此进行了广泛的研究,但是离线手写 签名验证的研究并不多。在这样的背景下,本文分析了离线手写签 名验证的应用背景和发展历史及国内外的研究动态,总结了现有各 种方法适用范围及优缺点,探讨了签名验证问题的性质和实现的难 点,并设计了一个离线手写签名验证系统。本文在签名图像预处理 阶段,对签名样本图像先进行了二值化,然后使用基于数学形态学 的图像滤波方法对图像进行平滑去噪和细化处理,最后进行图像归 一化处理。在签名的特征提取阶段,采用了基于纹理分析法的思想, 使用了其中的频域分析法进行特征提取,即采用傅立叶变换和小波 变换分别提取图像的谱特征作为签名的特征。最后在签名验证阶 段,分别用相关算法、欧式距离分类器和动态时间弯折算法进行签 名验证,并提出了签名二次分类法,经过大量的实验取得了比较满 意的识别率。 关键词:离线手写签名验证:纹理特征;动态时间弯折 二次分类法 哈尔滨工程大学硕士学位论文 a b s tr a c t h a n d w r i t t e ns i g n a t u r ev e r i f i c a t i o n ( h s v ) i sad i s c i p l i n ew h i c h a i m st od e c i d et h ei d e n t i t yo fw r i t e r sa c c o r d i n gt ot h eh a n d w r i t i n g s t y l es i t sa p p l i c a t i o n si n c l u d eb a n k i n g ,l a we t c i th a sb e c a m eo neo f t h em os ta c t i v eb u td i f f i c u l tp r o b l e m si nt h ep a t t e r nr e c o g n i t i o n s o t h e s t u d y o fh s va t t r a c t sm o r ea n dm o r er e s e a r c h e r si nt h er e c e n t y e a r s ,b u tt h es t u d yo fo f f - l i n eh s vi s t e s st h a nt h eo n l i n eh s v u n d ert h i sb a c k g r o u n d ,t h ea p p l i c a t i o nb a c k g r o u n da n dh i s t o r yo f d e v e l o p m e n to f0 f f l i n eh s vt e c h n i q u e sa r eb r i e f l yi n t r o d u c e di nt h i s t h e s i s t h es t a t eo ft h e0 f f - l i n eh s vr e s e a r c h e sa th o m ea n da b r o a dis a l s os u r v e y e d t h ea n a l y s i so fa l lt h ee x i s tm e t h o d si s g i v e n ,a l o n g w i t hw h e r et h e ycanb eu s e da n dh o wt h e ycanb eu s e d t h en a t u r eo f t h eo f f l i n eh s vp r o b l e ma n dd i f f i c u l t i e sa r ea n a l y z e d ,a n dt h e nt h e o v e r a l ls t r a t e g ya n da na p p l i c a b l ec o m p u t e ro f f - l i n eh s vs y s t e ma r e p r o p o s e d i nt h ep r e p r o c e s s i n go fs i g n a t u r ei m a g e ,t h ei m a g e sa r ef i r s t l y b i n a r i z e d t h e n am o r p h o l o g i c a lm e t h o di su s e dt om a k et h ec u r v e s m o o t ha n dt h i n f i n a l l y ,t h ei m a g e sa r en o r m a l i z e d i nt h ep r o c e s so f f e a t u r ee x t r a c t i o n ,t h et e x t u r ef e a t u r e so ft h es i g n a t u r e sa r ee x t r a c t e d i nf a c t ,t h em e t h o d so ff o u r i e rt r a n s f o r ma n dw a v e l e tt r a n s f o r ma r e u s e dt oe x t r a c tt h es p e c t r u mf e a t u r e so ft h es i g n a t u r e s i nt h ep r o c e s s o fv e r i f i c a t i o n ,t h er e l e v a n tt h e o r y ,t h ee u c l i d i a nt h e o r ya n dd y n a m i c t i m ew a r p i n gm e t h o da r eu s e dr e s p e c t i v e l y a l s o ,as e c o n d - t i m e s i g n a t u r e c l a s s i f i c a t i o nm e t h o di s p r o p o s e d t h ee x p e r i m e n th a s 哈尔滨工程大学硕士学位论文 p r o v e nt h a tt h eh s vs y s t e mc a ng e tt h es a t is f y i n gr i g h ti d e n t i f y i n g r a t e k e y w o r d s :o f f l i n es i g n a t u r ev e r i f i c a t i o n ;t e x t u r ef e a t u r e ; d y n a m i ct i m ew a r p i n g ;s e c o n d t i m ec l a s s i f i c a t i o n 哈尔滨工程大学 学位论文原创性声明 本人郑重声明:本论文的所以工作,是在导师的指导 下,由作者本人独立完成的。有关观点、方法、数据和文 献的引用已在文中指出,并与参考文献相对应。除文中已 注明引用的内容外,本论文不包含任何其他个人或集体已 经公开发表的作品成果。对本文的研究作出重要贡献的个 人和集体,均已在文中以明确方式标明。本人完全意识到 本声明的法律结果由本人承担。 作者( 签字) :蓥丝 日期:2 0 0 5 年1 月5 日 哈尔滨工程大学硕士学位论文 第1 章绪论 1 1 课题研究的目的和意义 现代科学研究表明,人的书写风格与个人的性格,体质和幼时的 训练有关。由于每个人都有自己独特的书写风格,因此签名常常是一 个人身份的证明,与其他生物特征如:指纹,人脸,虹膜等特征相比, 具有形象,方便,易行,难以窃取遗忘等优点。 而且随着中国加入w t o ,经济的发展和国际交往的日益频繁在 金融界和政府界会有各种各样的协议书、合同、法规及支票等都需要 当事人的签名。因此,假如签名被模仿或伪造,将造成严重的社会后 果和巨大的经济损失,严重的更会破坏整个金融秩序和社会安定。因 此,对手写签名进行可靠、有效、快速的鉴定具有重要的应用价值和 社会意义。 目前手写签名验证基本上都是采用人工的方法,验证过程慢且不 可靠,特别是容易引入人的感情因素,影响验证效果的真实性。利用 计算机辅助进行手写签名验证,可以提高验证速度与准确性,避免人 为因素的影响。但计算机毕竟不是人的大脑,即使不能对目标作出最 终的鉴定结果,也能缩小验证的范围,为人工验证提供有利的帮助。 因此,计算机手写签名验证的意义更是十分明显的。 再者,最重要的是手写签名验证在工程上的意义。手工验证是一 种非工程的工作方式,手写签名验证的计算机化是把一个非工程的问 题纳入用工程手段来处理。这种方法、手段的有效性将直接影响整个 研究的可行性和有效陛。虽然计算机远不及人脑的智能,但利用计算 哈尔滨工程大学硕士学位论文 机自身的优点,用工程的方法来处理手写签名验证这一非工程的领域, 对手写签名验证具有不可动摇的推动作用。 由此可见,手写签名验证作为一个特殊的学科,不管是在社会应 用还是工程和科研上都具有深远的意义。而且手写签名验证技术涉及 到模式识别和图像处理、人工智能、统计决篆理论、组合数学,信息 论、计算机等学科;也涉及到语言文字学、,t l , 理学、生物学等,是一 门综合性的技术。因此,对其进行研究是十分必要的。 1 2 手写签名验证系统简介 手写签名验证系统根据数据获取的方式可分为以下两类:在线 ( o n l i n e ) 手写签名验证系统和离线( o f f - l i n e ) 手写签名验证系统。在线 手写签名验证是指:通过专用的数字板或数字仪实时采集书写信号, 提取签名的动态特征和静态特征,它主要建立在签名时的力度上,分 析笔的移动,因此又称为签名力学辨识。提取的动态特征包括:运笔 速度、加速度、压力、运笔方向等,静态特征主要包括字迹形态。签 名比较的方法包括函数波形匹配和参数特征匹配,验证的可靠性比较 高。而离线手写签名验证是指:通过扫描仪或摄像机将写在纸上的签 名转化为计算机能处理的信号,因此它只能从签名的形态来判断签名 的真伪,提取的特征包括:签名的位置、形状、笔划的方向、笔划间 的搭配等。 相比较而言,在线手写签名验证的识别率较高,而对于离线手写 签名验证来说,由于它仅仅依靠签名图像的静态信息,而书写过程的 动态信息几乎完全丢失,因此,离线手写签名验证的难度非常大,识 别率也相对低一些,至今仍然没有达到实用价值的产品面世。 一个典型的离线手写签名验证系统如图1 1 所示。 2 哈尔滨工程大学硕士学位论文 学习阶段 签名图像 获取 i 预处理 验证阶段 图1 1 离线手写签名验证系统框图 该系统包括两个部分:学习阶段和验证阶段。 在学习阶段中,包括三部分,分别是签名图像获取、预处理和特 征选择和提取。下面分别介绍一下这三部分的功能。 一、签名图像获取 获取图像是签名验证的第一步。通常要通过图像输入设备实现, 采用的图像输入设备有红外遥感成像、测距成像、c c d 成像、扫描仪 成像等,获取的图像是样本签名图像的象素描述。象素描述的重要参 数是分辨率,分辨率包括空间( 二维平面) 分辨率和灰度分辨率,前 者反映了象素描述在空间上的精细程度,而后者则反映了象素描述在 灰度( 色彩) 空间的精细程度。由于空间分辨率的高低对签名验证的 哈尔滨丁程大学硕士学位论文 影响较大,因此要认真选择。 二、图像的预处理 图像预处理在实用系统中是一个很重要的阶段。预处理效果的好 坏会直接影响到整个手写签名验证系统的性能,其包含的内容很广泛。 一般而言,预处理是指对获取的原始图像进行整理加工、去伪存真的 过程,其目的是驱除噪声,突出目标,包括二值化、平滑去噪、细化、 归一化等。 三、特征选择和提取 特征选择和提取是去除签名图像信息中对分类没有帮助的部分, 将图像信息集中到有代表性的特征上来的过程。选择稳定的、有代表 性的特征往往是一个手写签名验证系统成功的关键。根据模式识别的 观点,好的特征选择和提取的方法必须满足三个条件:一是提取的一 组特征相互独立或者说不相关:二是特征提取能有效减小类内距离, 增大类间距离;三是特征向量的维数尽量小。而在实际应用中,寻找 满足这三点要求的特征提取方法是一项富有挑战性的工作,也是人们 梦寐以求的。 在离线手写签名验证中,我们将可以提取的特征分为两大类:静 态特征和伪动态特征。静态特征指图像的布局特征,又可分为全局特 征和细节特征【2 1 。全局特征是指将一张签名图像看作一个整体,提取 出签名的长、宽、基线、书写流畅性等特征。全局特征比较稳定,对 于签名的变化不太敏感,受噪声的影响也不大。细节特征是指签名图 像的细节部分,如拐点、平均倾斜度、字间距等。细节特征对签名的 变化非常敏感,极易受噪声干扰,但是它们更能反映签名的本质特征。 伪动态特征是指从签名图像中恢复的一些压力信息即动态信息,如笔 顺,可以从笔划的粗细来判断。在实际的应用中,可以将各种特征结 合起来,验证的效果比较好。 在学习阶段进行特征选择和提取后,其目的是生成参考样板,以 哈尔滨工程大学硕士学位论文 便进行后面的工作。 在验证阶段中,包括四部分,分别是签名图像获取、预处理、特 征选择和提取和签名验证并输出决策结果。前三个部分与学习阶段功 能相同,下面介绍一下第四部分。 四、签名验证并输出决策结果 签名验证是训l 练过程的关键步骤之一。目的是根据测试签名的特 征信息来判断该测试签名是否属于参考样板,如果属于,则判断属于 哪一类参考样板:最后输出决策结果。其中采用的分类器可分为模板 匹配分类器、统计决策分类器( 含几何分类器) 、句法结构分类器、模 糊判决分类器、神经网络分类器和逻辑推理( 或人工智能) 分类器等 六种。 1 3 手写签名验证技术的国内外研究动态 手写签名验证是通过分析手写签名的书写风格来判断书写人身份 的一门技术。近年来,由于手写签名验证技术在金融、法律等领域得 到广泛的应用,它正逐步成为模式识别领域中一个十分活跃但难度较 高的研究课题,中外学者对此进行了广泛的研究,但至今未能取得令 人满意的解决方案。手写签名本身具有一定的复杂性,虽然在同一个 人的手写签名中可以观察到某些不变性,但书写本身不是一个可重复 的过程。同一个人在不同年龄、不同精神状态、不同体力状态下所写 的签名将有很大不同,即使是同一个人连续两次签名也不可能相同。 因此,选择一组既能表达出不同签名者不同的书写风格( 即类间差别) , 又能容忍每次签名的自然差异( 即类内差别) 的特征,这是问题的关 键和难度所在。另一方面,目前对在线手写签名验证的研究工作开展 较多,相比之下,关于离线手写签名验证的文献要少得多,这主要是 由于离线手写签名验证要比在线困难得多。离线手写签名图像很容易 哈尔滨工程大学硕士学位论文 被模仿、复制,而在线验证系统普遍采用的运笔速度、加速度、压力 等动态信息,在离线图像中已保留得不多了。 常用的识别方法可以大致分为五类:模板匹配法、基于统计学识 别法、基于结构特征识别法、频域分析法和神经网络法。 模板匹配法是一种传统的模式识别方法。其基本原理是:定义每 个模式类的表征模式即模板,在识别过程中,通过逐个比较未知样本 与模板中的对应点( 即匹配) ,根据匹配结臬的好坏决定位置样本所归 属的类别瞪j 。y o s h i m u r a 等人【4 1 指出模板匹配法在日文签名验证中有很 好的效果。但是,使用模板匹配法时,两个签名的相似度受笔划的宽 度的影响。使用不同的笔签名,笔划宽度也不同。为了解决这个问题, 需要对签名图像进行归一化处理。k a t s u h i k ou e d a 51 在前人的基础上提 出一种新的模板匹配法应用于日文签名验证。这种改进的模板匹配法 首先将签名的笔划细化为一个象素宽,然后将签名的大小归一化。然 后再计算样本签名和测试签名的相似度。如果超过闽值贝q 为伪造签名。 该方法的平均误差率为9 1 ,传统的方法误差率为1 9 2 。经研究此 种方法对于鉴别随机伪造者比较有效,但是对于熟练伪造者的鉴别不 是特别有效。 基于统计学识别法主要描述图像的纹理单元或局部模式随机分布 和空间统计特征,建立统计学模型。它的理论支柱是概率论和数理统 计,是模式识别中经典性基础性的技术【6 】。其中隐马尔可夫模型 ( h i d d e nm a r k o vm o d e l s ) 作为统计概率模型已经被证明是一种很好的 签名验证模型f 7 】。 隐马尔可夫模型法是把签名的过程看成是一个随机过程一一马尔 可夫过程。隐马尔可夫模型是对签名信号的时间序列结构建立统计模 型,将之看作一个数学上的双重随机过程:一个是用具有有限状态数 的m a r k o v 链来模拟签名信号统计特性变化的隐含的随机过程,另一个 是与m a r k o v 链的每一个状态相关联的观测序列的随机过程。前者通过 6 哈尔滨工程大学硕士学位论文 后者表现出来,但前者的具体参数是不可测的。用隐马尔可夫模型对 签名进行建模的优势是,可以灵活的根据不同的签名的形状和长度建 模。而且,隐马尔可夫模型输出的是概率,因此特别适合在验证过程 中实现接受或拒绝算法。g r i g o l l 1 0 i n e d s o nj u s t i n o 7 , 8 1 使用隐马尔可 夫模型进行签名验证的一般过程是:用前向后向算法( f o r w a r d b a c k w a r d ) 通过递推方法计算已知模型输出o 及模型i 项,r ,a ,b ) 的产生 输出序列的概率p ( 0 1 ) ,然后用b a u m w e l c h 算法,基于最大似然准则 ( m l ) 对模型参数i ( z ,a ,b ) 进行修正,最优参数 的求解可表示为 = a r g m a x f p ( 0 1 2 ) 1 。最后用v i t e r b i 算法解出产生输出序列的最佳状态转 移序列x 。所谓最佳是以x 的最大条件后验概率为准则,即x = a r g m a x p ( x l o ,2 ) ) 。实验结果表明该方法对于随机伪造者的鉴别率很高,但是 对于熟练伪造者的鉴别率很有待提高。 其他的统计方法还包括灰度共生矩阵纹理分析方法、随机场模型 法等【2 1 4 l 。 基于结构特征识别法描述了图像的纹理单元及其周期性排列的空 间几何特征和排列规则【1 5 l 。因为有很多的手写签名无法分辨其内容, 我们将其看作一个整体,分析它的整体结构。k h u a n g 和h y a n 16 l 使用 了一种将静态结构特征和伪动态结构特征相结合的方法来进行离线手 写签名验证。他们选择了方向边界这个结构特征作为验证的基础。其 他还有形态学、图论、拓扑学等方法【17 a 8 1 。使用结构特征验证法比较 输入的签名和已有的签名的整体和细节的结构特征,可以消除随机伪 造者和熟练伪造者。 频域分析法是建立在多尺度分析与时频分析基础之上的分析方法 19 1 。q i 和h u n t 2 0 】首次在离线签名验证中使用多尺度分析法。他们选 择了低频信号来提取结构特征。w e n 等人【2 1 l 在在线中文签名系统中使 用基于小波的方法来检测熟练伪造者,但是他们的方法不适用于离线 系统。p e t e rs h a o h u ad e n g 2 2 】在离线签名验证中使用小波分析,取得 7 哈尔滨工程大学硕士学位论文 了比较满意的结果。实验证明频域分析法可以同时应用于离线签名验 证和在线签名验证中,也可以应用于西方文字签名和中文签名中。 人工神经网络这f - 新兴的技术出现以后,人们将它应用于签名验 证中也取得了很好的效果。人工神经网络本质上是一个自适应非线性 动力学系统,模拟了人类神经活动的原理,具有自适应性、并行性、 鲁棒性、容错性和学习特性,其很强的分类能力和输入一输出映射能 力在签名验证中都很有吸引力 2 3 - 2 5 】。 m i g h e l l 等人 2 6 1 是最早将神经网络应用于离线签名验证中的人。 后来r a s h aa b b a s 等人 2 7 - 2 9 】将神经网络加以改进。一般采用前向反馈 神经网络。神经网络包括输入层,隐层和输出层。输入层的神经元数 量由签名图像的大小来确定,通常是直接将签名图像,而不是提取后 的特征,输入到神经网络中。如定义签名图像的大小为l5 0 4 0 象素, 输入层就有6 0 0 0 个神经元。输出层有一个神经元,给出了输入该网络 的签名是真实签名的可信度一一一个0 到l 之间的数字。0 表示签名 完全是伪造的签名:l 表示完全是真实的签名。在试验中,如果网络 的输出结果在一个0 5 的阈值之上则就可以认为是真实的,反之则是 伪造的。通过改变隐层的神经元数量,o ,l ,5 0 或1 0 0 ,尝试了不同 的网络结构。算法可以采用反向传播算法。实验结果显示,使用神经 网络进行签名验证对于随机伪造者的识别率很高,而对于熟练伪造者 的识别率还有待提高。 1 4 中文手写签名验证的难点 由于人类的书写动力模型并非固定不变,手写签名的动态变化范 围很大。主要还存在以下难点: 1 手写签名的可变性,签名的稳定性只是相对而言的。签名随着 人的心理,生理状态的变化而波动,如疾病,疲劳,饮酒等。另外书 哈尔滨工程大学硕士学位论文 写位置,笔的式样等实际条件也会影响签名。所以我们不可能从一个 个体中获得非常准确的,可重复的签名特征样本。另外手写签名是不 断演化的,人的手写签名是一个演变的过程。这些不确定性给鉴别手 写签名的真伪带来了困难。 2 可用样本少。从实用的角度来讲,不可能用大量的样本进行训 练,这样会造成阈值的选取的困难:另一方面,伪造签名样本不易获 得。伪造签名的样本不能用统计的方法获得,只能用随机的样本来代 替熟练签名进行性能评价。这就引起对系统性能的过高的估计。 3 ,离线手写签名验证中,由于丢失了书写过程的动态信息,使可 利用的信息减少,增加了验证的难度。 4 中文签名与西方文字签名的差异。中文签名与西方文字签名的 形状有很大的不同,通常西方文字的签名是一个整体,无法分辨出其 中的单个字母,而中文签名一般由两或三个部分组成( 两个字的名字 或三个字的名字) ,且汉字的结构及其复杂。因此在验证的方法上还需 要进一步的研究。 鉴于以上原因,离线手写签名验证至今还没有一种切实有效的方 法来达到较高的正确识别率。 1 5 论文的主要工作 本文针对离线手写签名验证中的图像预处理、特征选择和提取、 验证方法等一些问题进行了探索性的研究,主要工作和研究成果包括: ( 1 )对现有的手写签名验证技术做了比较全面的综述,通过查阅 大量的国内外的文献,总结了各种方法的适用范围及优缺 点,同时介绍了国内外研究动态和一些国外的最新研究成 果: ( 2 )在签名图像预处理阶段,首先运用数字图像处理技术对手写 哈尔滨工程大学硕士学位论文 签名图像进行二值化,然后选择了基于数学形态学的图像滤 波方法对手写签名图像进行了平滑去噪和细化处理,最后在 必要时对签名进行了归一化处理,为后面的工作打好了基 础: ( 3 )在手写签名特征提取阶段,将签名图像当作纹理看待,总结 现有的纹理分析方法,基本上可以分为统计方法、结构方法、 基于模型的方法和频域分析法,并利用频域分析法中的傅立 叶变换和小波变换进行了签名特征提取: ( 4 )在签名验证部分使用傅立叶变换并利用相关函数分类法,基 于整数小波系数变换并利用加权欧式分类器法和基于 m a l l a t 小波变换并利用动态时间弯折算法分别进行验证。并 根据实验结果提出了签名二次分类法,即先用傅立叶变换对 签名进行第一次粗分类,然后用小波变换的方法进行第二次 验证。最后分析了三种方法的适用范围和实验结果; ( 5 )对本文所做的工作做了总结,提出了进一步的发展方向和需 要解决的问题。 本论文的内容结构介绍如下:第一章是绪论部分包括课题研究的 目的和意义,手写签名验证系统的构成,国内外研究动态及中文手写 签名存在的困难等。第二章则为签名图像的数据采集和预处理,包括 数据采集的方式,图像预处理,二值化、平滑去噪、细化和归一化等。 第三章介绍基于纹理的签名特征提取,包括纹理的介绍,基于纹理的 各种特征提取方法的总结和本文所用的特征提取方法的详细介绍等。 第四章则是手写签名的验证部分,介绍了所使用的三种验证方法及它 们的适用范围,对实验条件和实验样本进行说明并作出了实验结果的 分析等。最后是结论部分,包括对本次论文的总结及对未来的展望等。 o 堕签亟墨堡盔兰堡主兰垡丝奎 第2 窜签名图像的数据采集和预处理 2 。1 签名图像的数据采集 数据采集是指利用某种装置将签名样本的信息转化为离散的数字 信息输入计算机。所采用的数据采集装置根据在验证过程中所采用的 信号而定,采集到的签名样本的质量对于后面的处理过程和鉴别性能 有重要的影响。 本次实验所用的签名样本是用碳素笔自由书写在打印纸上的。所 使用的图像输入设备是m i c r o t e k 扫描仪。图像扫描仪的扫描精度和所 能获取签名信息的大小直接相关。签名验证时就是从预处理过的原始 签名中提取特征,对待验证样本进行鉴别真伪。因此签名图像的清晰 度是影响签名验证系统性能的重要因素【如l ,也是离线签名验证系统中 的一个很重要的参数。常用的图像扫描精度有2 0 0 d p i ,3 0 0 d p i ,6 0 0 d p i 等几种。扫描精度越高,签名图像的清晰度就越高,包含的信息量就 越大,这对签名的验证应该有利。但清晰度太高也有它的缺点,那就 是数据量大,同时所需内存和处理时间也增加,鉴别速度受到明显的 影响,这显然不是我们所追求的,但是分辨率太低就会使我们得不到 足够的验证信息。因此,合理的选择扫描精度很重要。综合各方面的 因素,本次实验中选择了6 0 0 d p i 的扫描精度队3 2 l ,以2 5 6 级灰度方式 输入计算机,存为b m p 文件。每个原始签名图像按照一定的命名规则 单独存为b m p 文件。 输入图像可以是二值图像或灰度图像,灰度图像会包含更多的信 息,但要比二值图像占用更多的内存。由于灰度图像的灰度级变化等 方面可能包含签名的部分动态信息,因此可利用灰度图像获得签名的 哈尔滨工程大学硕士学位论文 伪动态信息,用于特征提取。 本次实验采集到的签名样本可以分为两类:真实签名和伪造签名。 其中伪造签名又可分为随机伪造者签名和熟练伪造者签名。随机伪造 者是指那些从未见过真实签名的人,他们可能用自己的笔迹来伪造真 实的签名,甚至有的人签自己的名字来伪造真实的签名,如图2 2 。熟 练伪造者是指那些不仅见过真实的签名,而且还精心的模仿过真实的 签名的人,如图2 3 。因此,他们的伪造签名与真实签名十分相似,给 签名验证工作带来很大的难度。在现实中,随机伪造者的数量比较多。 但是熟练伪造者的鉴别难度更大。 图2 1 2 2 久 真实签名样 乒 入 随机伪造者 夕 图2 3 熟练伪造者签名样本 2 2 签名图像的预处理 由于本实验中数据获取是书写在自纸上的签名经过扫描仪输入计 算机的,那么就必然存在着干扰,因此通常不能直接使用。这些干扰 噪声大致可分为两类: 搬 撅一撩搬本撅一撅 1 屯 王封己 哈尔滨工程大学硕士学位论文 ( 1 ) 因签名背景( 如书写用纸) 有杂质,书写不好引起的干扰。 此类干扰表现为文字笔画附近出现污点( 称黑色孤立点) ,或文字笔画 中有缺陷( 称为白色孤立点) 。 ( 2 ) 由于扫描设备的原因或书写用力不均,字体潦草等产生的干 扰。此类干扰表现为签名大小不一,笔画粗细不均,甚至笔画断开或 相邻文字粘连等。 因此,为了对签名图像做进一步的处理,必须首先进行预处理, 清除黑白孤点,均匀笔画粗细,使位置、大小不一的文字规范化。预 处理的过程一般包括签名图像二值化,平滑去噪、细化及签名图像的 归一化等,下面分别进行讨论。 2 2 1 签名图像的二值化 由于离线手写签名验证只需处理图像中的字符信息,对颜色等信 息不作处理,所以必须对扫描得到的文本图像进行二值化处理,以去 掉不必要的信息,提高鉴别的速度,为以后的特征提取打下基础。 设扫描后的签名图像点阵为: c ( f ( i ) ) i21 ,2 ,p ,j = l 2 ,q ( 2 一1 ) 式中f ( i ,j ) 是象素( f ,) 的灰度值。有黑笔画的部分,f ( i ,j ) 小:而白背 景部分,f ( i ,j ) 则大。最简单的二值化通过设定固定灰度阈值7 1 完成, 即当f ( i ,j ) 比预定阈值,大,看成背景,以“0 ”标志;否则看成签名 笔画,以“1 ”标志。 假设: g ( f ,) :l , f ( i 皇: f :1 ,2 ,p ,:1 ,2 ,可 g t 。,j j 2 i 。,、f ,) 丁 7 2 1 2 ,p ,。1 2 可 b = ( g ( f 埘即为签名图像二值化后的图像点阵。 对于签名图像二值化,要求二值化后的图像能忠实地再现原签名。 哈尔滨工程大学硕士学位论文 基本要求为: ( 1 ) 笔画中不出现空白点; ( 2 ) 二值化的笔画基本保持原来文字的结构特征; 二值化的关键在于阈值7 1 的选择。一般情况下,的选择不仅与 象素点的位置有关,而且还与该点的灰度值和它周围点的灰度值有关。 因此,闽值7 1 可用一个形式为三元函数的闽值算子来表示。 t = t f ( i ,_ ,) ,n ( i ,) ,( f ,朋( 2 - 2 ) 式中( f ) 是签名图像中象素点的坐标,f ( i ,j ) 是点( f ,) 的灰度值, v ( f ,j ) 表示点( f ,j ) 周围局部灰度特征。 因此二值化的方法根据不同的阈值选择方法分为整体闽值二值 化,局部阈值二值化和动态阈值二值化。虽然局部阈值法和动态阈值 法能处理书写质量差,干扰较严重的签名但是计算时间过长,而且 本次实验的签名样本其笔画和背景的区分比较明显。所以在本次签名 验证中,采用整体阈值二值化法。 仅由象素点( f ) 的灰度值f ( i ,j ) 确定闽值的方法称为整体闽值选 择法。闽值丁表示为:t = t f ( i ,朋。 常用的整体阈值选择方法有人工设定整体闽值法和由灰度级直方 图确定整体阈值法,本文根据实际情况选择了由灰度级直方图确定整 体阈值法。下面分别介绍一下这两种方法: 1 、 人工设定整体阈值 根据实验或人的先验经验,预先给定一个固定的阈值7 1 d 。当 f ( i ,j ) t o 时,( f ,) 为签名笔画上的点,否则为背景上的点。这是一种 最简单的速度最快的二值化方法。当文字清晰,轮廓明显,干扰很小 时,它是一种行之有效的二值化方法。人工设定整体阈值的缺点是: 不能根据每个文字确定它最佳的阈值。确定阈值7 后,光源等外 晃条件改变时,不能使闽值随之改变。 2 、由灰度级直方图确定整体闽值 4 哈尔滨工程大学硕士学位论文 这是一种根据图像和背景的灰度值自动确定整体阈值法。灰度级 直方图给出了一副图像灰度值的概貌描述。设规范化灰度值譬的范围 为0sgsl ,g = 0 为最黑,g = 1 为最白。m 为灰度级数目,p ( g , ) 为 第k 级灰度的概率。仇是在图像中出现的灰度级为k 的次数,订为图 像中象素的总数。则有 p ( g ) = y l k ,0 g 女1 ,k = 1 , 2 ,m( 2 - 3 ) 盯 通常称以p ( g 。) 为纵坐标,以g 。为横坐标的图像为灰度级直方图。签 名图像的直方图一般有两个峰值,一个峰值对应签名的笔画部分,另 一个峰值对应签名的背景部分。阈值应取在两个峰值的波谷处,波谷 越深陡,二值化效果越好。 在本论文中,采用了由灰度直方图确定阈值的整体阈值法。如图 2 6 所示,某一签名样本图像的灰度直方图有两个最大峰值,一个峰值 对应签名的笔画部分,另一个峰值对应签名的背景部分。我们将阈值 设在相对于两峰的中间位置。图2 5 为二值化之后的签名图像。 馕,i 攀。j o 蕉 图2 4 原始签名图像 馁砂萍 图2 5 签名的二值图 哈尔滨工程大学硕士学位论文 _月_j。: 16 4 3 9 5 1i i 0 。写b 、o 0 1 。、5 1 。0 。曲6 一2 5 5 7 显示的灰度匿撼j 嘬:f 脚艮: 。毒j ;廑重豳。亭j 童幽 图2 6 签名的灰度直方图 2 2 2 签名图像的平滑去噪 利用滤波技术可从复杂的信号中提取出所需要的信号,抑制不需 要的信号,使图像更清晰。图像的清晰度主要决定于图像边缘、细线 和小特征是否清晰,特征之间的区域变化是否平滑。对图像滤波的方 法可分为空域滤波和频域滤波。过去,主要用线性滤波器来滤波,但 线性滤波器不能有效地抑制各种非加性高斯噪声,且不利于信号边缘 等细节特征的保持。因此,本文主要采用非线性滤波器中的基于数学 形态学的图像滤波方法来处理签名图像。 基于数学形态学的图像滤波方法是一种非线性滤波法 3 3 , 3 4j 。它是 研究数字影像形态结构特征与快速并行处理方法的理论,是通过对目 1 6 哈尔滨工程大学硕士学位论文 标影像的形态变换来实现结构分析和特征提取的。数学形态学算子的 性能主要以几何方式刻画,而不同于传统方式中以解析形式描述算子 的性能,这种特点更适合视觉信息的处理和分析,见图2 4 。从图中可 知,使用具有一定形态的结构元素度量可以提取图像中的对应形状信 息因此,在形态学的操作中最重要的是结构元素的选择。结构元素 是一个用来定义形态操作中所用到的邻域的形状和大小的矩阵,该矩 阵仅由0 和1 组成,具有任意的大小和维数,1 代表邻域内的像素。 形态学运算都是对数值为1 区域的运算。 图2 ,7 数学形态学的基本思想 利用数学形态学对图像滤波可达到图像增强的目的。其中:a 表 示输入图像,b 表示结构元素,口表示图像中爿的一像素的坐标,b 表 示结构元素b 中的一像素的坐标,w 表示b 的对称集b 中的一像素的 坐标,z = ( z l , z 2 ) 表示坐标系中的一个点的坐标,c 为口相对于:平移之 后的坐标。 对称集( r e f l e c t i o n ) :集合口的对称集记为b ,定义为 b = w i w = - b ,v b b ,( 2 - 4 ) 式中:b 所有元素的坐标以原点( 不一定是坐标0 点) 为中心进行取 反,在数学形态学中一般是对结构元素做其关于原点的对称集。 平移( t r a n s l a t i o n ) :集合彳中所有元素相对于点z = ( = ,z 2 ) 平 1 7 哈尔滨工程大学硕士学位论文 移定义为 ( 爿) z = 忙ic = 以+ = ,v a a )( 2 - 5 ) 膨胀( d i l a t i o n ) :膨胀的运算符为“o ”,图像集合爿用结构元 素b 进行膨胀记做a b ,定义为 a o b = z i ( b ) :n a 由 或a o b = z i ( b ) :n a 】a )( 2 - 6 ) 式( 2 6 ) 表明,用b 对a 膨胀是,首先对b 做关于原点的对称集,再将 其对称集平移:,当a 与b 的对称集的交集不为空集时,b 的原点就 是膨胀集合的象素,膨胀运算可以填平图像中小孔和弥合小裂缝。 腐蚀( e r o s i or 1 ) :腐蚀运算是膨胀运算的逆运算,其运算符为 “0 ”,图像集合爿用结构元素占腐蚀记作爿船,定义为 a o b = z l ( b ) :4 )( 2 - 7 ) 式( 2 7 ) 表明,a 用b 腐蚀的结果是所有满足将b 平移:后,b 仍全部 包含在a 中的:的集合,直观看是b 经过平移后全部包含在a 中的8 的原点组成的集合。腐蚀运算可以去除图像中孤立的点和毛刺。 开( o p e n i n g ) :使用同一个结构元素对图像先腐蚀在膨胀的运算 称为开运算,其运算符为“o ”,a 用占开运算记为ao b ,定义为 a 。口= ( a o b ) 0 b( 2 8 ) 闭( c 1o s i n g ) :闭是开的逆运算,即使用结构元素对图像先膨胀 再腐蚀,其运算符为“”,爿用b 闭运算记为爿b ,定义为 a b = ( 4 0 b ) 铅 ( 2 9 ) 对膨胀和腐蚀运算的分析可知:开运算能去除孤立的小点、毛刺 和小桥;闭运算能填平小湖和弥合小裂缝,而运算均不改变图像总的 位置和形状,因此,二者结合使用既能消噪又能平滑的目的。本文在 处理中首先对图像进行腐蚀运算如图2 8 ,去除了图像中的孤立的点和 毛刺,然后再对图像进行膨胀运算如图2 9 ,填平图像中小孔和弥合小 裂缝,从而完成签名图像的平滑去噪工作。 lr 哈尔滨工程大学硕士学位论文 4 原 8 腐 图2 9 膨胀后的图像 2 2 3 签名图像的细化 为了提取手写签名的拓扑结构,以及突出签名的形状特点和减少 冗余的信息量,要对扫描进来的签名图像进行细化处理。所谓细化, 就是寻找图形、笔划的中轴线或骨架,以其骨架取代该图形或笔划。 也就是说,细化之后该图形或笔划的象素宽度为1 ,可以用数学语言 严格地描述图形的轴线或骨架。细化的过程就是对图像逐层剥落的过 程,随着细化的进行,图像有规律地缩小。 近几十年来,各国学者提出了许多细化算法,但大多数是在以下 两类方法的基础上发展起来的。其一是b l u m 定义的一种细化法,即 1 9 军 萍萍 移 一 钐 一 谚 锾龇误酏误 哈尔滨工程大学硕士学位论文 所谓的中轴变换;其二是r o s e n f e l d 提出的局部差别删除法。而这些算 法都不同程度地存在判断复杂,执行时间长,对噪声敏感等闻题。而 基于数学形态学的方法具有算法简单、速度快、并行处理,易于实现 等特点。因此本文也选择了基于数学形态学的方法对签名图像进行细 化处理。 由前面介绍的数学形态学的基本知识可以知道,基本形态运算中 的薄化运算( t h i n n i n g ) 是指结构元素b 对输入图像4 的薄化,要实现薄 化运算首先判断击中不击中: 击中不击中( h i t m is s ) :a 是输入图像爿的对称集,结构基元 e ,f ( e n f m ) 构成一个结构元素对b = e ,用。则击中不击中的运算 符为“”,记为a + b ,定义为 a 十b = ( a b e ) n ( a o f )( 2 一1 0 ) 若a b 中,则为击中:a + b = 巾,则为击不中。即4 被占击中的结 果相当于a 被e 腐蚀的结果与a 被f 腐蚀的结果的交集。 击不击中运算实际上是一种严格的模板匹配,它不仅指正出匹配 点所应满足的性质,即模板的形状。同时也指出这些点不应满足的性 质,即对周围环境背景的要求。 薄化运算( t h i n n i n g ) :结构元素b 对输入图像a 的薄化记为 a o b ,定义为 爿d b = a 一( 爿+ b )( 2 1 1 ) 式( 2 一1 1 ) 表示8 对a 的薄化的结果是从图像4 中去除被b 击中集合后 剩余的图像集合,所以对图像进行薄化运算可以使图像减细。 结构元素b 首先应使得图像在细化过程中保持连通性。更具体的 说,基于数学形态学的细化运算是由腐蚀和膨胀两种变换合成的,在 2 0 哈尔滨工程大学硕士学位论文 腐蚀过程中,不断移动结构元素b 的中心点,使它与图像a 中各点重 合,若当a 中某点( 灰度为1 ) 与b 的中心重合,该点的邻点( 在此 取8 邻域点) 也恰好与日的其他点结构特征相同,则可将该点的灰度 由1 变为0 ,即从a 中删去该点,将中心点由1 变为0 后,a 的连通 性不变。其次就是孤立点、一条线段的端点、非边界点的结构形式不 能选取。因为孤立点已经不存在进一步细化的问题:一条线段没有“厚 度”,因此,不必细化:而非边界点不属于被腐蚀或“剥落”的对象。 所使用的结构元素如图2 1 0 所示。 0o0 l lll ( b 1 ) o 0ll 01 o0 fl 0 叠 i叠 ( b 2 ) 1 ll0 00 10 1l0 10 ( b 3 ) l 0l o0 1ii l 000 ( b 4 ) 0o 011 l ( b 5 )( b 6 )( b 7 ) ( b 8 ) 图2 1 0 结构元素的特征 其中,符号“半”表示可取灰度1 ,又可取灰度0 的像素。然后将b 1 , b 2 两种结构元素旋转9 0 度、1 8 0 度、2 7 0 度得出b 3 b 8 这6 种结 构元素,总共有8 种结构元素。这8 种结构元素分别对应着东、西、 南、北及东北、西北、西南及东南8 个方向上的边界点。 综上所述,使用数学形态学的方法对二值图像进行细化,虽然要 用到多个结构元素,但它们之间是相互独立并列的关系,每次只用到 其中一个判据。也就是说,只要判断出图像中的某一像素及其邻点, 与众多结构元素中的一个相匹配,那么该像素就是可以删除的边缘点, 哈尔滨工程大学硕士学位论文 而不像其他方法那样需要几个条件同时满足才能删除。因此基于数学 形态学的细化方法简单明了。本实验中使用该方法进行细化处理后的 图像如图2 1 1 所示。 误砂萍 幽2 4 原始签名图像 锾砂萍 图2 1 1 细化后的图像 2 2 4 签名图像的归一化 人们在书写签名的过程中的任意性以及因人而异的书写方式,形 成手写签名的各种变形,造成手写签名图像的大小不一。因此需要将 它们作归一化处理。 归一化的内容包括灰度范围、字符尺寸、位置、倾斜方向、笔划 厚度和方向等。尺寸的归一化在签名验证中最为普遍,基本的方法是 将去掉四边空白后的签名图像线形映射到归一化点阵中去,这就是下 面所说的“四边定界法”p “。签名验证的字符归一化的特殊性在于, 字符的倾斜、笔划的位置和方向等特征需尽量保持,因此像矩归

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论