文档简介
摘要 签名是一种使用广泛的识别身份的生物特征,在社会生活中扮演 着重要的角色。基于手写签名的身份鉴别在金融、军事、商业、通信、 办公自动化、安全等领域有着广泛的应用前景。因此研究在离线状态 下,使用计算机对手写签名进行自动识别进而辨别身份的技术具有很 大的实用价值。本文对离线签名鉴别中的预处理、特征提取、认证和 识别作了深入的研究。主要工作体现在以下几个方面: 1 ) 研究了签名图像的平滑、二值化、细化和笔迹修复等预处理 操作。考虑签名图像特性并针对图像二值化中的阈值选取问题,提出 一种混合二值化算法,有效地解决了全局阈值法和局部比较法的不 足,抗噪能力强,保持笔划连通性好,适合于签名图像的二值化。 2 ) 提出一种基于保局投影的特征提取方法。综合采用签名的形 状特征、伪动态特征、纹理特征作为初始特征,克服了单一特征没有 足够能力反映细微差异的缺陷;利用保局投影对高维初始特征集进行 降维,获取更具, j j 另j 性的特征。该方法既具有保持数据集结构不变的 非线性特点,又有效解决了“维数灾难”问题。 3 ) 提出一种基于最优阈值的签名认证方法。运用加权欧氏距离 构建判别器,采用遗传算法自适应选取最优阈值。克服了传统方法对 所有人选取相同阈值的缺陷。实验结果表明该方法能有效的降低误识 率( f a r ) 和拒识率( f r r ) ,从而提高签名认证的准确率。 4 ) 采用一种具有纠错能力的多类s v m 分类法对签名图像进行识 别。利用纠错码结合支持向量机来构造多个二元分类器;根据每个 s v m 分类器的输出采用投票方法决定识别结果。该方法有效地利用了 信道差错控制编码技术因而具有纠错能力,取得了比传统方法更好的 识别效果。 关键词:离线签名鉴别预处理特征提取最优阈值支持向量机 a b s t r a c t s i g n a t u r ei so n eo ft h eb i o l o g i c a lf e a t u r e su s e da b r o a dt ov e r i f y i d e n t i t y , a n dp l a y sa ni m p o r t a n tr o l ei nl o t so ff i e l d s a s aw a yo f p e r s o n a li d e n t i f i c a t i o n ,s i g n a t u r ev e r i f i c a t i o nh a saw i d ep e r s p e c t i v e i na p p l i c a t i o n si ne l e c t r o n i c b a n k ,m i l i t a r y a f f a i r s ,e l e c t r o n i c b u s i n e s s , c o m m u n i c a t i o n ,o f f i c ea u t o m a t i o na n ds e e u r i t y s oi t sv a l u a b l ef o ru st o d e a lw i t ht h eo f f - l i n e s i g n a t u r ev e r i f i c a t i o nr e s e a r c h s i g n a t u r ei m a g e s b e i n gt h eo b je e t s ,p r e p r o e e s s i n g ,f e a t u r ee x r t r a c t i o n ,v e r i f i c a t i o na n d r e c o g n i t i o na r es t u d i e di nd e p t hi nt h i sp a p e r o u rr e s e a r c hw o r kf o c u so n t h ef o l l o w i n ga s p e c t s : 1 ) i m a g ef i l t e r i n g ,b i n a r i z a t i o n ,t h i n n i n ga n dh a n d w r i t i n gr e p a i r i n ga r e s t u d i e d t h i sp a r tp r o p o s e sa nh y b r i db i n a r i z a t i o na l g o r i t h mf o rs i g n a t u r e i m a g ew i t c ho v e r c o m et h es h o r t c o m i n g so fg l o b a lt h r e s h o l d i n ga n dl o c a l t h r e s h o l de f f e c t i v e l y o u rh y b r i da p p r o a c hi sr o b u s tt on o i s ea n dm a k e s c o n n e c t i v i t yo fs t r o k eb e t t e r 2 ) am e t h o df o rf e a t u r ee x t r a c t i o n ,w h i c hi sb a s e do nl p p i sa d o p t e di n t h ep a p e r t h r e ed i f f e r e n tk i n d so ff e a t u r e sa r eu s e da s i n i t i a lf e a t u r e s , i n c l u d i n gs h a p e ,p s e u d od y n a m i ca n dt e x t u r ef e a t u r e i ta v o i d st h e s h o r t a g eo fu s i n go n l yo n ek i n do ff e a r u t e sw h i c ha r en o tc a p a b l eo f r e f l e c t i n gs l i g h td i f f e r e n c e t h e nt h el p pi su s e dt or e d u c et h ed i m e n s i o n o ft h ef e a t u r es p a c ei no r d e rt og e tm o r ed i s c r i m i n a n tf e a t u r e s t h i s m e t h o dh a st h en o n l i n e a rp e c u l i a r i t yo fk e e p i n gt h ed a t as t r u c t u r e u n c h a n g e d 3 ) am e t h o db a s e do n o p t i m a l t h r e s h o l df o r r e c o g n i t i o n i s a d o p t e d w e i g h t e de u c l i d e a nd i s t a n c ei su s e df o rv e r i f i c a t i o na n dg e n e t i c a l g o r i t h mi s u s e dt of i n do u tt h eo p t i m a lt h r e s h o l df o re a c hw r i t e r a d a p t i v l y , w h i c hc a no v e r c o m et h ed r a w b a c k so ft r a d i t i o n a lm e t h o do f s i n g l et h r e s h o l d t h ee x p e r i m e n tr e s u l ts h o w st h a tt h ea p p r o a c hc a n e f f e c t i v e l y l e td o w nt h ef a ra n de r r , a n dh a s e n c o u r a g e dt h e p e r f o r m a n c eo ft h ev e r i f i c a t i o n 4 ) a m e t h o df o rs i g n a t u r er e c o g n i t i o n ,w h i c hi sb a s e do nam u l t i c l a s s c l a s s i f i e rc o m p o s e do ft w oc l a s ss v mc l a s s i f i e rw i t he r r o rc o r r e c t i n g ,i s i i a d o p t e di nt h ep a p e r e r r o rc o r r e c t i o nc o d ec o m b i n e dw i t hs v mi su s e d t oc o m p o s eam u l t i c l a s sc l a s s i f i e r t h e r e c o g n i t i o nr e s u l t si sd e c i d e db y t h eo u t p u to fe a c hs v mc l a s s i f i e r t h i sc l a s s i f i e rh a se r r o rc o r r e c t i n g a b i l i t yb e c a u s ei tu s e st h ee r r o rc o n t r o le n c o d ei nc o m m u n i c a t i o n a l c h a n n e l t h e r e f o rt h i sc l a s s i f i e rh a sb e t t e rc l a s s i f i e de f f e c tt h a nt r a d i t i o n a l c l a s s i f i e r s k e y w o r d s :o f f - l i n es i g n a t u r e r e c o g n i t i o n ;p r e p r o c e s s i n g ;f e a t u r e e x t r a c t i o n ;o p t i m a lt h r e s h o l d ;s v m i i l 原创性声明 本人声明,所呈交的学位论文是本人在导师指导下进行的研究 工作及取得的研究成果。尽我所知,除了论文中特别加以标注和致谢 的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不 包含为获得中南大学或其他单位的学位或证书而使用过的材料。与我 共同工作的同志对本研究所作的贡献均己在论文中作了明确的说明。 作者签名:j 雌 日期:丑年上月三日 关于学位论文使用授权说明 本人了解中南大学有关保留、使用学位论文的规定,即:学校 有权保留学位论文,允许学位论文被查阅和借阅;学校可以公布学位 论文的全部或部分内容,可以采用复印、缩印或其它手段保存学位论 文;学校可根据国家或湖南省有关部门规定送交学位论文。 储签名:摊导师签名五陋日期:型年上月塑日 中南人学硕十论文第一章绪论 1 1 研究背景及意义 第一章绪论帚一早珀t 匕 当今的社会是一个高速发展的社会,计算机和网络的普及使人们之间的交往 越来越频繁,但随之而来的安全问题却越来越突出。以往通用的安全认证手段局 限于使用钥匙、磁卡和密码等措施。但是钥匙和磁卡容易遗失,而密码可能被遗 忘,并且黑客利用计算机日益提高的运算性能很容易将固定位数的密码攻破,这 对安全性能要求比较高的领域,如金融领域、安全领域和个人隐私领域等,可以 说是灾难性的,因此这就需要相当可靠的信息安全保障。一种新的更安全、方便 的身份识别途径一生物特征识别技术正是基于用户的独特性而备受瞩目。 所谓生物特征识别技术( b i o m e t r i c s ) 是指通过计算机将人体所固有的生理 特征或行为特征进行收集、处理,来进行个人身份鉴别( 认证和识别) 的技术。可 供做个人身份确认的生物特征有许多种,大致可分为两类: ( 1 ) 生理特征:它是与生俱来的,多为先天性的。常用的生理特征包括d n a 、指 纹、掌纹、视网膜、虹膜、面部特征、手形以及一些部位的皮下血管分布情 况等; ( 2 ) 行为特征:是习惯使然,多为后天形成。如声纹、签名、笔迹和步态等。 科学家将生理特征和行为特征统称为生物特征。 如图1 1 所示为基于不同的身份验证方法:生物特征和物理特征( 基于动态 和静态) 的区分。 图1 1 不同的身份验证方法 能够用来鉴别身份的生物特征应该具有以下四个特点: 艏鹳髋j;|: 一 一 擞| 薹膘数 一 祸一 静态特征 v 中南人学硕i :论文 第一章绪论 ( 1 ) 广泛性,每个人都应该具有这种特征; ( 2 ) 唯一性,每个人拥有的特征应该各不相同; ( 3 ) 稳定性,所选择的特征应该不随时间变化而发生变化或者变化很小; ( 4 ) 可采集性,所选择的特征应该便于测量。 手写签名作为一种生物特征,虽然不属于个人固有的生理特征,但它是一种 行为特征。现代人体运动学研究表明,签名这种运动是由人的神经一肌肉系统决 定的,与个人的性格、体质和幼时的训练有关,每个人都拥有自己独特的书写风 格,表现为不同的书写力道、笔划书写顺序、笔划连接方式、局部装饰笔划等。 因此签名可以作为辨识个人身份的一种有效生物特征。 签名鉴别是建立在每个人的签名都有自己独特的理解和写法,并且相对稳定 的基础之上的。签名不仅代表了签名者的信息,而且签名的某些内在的具有唯一 性的特征与产生签名这一信息的特定生物力学系统有关乜3 j 。与其他生物测定技 术相比,签名鉴别具有如下优点: 1 ) 签名作为一种用户的习惯行为,不会被遗忘。 2 ) 自然性。签名是用户经常进行的活动,属于一种容易接受的信息采集模 式。在笔迹鉴别过程中,用户可以和平时一样,在很自然的方式下提供 签名。相比之下,虹膜识别虽然具有很高的识别率,但在数据采集阶段 用户必须将眼睛睁大,站在仪器的有效感受范围内,较长时间内保持特 定的姿势,这对用户而言是很不舒适的。 3 ) 共享性。正因为签名是独特的,长久以来人们使用签名、并信任签名所 代表的内涵。在现代的金融领域,用户可签署函件赋予他人以代理人的 权利,或以支票的形式使他人间接地使用自己的签名,从而他人可以享 有用户的部分权力。这是用其他的生物特征无法实现的。 此外,签名还具有难模仿,尊重隐私权,信息获取高效,易被接受,人体伤 害少等优势。鉴于签名鉴别的诸多特点,它在金融、银行、安全等领域有着很好 的应用前景。例如在金融领域中,用户无需出据繁琐的诸如单位证明之类的各种 纸张证据,只需要一个简单的签名就可以对用户的身份进行认证;在安全领域中, 通过辨明笔迹可以缩小嫌疑人的范围;通过签名识别则可以对敏感人物签署的文 件进行监控;特别在银行里,每天都面临大量的支票需要确认真伪,有效的签名 认证将简化确认过程,提高工作效率。 签名鉴别问题属于模式识别领域中的图像识别问题,它主要涉及计算机、图 像处理、模式识别、语言文字学、数学、人工智能和仿生学等学科,是一个综合 多个学科的研究领域。近年来,众多机构和学者在关于签名鉴别的理论和技术性 课题领域开展了广泛的研究,发表了大量的学术论文和研究报告,开发出了具有 2 中南大学硕上论文 第一章绪论 一定应用价值的签名鉴别系统。但是,在特征提取和分类决策方面仍存在较多待 解决的问题,具有较大的研究空间。因此,中文签名鉴别的研究是一项具有重要 现实意义的高科技应用基础研究,对提高我国高科技领域的智能水平,改善人机 之间的信息交互能力有着重要的理论和现实意义。 1 2 离线签名鉴别系统 签名一般可以通过两种途径获得,即:在线方式和离线方式。相应地,签名 鉴别h 儿副也可分为在线签名鉴别和离线签名鉴别两种。在线签名鉴别中,签名被 表示成一种或几种随时间变化的信号序列,其中包含签名的动态信息,因此在线 签名鉴别也称为动态或联机签名鉴别。而在离线签名鉴别中,签名是以所提取的 二维图像特征的形式来描述的,故也称之为静态签名鉴别。一般说来,在线签名 鉴别的识别率较高,因为这种方式的特征是以输入信号的方式获得的,可以利用 书写过程中笔尖运动的速度、加速度、压力等作为识别特征。对于离线签名鉴别, 由于书写过程中的动态信息几乎全部丢失,只能依据签名图像的静态信息,即每 个人笔迹的特点和相对稳定性来有效反映签名的书写风格和书写习惯,因此鉴别 难度比较大,识别率也相对较低。而在在线签名鉴别中,每个人的笔尖运动都有 自己的习惯,不同人之间难以相互模仿,从而使得在线签名鉴别工作相对简单。 此外,根据身份鉴别系统工作模式的不同,又可将签名鉴别分为签名识别和签 名认证两类。目前,相关的研究大都集中于“认证”( v e r i f i e a t i o n ) ,有关“识 别( r e c o g n i t i o n ) 的研究比较少。但离线签名识别与离线签名认证在预处理和 特征提取这两个步骤上基本上相同,它们不同之处主要在判别决策上。 在认证模式下,。系统对签写人身份的真伪进行认证,是一个二分类问题。认 证系统有两个重要的统计性能指标:错误拒绝率f r r ( 漏报) 和错误接受率a f r ( 虚 警) 。错误拒绝是指生物特征的真实拥有者被系统拒绝,错误接受是指将冒充者 识别为真正的生物特征拥有者。对于理想的系统来说,这两个错误率都应该是零。 但实际上这两个指标是相关的,当错误拒绝率比较低时,错误接受率相应会比较 高,反之亦然。系统往往需要在两个错误率之间取一个折衷。 在识别模式下,系统的输出通常是输入的若干个可能的拥有者,识别目的是 从参考签名样本库中找出给定签名对应的签写者,是个多分类问题。系统性能的 主要指标是正确识别率以及匹配一个特征所需的平均时间。 1 2 1 离线签名鉴别系统 ( 1 ) 离线签名认证系统 中南人学硕一i :论文第一章绪论 签名认证系统一般有两个主要流程操作,一是签名样本的注册即模板的生 成。将采集的参考样本输入系统,提取有用信息,建立模板数据库;二是提取 待测签名的相关信息经过与模板信息的比较以验证真伪。在训练阶段,使用一 定数量的真实签名资料将用来建立其所拥有的参考样本。在比较阶段,将测试 用签名样本信息输入系统,这个测试样本包含的信息将用来与训练阶段所建立 的参考样本信息比较,以此判断此测试样本是否为该使用者的本人签名。 该系统流程图见下图1 2 。如果使用者从未在该系统上注册过,将被要求 输入数个签名以产生其参考样本。随后,这些真实签名样本将经过预处理过 程,包括去除背景、平滑、二值化、细化等过程。接下来的训练阶段将提取这 些样本的有效签名特征,并建立参考样本。如果欲进入系统的使用者已登记 过,要进行签名认证,则其输入的签名将进行与训练阶段相同的预处理与特征 提取等步骤,所产生的资料则与此使用者在系统中已建立的参考样本资料库相 比对,以决定输入的签名是否为本人的真实签名。 伪造签名 图1 2 离线签名认证流程图 ( 2 ) 离线签名识别系统 所谓离线签名识别,顾名思义就是根据离线签名图像对签写人的身份进行识 别,其依据是每个人的签名都有着自己独特的理解和写法,而且这些蕴藏在签名 4 中南大学硕士论文第一章绪论 中的书写习惯相对稳定,能代表签写人的身份。构造离线签名识别系统的目的是 为了依据离线签名图像识别对应签写人的身份,系统并不对签名的真伪进行认 证。离线签名识别系统包括数据采集模块、预处理模块、特征提取模块、注册模 块、参考数据库模块和识别模块六个部分。其中,参考数据库由参考签名图像库 和对应的参考特征库组成。 签名识别的一般流程如图1 3 所示:首先通过数据采集( 数字化) 将签名样本 转化为数字图像;然后对得到的数字签名图像进行预处理,以滤除签名图像在数 字化中可能引入的噪声,改善图像质量,并获取各种能有效表征签名的签名信息 载体;接下来进行特征提取,提取的特征形成特征集将被用于注册或用于签名者 身份识别;最后根据该签名对应的签名者身份是否己经申明将签名注册到参考数 据库或者利用参考数据库对签名人身份进行识别。 数据采集 上 预处理 上 特征提取 图1 3 离线签名识别流程图 1 2 2 离线签名鉴别的难点及存在的问题 手写签名作为身份认证方式是当前研究的热点,但是与其他生物测定方法 ( 尤其是指纹、视网膜、虹膜和d n a 等基于生理特征的测定方法) 相比,离线签名 鉴别从理论上来分析,难点在于: ( 1 ) 签名的变化性和多样性 生理特征在一段相当长的时间内是不可变的( 除非十分特殊的情况,如发育 5 中南人学硕1 j 论文 第一章绪论 期、受伤、手术、基因突变等) ,而行为特征会随着人的习惯改变而相应发生或 多或少的变化。手写签名作为基于行为特征的测定技术,特定于某个用户的习惯 特性并不稳定,既会在短时期内的若干样本中有所波动,长时期内也会在j 下常的 范围中表现出细微的变化。这将给样本训练、认证和识别带来一定的困难,也使 得系统难以长期适应用户签名习惯的变化。 ( 2 ) 可用样本少 对于签名认证,一方面如果用大量的样本进行训练这样会造成阈值选取的 困难;另一方面,伪造签名样本不易获得。伪造签名的样本不能用统计的方法获 得,只能用随机的样本,而这就造成所获得的伪造样本有很多都是简单伪造签名, 如果用它们来代替熟练伪签名进行性能评价,必然会引起对系统性能过高的估 计。 对于签名识别,如果训练样本太少,则无法提供给分类器足够的分类信息, 影响识别效果;提供的有效样本越多,获得的有关签名的信息也就越多,识别效 果也就越好。但并不是说样本越多越好,一方面选取的样本过多会增加运算量, 增加分类器负担;另一方面,如果所选取的样本有效性低,可能会带入过多的冗 余信息和干扰,反而使得有用信息无法突出。 ( 3 ) 特征集的区分度不够大 这并非指签名过程中不存在用户间区分度足够大的静态形状特征和动态行 为特征,在理想的情况下一定客观存在这样的特征组合。但在实际应用中,识别 和认证的用户群相当大,这样的特征集合也相应的会很庞大,在盲目追求鉴别率 的同时将耗费极大的代价。 相对于在线签名鉴别,离线签名鉴别过程中由于丢失了书写过程中的动态信 息,使可利用的信息减少,增加了鉴别的难度。另外,有些高超的伪造签名模仿 得惟妙惟肖,有时即使是人类专家进行鉴别,鉴别率也可能会很低。 再者,中文签名鉴别与西文签名鉴别也有较大本质上的区别。中文主要由笔 段构成,而西文以弧段为主;而且中文签名数目多,结构复杂,且字体变化多样, 而西文签名则相对简单很多,例如英文签名只可能由2 6 个英文字母组成,即使 是只文签名,和中文签名相比,更接近手写印刷体,远不如中文签名那么复杂。 鉴于以上原因,中文离线签名鉴别至今还没有一种切实有效的方法来达到较 高的识别率。一方面,努力寻找提高离线签名鉴别系统性能的方法是当务之急, 另一方面也可以这样考虑,虽然鉴别率现在还达不到很高,但是当需要鉴别的签 名数量很大时我们可以利用我们设计开发的鉴别系统帮助人工签名鉴别专家进 行签名的初步筛选,然后由专家对筛选出的计算机难以分辨的签名进行最终鉴 别。 6 中南人学硕:t :论文 第一章绪论 1 3 国内外发展现状 由于签名鉴别具有良好的应用前景和巨大的商业价值,国外对其的研究已有 3 0 几年,并取得了不少的成果,特别是在线签名的鉴别己相当成熟,现在某些 发达国家已经有许多成熟的商用在线签名自动鉴别仪器。由于离线签名提供的信 息较少,难度较大,相对在线签名来说研究成果比较少,还没有实用的离线签名 鉴别系统问世。我国对签名鉴别的研究较晚,外文签名鉴别的某些研究成果值得 借鉴;由于汉字的结构极其复杂,使中文签名鉴别难度更大。 如前所述,签名鉴别还可以分为认证( v e r i f i e a t i o n ) 和识别( r e c o g n i t i o n ) 的两种方式。但离线签名认证与离线签名识别在预处理和特征提取这两个步骤上 基本上相同的,它们不同之处主要在判别决策上,离线签名识别目的是从参考签 名样本库中找出给定签名对应的签写者,是个多分类问题,而离线签名认证则是 对签写人身份的真伪进行判别,是一个二分类问题。目前,相关的研究大都集中 于“认证”,有关“识别”的研究比较少。 预处理方面,不同的签名鉴别系统根据所提取特征的不同,采用不同的预 处理步骤。签名图像的预处理通常包括图像的平滑、二值化、灰度校正、归一化、 细化、倾斜校正,轮廓提取等方面。目前有不少针对签名图像二值化【每7 1 、细化0 1 、 轮廓提取和跟踪【l l 】【1 2 】方面的改进和创新的文献,每一方面都有不同的预处理方 法,在此不做详细介绍。 特征提取方面,用于离线签名鉴别的特征主要有:全局特征口3 川、局部特征 ( 如网格特征m m 5 6 3 ) 、伪动态特征1 6 m 7 m 引、纹理特征1 0 3 和一些矩特征2 0 1 等,另外, 小波变换n9 。、g a r b o r 滤波器晗也可用于签名图像的特征提取。 在认证和识别中用于判别决策的方法主要有:k 近邻法n 矾、加权欧式距离n 刀、 模糊判决法1 、神经网络方法n 3 儿h 儿1 8 1 和隐马尔可夫模型( h m m ) n 等,此外,基 于多分类器组合的分类方法也被用于签名识别阳矧。 以下是近年来国内外学者在离线签名鉴别方面的研究情况。 a l n m a r n 町提取签名图像的倾斜特征、高灰度特征以及参考模式特征并采用 最小距离法进行签名认证,对一些精心伪造的假签名的识别获得了较好的效果。 此后,作为一种有效的伪动态信息,高灰度特征常用于离线签名鉴别。 柯晶、乔谊正等在文献 2 0 中提出了签名静态特征和伪动态特征相结合的 方法,签名伪动态特征包括灰度级分布和笔划宽度分布的概率直方图,通过计 算距离来鉴别,对熟练伪造签名达到了接近9 0 的平均正确率。 q i 和h u n t u 4 。提出利用签名图像的全局特征和局部网格特征来进行签名认 证。其中全局特征将签名轨迹视做一个整体,包括图像大小、图像的重心位置、 7 中南人学硕一l :论文第一章绪论 倾斜角等;而网格特征则类似于放大镜,可提供各个层次上签名的细节信息,包 括网格轮廓特征,e s c 特征,包络线特征等。前者便于认证在外形上与真实签名 存在较大差别的随机伪造,后者便于认证与真实签名极为相似的精心伪造。采用 加权欧式距离分类器完成分类工作,针对一般伪签名和精心伪签名均取得了较好 的效果。 y i n g y o n gq i 和b o b b yr h u n t 在文献 2 1 2 2 中利用静态特征加多分辨率 分析的方法,对图像和水平垂直投影进行小波变换。分类器分别采用神经网络 和矢量化方法,对英文签名的识别取得了很好的效果。 p o t t i e r u 列提取签名的全局几何特征( 宽高比、主轴倾斜度等) 、 p a l n a i s w a m i 瞳3 1 提取签名的网格特征、d a r w i s h n 8 1 提取签名的两种矩( 几何不变矩 和z e m i k e 矩) 特征和拓扑逻辑特征,然后利用神经网络分类器进行鉴别,得到 了比较理想的鉴别效果。 n a b e e la m u r s h e d 和f l a v i ob o r t o l o z z i 等在文献 2 4 2 5 中提出了模糊 神经网络识别离线手写签名的方法,其做法是:将签名图像分块,对每一块用模 糊a r t m a p 神经网络进行判别,再对输出进行判别。 j u nl i n 和j i e g ul i 在文献 1 7 中通过提取签名的静态特征和签名的高压 特征( h i g h p r e s s u r ef e a t u r e ) ,并采用加权欧氏距离分类器进行分类。 r o b e r ts a b o u r i n 和g i n e t eg e n e s t 在文献 2 6 2 7 中提出了基于视觉的签 名表示新形式,认形态学的角度表示签名的形状特征。分类采用了近邻法和最 小距离法,对简单假签名取得了很好的效果。 刘成林、戴汝为等在文献 2 8 中提出了基于多通道分解与匹配的笔迹识别 方法。将二值化的笔迹图像按笔划的方向性先进行方向分解,然后对各个方向 上的子图像进行频带分解。用分解后的采样信号制作为笔迹特征,用特征匹配 的方法进行书写人识别,取得了很好的实验效果。 r o b e rs a b o u r i n 和j p d r o u h a n d 等在文献 2 9 3 中利用签名的形状矩阵作为 签名的混合形状特征,通过比较形状矩阵的相似度来识别简单的假签名。 此外,p e t e rs h a o h u ad e n g 在文献 3 0 对签名的轮廓进行小波变换来对签 名进行识别。 e d s o nj r j u s t i n o 等在文献 3 1 3 2 3 3 中提出通过构造签名的 h m m ( h i d d e nm a r k o vm o d e l ) 用于简单的假签名识别。 程析、侯义斌在文献 3 4 中提出了基于模糊模式识别的离线签名认证技 术,其方法是利用模糊模式识别的方法,构造6 个特征的隶属度函数,分别为: 水平方向重心、垂直方向重心、高度和宽度比、笔划面积与图像面积比、签名 的正倾斜度、签名个独立部分之间的间隔和图像总宽度之比。针对简单伪造签 8 中南大学硕士论文第一章绪论 名得到了8 8 的正确认证率。 朱勇、谭铁牛等在文献 3 5 中提出了一种不依赖于文本的笔迹鉴别方法, 他们将手写笔迹当作一种纹理来看待,使用多通道二维g a r b o r 滤波器来提取纹 理特征。并用加权欧氏距离分类器来完成匹配工作,取得了很好的效果。 在多分类组合识别方面,h b a t l z k a s i 在文献 2 5 中同时提取签名图像的 全局特征、纹理特征和网格特征,每类特征分别输入一个神经网络分类器进行 初步识别,然后分别利用神经网络组合多个分类器的输出得到最终的鉴别结 果。 综合上述方法,我们发现离线签名鉴别的研究都是结合汉字结构与书写特 征,进而提出各种各样的特征量及其提取方法和识别方法,并最终实现签名鉴别 工作的自动化。因此在研究中必须针对应用背景,考虑方法和手段的实用性。就 签名本身而言,签名是书写人有意识的行为,受到情绪、书写环境等各种因素的 影响。因此某些人的签名数据将呈现出很大的变化性。另一方面,不同人的签名 数据间有很大的相异性,若分类器对所有人都设置相同的参数,比如统一的阈值, 则当用户人数增加时,需要重新训练整个系统。当用户人数越来越多时,系统的 识别率将不可避免地下降,既费时也不可靠。因此如何对不同的用户设定不同的 参数,来保证对所有用户都有比较好的识别效果,成为当前研究存在的不足,也 为本文的研究提供了依据,是本文工作的重点。 1 4 本文的主要研究内容 本文主要对签名图像预处理、特征提取和分类器设计进行了研究,主要工 作如下: ( 1 ) 在预处理方面,本文的预处理包括:签名图像的平滑、二值化、细化和 笔迹修复等。本文分别采用中值滤波法对灰度图像平滑和u n g e r 平滑算法 对二值图像平滑。考虑签名图像的特性,本文提出了一种适用于签名图像 的混合二值化算法,该方法将全局阈值与像素点的邻域信息相结合,即 阈值由全局阈值和邻域均值综合决定,有效地克服了全局阈值法和局部 比较法的不足。对图像的细化我们采用一种两步细化算法,该算法重复 执行两个步骤,在每一步中用一个逻辑规则判断并标记待删除的像素, 待扫描完整幅图像后再去除所有作了标记的像素。在笔迹修复方面,我 们进行了去除断点、孤立点、短线和毛刺的操作。 ( 2 )在特征提取方面,提出了一种基于保局投影的特征提取方法。该方法综 合采用签名的形状特征、伪动态特征和纹理特征作为初始特征,克服了 单一特征没有足够能力反映细微差异的缺陷;利用保局投影对高维初始 9 中南人学硕。 :论文 第一章绪论 ( 4 ) 特征集进行降维,以获取更具判别性的特征。该方法既具有保持数据集 结构不变的非线性特点,又有效解决了“维数灾难”问题。 在认证方面,本文提出了一种基于最优阈值的认证方法。该方法首先采 用加权欧式距离法构建判别器,并采用遗传算法自适应选取最优阈值t , 认证过程就是拿未知样本的特征与已知的训练样本的特征相比,当且仅 当它的d t 时,未知样本为假。该方法克服 了传统阈值法对所有人选取相同阂值的缺陷,能有效地提高认证的准确 率。 在识别方面,本文采用一种具有纠错能力的多类s v m 分类法对签名图像 进行识别。该方法利用纠错码结合支持向量机来构造多个二元分类器; 根据每个s v m 分类器的输出采用投票方法决定识别结果。该方法有效地 利用了信道差错控制编码技术因而具有纠错能力,即使几个二类分类器 产生了错误的输出结果,由于具有纠错机制,这些错误对最终的分类不 产生影响,仍然可以得到正确的分类结果。实验结果表明本文的方法取 得了比传统方法更好的识别效果。 1 5 章节安排 本文共分六章,主要内容如下: 第一章绪论。概述了签名鉴别的研究背景和意义、签名鉴别的分类、系统构 成及国内外发展现状。 第二章签名图像预处理。深入研究了签名图像的平滑、二值化、细化和笔迹修 复等预处理操作。提出了一种适用于签名图像的混合二值化方法。 第三章签名图像特征提取。综合采用签名的形状特征、伪动态特征和纹理特征 作为初始特征;并采用保局投影对高维初始特征集进行降维,获取更具 判别性的特征。 第四章基于最优阈值的离线签名认证。实现了一种基于遗传算法自适应选取最 优阈值的认证方法,并给出了实验结果。 第五章基于多类s v m 分类器的离线签名识别。应用和实现了一种具有纠错能力 的二类支持向量机分类器构成的多类分类器进行签名识别,并给出了实 验结果。 第六章总结与展望。 l o 中南大学硕十论文 第二章数据采集和预处理 2 1 概述 第二章签名图像预处理 预处理是签名鉴别的第一个核心步骤,目的是去除签名图像中的干扰,为后 面的特征提取做准备。该阶段处理结果的质量直接影响到后续处理的效果,所以 预处理在签名鉴别中的作用非常重要。 在签名鉴别中,签名者的情绪,纸张的质地和纹理,扫描设备等原因都会对 签名有一定的影响。例如文字笔画附近出现污点( 称为黑色孤立点) ,图中有缺陷 ( 称为白色孤立点) ,签名笔划断开或者相邻文字粘连等。所以一般我们不直接采 用通过扫描仪等输入设备得到的签名图像,而是先对其进行预处理。签名图像的 预处理包括两种:一种是去除签名图像输入时的干扰和噪声;另一种则是对签名 图像做变换处理以加强有用信息,为下一步提取特征向量做好准备。 在签名图像预处理方面,目前还没有文献在这方面做过系统的研究,已有的 文献对签名图像的预处理大都只做简单介绍。如h b a l t z a k i s 等在文献 9 中对 扫描得到的二值签名进行去噪、签名区域获取、笔划宽度归一化和细化操作以获 取骨架签名;g e o r g e 等在文献 1 0 中对签名图像进行大小归一化处理;c a m a i n o 等在文献 1 1 中对签名图像进行滤波、倾斜校正和二值化操作以获取骨架签名; 孔维娜在其硕士论文 1 2 通过滤波、二值化、细化以及位置和大小归一化来获得 归一化的二值签名和骨架签名;陈刚等在文献 3 6 中提出了一种有效的签名图像 预处理方法。该方法从签名图像的表示与描述出发,得到四种归一化的签名信息 载体,即:归一化的二值签名、归一化的灰度签名、归一化的二值骨架签名和归 一化的灰度骨架签名。 本文实验所用的签名样本都是使用普通钢笔自由书写在打印纸上的,每页 a 4 纸张上书写2 5 个签名,这些签名分多次签写,每次间隔一到两天。将所有签 名样本用扫描仪进行灰度扫描输入计算机,所采用的扫描仪是h p s c a n j e t 3 3 0 0 c , 扫描精度为3 0 0 d p i ,扫描得到的数字图象经分割后每个签名按照一定的命名规 则单独存为b m p 格式。根据需要,本文的预处理包括平滑、二值化、细化和笔迹 修复等,分别在第二节至第五节进行介绍。其中第三节提出了一种新的适用于签 名图像的混合二值化方法,该方法将全局阈值与象素点的邻域信息相结合,由全 局阈值和邻域均值综合决定图像阈值。克服了全局阈值法和局部比较法的缺点, 取得了较好的效果:在第五节我们提出了签名笔迹修复方法,该方法能有效去除 签名图像中存在的伪特征点,保留真特征点,取得了较为理想的效果。最后是本 中南人学硕士论文第二章数据采集和预处理 章小结。 2 2 签名图像的平滑 图像平滑的主要目的在于提高签名图像的质量,消除噪声。例如,在噪声较 大的情况下,系统就有可能将噪声当成是签名的一部分,若不能很好地去掉这些 噪声,将会影响随后的特征提取。平滑处理一般应用在两个方面:对灰度图像的 平滑,以及二值化后对二值图像的平滑。通过平滑,前者可以改善灰度图像质量, 后者可在一定程度上消除图像中的噪声点( 孤立点、白点或黑点) 以及笔画边缘的 细小毛刺。一般在空间域内可以用邻域平均来减少噪声;在频率域,由于噪声频 谱通常多在高频段,因此可以采用各种形式的低通滤波的办法来减少噪声。常见 的平滑处理算法主要包括:邻域平均法、中值滤波法、频率域低通滤波等。 本文用到的平滑包括两部分: 1 对原始狄度图像的平滑 采用的是中值滤波法。中值滤波是一种典型的低通滤波器,主要目的是保护 图像的边缘,同时也能去除噪声。与加权平均方式的平滑滤波不同,中值滤波是 将邻域中的像素按灰度级排序,取其中间值为输出像素。中值滤波的效果依赖于 两个要素:领域的空间范围和中值计算中涉及的像素数( 当空间范围较大时,一 般只取若干稀疏分布的像素作中值计算) 。中值滤波能够在抑制随即噪声的同时 不使边缘模糊,方法简单易于实现,能较好的保护边界,因而受到广泛欢迎。 建立一个n n 窗口( n 一般取3 或者5 ) ,依次移动到图像各个像素点位置 上,用窗口中所有灰度中间值取代当前像素点灰度值。具体方法如下图所示: 图2 1 像素p 的8 邻域分布 其中p 为目标像素,和周围风口岛组成3 3 矩阵,然后对这9 个元素的 灰度进行排序,以排序后的中问元素为p 的新灰度值,如此完成对象素p 的中值 滤波,再迭代对其它像素进行滤波即可。 2 对二值图像的平滑 采用u n g e r 平滑算法。u n g e r 平滑算法的思想是检查窗口内的图像结构的细 1 2 中南人学硕i 二论文 第_ 二章数据采集和预处理 节,而不是取值为1 的像素的个数。设u n g e r 模板为3 3 窗1 :3 lp 。p p ol ,其 i 见 p 2al 厂1 l p 5 p 6p t j 中p 为当前点,风p ,为其8 邻点,平滑准则为: ( 1 ) 当p 为黑像素时,如果p o ,p 。,p 2 中至少有一个为黑,同时,p 。,p 5 ,p 。中至少 有一个也为黑;或者p 2 ,p 3 ,p 。中至少一个为黑,n i 对p 6 ,p ,p o 中至少有一个为黑, ( 2 ) 当p 为白像素时,如果,p :,p 。,p 。中至少有三个元素为黑,则p 改为黑, 2 3 签名图像的二值化 二值化就是对图像进行阈值化分割,将整幅图像画面处理成仅有黑和白的二 值图像,不呈现出灰度变化,以便于数据压缩、特征突出及后续图像处理工作。 图像二值化的关键在于阈值t 的选取,根据阈值t 来区分图像中的对象和背景。 设原始灰度图像为f ( x ,y ) ,变换后的二值图像为g ( x ,y ) ,则二值化的过程表 示为: 贴川= 嚣凭籍 q 1 根据选取阈值的运算范围不同,二值化方法可以分为全局阈值法和局部阈值 法。全局阈值法由文本图像的直方图或灰度的空间分布确定一个阈值,并根据此 阈值实现灰度文本图像n - 值化文本图像的转化。此方法的优点在于算法简单, 但是由于对整幅图使用一个阈值处理,因此对输入图像量化噪声和不均匀光照等 情况抵抗能力差,不能广泛地应用于实际。典型的全局阈值法包括0 s t u 方法砸1 、 最大熵方法等3 引。局部阈值法m 3 通过定义考察点的邻域,由邻域计算模板实现 考察点灰度与邻域点的比较。此方法不受非均匀光照条件等口7 1 情况的影响,较全 局阈值法有更广泛的应用。典型的局部阈值法有k a m e l z h a o 算法和b e r n s e n 算法 等口引1 。局部阈值法虽然能够根据局部灰度特性来自适应地选取阈值,有较大的 灵活性,但是仍然存在缺点,如:实现速度慢,字符笔画中出现断裂以及伪影现 象( g h o s t ) ( 即在背景区域得到笔画结果) 。 考虑到全局阈值法和局部比较法的优缺点,本文提出一种全局阈值法与局部 灰度分布特性相结合的二值化方法,该算法将全局阈值与象素点的邻域信息相结 中南大学硕十论文 第二章数据采集和预处理 合,象素点的二值化阈值由全局阈值和邻域均值综合决定。 对于待考察的象素点和它的8 一邻域有下面的平滑性假设:笔划点的邻域点 很可能是笔划点,而背景点的邻域点很可能是背景点。从而可以这样认为:笔划 点的邻域点灰度均值较大,而背景点的邻域均值较小。反之,邻域灰度均值较大 的象素点是笔划点的可能性大,而邻域灰度均值较小的象素点是背景点的可能 性大。该假设除边沿点外几乎处处成立。 根据上述的假设,引入一种描述象素点属于笔划程度的测度函数扩展 的隶属度函数一( 以由邻域均值,决定) 。在全局阈值的基础上,对于一 大的点,降低其二值化阈值;反之,若i 小,则升高其阈值。从而图像的二值
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年化妆品行业个性化美妆服务推广研究报告及未来发展趋势预测
- 2025年航天科技行业技术创新与航天发展战略研究报告及未来发展趋势预测
- 2025年农业养殖行业智能养殖技术应用研究报告及未来发展趋势预测
- 2025年航运物流行业智慧港口建设规划研究报告及未来发展趋势预测
- 2026年中国编织袋行业市场分析报告
- 2025年及未来5年中国药用塑料安瓿瓶行业全景评估及投资规划建议报告
- 2025年及未来5年中国口腔激光治疗仪行业市场调研及投资规划建议报告
- 2025年及未来5年中国排气扇行业运行态势及未来发展趋势预测报告
- 2025年及未来5年中国羊羔绒布市场发展前景预测及投资战略咨询报告
- 保温衣技术协议书
- 仓库搬运人员安全注意事项培训课件
- 降低crrt非计划下机率成果报告书
- 档案整理及数字化服务方案
- 猫武士三部曲 4天蚀遮月
- 《内河航道引航》考试复习(重点)题库(300题)
- 工程整改通知单问题整改通知单
- 降低手术患者术中低体温发生率
- 大班语言-蜂蜜失窃谜案
- 中国地质大学地球科学概论教学课程pptpart5公开课获奖课件
- YY/T 0801.1-2010医用气体管道系统终端第1部分:用于压缩医用气体和真空的终端
- (完整)电厂安全教育知识题库及答案(通用版)
评论
0/150
提交评论