




已阅读5页,还剩70页未读, 继续免费阅读
(通信与信息系统专业论文)基于纹理特征提取的离线文字笔迹鉴别技术的研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于纹理特征提取的离线文字笔迹 鉴别技术的研究 摘要 离线文字笔迹鉴别技术是依据文字笔迹对书写人身份进行判别的一项技术, 随着应用领域的不断扩展,离线文字笔迹鉴别技术已经成为计算机视觉和模式识 别领域一个十分活跃的研究课题。 由于它几乎包括了图像处理和模式识别领域中的所有典型问题,如图像预处 理,特征提取和分类器设计等等,所以它一直也是图像处理和模式识别领域中的 难点。本文的主要目的是研究离线文字笔迹鉴别系统的组成和关键部分的主要算 法,为离线文字笔迹鉴别系统的实现提供技术支持。 离线文字笔迹鉴别系统主要包括图像预处理、特征提取和分类器设计三部 分。 1 预处理是离线文字笔迹图像鉴别的第一步,本文采用了一套完整的离线 文字笔迹图像预处理算法,包括去除图像的背景、噪声,以及图像的二值化和归 一化处理等。 2 特征的稳定性及其有效性决定着鉴别系统的性能,本文从纹理特征入手, 采用了一种基于多通道g a b o r 滤波器的特征提取算法,该算法与文本内容无关, 可记录下每一个通道的书写人文字笔迹风格的特征向量一均值和方差,它们表征 每个通道文字笔迹图像纹理特征的重要信息。 3 在分类器设计方面,本文采用了一种基于s v m 理论的文字笔迹分类方 法。通过s v m 的训练,然后将笔迹图像的特征数据作为测试样本,根据本文采 用的分类方法,通过分类器对文字笔迹进行判别。 在实验中,本文通过录入不同人书写的大量文字笔迹,进行特征提取,最后 用支持向量机的训练方法得出了较好的结果,实验数据表明该算法是适用的、可 浙江工业大学硕士学位论文 行的。 关键词:离线文字笔迹鉴别,预处理,纹理特征,特征提取,s v m 浙江工业大学硕士学位论文 s t u d yo no f f l i n ec h a r a c t e r h a n d w r i t i n gi d e n t i f i c a t i o nb a s e do n t e x t u r ef e t u r ee x t r a c t i o n a b s t r a c t t h eo f f - l i n ec h a r a c t e rh a n d w r i t i n gi d e n t i f i c a t i o nt e c h n i q u ei sat e c h n i q u et h a t a i m st od e c i d et h ei d e n t i t yo fw r i t e r sa c c o r d i n gt ot h ec h a r a c t e rh a n d w r i t i n g w i t ht h e c o n t i n u o u se x p a n s i o no fa p p l i e df i e l d s ,t h e o f f - l i n ec h a r a c t e rh a n d w r i t i n g i d e n t i f i c a t i o n t e c h n i q u e b e c o m e sf i l la c t i v ea r e ao fc o m p u t e rv i s i o na n d p a t t e r n r e c o g n i t i o n b e c a u s et h i st e c h n i q u ei n v o l v e sa l lo ft h et y p i c a lp r o b l e m si ni m a g ep r o c e s s i n g a n dp a a e m r e c o g n i t i o n , f o re x a m p l e ,i m a g ep r e p r o c e s s i n g ,f e a t u r ee x t r a c t i o n , c l a s s i f i e rd e s i g na n ds oo n , s oi ti saf o r m i d a b l et a s ki nt h ei m a g ep r o c e s s i n ga n d p a r e m r e c o g n i t i o n t h em a i np u r p o s eo ft h i sp a p e ri st os t u d yt h ec o m p o s i t i o na n d t h em a i na l g o r i t h mo fk e yp a r t so fo f f - l i n ec h a r a c t e rh a n d w r i t i n gi d e n t i f i c a t i o ns y s t e m , a n do f f e r i n gt e c h n i c a ls u p p o r tf o rs y s t e m sr e a l i z a t i o n t h es y s t e mi n c l u d e st h r e ep a r t s :p r e p r o c e s s i n g ,f e a t u r ee x t r a c t i o n ,a n dc l a s s i f i e r d e s i g n 1 p r e p r o c e s s i n gi s t h ei n - s ts t e po fo f f - l i n ec h a r a c t e rh a n d w r i t i n gi m a g e i d e n t i f i c a t i o n ,i nt h i sp a p e r , as e r i e so fc o m p l e t ep r e p r o c e s s i n ga l g o r i t h r ni sa d o p t e d f o ro f f - l i n ec h a r a c t e ri m a g e ,i n c l u d e sr e m o v i n gt h eb a c k g r o u n da n dn o i s eo fi m a g e , a n dt h e p r o c e s s i n go fi m a g eb i n a r i z a t i o na n d n o r m a l i z a t i o n 2 t h es t a b i l i t ya n de f f i c i e n c yo ff e a t u r eh a v ec r u c i a li n f l u e n c e o nt h e i d e n t i f i c a t i o ns y s t e m f r o mt h ea s p e c to ft e x t u r ef e a t u r e ,t h i sp a p e ra d o p t saf e a t u r e e x t r a c t i o n a l g o r i t h mb a s e o nm u l t i c h a n n e lg a b o rf i l t e r ,t h i sa l g o r i t h mi st e x t i n d e p e n d e n t i td e n o t e st h em e a na n ds t a n d a r dd e v i a t i o no fe a c hc h a n n e l ,t h e y r e p r e s e n ti m p o r t a n tm e s s a g e so f e a c hc h a n n e l st e x t u r ef e a t u r e i i i 浙江工业大学硕士学位论文 3 i nt h ea s p e c to fc l a s s i f i e rd e s i g n , t h i sp a p e ra d o p t sac h a r a c t e rh a n d w r i t i n g c l a s s i f i c a t i o nm e t h o db a s e do ns v mt h e o r y t h r o u g ht h et r a i n i n go fs v m ,a n dt h e t e s t e df e a t u r ed a t aa st e s t e ds a m p l e s ,t h e nt h ec h a r a c t e rh a n d w r i t i n gt y p ec a nb e j u d g e db ym e a n s o ft h et r a i n e ds v ma c c o r d i n gt ot h em e t h o da d o p t e di nt h i sp a p e r i nm ye x p e r i m e n t ,t h r o u g hi n p u t t i n gc h a r a c t e rh a n d w r i t i n gb yv a r i o u sp e o p l ea n d f e a t u r ee x t r a c t i o n ,f i n a l l y , i ta c q u i r e sg o o dr e s u l t sb ys v mt r a i n i n g ,t h ee x p e r i m e n t a l d a t as h o w st h ea l g o r i t h mp r o p o s e dh e r ei ss i m p l ea n de f f e c t i v e k e yw o r d s :o f f - l i n ec h a r a c t e rh a n d w r i t i n gi d e n t i f i c a t i o n ,p r e - p r o c e s s i n g ,t e x t u r e f e a t u r e ,f e a t u r ee x t r a c t i o n , s v m i v 浙江工业大学硕士学位论文 浙江工业大学 学位论文原创性声明 本人郑重声明:所提交的学位论文是本人在导师的指导下,独立进行 研究工作所取得的研究成果。除文中已经加以标注引用的内容外,本论文 不包含其他个人或集体已经发表或撰写过的研究成果,也不含为获得浙江 工业大学或其它教育机构的学位证书而使用过的材料。对本文的研究作出 重要贡献的个人和集体,均已在文中以明确方式标明。本人承担本声明的 法律责任。 作者签名:芜焰瓜 日期:劲。7 年厂月上f 日 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意 学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文 被查阅和借阅。本人授权浙江工业大学可以将本学位论文的全部或部分内 容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存 和汇编本学位论文。 本学位论文属于 l 、保密口,在年解密后适用本授权书。 | 2 、不保密g 。 ( 请在以上相应方框内打“) 日期:脚印年5 月2 1 日 日期奠。9 f 年厂月。日 4 太己 觅倒,b 缎丢 弦万p 名名釜登 者师 作导 第1 章绪论 1 1 研究的背景和意义 文字笔迹鉴别技术是目前国内外鉴别技术领域研究的一个热点。在我国, 用文字笔迹解决诉讼纠纷、决狱判案已有两千余年的历史。历代司法实践中,“对 笔迹”被传为传统的办案手段之一,文字笔迹鉴别可堪称一项古老的鉴别技术。 计算机文字笔迹鉴别按照取样的方式分主要分为在线( o n - l i n e ) 和离线 ( o f f - l i n e ) 两类。离线文字笔迹鉴别的对象是写在纸上的字符,通过扫描仪转化为 计算机能处理的信号;而在线的文字笔迹鉴别则通过专用的数字板或数字仪实时 地采集书写信号,它不仅可以采集到笔迹序列并转化成图像,而且可以记录书写 的压力、速度等信息,可为文字笔迹鉴别提供更丰富的信息,因此与在线鉴别相 比,离线鉴别的难度较大。而根据考察的对象和提取特征的方法的不同又可以分 为两大类;文本独立( t e x ti n d e p e n d e n t ) 方法和文本依存( t e x td e p e n d e n t ) 方法,文 本独立的特征是从大量字符集中提取的,这里面的特征也有两类,一类是文本的 布局和排版特征( 行间、字间距等) ,另一类是字符的大致形态( 圆形、变形、长形) 、 字位倾斜( 直立、偏左、偏右) 、笔划方向等,通过多数字符的统计平均得到。文 本依存方法从检验笔迹和参考笔迹中选择相同的单字( 称为特征字) 进行比较。因 为是在相同字的基础上进行鉴别,因而提取的文字笔迹特征是依赖于字符类别 的,也就说是依赖于文本内容的。与文本独立方法相比,文本依存方法可以提取 更多的反映书写风格的特征,除了上面提到的字形、字位、笔划方向分布,还有 笔划搭配、部首搭配、笔划形态( 起收笔、曲率、转折等) 。此外,还可以直接用 模板匹配的方法进行比较。文本依存方法可以提取更多的特征,允许对字符进行 细致深入的分析,因而可以得到比文本独立方法更高的鉴别率和可靠性【i 】。 离线文字笔迹鉴别技术是计算机视觉和模式识别领域中的一个非常活跃的 研究课题,作为一种身份鉴别的手段,它有许多的优点。手写文字笔迹易于获取, 浙江工业大学硕士学位论文 而且不同的人有不同的笔迹,因此基于文字笔迹的身份鉴定有着十分广阔的应用 范围,离线文字笔迹鉴别技术是根据手写文字笔迹判断书写者身份的- 1 7 科学和 技术。离线文字笔迹鉴别有2 种方式:一种是直接比较2 份手写文字笔迹,确定它 们是否为同一人所写:另一种是从不同人书写的参考文字笔迹( r e f e r e n c e h a n d w r i t i n g ,又称样本) 中找出与检验文字笔迹( t e s th a n d w r i t i n g ,又称检材) 的书 写风格最接近的样本。前一种方式称为验证( v e r i f i c a t i o n ) ,后一种方式称为鉴别 ( i d e n t i f i c a t i o n ) 或识 j i j ( r e c o g n i t i o n ) 。离线文字笔迹鉴别中假设参考文字笔迹的书 写人是己知的,从而通过书写特征的比较就可以确定笔迹的书写入1 2 j 。 纹理分析是图像处理技术中非常活跃的部分,纹理特征的提取是图像分析和 处理的关键技术之一。在理论分析方面,纹理作为图像的重要特征之一,是图像 分析的基础;在实际应用中,很多图像特征的分析和理解,如图像分割、目标识 别、深度信息获取、形状分析等等,都用到图像的纹理特征。而本文所研究的就 是基于纹理特征提取的离线文字笔迹鉴别技术。 随着国民经济的迅速发展,在金融、办公自动化和公共安全等领域,文字笔 迹鉴别的重要性日益明显。各国政府之间的协议和备忘录的签订、官方文件以及 法令和法规的颁布、银行支票的签署和汇兑,都需要当事人亲笔的文字签名才能 生效。文字笔迹鉴别在国外,尤其是在北美和西欧,是普遍接受的身份鉴别方法 之一。鉴于文字笔迹鉴别的诸多特点,它在金融、银行、安全等领域有着很好的 应用前景。例如在金融领域中,用户无需出据繁琐的诸如单位证明之类的各种纸 张证据,只需要一个简单的文字样本就可以对用户的身份进行认证;在安全领域 中,通过鉴别文字笔迹可以缩小嫌疑人的范围,通过文字笔迹鉴别则可以对敏感 人物签署的文件进行监控;特别在银行里,每天都面临大量的支票需要确认真伪, 有效的文字鉴别将简化确认过程,提高工作效率。 1 2 国内外现状 计算机文字笔迹鉴别的研究最早始于2 0 世纪6 0 年代。1 9 6 6 年苏联的几名研究 者发表了用电子计算机进行笔迹鉴别的报告。他们的方法是从字符骨架提取一些 代表点作为特征,用字母“k 作为实验样本,得到了7 5 的鉴别正确率。至7 0 年代末、8 0 年代初,计算机文字鉴别的研究和发展形成一个热潮。其中影响最大 的是前联邦德国刑事技术部主持研制的计算机联网笔迹鉴别系统。该项目投资 2 浙江工业大学硕士学位论文 大、历时长,有大量专家学者参加了研究,提出了一系列行之有效的方法。日本 虽未公开报道过他们的文字笔迹鉴别系统,但他们至少在研究上做出了很大的贡 献。日本学者在这方面发表的文献数量最多,质量也都比较高。由于语言文字上 的渊源,日本的方法比较适合中国的情况,值得借鉴。 对于汉字的文字笔迹鉴别,由于文化背景等的差异,西方国家对于东方文字 鉴别问题研究较少,因此相关问题的研究机构大多分布在亚洲,目前主要研究 机构包括韩国釜山大学p n u ,中国科学院自动化所模式识别实验室n l p r ,中国 科学院计算所c a s i c t ,美国b u f f a l o 大学c e d a r ,日本早稻田大学w a s a d a ,香港科 技大学m u s t ,新加坡南洋理工大学n t u ,东京科技大学s u t ,以及泰国清迈工 程学校掣3 1 。 表1 1计算机文字笔迹鉴别系统与传统文字笔迹鉴别的区别 传统的文字笔迹鉴定计算机文字笔迹鉴别系统 鉴别工作量大小 主要是依靠“手工”操作的方 半自动化或全自动化地挑选 法,人工描字、制作检验记录 ( 比对表) ,再根据个人对特 检材、样本中的特征字或相同 征的认识及分析、比对,综合 字,按相似度顺序排列,自动 鉴别形式 生成比对表,记录笔迹特征, 评断,靠鉴定人主观意识的分 具有客观性。 析、判断做出鉴定结论。 对于检材数量大的情况下,工对于检材数量大的情况下,工 工作效率作效率低,鉴别速度慢,并且,作效率高,鉴别速度快,正确 误识率高。率高。 简单,鉴别结果极易受到外界 因素干扰,如:鉴定人员的专不易受到外界干扰,具有很高 业知识、业务水平、思维方式、的独立性,封闭性。 鉴别环境 工作态度、情绪、精神状态等。 没有一个综合评断及分项评 在比对的过程中有统一的标 断可定量分析、计算的科学统 鉴别标准 准。 一标准。 鉴别的准确性准确性低准确性高 中国的文检部门在文字笔迹鉴别方面的水平是世界领先的。中科院自动化所 3 浙江工业大学硕士学位论文 文字识别试验室从1 9 9 2 年开始,与北京市刑事科技研究所合作,开始了这方面的 研究工作。1 9 9 7 年,刘成林、戴汝为、刘迎建发表的基于多通道分解和匹配的 笔迹鉴别研究和简化的w i g n e r 分布及其在笔迹鉴别中的应用等文章提出了 自己的新的鉴别方法,并取得了较好的效果。2 0 0 0 年,谭铁牛提出的将笔迹、文 字识别问题作为纹理识别来处理的方法,通过选取1 7 个人的笔迹进行试验,也取 得了较好的效果。2 0 0 5 年,清华大学电子系与公安部第二研究所合作研制的“计 算机笔迹鉴别系统”实现了利用计算机进行自动化的笔迹鉴别,可以判断检材和 样本是否都是同一个人书写的【4 l 。 与传统的文字笔迹鉴别相比,利用计算机进行的文字笔迹鉴别显然具有相当 大的优势,计算机文字笔迹鉴别与传统文字笔迹鉴别的区别如表1 1 所示。 1 3 离线文字笔迹鉴别技术的原理和流程 所谓离线文字笔迹鉴别,顾名思义就是根据文字图像对书写入的身份进行鉴 别,其依据是每个人的书写方式都有着自己独特的特征和写法,而且这些蕴藏在 文字中的书写特征相对稳定,能代表书写人的身份。与其他图像特征相比,纹理 特征能更好的兼顾宏观特征与细部特征两个方面。 图1 - 1 文字笔迹鉴别原理图 一般的离线文字笔迹鉴别系统包括数据采集模块、预处理模块、特征提取模 块、参考数据库模块和鉴别模块五个部分,其中特征提取模块是整个系统的关键, 因为只有将有效的文字特征提取出来,才能正确的进行分类判别,文字笔迹鉴别 4 浙江工业大学硕士学位论文 原理图如图1 1 所示。 图1 2 文字鉴别一般流程 文字笔迹鉴别的一般流程如图1 2 所示,首先通过数据采集( 数字化) 将文字样 本转化为数字图象,然后对得到的数字图像进行预处理,以滤除文字图像在数字 化中可能引入的噪声,改善图像质量,并获取各种能有效表征文字的文字信息载 体,接下来进行特征提取,提取的特征形成特征集将被用于书写者身份鉴别,最 后根据该特征集和参考数据库对书写人身份进行鉴别。 1 4 本课题的技术路线 文字笔迹鉴别技术是基于图像分析和图像识别的技术,对含有文字的图像进 行预处理,并进一步提取出纹理特征,最后进行鉴别鉴定。 先将采集来的文字样本进行预处理,预处理的过程为先去除背景,然后去除 噪声,再进行图像的二值化,最后进行图像的归一化,得到纹理提取需要的纹理 图像。 纹理特征提取是鉴别能否成功的关键,在本课题中我们采用了一种基于多通 道g a b o r 滤波器的纹理特征的提取方法,多通道g a b o r 滤波器在纹理图像分析中非 常有效。它之所以具有吸引力,是因为它允许我们去研究不同纹理主要尺寸和方 向的差异,允许我们仅用简单的灰度值统计来提取纹理特征。 5 浙江工业大学硕士学位论文 分类器设计是文字笔迹鉴别过程的最后个环节。在本课题中我们采用了一 种以s v m 为核心的分类方法,该方法是建立在统计学习理论基础上的机器学习 方法,通过学习算法,s v m 可以自动寻找出那些对分类有较好区分能力的支持 向量,由此构造出的分类器可以最大化类与类的间隔,因而有较好的适应能力和 较高的鉴别率。 1 5 论文研究内容和全文体系结构 离线文字笔迹鉴别系统按顺序可分为图像的预处理、特征提取和分类器设计 三大部分,本文分别对以上三部分进行了研究。基于图像处理和模式识别方面的 相关理论,本文采用了一套较完整和系统的文字笔迹纹理预处理的算法,与先前 的预处理方法相比,省去了去除行间和字间的空档的步骤,并充分考虑到标点符 号对笔迹特征提取的影响;在特征提取方面,本文采用了一种基于多通道g a b o r 滤波器的文字笔迹鉴别算法,多通道g a b o r 滤波器在纹理图像分析中非常有效, 它之所以具有吸引力,是因为它允许我们去研究不同纹理主要尺寸和方向的差 异,允许我们仅用简单的灰度值统计来提取纹理特征;在分类器设计方面,本文 采用了一种以s v m 算法为核心的分类器设计方法,该方法是建立在统计学习理 论基础上的机器学习方法,具有较好的适应能力和较高的分准率。在m a t l a b 和 v i s u a lc + + 软件平台下,本文对所采用的算法进行了实验,验证了本文所采用算 法的优越性。 论文的具体内容安排如下: 第一章首先介绍了文字笔迹鉴别的研究背景和意义,其发展历史和成果,以 及文字笔迹鉴别技术的原理、一般流程和技术路线,最后介绍了本论文的研究内 容和具体安排。 第二章介绍了离线文字笔迹图像的预处理,一般包括去除背景、消除噪声、 图像二值化、字符切分、图像归一化等,最后得到纹理分析所需的纹理图像。 第三章介绍了利用多通道g a b o r 滤波器来提取纹理特征。 第四章介绍了s v m 理论以及基于支持向量机的离线文字笔迹鉴别的分类器 设计。 第五章为实验结果及其分析。 第六章总结本论文的主要工作,并对离线文字笔迹鉴别技术的发展趋势做出 6 浙江工业大学硕士学位论文 了展望。 7 浙江工业大学硕士学位论文 第2 章离线文字笔迹图像的预处理 将手写文稿转换成数字图像的过程中,受纸张质量影响容易产生字形畸变, 污点,断笔,交连等干扰;受设备影响容易产生噪声:文稿扫描过程中摆放位置 不正等情况会造成字符大小位置的不确定,受以上三个因素的影响,在鉴别前, 首先需要对获取的原始图像进行预处理。预处理操作一般包括去除背景、消除噪 声、图像二值化、字符切分、图像归一化等。由于每一幅图像的背景不同,为了 得到统一的纹理图像,首先必须消除背景的影响;消除噪声的目的在于对输入中 存在噪声的文字笔迹图像进行滤波,去除图像中的噪声成分,如背景上的黑色孤 立点和汉字笔划中的孤立白点等,从而得到一幅较清晰的文字笔迹图像;二值化 主要的目的是将灰度图像转化成黑白的二值图像;字符切分的主要目的是得到单 个汉字的图像,经过切分后的单个文字笔迹图像还需要进行归一化和细化操作, 归一化操作的目的是消除由于字体字号变化等因素带来的汉字图像在尺寸和位 置上的变化。对离线文字图像进行预处理的目的是用来抑制无用信息增强有用信 息,得到能够进行文字笔迹特征计算的纹理图像。 2 1图像的采集与去除背景 课题所用的文字图像是用普通书写工具自由书写在普通的纸张上的。使用的 图像输入设备是扫描仪,图像扫描仪的扫描精度和所要获取信息量的大小直接相 关。在计算机文字鉴别系统中,文字笔迹图像的清晰度是影响系统性能的重要因 素,常用的图像扫描精度有2 0 0 d p i 、3 0 0 d p i 、6 0 0 d p i 等几种,扫描精度越高,文 字笔迹图像的清晰度就越高,所包含的信息量就越大,这对文字笔迹的鉴别就越 有利。综合各方面的因素,我们选取 3 0 0 d p i 的扫描精度,获得的笔迹图像以b r n p 文件格式保存于计算机中【5 1 。 由于每份文字笔迹所选用的纸张没有统一的标准,因此我们第一步要将文字 笔迹图像的背景去掉。由于笔迹图像是以位图( b m p ) 形式保存的,图像的每个像 8 浙江工业大学硕士学位论文 素都有r 、g 、b 属性值,分别表示像素点的红色、绿色和蓝色分量,不同的r 、 g 、b 就产生了我们看到的不同的颜色【6 1 。人眼所看到的颜色不同是人的感性认 识,感性的东西不能被计算机处理,必须对其进行量化。为了对这个“不同”进 行量化,为了表示像素p ( ,1 ,g l ,6 1 ) 和g ( ,2 ,9 2 ,b 2 ) 之间颜色的差异,我们引进度 量像素之间差异的量三来表示像素之间的距离,三的计算依照欧几里德距离公式 如下计算: 二= i ,1 一,2 1 2 + l g l - 9 2 1 2 b l - b 2 1 2 ( 2 - 1 ) 三的值越小说明像素之间的颜色差异越小。有了像素之间的距离,我们可以 将照片的所有像素映射到坐标为r 、g 、b 这样一个三维空间。采用k m e a n s 算法 来对照片的像素矩阵来聚类,以产生背景类并将其删除,从而实现照片背景的去 除。k - m e a n s 算法在聚类算法体系中属于基于划分的方法。给定一个刀个对象的 数据库,一个划分方法构建数据的k 个划分,每个划分表示一个聚簇,并且k 。 事先需给定要构建的划分的数目七,划分方法首先创建一个初始划分,然后采用 一种迭代的重定位技术,尝试通过对象在划分间移动来改进划分。一个好的划分 的一般准则是:在同一个类中的对象之间尽可能“接近 或相关,而不同类中的 对象之间尽可能“远离 或不同。为了达到全局最优,基于划分的聚类会要求穷 举所有可能的划分。在k m e a n s 算法中,每个簇用该簇中对象的平均值来表示。 2 2 图像的去噪 由于文字笔迹图像在扫描输入过程中会产生随机噪声,因此需要进行去除噪 声处理,消除图像中的这些噪声成分叫做图像的平滑化。平滑化处理是图像增强 中的一种技术,其目的是消除图像在数字化时所混入的噪声,从而突出一幅图像 中的有效信息。对图像平滑化处理的要求有两条:一是不能损坏图像的边缘轮廓 及线条等重要信息,二是使图像清晰,视觉效果好。去噪的方法有很多,例如均 值滤波、中值滤波和边缘保持滤波。 2 2 1 均值滤波 设一图像是由肘幅小图像组成的集合,图像的形式可以表示为: z ( 工,y ) - - s ( x ,y ) + m ( x ,y ) ( 2 - 2 ) 9 浙江工业大学硕士学位论文 式中s ( x ,y ) 为理想图像,f ( 工,y ) 为噪声图像。由于有噪声存在,导致图像 的质量下降。图像噪声概率分布虽不能准确了解,但可假定噪声为互不相关且均 值为0 的随机噪声,即: e m ( x ,y ) = o e ,( z ,y ) + n j ( x ,y ) = e m ( x ,y ) + e 以( z ,j ,) ,f ( 2 3 ) e m ( 石,y ) m ( x ,y ) = e m ( x ,y ) ) e h ( x ,y ) ,f j 式中e 1 表示数学期望算子。 对m 幅图像作平均运算: 砥y ) 。击犁s ( 训) + f ( 训) ( 2 - 4 ) 显然分析的结果是采用求多幅图像之间的均值得到的,在一幅图像内部,以 像素为单位,求周围相邻像素的均值并赋值给中心像素,就会起到类似滤波的效 果,当作平均处理的噪声图像数目增加时,其统计平均值就越接近原始无噪声图 像吲。通常情况下去噪滤波会采用均值滤波模板进行滤波,下面给出3 x 3 均值滤 波模板示意图,如图2 1 所示: 1 9 1 1 11 i 11 i i 图2 - 13 x 3 均值滤波模板示意图 这种运算的实质是求窗口内的所有像素点的平均值,然后将其赋给中心像素 点,作为中心像素点的滤波输出。这个取均值的模板其实是一个低通滤波器。因 图像细节信息主要分布在高频区域,因此均值滤波的过程会导致图像变模糊。如 果模板选取过大,则这种模糊会加剧;模板选择越小,去噪能力会下降。因此模 板大小的选择实际上是去噪能力和保留图像细节的一种折中。这种方法在实际应 用中的最大困难在于把多幅图像配准,以便使相应的像素能正确地对应排列。 2 2 2 中值滤波 1 0 浙江工业大学硕士学位论文 中值滤波器是一种常用的非线性平滑滤波器,是由图基( t u f t y ) 在1 9 7 1 年提 出的。它是基于图像的这样一种特性:噪声往往以孤立的点的形式出现,这些点 对应的像素很少,而图像则是由像素数较多、面积较大的小块构成。其基本原理 是把数字图像或数字序列中一点的值用该点的一个领域中各点值的中值代换。中 值的定义如下: 一组数五,毛,把刀个数按值的大小顺序排列如下: 薯l x j 2 3 y = m e d x l ,而,x 3 ,矗 = 气字) 力( 。彩) 三 气勺+ 1 钥 ,z ( g 化打) q 5 y 称为序列五,x 2 ,而,矗的中值。 把一个点的特定长度或形状的邻域称做窗口。在一维情形下,中值滤波器是 一个含有奇数个像素的滑动窗口。窗口正中间那个像素的值用窗口内各像素值的 中值代替。 设输入序列而,x 2 ,x 3 9o ,为自然数集合,窗口长度为刀。则滤波器输出为j 乃= m e d x , = m e d x ,薯而+ 。 ,i e ,“= ( ,l 1 ) 2 ( 2 6 ) 由大量实验可得,对于零均值正态分布的噪声输入,中值滤波输出与输入噪 声的密度分布有关,输出噪声方差与输入噪声密度函数的平方成反比。对随机噪 声的抑制能力,中值滤波性能要比平均值滤波差些。但对于脉冲干扰来讲,特别 是脉冲宽度小于棚2 ,相距较远的窄脉冲,中值滤波是很有效的。 中值滤波算法去除脉冲噪声的性能受滤波窗口尺寸的影响较大,窗口大时除 噪能力较强,但容易滤去非噪声细节,窗口小时能较好地保护图像细节,但除噪能 力弱。针对这一矛盾,有人提出了自适应中值滤波算法,自适应中值滤波的基本 思路可描述如下: ( 1 ) 根据噪声污染进行图像块分类,若极值与均值差大于阈值,则为污染块,否则 为非污染; ( 2 ) 根据污染程度决定滤波窗口的大小; ( 3 ) 对非污染块保留原值,对噪声污染块进行滤波。 在信噪比较大时,自适应中值滤波算法可以更好地保留图像细节,并提高 浙江工业大学硕士学位论文 滤波速度。它的困难在于对污染程度的度量,对此【8 】根据不同的噪声模型提出了 两种改进思路,一是基于首先检测中心像素是否出现脉冲然后再检测滤波后是 否残存脉冲的分级排序策略,另一种是基于对脉冲噪声的大小检测策略。这两种 改进一是使中值滤波可以同时滤去正噪声和负噪声,二是实现简单、并且滤波性 能更好。总的来说,自适应中值滤波在性能上获得了很大的提高,并且在信噪比 较高时能减少滤波次数、提高滤波速度。 2 2 3 边缘保持滤波 根据图像的相关性,在一个邻域内,无干扰图像的灰度值变化不会很大,所 以其方差也应该较小,即该邻域内的灰度均值最小。将该邻域与相应的加权模板 作卷积运算所得到的灰度值作为待处理像素点的灰度值,可降低噪声的干扰并较 好地保持图像的边缘细节。 拼 图2 - 2 a 模板l 去i去 对灰度图像的每一个像素点( f ,) 取适当大小的一个邻域( 如3 x 3 邻域) ,分 别计算( f ,) 的左上角子邻域、左下角子邻域、右上角子邻域、右下角子邻域的 灰度分布均匀度,取子邻域中最小均匀度所对应的区域与模板1 做卷积运算( 自 定义加权模板如图2 2 所示) ,然后取最小均匀度对应区域的均值作为该象素点的 新的灰度值吲。 计算灰度均匀度的公式为: v = 厂2 ( f ,_ ,) 一( 巾,) ( 2 - 7 ) 也可以用下式计算: v = l 巾,j ) - f ( i ,j ) i ( 2 - 8 ) 厂、z 若像素点( f ,) 所取的邻域是5 5 邻域,则应该计算其左上角子邻域( 3 3 邻 1 2 浙江工业大学硕士学位论文 域) 、右上角子邻域、左下角子邻域、右下角子邻域和以该像素点为c 孥心的一个 3 x 3 子邻域的灰度分布均匀度。若其最小均匀度对应的区域是上、下、左、右4 个子邻域中的一个,则与模板2 做卷积运算;若其最小均匀度是以该像素点为中 心的子邻域,则与模板3 做卷积运算,并将运算后所得到的灰度值作为该像素点 的新的灰度值。 如果只使用单一的3 3 邻域进行平滑,当中心像素灰度级受噪声干扰较大 时,只使用邻近的4 个像素与模板做卷积运算,将所得的灰度值作为目标点的新 灰度值,并不能达到有效的平滑,因此邻域尺度的选择是算法的关键,对灰度图 像的每一个像素点( f ,_ ) 首先计算3 x 3 邻域的灰度级均值加和灰度级标准差仃, 设窗口中心像素点( f ,j ) 的灰度级为,则 仃= ( ,一m ) 2 ( 2 - 9 ) 在灰度变化缓和的区域,像素灰度级很接近,故盯很小,很容易满足 口卜一坍i 盯( 口为常数) 。用均匀度最小的邻域内的9 个邻域点与模板做卷积运算, 将所得的灰度值给目标点像素赋值,该值与中心像素的灰度级,相差无几,不会 破坏图像内容。若中心像素灰度级受噪声影响而使,其变得很大,则更容易满足 口p m i o r ,用均匀度最小的邻域内的9 个邻域点与模板做卷积运算所得的灰度 值更为可取。当有边界穿过邻域时,则邻域内各像素的灰度级有较大起伏,因而 盯较大,使得口卜一m l 0 是自定义的惩罚系数,用来控制样本偏差与机 器泛化能力之间的平衡。用l a g r a n g e 乘子法把式( 4 2 4 ) 化成其对偶形式,其结果 与线性可分情况下几乎完全相同【3 8 j 。只是式( 4 2 0 ) 变为: 0 c ,f = l ,2 ,_ ( 4 2 5 ) 4 3 4 离线文字笔迹鉴别s 分类的非线性情形 3 8 浙江工业大挚硕士学位论文 o oo o o o o o o o 0o 0 0o o ooo 000 0 图4 - 3 离线文字笔迹鉴别的非线性情况 在很多情况下,离线文字笔迹特征样本线性不可分离的情况并不能用一个简 单的线性分离来完成,如图4 - 3 所示,至少需要用两次以上的函数才能将它们分 离开【3 9 j 。 直观的想法是利用非线性函数( 这里考虑二次函数) ,设z = 厂,s ) 2 ,二次判别 函数为: 厂( x ) = s g n ( ,1 嵋+ s + 佻+ ,2 w 4 + s 2 w 3 + b ) ( 4 2 6 ) 这里w ,是向量w 的第个分量。 可以猜想,二次函数( 4 2 6 ) g 】以彳艮好的划分图的数据,但这里出现新的 问题,虽然函数( 4 2 6 ) 可以对数据很好的分类,但增加了确定w 和b 的困难,为 解决这个问题,需要作一个变换,将二维空间的x = ,l ,了 1 映射到五维空间上: ( z ) = ( 聒,2 ,j 2 ) 7 ( 4 - 2 7 ) 定义m ( x ) :r 2 一r 5 ,则: ( ,鬻车毗n 暴糍+ r s , r 2 , $ 21 r w 件2 8 , 就一般情况而言,对低维输入离线文字笔迹样本x 是线性不可分的情况,若 存在一个映射,将离线文字笔迹样本x 变到高维空间w ,在高维空间w 中, 可以用线性判别函数对离线文字笔迹样本进行分类,此时,则称x 输入空间( i n p u t s p a c e ) ,称为特征空f 司( f e a t u r es p a c e ) 。由此可以看出,通过映射,将非线性 3 9 浙江工业大学硕士学位论文 可分离的离线文字笔迹样本映射到高维特征空l 司中,在高维空间中。司以按照前 两节讲的方法,构造具有最大间隔的支持超平面 4 0 j 。 考虑离线文字笔迹鉴别是一类非线性分类问题,可使用一个非线性把样本 数据映射到一个高维特征空间,再在该空间建立最优超平面,此时式( 4 1 8 ) 可变 换为: 哑n 吉”乃q _ k ( 毛一) 一哆 ( 4 2 9 ) 。 二如i = 1,- i 式中k ( _ ) 称为核函数,作为核函数,它必须满足m e r c e r 条件。 m e r c e r 条件:对于任意的对称函数k ( 一) ,它是某个特征空间中的内积 运算的充分必要条件,对于任意的缈( x ) 不恒等于0 ,且如2 ( 石p ( j o ( 4 - 3 0 ) 4 4 离线文字笔迹鉴别的核函数选择 支持向量机由训练集和核函数完全刻画,这样在实际问题中,常常是直接给 出核函数( 而不是先给出映射( z ) ) ,所以如何构造和选择离线文字笔迹训练鉴 别的核函数就显得格外重要了【4 1 1 。常用的核函数主要有三类: ( 1 ) 多项式核内积函数k ( 墨薯) = ( ( 脒) + d ) 9 ,d o ,q 是自然数,与之对应的支 持向量机是一个g 阶多项式分离器。 ( 2 ) 高斯( 径向基) 核函数( 1 m f ) ,k ( x ,薯) = e x p 一( k 一1 2t y 2 ) ,仃 0 。所得到的支 持向量机是一种径向基函数分类器,它与传统r b f 方法的重要区别是,这里每 个基函数中心对应一个支持向量,它们以及输出权值都是由算法自动确定的。 ( 3 ) s i g m o i d 内积函数k ( x ,薯) = 鼬( v ( 搿) + c ) ,这时支持向量机实现的就是包 含一个隐层的多层感知器,网路权值和隐层节点数是由算法自动确定的,而且算 法不存在困扰神经网络方法的局部极小点问题。 对于离线文字笔迹鉴别问题,我利用m a t l a b 的支持向量机工具箱 o s u s v m 3 0 0 ,采用高斯径向基核和多项式核函数来进行样本训练。 多项式核函数为: 浙江
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年社区团购市场用户留存与社区团购平台用户增长策略研究报告
- 2025年工业互联网平台TEE在工业设备智能故障诊断与修复的应用案例
- 江苏省淮安市淮阴中学、姜堰中学2026届化学高一第一学期期中质量跟踪监视模拟试题含解析
- 2026届云南省文山州马关县一中化学高二第一学期期末质量跟踪监视试题含答案
- 广东大埔华侨二中2026届化学高三第一学期期末监测模拟试题含解析
- 2026届安徽省亳州市第十八中学化学高二上期中联考模拟试题含解析
- 2025年注册会计师(CPA)考试 会计科目押题冲刺试卷及解析
- 新中国人口政策的变迁
- 河南省安阳市林州一中2026届高三化学第一学期期末检测试题含解析
- 2026届黑龙江省大兴安岭漠河县一中化学高一第一学期期末调研模拟试题含解析
- DB65-T 4773-2024 生物安全实验室消毒技术指南
- 成人体外膜氧合辅助期间感染防控专家共识2024版
- 2024年河北石家庄市井陉矿区人力资源和社会保障局公益性岗位招聘100人历年(高频重点提升专题训练)共500题附带答案详解
- 优化方案语文必修上册
- 云南省大中型水电站情况表
- 旅游景区规划设计方案
- 高中历史知识竞赛省公开课一等奖全国示范课微课金奖课件
- DL-T 5117-2021水下不分散混凝土试验规程-PDF解密
- 铁路专用线设计规范(试行)(TB 10638-2019)
- 国家药政法规培训
- 深圳航空公司招聘笔试真题
评论
0/150
提交评论