(计算机应用技术专业论文)基于ehmm算法的笔迹识别在身份鉴别系统中的应用研究.pdf_第1页
(计算机应用技术专业论文)基于ehmm算法的笔迹识别在身份鉴别系统中的应用研究.pdf_第2页
(计算机应用技术专业论文)基于ehmm算法的笔迹识别在身份鉴别系统中的应用研究.pdf_第3页
(计算机应用技术专业论文)基于ehmm算法的笔迹识别在身份鉴别系统中的应用研究.pdf_第4页
(计算机应用技术专业论文)基于ehmm算法的笔迹识别在身份鉴别系统中的应用研究.pdf_第5页
已阅读5页,还剩78页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

y5 8 c 1 8 8 北京交通大学硕一 日 7 f 究生学位论文 摘要 笔迹识别是通过分析手写文字的书写风格来判断书写人身份的一门技 术 笔迹识别作为一种利用人的行为生物特征进行身份识别的方法, 具有侵 袭性小、 设备成本较低、 应用简单等优点, 从而成为当前模式识别和机器学 习 领域的一个研究热点。 应用计算机进行笔迹识别,又分为在线( o n - l i n e ) 和 离 线( o f f - l i n e ) 两类方法。 本文的研究二 1_ 作是基于离线方法的笔迹样本的特征提取和识别, 以手写 笔迹样本图像作为研究对象, 研究、 验证和实现基于e - h mm ( 嵌入式一 隐马 尔可夫模刑 )算法模型的笔迹特征提取和识别方法, 本文研究的主要内容是: 首先 对传统的纹理图像分析方法和笔迹识别方法进行研究, 分析了现 有方 法的特点 和缺陷, 进而, 提出了 应用e - i i m m c 嵌入式一 隐马尔 ij 夫模型) 算法进行笔迹纹理图像特征提取和模式识别的思想。 进而, 又章对 e - h mm算法模型的模型构建、 学习算法和匹配识别等问 题进行了深入研究和讨论,并以笔迹样本作为研究对象,在 i n t e l公司的 o p e n c v 系 统的h m m d e m 。 子系统上进行了 多项实验研究和分析验证。 另外, 木文对实验子系统的程序框架进行了分析和研究, 为实现把不同 的特征分析算法在同 一 子系统中替换的目 标进行了研究准备l作。 木文在算 法研究和识别实验的过程中, 还对应用e - h mm算法模型进行人脸识别的研 究进行了相关阐述,同笔迹识别问题的研究结论进行了比较和借鉴。 本文的主要工作和贡献是: 1 , 研究应用图像分块和d c t( 离散余弦变换)方法,进行笔迹图像样 本的预处理工作, 通过样本图像块从时域到频域的变换, 提取反映主要样本 统计特征的低频信息,构造e - h mm观察向量; 2 、 研究应用 e - h mm ( 嵌入式隐马尔可夫模型)算法模型,进行笔迹 样本的特征训练和匹配识别, 在实现提取样本的纹理统计特征的同时, 反映 手写文字的结构信息,实现对笔迹样本的更有效的特征表现; 3 , 基于上述算法理论, 本文研究分析了i n t e l 公司的i p l 类库和o p e n c v 系统的功能模块,文章对其中的h mmd e m 。子系统的程序设计框架和数据 小卜 针气 ; y fj ( ; 意 勿宝诀 _ 专 市 北京交通大学硕士研究生学位论文 结构进行了深入分析, 为实现识别算法可替换和程序框架复用做了许多准备 性的研究工作。 4 ,最后,本文应用 h mmd e m o 子系统,进行了笔迹识别的多项实验, 升 一 对实验结果进行了分析和比较, 进一步支撑和验证了本文提出的关于纹理 图像特征提取和匹配识别的思想和结论。 关键词: 笔迹识别纹理特征提取e - h mm嵌入式隐马尔可夫模型 d c 丁离散余弦变换o p e n c v 系统 北京交通大学硕士 研究生学位论文 ab s t r a c t h a n d w r i t i n g r e c o g n i t i o n i s t h e t e c h n o l o g y t o i d e n t i f y t h e w r i t e r b a s e d o n t h e t e x t u r e a n d w r i t i n g s t y l e a n a l y s i s o f t h e h a n d w r it i n g s a m p l e s . a s o n e k i n d o f b i o m e t r i c i d e n t i f i c a t i o n m e t h o d , h a n d w r i t i n g r e c o g n i t i o n h a s b e c a m e a r e s e a r c h h o t s p o t o f t h e p a t t e r n r e c o g n i t i o n a n d m a c h i n e r y s t u d y , w i t h t h e s t r o n g p o i n t s o f s m a l l a f f e c t , l o w d e v i c e c o s t a n d s i m p l e u s in g . t h e c o m p u t e r h a n d w r it i n g r e c o g n i t i o n c o n t a i n s t w o m a i n m e t h o d s w h i c h a r e o n - l i n e a n d o f f - l i n e . i n t h i s p a p e r , w e w i l l s t u d y t h e h a n d w r i t i n g f e a t u r e e x t r a c t i o n a n d r e c o g n i t io n b a s e d o n t h e o ff - l i n e m e t h o d . w e w i l l t a k e t h e h a n d w r i t i n g i m a g e a s r e s e a r c h o b j e c t a n d s t u d y t h e h a n d w r i t i n g f e a t u r e e x t r a c t i o n a n d r e c o g n i t i o n m e t h o d b a s e d o n e - h mm( e m b e d e d - h i d d e n ma r k o v m o d e l s ) mo d e l t h e m a i n c o n t e n t o f t h i s p a p e r : a t f i r s t , w e s t u d y t h e t r a d i t io n a l m e t h o d o f t e x t u r e i m a g e a n a l y s i s a n d h a n d w r i t i n g r e c o g n i t i o n a n d a n a l y s e t h e s t r o n g p o i n t s a n d s h o rt c o m i n g s o f t h e s e m e t h o d s . a n d t h e n , w e b r i n g f o r w a r d t h e n e w i d e a t h a t u s i n g e - h mm ( e m b e d d e d - h i d d e n ma r k o v m o d e l s ) t o r e a l i z e t h e s t a t i s t i c a l f e a t u r e e x t r a c t i o n o f h a n d w r i t i n g t e x t u r e i m a g e a n d p a tt e rn r e c o g n i t i o n . mo r e o v e r , i n t h i s p a p e r w e h a v e m a d e a f u r th e r s t u d y a b o u t t h e m o d e l c o n s t r u c t i o n , s t u d y a l g o r i t h m s a n d m a t c h i n g r e c o g n i t i o n o f t h e e - h m m. w e h a v e a l s o t a k e n h a n d w r i t i n g s a m p l e s a s r e s e a r c h o b j e c t a n d m a d e s o m e m a t e r i a l a n a l y s i s a n d v a l i d a t e . w e h a v e t a k e n s e v e r a l e x p e r i m e n t s a n d a n a l y s i s o n t h e o p e n c v s y s t e m o f i n t e l c o m p a n y . i n a d d i t i o n , i n t h i s p a p e r w e h a v e s t u d i e d t h e p r o g r a m fr a m e w o r k o f t h e e x p e r i m e n t s u b s y s t e m i n o r d e r t o r e a l i z e t h e r e p la c e m e n t o f d i ff e r e n t f e a t u r e a n a l y s i s a l g o r i t h m s i n t h e s u b s y s t e m . i n t h e c o u r s e o f a l g o r i t h m s s t u d y a n d r e c o g n i t i o n e x p e r i m e n t , w e h a v e e x p l a i n e d t h e r e l a t e d s t u d y o f f a c e r e c o g n i t i o n u s i n g e - h mm m o d e l a n d m a d e a c o m p a r i s o n w i t h t h e h a n d w r it i n g r e c o g n i t i o n . t h e m a i n t a s k a n d c o n t r i b u t i o n o f t h i s p a p e r : 1 . w e s t u d y t h e m e t h o d o f h a n d w r i t i n g i m a g e s a m p l e s p r e t r e a t m e n t u s i n g i m a g e d i v i s i o n a n d d c t t r a n s f o r m . i n t h i s m e t h o d , w e c o n s t r u c t t h e e - h mm o b s e r v e d v e c t o r u s in g t h e l o w f r e q u e n c y in f o r m a t i o n o f i m a g e s a m p l e s w h i c h i s t h e d c t t r a n s f o r m r e s u l t s , w h i c h r e fl e c t t h e ma i n s t a t i s t i c a l f e a t u r e o f t h e m 北京交通大学硕 l 研究生学位论文 s a m p l e . 2 . w e s t u d y t h e e - h mm( e m b e d d e d - h i d d e n ma r k o v m o d e l s ) m o d e l a n d c a r r y o u t t h e f e a t u r e e x t r a c t i o n a n d p a tt e rn re c o g n i t i o n o f h a n d w r i t i n g s a m p l e s b a s e d o n i t . u s i n g t h i s m e t h o d , w e t r y t o r e fl e c t b o t h s t a t i s t i c a l a n d s t r u c t u r e i n f o r m a t i o n o f t h e h a n d w r i t i n g s a m p l e s a n d r e a l i z e m o r e e ffic i e n t r e fl e c t i o n o f t h e h a n d w r i t i n g s a m p l e s . 3 . b a s e d o n t h e s e a l g o r i t h m s , i n t h i s p a p e r w e s t u d y t h e i p l l ib r a r y a n d t h e o p e n c v s y s t e m o f i n t e l c o m p a n y . a n d w e m a k e a f u r t h e r s t u d y o f t h e h mmd e m o s u b s y s t e m f r a m e w o r k a n d d a t a s t r u c t u r e a n d d o a lo t o f p r e p a r a t i o n s t u d y w o r k o f t h e a l g o r i t h m s r e p l a c e m e n t a n d p r o g r a m fr a m e w o r k r e u s e . 4 . a t l a s t , w e t a k e s e v e r a l e x p e r i m e n t s o f h a n d w r i t i n g r e c o g n i t i o n u s i n g h mmd e m o s u b s y s t e m a n d m a k e a n a l y s i s a n d c o m p a r i s o n o f t h e e x p e r i m e n t r e s u l t s , i n t h i s w a y , w e f u rt h e r v a l i d a t e t h e i d e a a n d c o n c l u s i o n a b o u t t e x t u r e i m a g e t r e a t m e n t a n d p a tt e rn r e c o g n i t i o n i n t h i s p a p e r . ke v wo r d s : h a n d w r i t i n g r e c o g n i t io n e - h mm( e m b e d d e d - h i d d e n t e x t u r e f e a t u r e e x t r a c t i o n ma r k o v m o d e l ) d c t o p e n c v s y s t e m w 北京交通人学硕生研究生学位论文 第一章 引言 生物识别技术是指通过自 动化技术利用人体的生理特征和 ( 或)行为特 征进行身份鉴别的技术。目前利用生理特征进行生物识别的主要方法有:指 纹识别、虹膜识别、手掌识别、视网膜识别和人脸识别;利用行为特征进行 识别的主要方法有:声音识别、笔迹识别和击键识别等。 通过几十年的快速发展,除了这些比较成熟的生物识别技术之外,还有 许多新兴的技术,如耳朵识别、人体气味识别、血管识别、步态识别等随 着现代生物技术的发展,尤其是人类基因组研究的重大突破,研究人员认为 d n a识别技术或基因型识别技术将是未来生物识别技术的主流。 本文将要探讨的问题,是一种基于 e - h mm ( 嵌入式一 隐马尔可夫模型) 算法模型的笔迹识别的身份鉴别系统研究。笔迹识别问题,首先是应用人的 行为特征进行身份鉴别的一种方法,进而,笔迹样本图像的预处理、特征提 取等研究同人脸识别、指纹识别、虹膜识别等人体特征识别方法的研究具有 很大的相关性。因此,本文对笔迹识别问题进行研究和探讨,并提出一种新 的基于e - h mm算法模型的笔迹识别方法,逐步深入的探讨应用不同生物特 征进行身份鉴别这个问题的一些共同特性。 1 . 1 为什么要应用生物特征进行身份鉴别 首先,为什么我们要采用人体的生理或行为特征来进行身份鉴定呢?这 种鉴定能保证安全性和准确性吗?其实,由于人体生物特征具有人体所固有 的不可复制性和唯一性,这使得生物识别身份验证方法可以不依赖于各种人 造的和附加的物品来证明自己的身份, 而用来证明自 身的恰恰是人本身,所 以,它不会丢失、不会遗忘,很难伪造和假冒,这样也就保证了它的安全性 与可靠性。 例如,在所有生物识别技术中, 指纹识别是发展最成熟也是最 “ 传统” 的技术,其应用领域也最为广泛。指纹在相对性和稳定性方面均非常符合生 物识别系统的要求,世界上不存在两个指纹相同的人,而且人的指纹一经形 成便具有很强的稳定性,从出生到死亡都不会出现明显变化。指纹识别己 经 有了 很长的一段历史。目 前,全球范围内都建立了指纹鉴定机构以及罪犯指 纹数据库, 指纹鉴定已经被官方所接受. 成为司法部门有效的身份鉴定手段。 北京交通大学预j 研究生学位论文 1 2 不同生物特征 叭1 3 刀0 0 应用于身份鉴别系统的比较 评价一个生物识别系统的性能主要从下列几个方面进行:非侵袭性,即 识别过程中,提取样本的过程对识别对象是否具有非侵袭性;唯一性或者精 确性,指生物特征和对象身份匹配的程度;持久性,指对对单一的对象而言, 具有的生物特征相对稳定不变的程度:可收集性,指生物特征标准样本收集 和测试样本收集的难度和样本数量的级别识别,标准样本的越多,当然会提 升以别的精确性,样本收集容易,也会使系统可以更加方便和应用;识别性 能,指通过样本鉴别和区分对象身份的正确率。 , i 物特征非侵袭性唯一性持久性可收集性识别性能 一 人脸 同低中等 低嗬】 一一 指纹中等尚品中等 占一 目 手纹 中等 中等 中等 自 中等r 石 一一 虹膜 低 局向中等r 可 笔迹高低低高低 一 声音局低第中等低 表11 :各种生物特征识别技术特点的比较 如表i 1 ,是针对目前的研究现状,对不同生物特征应用于识别系统的性 能从非侵袭性、唯一性、持久性、可收集性和识别性能几个方面进行比较。 更直观的,国际生物识剐集团在对几种识别技术进行对比评价后,列出 对各种技术进行对比如图1 1 : 北京交通人掌坝j 研究生学位论文 虹膜识别声音识别 距离中心越近,偏离理想状态越远 竺! ! 堡壅竺! 堡塑兰! 壁! :兰墨矍垦 刳1 1 可见,各种识别技术均有其优劣之处,没有一个单一生物识别系统是可 以达到百分之百的完美与准确。在识别的精确性方面,虹膜识别是各种识别 技术中错误率最低的,其次是视网膜和指纹技术识别:在费用方面,以击键 法最低,其次是声音和笔迹识别。另外,每种生物特征都有自己的适用范围。 比如,有些人的指纹无法提取特征,患白内障的人虹膜会发生变化等。在对 安全有严格要求的应用领域中,人们往往需要融合多种生物特征来实现高精 度的识别系统。数据融合是一种通过集成多知识源的信息和不同专家的意见 以产生个决策的方法,将数据融合方法用于身份鉴别,结合多种生理和行 为特征进行身份鉴别,提高鉴别系统的精度和可靠性,这无疑是身份鉴别领 域发展的必然趋势。 北京交通大学硕士研究生学位论文 1 . 3 笔迹识别的方法流派和研究现状概述 妇 3 . 1 笔迹识别概述 如前文所述,笔迹是属于人的行为特征之一,笔迹识别就是通过分析手 写笔迹的书写风格来判断书写人身份的一门技术,是根据生物特征来鉴别身 份的一个重要方法。 笔迹识别的方法,根据考察的对象可分为与内容有关的笔迹识别和与内 容 无关的 笔 迹识别, 即 文本依 存( t e x t - d e p e n d e n t ) 和文 本独立 ( t e x t - i n d e p e n d e n t ) 两类。前者要求作者书写固定内容的文字以鉴别身份,如手写签名的认证, 但实际上 固定内容的文字的笔迹易于伪造, 给鉴别带来很大困难: 后者对作者 书写文字内容没有要求,因此这类方法实用性较广,可用于历史研究、法庭 取证、安全保密等方面。 由于笔迹具有一定的相似性,因此如何提取笔迹的识别特征和设计 一 个 怎样的分类器是解决笔迹识别的关键。与内容无关的笔迹特征实际上是从大 量字符集中提取与字符无关的特征,如字间距离、疏密、字迹浓淡等。 以往常用的笔迹鉴别分类器主要有相邻分类器、距离分类器、人工神经 网络分类器等。其中神经网络方法具有其他方法所没有的优点:良好的容错 能力、 分类能力强、并行处理能力和自 学习能力好,越来越多的学者正进行此 方面的研究。 而前向神经网络又是应用最广泛的一种人工神经网络, 它在许多 学科领域有着很重要的实用意义。 本文将要讨论和研究的主要问题,就是以手写笔迹图像作为研究样本, 研究样本的预处理以及样本特征提取分析的算法模型,进而,进行实现算法 的系统分析和相应的笔迹识别实验。 同时,本文希望通过算法研究、实验系统框架分析和实验分析等工作, 通过对笔迹识别问题的研究,找到以纹理图像为研究对象,基于纹理统计特 征分析的模式识别问题的普遍适用的一些规律和结论。上文所介绍的人脸识 别、掌纹识别、虹膜识别等模式识别问题的方法流派中,都同纹理特征的提 取有密切的关系,研究这一问题的一些规律,对这类问题的进一步的研究具 有重要的价值。 北京交通人学硕研究生学位论文 妇. 3 . 2 笔迹识别研究的主要算法流派 目前,国内和国际上笔迹鉴别的研究工作主要包括: 1 、 中科院自 动化所的研究中把手写笔迹作为一种纹理来看待, 使用多通 道二维g a b o r 滤波器来提取纹理特征,并使用加权欧氏距离分类器来完成匹 配 l 一 作 : 月 2 、 南昌航空工业学院研究直接提取笔迹灰度图象特征, 用前向神经网络 分 类 器 进 行鉴 别的 方法: 川 3 、 中科院自 动化所研究中应用的另一种方法是利用字符的笔划方向性进 行万向分解,然后把每个方向的子图像进行频带分解后的采样信号值作为笔 迹特征,用特征匹配方法进行书写人识别; 4 、 上 海 大 学 的 论 文 中 提 出 了 基 于 基 本 笔 画 运 笔 特 征 的 笔 迹 识 别 方 法; = 7 5 , ma s a h i r o o z a k i 提出用模糊似然估计函数进行笔迹鉴别,主要应用主 分 量 分 析 提 取 笔 迹 的 特 征 , 进 而 实 现 模 式 分 类 : 2 3 l 2 s 7 6 , d .a .v a l k a n i o t i s 的方法是应用多层感知器神经网络,实现笔迹样本的 分 类 识 别 。 16 7 荟 1 . 3 . 3 文字识别研究中的相关理论 本文研究的笔迹识别问题,即根据不同书写者的手写笔迹鉴别身份,同 文字内容识别的应用不完全相同,但是两者在研究过程中有许多方法和理论 是相似的,这里,对相关的研究方法和理论进行简要的介绍,与笔迹识别中 的基本理论应用进行参照。 通常的手写汉字识别一般过程,可以用如图1 .2 所示的原理图来表示: 北京交通大学硕士研究生学位论文 文本图像 手写权 字 1后处理 一 州 关联语库 t 字码文本语料收集 图 1 . 2 主要包括预处理,单字识别,后处理三个阶段以及各阶段所需的样本字 库、识别字库和关联字库三个数据基。根据情况的不同,单字识别常常有特 征提取和粗细分类两个不同步骤的区分,特征提取部分的处理同笔迹识别中 的特征提取处理具有相似的特点。 首先,对于输入的手写汉字图像样本,预处理包括所有需要将输入汉字 图像转化为对于图像系统特征分析部分可以接受形式的步骤。其内容和要求 依赖于后续处理中的识别方法,一般有文本切分、数值化 ( 二值化) 、平滑、 细化以及规整化等几个步骤,往往采用现有的图像处理技术来完成。 经过预处理,得到的数据量是很大的,而每个像素数据所含的有用的信 息却很少。特征提取就是要将图像中的有用信息集中于一些少量的、经过精 心选择的特征上。自 然特征选择的好坏直接影响的系统性能的好坏。所以, 选择稳定的具有代表性的特征,是手写汉字识别研究的核心问题,当然,也 是笔迹识别中的核心问题。本文进行的研究工作,主要就是选择和构造适合 描述汉字纹理统计特征和结构特征的算法模型。 在特征的描述中,通常可以把特征分为统计和结构两大类,其中统计特 征又可以分为局部的和整体的两类。 局部特征的明显特点是只注意汉字的局部区域的统计性质而相对忽略文 字的结构规律和整体的统计性质。比较常用的局部特征包括像素本身、线元 梯度、笔划域、方向段强度、方向笔划数,方向映象、方向密度和周边形状 描述。当然,也有采用多种局部特征综合研究的。 北京交通大学硕士研究生学位论文 不同于局部特征,整体特征尽管也忽略汉字的结构特性,但在计算统计 特征时是把汉字图像作为一个整体考虑的。 己用于手写汉字识别的整体特征, 包括有一维投影特征和二维变换特征等。总体来讲,整体特征比局部特征更 多的忽略了汉字的内在结构信息,所以往往都仅作为粗分类特征而被运用。 结构特征是那些能反映汉字内在结构性质的特征。这些特征往往就是构 成汉字的基本要素。因此,鉴于对汉字基本要素的不同看法,就形成了多种 结构特征类型,主要包括有要点 ( 特征点) 、笔划、笔划序列和部件四种。 特征选择之后就是分类处理,分类通常使用某种策略作为依据,通过将 输入汉字的特征取值,与识别字库的每个字类代表的标准取值进行比较来完 成,即所谓匹配。在笔迹身份鉴别的研究中,基本思想也是把待识别样本同 代表书写者身份的标准取值进行比较,进行分类划分。在汉字识别中,首先 将输入汉字匹配到某个字类范围,然后再对其进行进一步区分,最终获得匹 配的单个字类。这就是所谓的粗分类和细分类。 当然无论是粗分类还是细分类,也不管是区分粗细分类还是不区分粗细 分类, 要进行分类匹配, 就离不开分类匹配方法的确定。 在手写汉字识别中, 常用的匹配方法有对比匹配法、结构匹配法、松弛匹配法。 1 、 对比匹配法。 主要思想是基于特征空间中的某种距离测度的计算。 几 乎所有统计的局部和整体特征向量都可以采用对比匹配来完成对汉字的分 类。 如果解决符号串之间的距离计算, 也可以将此方法用于结构特征的匹配。 2 、 结构匹配法。 主要是针对结构特征的一种匹配技术, 大致可以分为问 法匹配、关系图匹配和树搜索匹配等.由 于结构匹配方法比 较灵活, 所以 也 常常结合模糊数学和人工智能技术来完成字类匹配。 3 , 既可以应用于统计特征, 又可应用于结构特征的一类匹配方法是松弛 匹配方法。严格的说, 松弛只是一种计算方法,通过使用局部相互制约关系 和多次反复迭代来获得一个最优的整体结果。使用松弛匹配的出发点就是同 时考虑所有可能的匹配,并通过迭代取舍,渐渐收敛到最可能的匹配伤。尽 管付出的时间代价很大,但是会得到比较好的识别效果。 1 . 4 本文研究的出发点和主 要工作 基于上述笔迹识别的方法流派、 研究现状和相关理论,本文研究的出发 点,是把笔迹样本图像作为一种纹理图像,通过提取纹理的灰度统计特征, 实现样本表示和身份鉴别的目的。 但是, 本文认为传统的笔迹纹理分析方法, 都针对笔迹图像的灰度信息进行统计分析和特征提取,侧重于笔迹纹理的全 北京交通大学硕 : 研究生学位论文 局统计特性分析, 对于文字本身的结构特性和局部统计特性的分析不够充分。 本文主要的研究工作,首先,对传统的纹理图像的分析方法和笔迹识别 万法进行了研究, 分析了现有方法的特点和缺陷, 进而, 提出了应用e - h mm ( 嵌入式一 隐马尔可夫模型) 算法模型进行笔迹纹理图像统计特征提取和模式 识别的思想。文章对 e - h m m 算法模型的模型构建、学习算法和匹配识别等 方法进行了深入研究和讨论,并以笔迹样本作为研究对象进行具体的分析和 验证,并应用i n t e l 公司的o p e n c v 系统的h m m d e m 。 子系统, 进行了多 项 实验和结果的分析比较。另一方面,本文对该实验子系统的程序框架进行了 分析和研究, 为多种特征分析和提取算法在子系统中的实现进行了准备工作。 在本文在算法研究和识别实验的过程中,还对应用e - h mm算法模型进 行人脸识别的的研究进行了相关阐述,同笔迹鉴别问题的算法和实验方法进 行比较和借鉴。 1 . 5 本文的主要贡献和材料组织 5 1 . 5 . 1 本文的主要贡献 1 、研究应用图像分块和 d c t( 离散余弦变换)方法,进行笔迹图像样 木的预处理工作,通过样本图像块从时域到频域的变换,提取反映主要样本 统计特征的低频信息,构造e - h m m观察向量; 2 、 研究应用e - h mm ( 嵌入式隐马尔可夫模型)算法模型,进行笔迹样 本的特征训练和匹配识别,在实现提取样本的 纹理统计特征的同时,反映手 写文字的结构信息,实现对笔迹样本的更有效的特征表现; 3 、 基于上述算法理论, 本 文 研究 分析了i n t e l 公司的i p l 类库和o p e n c v 系统的功能模块, 文章对其中的h m m d e m 。 子系统的程序设计框架和数据结 构进行了深入分析,为实现识别算法可替换和程序框架复用做了许多准备性 的研究工作。 4 . 最后,本文应用h mm d e m 。 子系统,进行了笔迹识别的多项实验, 并对实验结果进行了分析和比较,进一步支撑和验证了本文提出的关于纹理 图像特征提取和匹配识别的思想和结论。 北京交通大学硕士研究生学位论文 fi 1 . 5 . 2 本文的材料组织 第一帝概述了本文的研究背景和主要工作。首先,介绍了应用生物特征 进行身份鉴别的概念、方法流派和国内外的研究成果;进而,对笔迹识别的 研究现状,特别是基于纹理特征提取的笔迹识别方法进行介绍,从而阐述了 本文的研究动机、主要贡献和材料组织; 第二章阐述了纹理图像的定义和经典分析方法,对基于纹理特征的笔迹 识别方法的研究现状进行分析,引入应用 e - h m m 算法模型进行笔迹识别的思 木 月 第三章对 h m m( 隐马尔可夫模型)的基本理论、算法模型进行介绍,在 此基础上,对e - h m m 算法模型进行了比较详细的分析和讨论。 第四章详细分析了应用e - h m m 算法进行模式识别的方法,对e - h m m 9 模型 的数据获取和d c t 观察向量的构造进行了分析,然后研究了应用e - h m m 模型 的进行训练和特征提取的流程。 第五章简要介绍了i n t e l 公司的 i p l ( i m a g e p r o c e s s i n g l i b r a r y 图像 处理类库) 类库和o p e n c v ( o p e n c o m p u t e r v i s i o n 开放计算机视觉)系统, 这是本文进行算法验证和实验程序系统平台。 第六章分析了基于e - h m m 算法的目 标识别程序系统的类层次模型、运行 框架和关键的数据结构及代码。 第七章针对应用 e - h m m 方法进行笔迹纹理的特征提取和识别的实验进行 了分析和介绍,首先对实验样本的选取进行了介绍,进而应用不同的样本集 合和参数配置进行识别实验的比 较,最后对实验的结果进行了理论分析。 第八章进行了全文的小结,对文章的主要工作和思想进行了总结,并对 算法理论、系统实现和实验中的问题,以及研究的前景进行了分析和展望。 北京交通大学硕士研究生学位论文 第二章基于纹理特征的笔迹识别方法的研究 2 1 纹理的定义 尽管纹理在图象分类和图象分析中是很重要的特性,并且它几乎无所不 在,从多光谱卫星图片到细胞组织的图象都可以看到纹理,但目前对纹理还 没有精确的定义。图2 1 中列举了自然和人工纹理的多种样本,其中,0 3 4 图就是通过把特定的子图象有规则地重复,由人工产生的纹理。 图2 t 人造和自然纹理图案 图2 1 中的其它部分则是更为复杂的自然纹理。图象纹理可定性地用咀 下一种或几种描述来表征:粗的、细的、平滑的、颗粒状的、随机的、线划 状的或斑驳杂色的、不规则的和波纹状的。从图2 1 所示的纹理可看到纹理 北京交通大学硕士研究生学位论文 是一种有组织的区域现象,它的基本特征是移不变性( s h i f ti n v a r i a n c e ) , 也即对纹理的视觉感知基本上与其在图象中的位置无关。移不变性可被描述 成是确定性的,( 规则的或结构的) 或是随机的( 不规则的) ,但很可能存在 着介于这两者之间的类别。确定性的图案通常是人造的,并且由线条、三角 形、矩形、圆、多边形有规律的排列组成,而随机图象则通常是自然界产生 的。 21 1 纹理研究的领域和内容 纹理研究的领域大致可分成三种类型。第一类是纹理的描述和分类。这 类问题在图象识别中有重要应用,因此已经引起了广泛的重视。例如,在医 学图象处理中利用纹理特性来区别正常细胞和癌细胞。这时,就要先抽取这 两种细胞图象的纹理特性,然后进行分类识别。第二类是以纹理为特征的图 象分割。第三类是利用纹理信息推断物体的深度信息或表面方向。 2 1 2 测量纹理特征的统计方法 从数字图像处理的角度,纹理图像应当定义为灰度分布上具有一定统计 特性的图像。 最早是用自相关函数来作纹理特性的测量,然后又采用功率谱、马尔可 夫过程和并发矩阵( c o o c c u r r e n c em a t r i x ) 来统计。纹理特性的统计方法 测量主要用于在航测照片中自动识别草地、水面、树林、田野等自然景物的 种类。用统计方法分析纹理的过程如图2 2 所示。 图2 2 统计方法分析纹理的过程 图2 2 中通过t 1 变换测量图象中纹理的统计特性,它的输出y 可是标量、 向量或是矩阵。这取决于所采用的方法。如果是向量或矩阵,那么这样的数 据还要经过聚集处理,以得到单一的测量。这就是图中t 2 处理的作用,它的 北京交通大学硕十研究生学位论文 是 一 种 有 组织的 区 域 现象, 它的 基 本 特征 是 移不 变 性( s h i f t i n v a r i a n c e ) , 也即对纹理的视觉感知基本上与其在图象中的位置无关。移不变性可被描述 成是确定性的,( 规则的或结构的)或是随机的 ( 不规则的) ,但很可能存在 着介于这两者之间的类别。确定性的图案通常是人造的,并且由线条、三角 形、矩形、圆、多边形有规律的排列组成,而随机图象则通常是自 然界产生 的。 2 . 1 . 1 纹理研究的领域和内 容 纹理研究的领域大致可分成三种类型。第一类是纹理的描述和分类。这 类问题在图象识别中有重要应用,因此已经引起了广泛的重视。例如,在医 学图象处理中利用纹理特性来区别正常细胞和癌细胞。这时,就要先抽取这 两种细胞图象的纹理特性,然后进行分类识别。第二类是以纹理为特征的图 象分割。第三类是利用纹理信息推断物体的深度信息或表面方向。 芍 2 . 1 . 2 测量纹理特征的统计方法 从数字图像处理的角度,纹理图像应当定义为灰度分布上具有一定统计 特性的图像。 最早是用自 相关函数来作纹理特性的测量,然后又采用功率谱、马尔可 夫过程和并发矩阵 ( c o - o c c u r r e n c e m a t r i x ) 来统计。纹理特性的统计方法 测量主要用于在航测照片中自动识别草地、水面、树林、田野等自然景物的 种类。用统计方法分析纹理的过程如图2 . 2 所示。 1 0 1 1 ) x - 幼 , 万 工a (i, j)y t, 输入图象 标量.向量 或矩阵 纹理特性 图2 .2 统计方法分析纹理的过程 图2 . 2 中通过t 1 变换测量图象中 纹理的统计特性, 它的输出y 可是标量、 向量或是矩阵。这取决于所采用的方法。如果是向量或矩阵,那么这样的数 据还要经过聚集处理,以得到单一的测量。 这就是图中t 2 处理的作用, 它的 北京交通人学硕研究生学位论文 输出是求得的纹理属性a ( i , 力。大多数情况下a ( i , j ) 是一个标量。 如前所述,通常认为纹理的观察与光照无关。对计算机来说为达到相似 的效果,通常先用等概率量化 e p q ( e q u a l p r o b a b i l i t y q u a n t i z a t i o n ) 对 图象作预处理。如果假设用摄象机、照相机底片、或扫描器作输入的图象系 统中的各个阶段都可用单调函数关系来表示的话,那么用 e p q 可以使各种处 理图象的对比度规整化。 因为, 如果两幅图象的灰度互为单调变换, 那么经过 e p q 规整处理以后就 具有相同的概率分布函数。这样的预处理的作用尚不清楚,因为对人的心理 物理学实验证明事实上人利用对比度来区分纹理。由于经过e p q处理后,图 象之间在一阶统计量上的区别被消除了,所以一阶统计量的区分作用被大为 降低。这时二阶统计量就成为主要的测量。 理论上,任何一种纹理分析的统计方法,如多通道 g a b o r 滤波器或灰度 共生矩阵,都可以用在笔迹纹理的特征提取,下面,将对灰度共生矩阵和多 通道g a b o r 滤波器这两种纹理分析的方法进行更详细的分析,分析笔迹纹理 特征提取方法的一些特性。 2 . 2 灰度共生矩阵方法应用于纹理特征的分析 上节所述的一阶统计特性只测量了纹理的点特性,然而纹理特性不仅与 纹理基元中的灰度影调有关,而且和纹理基元的相互关联有关。因此,如能 在纹理特性的测量中把纹理图案中的空间关系考虑进来将能更好地描述纹 理。测量纹理二阶统计特性的并发矩阵就是实现上述概念的一种方法。目 前 主 要 研 究 的 是 灰 度 并 发 矩 阵g l c m ( g r a y l e v e l c o - o c c u r r e n c e m a t r i x ) , 它 还 可 推 广 为 广 义 并 发 矩阵g c m ( g e n e r a l i z e d c o - o c c u r r e n c e m a t r i x ) , 灰 度并发矩阵g l c m说明当图象中象素( i , j ) 处的灰度为 i k ,同时与( i , j ) 沿 任 意 方向 相 距 位 移d 的 象素( i j , ) 处 的 灰 度为工 。 的 概率 。 从 概念 上讲, 可以 用下述方法来得到 g l c m统计:设向图象中抛下大量各不相干的细针,记下 针的两端处的灰度, 然后统计两个特定的灰度同时出现的频率 ( 或次数) , 并 存入概率矩阵中,这就得到了某一位移值d 时的并发矩阵。生物图象处理和 遥感图象处理中的应用说明 g l c m是性能很好的方法。它不但适用于纹理识 别, 而且用于纹理分割时效果也很好。 以下我们将详细讨论并发矩阵的定义。 为通用起见并发矩阵的统计特性不一定限于图象的灰度。设 y ( i , j ) 是 纹理基元所计算的某项特性, 并且它只能在整数集合 y l . . . , y r - - - , y s . . . , y t 北京交通大学硕士研究生学位论文 中取值。二阶统计所研究的是特征 y ( i , j ) 在相对位置满足特定空间约束条 件的两个象素处取某两个特定值,例如y r 和y s 的概率大小。说明两个象素 相对位置的空间约束条件可用逻辑谓词q 来表示。 。 一 , 【(, j ), (, 、 ) l ( 2 一 1 ) 其 中 (i, j ) 和仁 川 分 别 为 两 个 纹 理 基 元 的 象 素 位 置 , 例如,设当两个象素之间的距离小于或等于y 时co 为真, 口是逻辑表达式。 . (i,j ),(i j ) 一 卜i)2 + (j 一 , ,)2 r 、 : 一 晦y 、 (0 y )2 j 、 : 对g l c m 来说,空间约束可表示为 a ( i 一 i ) = 、 . ( 一 川= a y 因 此 , 它 可 由 位 移 向 量 d = (ax , 明来 表 示 。 ( 2 - 2 ) ( 2 - 3 ) 我 们 可 以 通 过 统 计 归 一 化 的 直 方 图 h (y , , y *, 呵 来 求 得 在 给 定 空 间 约 束 q 的条件下,特征y ( i , j ) 取y r 和y s 的概率。由于包含y r和y s 两个变量, 所 以 在 给 定 。 的 条 件 下 , 川 y . , y s , 钩 是 二 维 的 矩 阵 , 矩 阵 大 小 为 、 x n , 、 是 特征丫的量化级数。如果以灰度作为特征y ,用位移 d 来表示空间约束。, 那 么 这 时 的 直 方 图 拭 1 1 , 1 2 ,司 就 是 灰 度 并 发 矩 阵 。 l c m , 它 所 估 计 的 是 , 相 对 位 移 为d 的 一 对 象素的 灰 度为( 1 1 , 1 2 ) 的 概率。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论