（模式识别与智能系统专业论文）关于手写数字串切分的研究.pdf

上传人：活*** IP属地：宁夏上传时间：2019-12-12 格式：PDF 页数：66 大小：3.17MB 积分：0 举报 版权申诉

已阅读5页，还剩61页未读，继续免费阅读

（模式识别与智能系统专业论文）关于手写数字串切分的研究.pdf.pdf 免费下载

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

关子手写封今全碧勿分时研乡之一诵亨雳摘要票据自动处理系统是一个基于切分的识别系统。本文重点讨论了手写数字串的切分过程，这里用到的切分方法是基于字符本身特征的，而不依赖于识别技术。切分系统包括预处理、初步切分和连写数字串切分三部分。预处理包括二值化和去边框，提出了一种保留字符信息而去除边框的算法。初步切分包括连通域提取和连通域属性判别，给出了一种适应不同书写风格的属性判别方法。针对连写数字串切分的问题，提出了基于字符边缘的字符个数估计方法，同时找出切分参考点; 在此信息的指导下，分别提出了改进滴水算法和全局最优的多模具算法。构建了一个集成所有方法的切分平台( m m s s t o o l b o x ) ，基于它可以方便地研究现有和潜在的切分技术。该切分系统作为票据自动处理系统的关键组成部分，己经集成到识别系统中。关键字票据o c r ;手写数字串切分;连写数字:改进滴水算法;多模具算法关子手写翻笋碧切分劣兑护ab s t r a c t ab s t r a c t a u t o m a t i c c h e c k p r o g r a m i s a s e g m e n t a t i o n - b a s e d r e c o g n i t i o n s y s t e m . t h i s t h e s i s w i l l f o c u s o n t h e s e g m e n t a t i o n o f h a n d w r i t t e n d i g i t s t r i n g . i n p a r t i c u l a r , i t i s t h e c l a s s i c a l a p p r o a c h o f s e g m e n t a t io n b a s e d o n c h a r a c t e r f e a t u r e s a lo n e ( i .e . n o t a i d e d b y r e c o g n i t i o n ) . t h e s e g m e n t a t i o n s y s t e m i n c l u d e s p r e p r o c e s s i n g , e l e m e n t a r y s e g m e n t a t i o n a n d t h e s e g m e n t a t i o n o f c o n n e c t e d d i g i t s . t h e p r e p r o c e s s i n g i s m a d e u p o f b i n a r i z a t i o n a n d f o r m re m o v a l , a n e w t e c h n i q u e f o r i n t e l l i g e n t f o r m r e m o v a l i s d e v e l o p e d f o r c h a r a c t e r s t r o k e p r e s e rv a t i o n . t h e e l e m e n t a r y s e g m e n t a t i o n i s m a d e u p o f c o n n e c t e d c o m p o n e n t s e x t r a c t i o n a n d t h e d e t e r m i n a t i o n o f c o n n e c t e d c o m p o n e n t s , a n e w d e t e r m i n a t i o n a l g o r i t h m a d a p t i n g t h e w r i t e r s s t y l e i s d e v e l o p e d . i n o r d e r t o s o l v e t h e p r o b l e m o f s e g m e n t i n g c o n n e c t e d d i g it s , e s t i m a t i n g t h e n u m b e r o f c o n n e c t e d d i g i t s a n d f i n d i n g t h e r e f e re n c e p o i n t a r e p r o c e s s e d ; t h e n , t h e im p r o v e d d r o p f a l l a l g o r i t h m a n d m u l t i - m o u l d a l g o r i t h m a r e d e v e l o p e d . a m u lt i - m e t h o d s s t r i n g s e g m e n t a ti o n t o o l b o x ( m ms s t o o l b o x ) i s d e v e l o p e d f o r t h e p u r p o s e o f s t u d y i n g c u r r e n t a n d p o t e n t i a l t e c h n i q u e s f o r n u m e r ic a l d i g i t s e g m e n t a t i o n . a s a k e y t e c h n o l o g y , t h e s y s t e m i s s y s t e m. i n c o r p o r a t e d i n t o a c o m p l e t e o p t i c a lre c o g n i t i o n k e y w o r d s c h e c k o c r ; t h e s e g m e n t a t i o n o f h a n d w r i t t e n d i g i t s t r i n g ; c o n n e c t e d d i g i t s ; i m p r o v e d d r o p f a l l a l g o r i t h m ; mu l t i - m o u l d a l g o r i t h m 尖买手写裁演笋勿分内钾 21 - 落1 肴摆 e 第1 章概述模式识别诞生于2 0 世纪2 0 年代，随着4 0 年代计算机的出现， 5 0 年代人工智能的兴起，模型识别在6 0 年代初迅速发展成一门学科。儿十年来，模式识别研究取得了大量的成果，在很多方面得到了成功的应用。作为模式识别的一个重要组成部分，文字识别技术的应用正在把人类从许多枯燥无味的文字录入和校验中解脱出来. 虽然文字识别机器的性能还远不如人，但是文字识别技术已经产生了巨大的应用价值。 1 . 1金融票据 o c r系统文字识别是一个很大的领域，按照识别对象可分为两个子领域: 印刷文字识别和手写文字识别。由于印刷文字比较工整和清晰，识别系统能够分析并识别通用的印刷文本，如报纸、杂志等。与印刷 o c r技术相比较，由于书写人习惯不同，实现自由手写识别相当艰难，因此手写的识别仅限定在小字符集识别。文字识别系统还可以分为联机识别系统和脱机识别系统。联机识别系统是在书写的同时实现识别，实际应用如p d a ,掌上电脑等。脱机识别系统一般应用于文档识别、邮件分拣和表格数据自动录入系统。由于缺少可能的笔划和同步信息，脱机识别相对联机识别是一个更难解决的问题。 o c r ( o p t i c a l c h a r a c t e r r e c o g n i t i o n ) 作为一种脱机文字识别技术，它通过扫描、摄像等光学输入方式将汉字报刊、书籍、文稿及其它印刷品的文字转化为图像信息，再利用文字识别技术将图像信息转化为可以使用的计算机输入，广泛应用于大量文字资料、材料、票据、档案卷宗，文案的录入和处理领域。适合于有大量录入、保存、查阅电子文档需求的个人或单位。手写o c r 系统是通过对书写字符定义字符集或词集、书写字体等提出足够的限制而获得的。有调查表明:以1 0 0 个美国城市名称作为词集，其识别率可达9 5 % ，若以1 0 0 0 个名称作为词集，则识别率降到9 0 % 。由于手写o c r 技术的限制，专业型o c r 系统的产品多面向特定的行业，即适用于大量表格信息录入的部门，如邮政、税务、海关等。这种面向特定行业的专业型 o c r系统信息格式较为固定，识别的字符集相对较小、经常与专用的输入设备结合使用，因此具有速度快、效率高等特点。上个世纪九十年代，在美国仅支票一项，每年就有六千六百多万张。随着现金业务的减少，金融系统的银行单据将成倍增加。这些数千万甚至上亿的单据，在数据录入工作中一般采用人工录入，由于录入速度慢、错误率较高，已无法满足信息量日益增加的需要，成为金融行业计算机信息化进程的瓶颈。我国的情况更是如此，随着我国金融行业的电子化进程的加速，越来越多的金融票据需要采用电子化的存储形式，同时以信息化带动工业化总体社会发展目标要求更多的企业流程中的业务单据要由计算机来处理。应用手写o c r系统可以将人们从繁忙的录入工作中解放出来，极大地提高工作效率。而o c r 识别技术以其高速、准确、低成本的特点，成为金融行业建立影像索引并替代人工工作的重要手段。现在己经有一些面向银行的o c r 系统 1 , 幻，它们在识别支票金额部分有 5 0 % - 7 0 % 的识别率。也就是说，这些系统在提供合理可信度的条件下有5 0 % - 7 0 % 的识别率，但同时有0 . 1 % 的误识率。由于系统只识别了支票的金额部分并且误识率高于手工处理的差错率，不能满足实用需求。 1 9 9 9年，北京邮电大学模式识别实验室和山东中创公司达成协议，共同研究开发一套金融票据o c r 系统，并于2 0 0 1 年成功申请了国家8 6 3 重点项目( 2 0 0 1 a a 1 1 4 0 8 0 ) d金融票据尖买笋与一黔# d s d h i i 撰超 o c r 系统主要完成银行票据( 支票、存款单、取款单等) 的稽核工作，即通过o c r 技术识别票据上书写信息，检查票面的合法性( 如大小写是否一致，日期是否过期等) ，目的在于减少甚至完全替代重复性的人工操作。构成一个可以处理支票、存款单、取款单、转账汇票等 3 0 余种票据的金融ocr 系统，系统要达到如下技术指标: 整票误识率笔划特征点一底部特征点， . 或者底部特征点一笔划特征点一顶部特征点，如图2 - 8 ; 在处理多点连写的数字时，连接的特征点顺序为: .顶部特征点一笔划特征点一空洞特征点一 ) 底部特征点， .或者底部特征点一笔划特征点一空洞特征点一顶部特征点，如图2 - 9 a 1? 0 图2 - 8 : ( a ) 连写数字( b ) 前景背景细化( c ) 顶部( d ) 底部 ( e ) 笔划部分( f ) 空洞部分( b ) 前景背景上特征点( h ) 连接特征点得到切分线图2 - 9多点连写数字特征点连接顺序该系统的细化过程，尤其是背景细化，由于算法本身的特性，使得运算量很大，导致系统速度很慢，所以不适合用在对实时性要求比较高的金融o c r 系统中。 2 . 3逐步搜索的连写数字串切分算法 2 . 3 . 1滴水算法滴水算法是通过模仿水滴在两个字符间的下落或者滚动的轨迹来构筑切分路径， c o n g e d o 1 1 于1 9 9 5 年首先提出。根据起始点和滴水方向的不同，可以将滴水算法分为四类: 从顶部左侧向右下、从顶部右侧向左下、从底部左侧向右上、从底部右侧向左上。 s . a . k h a n 4 1 于1 9 9 8 年证明，采取其中的两类组合:从顶部左侧向右下和从底部右侧向左上，相当于四类的工作。算法涉及到三个关键步骤: ( 1 ) 起始点的确定; ( 2 ) 下一步寻址算法: ( 3 ) 从顶部左侧关尹手写尝f功勿5 .-落2 煮娜着手节勿 i友7 e 2 . 3 . 2动态规划算法数字串切分的过程实际就是寻找最佳路径的过程。动态规划d p ( d y n a m i c p r o g r a m m i n g ) 是一种很有效的寻找最佳路径的方法，它通过把一个n 步过程转化为n 个单步过程的方法使算法的复杂性按对数级降低。 g . l i u 在 1 2 1 提出基于l d p ( l i m i t e d )算法的连写数字串切分方法，对d p 算法的搜索空间、搜索方法加以限制，可以避免传统滴水算法中陷入局部最优的问题，同时进一步降低了运算复杂度。以下将详细介绍l d p 算法。搜索空间的限制对搜索空间加以限制主要是限制搜索空间的左右边界。对搜索空间的限制主要是为了防 1上不正确的切分路径的出现，一般都是对于书写不规整的情况，如开口的 0 等，同时也缩小了搜索范围，降低了搜索运算量。考虑字符倾斜的情况，可以计算出字符的倾斜程度，根据倾斜度确定搜索空间的左右边界。例如，对于字符向右倾斜这种一般情况，就要左边界放宽一些，右边界缩小一些。代价函数代价函数是动态规划算法中比较重要的一个要素，它的选取将影响到最终最小代价路径的搜索结果。这里选择的代价函数为:穿越笔划数( c s n : c r o s s s t r o k e n u m b e r ) 、穿越黑像素数( c p n : c r o s s p o i n t n u m b e r ) 及路径曲率( p c : p a t h c u r v a t u r e ) ，它们的优先级依次降低，即 c s n c p n p c ，实现时只有在高优先级的代价函数相差不大的情况下，才考虑次优先级的代价函数。总的说来， c s n 保存切分路径上像素点的分布信息， c p n 保存切分路径上穿越的像素点数，二者结合确定候选路径，而p c 则从全局角度出发，从候选路径中选择最佳路径。搜索算法根据 d p的原理，可将全局最优转化成局部最优之和，其决策过程必须是一个马尔可夫过程，即它的下一步行为必须完全由当前状态控制并与过去状态无关。根据这一原理，在计算每一点的代价时，按照图2 - 1 3 所示方法，即每一点只能从上一行的相邻三个点中的一个到达。这样做的好处在于限制横向一次移动多个点的路径出现，保持向下搜索的趋势，减少运算量。当由上一行的相邻三个点到达的代价相同时，取中间点，即与当前像素点同一垂直方向的点，以保持路径的曲率最小。 ( i - 1 , 一 1 ) ( i , j - 1 ) ( i + 1 , j - 1 ) ( i , j ) 图2 - 1 3 搜索方法对于提出的三个代价函数，将最小笔划穿越数和最小黑像素点穿越数为主代价函数 ( c p n i = c s n * 1 0 + c p n ) ，决定搜索中每一步的路径选择，最小路径曲率为辅代价函数，只在搜索到达底端，在判断最小代价路径的终点，当主代价函数相差不多的情况下，作为判断的依据。 2 . 4基于识别技术的连写数字串切分算法 2 . 4 . 1反复识别与切分 c o n g e d o , g . 于1 9 9 5 在 1 3 1 中提到的连写数字的切分方法，用到了识别技术。由于切分的盲目性，使用识别结果作为评价当前切分结果正确与否的依据，如果无法识别，则认为当尖于手写者今全碧崖夕分时班夕之一一第2 薰娜着一尝今句矽翻分友术前切分结果错误，尝试另外一种切分方法，直至找到可以识别的切分结果。这样就在识别与切分之间反复进行，用到的切分方法很多，包括各种滴水算法和前/ 背景分析算法等。假设一共有 n 种切分方法，图2 - 1 4 给出该系统的流程图。图2 - 1 4反复识别与切分流程图该方法使用识别器来选择切分线，虽然基于统计的方法，但是由于识别过程运算量非常大，无法满足实时性要求;同时识别器本身并非是理想的，可能识别错误，这样会带来错误的叠加: 更重要的是，该方法只能对字块做进一步切分，而无法判别切分出来的是否是数字碎片，进而做相应处理。 2 . 4 . 2滑动窗口的方法在 1 4 中， m a r t i n , g . 描述了一种将切分过程和识别过程融合在一起的方法。该方法使用了一个滑动窗口，从数字串的左侧向右侧滑动。使用神经网络的方法识别位于滑动窗口中间位置的字符。理想状态下，数字串中的每一个字符都有可能位于滑动窗口的中间，这样就可以直接识别了，而不需要严格意义上的复杂切分过程了。为了克服滑动窗口中可能带有的其他字符的笔画，在训练神经网络识别器的时候，加入噪声训练。图2 - 1 5 给出滑动窗口的一个示意图。 2 w、骨动窗图2 - 1 5滑动窗口方法示意图这种方法表面看起来只有滑动窗口的大体切分，避免了复杂的切分过程。但是事实上，这是一种运算量非常大的算法，每一次移动窗口，都需要用到运算量很大的神经网络的方法来识别。而且，很多窗口的位置是无法识别的 ( 如在两个字符之间)，或者对于同一个字符可能多次识别。如果增快窗口的移动速度，可以减少运算量并消除一些冗余识别的情况，但是这样也有可能由于移动太快而造成遗漏应该识别的字符。关子笋写尝y节勿分时适 f g 袭2 箕珊a 计算量小的滴水等算法，又很容易陷入局部最优。正是由于这些原因，有必要对改进现有算法。本文提出了一种对传统滴水算法的改进改进滴水算法和一种全新的多模具算法，这两个算法将在第4 章中详细介绍。芜子手写舒节切分9 夕 felt 兑二一，瑞j 肇 f ff k h lff与勿多切分 . l ，是水平的或有正斜率， l ，是垂直的或有负的斜率 ; . l ，和l r 不同时完全垂直和完全水平; . 空白部分长度必须小于门限1 = m a x ( 1 0 , 5 .0 x m ) ，这避免了填补两个不同字符之间的过大得空白: . l ，和l ; 交又于中间的空白部分区域内的一点。图3 - 8 是一个用该方法去边框的实例，虽然穿越部分包含有多余的直角，不够平滑，但是并不影响后面的切分和识别。 ( a ) 原图像( b ) 去边框后图3 一 8去边框算法实例子 3 . 2连通域提取 3 . 2 . 1垂直投影方法初步分离所谓连通域，是指从该区域内任何一个点到另外一个点的路径只通过黑像素点，而不经过白像素点，并且该区域包含所有满足条件的黑像素点。在整幅图像中确定这样的连通域，需要一个全部图像的搜索算法。为了缩小搜索范围，减少运算量，可以先用垂直投影的方法分离整幅图像中有垂直空隙的部分。目标像素 ( 黑像素) 垂直投影为零处，直接用直线分离各部分。如图3 - 9 所示。 ( a ) 原图像初步分离图3 - 9 垂直投影初步分离 3 . 2 . 2连通域提取算法垂直投影的方法将原图像分为几个部分，连通域的提取将对每一个部分单独处理，这样就缩小了搜索范围，提高了运算速度。按照从左往右，从上到下的顺序搜索，找到第一个黑像素点，以这个黑像索点为起点开劣夕二尹尊甜笋月笋姜夕分丈冲筋卿卜一袭，了章演迎今扔 i p 4j l i t 始搜索与之相连的所有黑像素点，如图3 - 1 0 ( a ) 所示。对已经归属某个逐通域的x - i t 素点做标记，以避免再次作为起点开始搜索。以此类推，找到 f 一个起点，搜索所有相连的黑像素点。直至找到所有连通域，保证图像上每一个黑像素点都有所归属。所有连通域的左右顺序必须严格排列，这样才能保证识别结果的正确顺序。但是如果仅仅按照寻找到的起点的先后顺序来排列左右顺序的话。不免会出现错误，如图3 - 1 0 ( b ) 所示。为了解决这样的问题，还需要提取连通域几何中心的特征。综合考虑起点的位置和连通域几何中心的位置，来确定左右排列顺序。 ( a ) 从左到右找起点伪 ) 按起点的先后排连通域a序可能出错瞬 3 - 1 0找连通域起点连通域的提取还有一个关键问题，如何定义相连的概念。这:i 定义该点的正上方、正下方、正左方以及正右方相连点，一个像素点周围有8 个像素点，的点，如图3 一 h( a ) 所示。这样的定义方法可以完成由于毛刺，如图3 - 1 1 ( b ) 所示。而其余4 个点被认为是不相连稍有接触的两个数字的分离，田.圈当前很紊点相邻点非相邻点 ( a ) 相邻的定义( b ) 对角线认为非相邻图3 一 u 连通域搜素算法 33连通域属性判别 3 . 3s连通域特征提取对于提取出来的连通域，需要进一步判别其属性，可能是噪声、数字的一部分、单个数字或者多个连写数字的组合。这里定义一个结构体来描述连通域的特征，用这些特征来判定属性，结构体定义如下;( 一般连通域为不规则图形，为了存储方便和便于分析，将连通域扩展到一个长方形区域里。) s t r u c t c o n n e c t e d - c o m p o n e n t 史 u n s i g n e d c h a r d a t a , / 1 连通域中每个像素点信息 i n t x l , y l : / / 连通域粗对整幅图像的起始点 i n t w , h : / / 连通域宽度和高度 i n t x 2 , y 2 , / /连通域右下角点 i n t a r e a ; 刀连通域面积 i n t b l a c 气n u m : / / 连通域包含的黑像素点个数， ) ; 芜子手写找字节切分功解乡之一彰3 章预妙理与匆步勿分不同人使用不同的书写工具，使得每一幅图像的书写风格都不同。所以对于每一幅具体的图像，我们都需要对其书写风格进行判断，这里采用两个指标来描述书写风格: 估计笔画宽度e s w ( e s t i m a t e d s t r o k e w i d t h ) 和估计字符高度 e c h ( e s t i m a t e d c h a r a c t e r h e i g h t ) 。这里采用了一种相对简单的方法来估算这两个值。 e s w定义为该图像中所有笔画宽度的中值，e c h 定义为该图像中所有连通域高度的最大值。还有可能用到的一个量，标准笔画面积s s a ( s t a n d a r d s t r o k e a r e a ) 定义为: s s a=e s w x e c h ( 3 - 1 ) 3 . 3 . 2判别数字部件由于扫描得到的图像质量不好，可能形成断笔，同时书写习惯也可能造成一个数字被分离开来，如数字 5 。在提取连通域的过程中，就不可避免的将本来属于同一个数字的部分，分到不同的连通域中，这时需要重新组合被分离的数字部件。 m i c h a e l d . g a r r i s 在 1 6 中做了对连通域属性的判别做了详细介绍，参考其方法，实际采用的流程如图3 - 1 2 所示。图3 - 1 2连通域属性判别流程图以下分别详细说明决策框中的判别准则: 1 . 是否噪声? 将提取一幅图像得到的所有连通域按照由小到大的顺序排列，面积比较小的部分是噪声的可能性比较大。如果( c .a r e a ( 0 .5 x s s a ) ) 11 ( ( c .w ( 2 x e s w ) ) s s a 是标准笔画面积，e s w 是估计笔画宽度。这样的噪声可能是真正的噪声，应该去除: 也有可能是数字内部的一部分，应该合并到数字里。所以后面还需要进一步判别该噪声是否位于一个数字的内部。 2 . 是5的顶部? 比噪声大，并且满足一定条件的连通域，可以被认为是数字 5 的顶部，应该合并到数字内。如果满足( 顶部高度比较小腿不能太靠右被测试的部分为t ，左边相邻部分为n ，那么条件可以具体为: 顶部高度比较小:t . h n .h 尖关笋写蒸? 节tj j s m 貂3 章朋迈理与p j ,p 切分不能太靠右 ( t x 2 一 ” .x 2 ) m i n ( ( t .w x 0 . 5 ) , ( n .w x 0 .5 ) ) 不能太靠左 : ( n .x l 一 t .x l ) m i n ( ( t .w x 0 . 5 ) , ( n .w x 0 . 5 ) ) 不能太靠下 ( t .y 2 一 n .y l ) ( n .h x 0 . 5 ) 象破折号:( t .b l a c k _ n u m / e s w ) ( t .l + e s w ) 其中l 是连通域对角线长度， e s w 是估计笔画宽度: h , w , x l , x 2 , y 1 , y 2 分别为结构体中定义的成员。 3 . 是合并候选项? 这里只讨论水平重叠情况下，合并候选项的判别。设两个待判别部分分别为c l 和c 2 : 如果( c l .x l _ c 2 .x l ) 如果由这两个特征构成的点落在直线的上方，那么认为该连通域包含有多个数字。很多切分系统都是基于这种计算简单并且具有适应不同书写风格的判别方法。标准笔画数ssc 0 0 . 5 1 1 . 5 2 2 . 5 3 3 . 5 高宽比 ( a r ) ( a ) 单字图像。 . 飞。:p .一 . 礼。标准笔画数留忍， . 喻，之2 日高宽比 ( a r ) ( b ) 多字图像图3 - 1 4单字和多字在二维空间分布图 x -f t写 w-7 1 v ty 分/1 y o f ,一一 - -m 4 i ff .i t 写数y沪 t v r 第4 章连写数字串切分金融票据o c r 系统中，手写数字串一般是用来书写账号和日期的。由于账号一般比较长，书写容易形成连笔，所以直线切分和连通域提取的方法很难将所有数字分离开来。同时，由于阿拉伯数字笔画很少，对切分的准确性要求就比较高，否则会严重影响识别结果的正确性。所以连写数字的切分的研究，不仅成为数字串切分研究的一个重点也是一个难点。本章详细讲述了连写区域内数字个数的估计方法，同时给出了相邻两个数字之间的切分参考点，用来指导下一步的切分; 针对逐步搜索的方法，给出了改进滴水算法，该算法是传统滴水的改进算法:同时讲述了基于结构特征的一种全新的切分算法多模具算法。 4 . 1连写区域内数字个数估计连写数字所需要的切分次数由连写区域内包含的数字个数决定，为了指导切分的进行，应该首先估计连写区域内所包含的数字个数。z . k . l u在 5 中提到使用基于结构特征的神经网络的方法来估计数字个数，该方法虽然是基于统计的方法，稳定性比较高，但是方法本身比较复杂，而且只能估计数字的个数，不能给出切分参考点。这里首先定义上、下边界波峰、波谷的概念，如图4 - 1 所示，上边缘曲线突起的部分为波峰，凹陷的部分为波谷:下边缘曲线凹陷的部分为波峰，突起的部分为波谷。功波峰、下边烤曲线图4 - 1上下边界波峰波谷定义根据连写数字本身的特点，统计上边界或者下边界波峰的个数 ( 即波的个数) ，就可以得出连写区域内所包含的字符的个数。由于开口的 4 和开口的 0 往往会造成“ 假” 的上边界波峰，如图4 - 2 ( a ) 所示，并且有些连笔往往会淹没上边界波峰，如图4 - 2 ( b ) 所示。由此可见，字串上边界波峰往往不稳定，所以这里使用比较稳定的下边界波峰来估计字符个数。民产漏留 ( a ) 开口 0 和 4 上边界的假波峰( b ) 连笔淹没上边界波峰图4 - 2上边界波峰情况求得字串的下边界波形后，采用三点平滑的方法平滑下边界波形，设 d o t i 是下边界波形上i 点的值，方法描述为: d o t i = ( d o t i 一 1 + d o t i + d o t i + 1 ) / 3 ( 4 - 1 ) 得到光滑的波形之后，如何识别波形的波峰呢? 使用句法分析的方法来分析波形是一种简单有效的方法，如在 1 7 1 用句法识别的方法来对波形进行分类。这里采用句法识别的方法识别波形中的波峰。波形的句法: 设w = w i w 2 . . .w为波形的链表达，其中w ; e ( p , n ,0 ) ，p代表上升段，完t手写辫乡之节切分村翻一光二一，奈4 罩逆写数笋清名夕分 n 代表下降段，0 代表非升非降段。为了识别波峰，需要一个确定的有限状态自动机，它是一个五元式 a = e . q , s , : ， f(4 - 2 ) 其中 e = 伽， p ,0 ; q 一 : ， p i p 2 : : 为初始状态 ; f 一 q 是终 il 状态集合集 : s 是从qx l 到q的映射: s ( z , n ) = p 2 8 ( z ,0 ) = z s ( z , p ) = p i : ,5 ( p , n ) = p 2 *i ,0 ) = p i s ( p a = p i ; s 伽 2 , n ) = p 2 8 伽 2 ,0 ) 一 p 2 6 伽 2 1 p ) = p , : 利用确定的有限状态自动机a ，可以很容易将波峰、波的起始点和波的终点识别出来: 当自动机由p i - -) , p : 时，是波峰位置: 当由p 2 - -) p . 时，是此波的终点，下一个波的起始点。在实际的账号书写中，不规范的书写会产生不合理的波峰分布情况，为了解决这种问题，还需进一步判别波峰的合理性。这里定义一个结构体来描述完整波形( 包括上升段和下降段) 的特征，用这些特征来判定其合理性，结构体定义如下: s t r u c t w a v e i n t * w a v e _ d o t ; / / 波形上每一个点的值 i n t x s , y s ; 刀波形起点坐标 i n t t o p x , t o p y ; / /波峰点坐标 i n t x e , y e ; / /波形终点坐标 i n t w , h ; / /波形的宽度和波峰的高度 : 判别依据主要是基于经验值的，为了保证依据能够应用于不同书写风格的数字。这里采用两个指标来描述书写风格:估计笔画宽度e s w ( e s t i m a t e d s t r o k e w i d t h ) 和估计字符高度 e c h ( e s t i m a t e d c h a r a c t e r h e i g h t ) , e s w 定义为连写区域中所有笔画宽度的中值。 e c h 定义为连写区域中上下边界差的最大值。基于经验的判别依据具体描述如下: 如果( 波峰的高度太小波形的宽度太小两相邻波峰的高度值相差太大) ，那么认为这个波峰是不合理波峰: 波峰高度太小:h 0 . 1 x e c h 波形宽度太小 : w 0 .7 5 x m a x ( h l ,

人人文库> 全部分类> 毕业设计 > 毕业论文

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

（模式识别与智能系统专业论文）关于手写数字串切分的研究.pdf

文档简介

温馨提示

最新文档

评论

（模式识别与智能系统专业论文）关于手写数字串切分的研究.pdf

文档简介

温馨提示

最新文档

评论

相关文档