（计算机应用技术专业论文）基于结构特征的自由手写数字识别系统.pdf

上传人：灰*** IP属地：宁夏上传时间：2019-12-17 格式：PDF 页数：55 大小：1.64MB 积分：0 举报 版权申诉

已阅读5页，还剩50页未读，继续免费阅读

（计算机应用技术专业论文）基于结构特征的自由手写数字识别系统.pdf.pdf 免费下载

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

南京邮j 【1 人学帧f j 研究生学位论文摘要摘要本文设计了一种基于结构特征的自由手写数字识别算法，形成了一个完整的手写数字识别处理过程。该过程采用了a t & t 贝尔实验室的m n i s t 手写数字识别评测数据库。 m n i s t 包含6 0 0 0 0 个训练样本，以及1 0 0 0 0 个测试样本，来自于2 5 0 人。处理过程的建立与训练就是以这6 0 0 0 0 个样本为对象的。过程中首先对样本进行预处理，包括，平滑去噪、闭合、细化等处理，最终会形成与样本文件同样大小的文件，其中每个样本都已经进行了预处理，这样在后面的操作中处理的对象便是已经做过预处理的样本。随后便准确的提取样本的特征，比较特征在样本类之间的差异性，对特征进行甄选，形成有效的特征集，利用特征在各类之间的差异性，形成识别规则，计算隶属度，最终形成一套完整的识别系统，完成对字符的识别。整个过程在m n i s t 样本库基础上进行训练，确定各识别参数，形成识别系统，最终的识别测试表明该系统能有效地对自由手写数字进行识别，对l0 0 0 0 个测试样本的以别，准确率达9 1 以上，该识别过程中所采用识别方法容易实现，复杂度较低，有效得对样本进行识别，效果理想。关键词：细化；手写体数字识别；结构特征 a b s t r a c t i nt h i st h e s i s ，an e wa l g o r i t h mb a s e do ns t r u c t u r a lf e a t u r e sf o rt h er e c o g n i t i o no f h a n d w r i t t e nd i g i t si sp r o p o s e d ，a n das o u n dp r o c e s so fr e c o g n i t i o ni sf o r m e d t h i sp r o c e s su s e m n i s tt r a i n i n gs e tf r o ma t & tr e s e a r c h m n i s ti sc o m p o s e do fat r a i n i n gs e to f6 0 ，0 0 0 e x a m p l e s ，a n da t e s ts e to f10 ，0 0 0e x a m p l e s ，f r o m2 5 0p e r s o n t h ef o r m a t i o na n dt r a i n i n gi s b a s e do nt h e s e6 0 0 0 0t r a i n i n ge x a m p l e s p r e t r e a t m e n ts h o u l db et a k e ni nt h i ss y s t e m ，s u c ha s s m o o t h i n g ，c l o s i n g ，t h i n n i n ga n ds oo n f i n a l l ya d e s t i n a t i o nf i l ei sc r e a t e dw h i c hi sa ss a m e a st h es o u r c ef i l eo ns i z e t h ef o l l o w i n gp r o c e s s e sa r eb a s e do nt h e s ee x a m p l e st h a th a v eb e e n p r e t r e a t e d a f t e rd o i n gt h a t ，m a s s i v ef e a t u r e sw i l lb ee x t r a c t e d i nt h i ss t a g ee f f e c t i v ef e a t u r e s a r ee x t r a c t e d ，c o m p a r e d ，a n ds e l e c t e d ，t h e nf o r m e dt h ef e a t u r es e t ，l i s t e di nat a b l ef o rf u r t h e r t r e a t m e n t u s et h ed i f f e r e n c e so ff e a t u r e sb e t w e e nc a t e g o r i e s ，i n t r o d u c ec r i t e r i a ，c a l c u l a t e v a l u e s ，f o r mas o u n ds y s t e m ，a n dc o m p l e t et h er e c o g n i t i o no ft h o s ed i g i t s t h ew h o l ep r o c e s si sb a s e do nt h em n i s tt r a i n i n gs e t ，c a l c u l a t et h ep a r a m e t e r s ，f o r m t h es y s t e mo fr e c o g n i t i o n e x p e r i m e n t a lr e s u l t si n d i c a t et h a tt h eo v e r a l lp e r f o r m a n c eo ft h e p r o p o s e dm e t h o di sc a p a b l eo fr e c o g n i z e10 0 0 0 t e s te x a m p l e se f f e c t i v e l y t h ec o r r e c tr a t ei s o v e r91 t h em e t h o du s e di nt h i ss y s t e mi se a s yt or e a l i z e ，a n dh a ss o u n de f f e c tt or e c o g n i z e t h en u m e r a ld i g i t s k e yw o r d s ：t h i n n i n g ；h a n d w r i t t e nn u m e r a lr e c o g n i t i o n ；s t r u c t u r a lf e a t u r e s 南京邮电大学学位论文独创性声明本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知，除了文中特别加以标注和致谢的地方外，论文中不包含其他人已经发表或撰写过的研究成果，也不包含为获得南京邮电大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。研究生签名：銎鍪主羔日期：迎：笙，酽南京邮电大学学位论文使用授权声明南京邮电大学、中国科学技术信息研究所、国家图书馆有权保留本人所送交学位论文的复印件和电子文档，可以采用影印、缩印或其他复制手段保存论文。本人电子文档的内容和纸质论文的内容相一致。除在保密期内的保密论文外，允许论文被查阅和借阅，可以公布 ( 包括刊登) 论文的全部或部分内容。论文的公布( 包括刊登) 授权南京邮电大学研究生部办理。研究生签名：链导师始型疃魄型坐南京邮i u 人学形ii j 研可生学位论文第一章绪论 1 1 论文研究的背景第一章绪论手写数字识别是“光学字符识别技术”( 简称o c r ) 的一个分支，它研究的对象是如何利用电子计算机自动辨认人手写在纸张上的阿拉伯数字。在整个o c r 领域中，最为困难的就是脱机手写字符的识别。到目自订为止，尽管人们在脱机手写英文、汉字识别的研究中已取得很多可喜成就，但在很多应用领域，距实用还有一定距离。而在手写数字识别这个方向上，经过多年研究，研究工作者已经开始把它向各种实际应用推广，为手写数据的高速自动输入提供了一种解决方案。字符识别处理的信息可分为两大类：一类是文字信息，处理的主要是用各国家、各民族的文字( 如：汉字、英文等) 书写或印刷的文本信息，目前在印刷体和联机手写方面技术己趋向成熟，并推出了很多应用系统；另一类是数据信息，主要是由阿拉伯数字及少量特殊符号组成的各干叶，编号和统计数掘，如：邮政编码、统计报表、财务报表、银行票据等等，处理这类信息的核心技术是手写数字谚别。这几年来我国丌始大力推广的 “三会”工程在很大程度上要依赖数据信息的输入，如果能通过手写数字识别技术实现信息的自动录入，无疑会促进这一事业的进展。因此，手写数字的识别研究有着重大的现实意义，一旦研究成功并投入应用，将产生巨大的社会和经济效益。手写数字识别作为模式识别领域的一个重要论题，也有着重要的理论价值： 1 、阿拉伯数字是唯一的被世界各国通用的符号，对手写数字识别的研究基本上与文化背景无关，这样就为各国、各地区的研究工作者提供了一个施展彳智的大舞台。在这一领域大家可以探讨，比较各种研究方法。 2 、由于数字识别的类别数较小，有助于做深入分析及验证一些新的理论。很多的算法都以手写数字识别作为具体的实验平台，验证理论的有效性，评价各种方法的优缺点。 3 、尽管人们对手写数字的识别己从事了很长时问的研究，并已取得了很多成果，但到目前为止机器的识别本领还无法与人的认知能力相比，这仍是一个有难度的丌放论题。 4 、手写数字的识别方法很容易推广到其它一些相关问题，一个直接的应用是对英文这样的拼音文字的识别。事实上，很多学者就是把数字和英文字母的识别放在一块儿研究的。 l 南京| i | l j i 【1 人学坝i ：研究生学位论文第一币绪论手写数字识别有着极为广泛的应用自，j 景，这也讵是它受到世界各国的研究工作者重视的一个主要原因。 ( 一)手写数字识别在大规模数据统计中的应用在大规模的数据统计( 如：行业年鉴、人口普查等) 中，需要输入大量的数据，以前完全要手工输入，需要耗费大量的人力和物力i 近年来在这类工作中采用o c r 技术已成为一种趋势。因为在这种应用中，数据的录入是集中组织的，所以往往可以通过专门设计表格和对书写施加限制以便于机器的自动识别。目日，j 国内的大多数实用系统都要求用户按指定规范在方格内填写。另外，这些系统往往采用合适的用户界面对识别结果做全面的检查，最终保证结果f 确无误。可以看出，这是一类相对容易的应用，对识别核心算法的要求比较低，是目自仃国内很多单位应用丌发的热点。 ( 二) 手写数字识别在财务、税务、会融领域中的应用财务、税务、会融是手写数字识别大有可为的又一领域。随着我因经济的迅速发展，每天等待处理的财务、税务报表、支票、付款单等越来越多。如果能把它们用计算机自动处理，无疑可以节约大量的时f u j 、金钱和劳力。与上面提到的统计报表处理相比，在这个领域的应用难度更大，原因有：1 、对识别的精度要求更高；2 、处理的表格往往不止一种，一个系统应能智能地同时处理若干种表格；3 、由于处理贯穿于整个f 1 常工作之中，书写应尽量按一般习惯( 如：不对书写者的写法做限定，书写时允许写连续的字串，而不是在固定的方格内书写) ，这样对识别及预处理的核心算法要求也提高了。 ( 三) 手写数字识别在邮件分拣中的应用随着人们生活水平的提高，经济活动的发展，通信联系的需求使信函的互换量大幅度增加，我国函件业务量也在不断增长，一些大城市的中心邮局每天处理量高达几百万件，业务量的急剧上升使得邮件的分拣自动化成为大势所趋。在邮件的自动分拣中，手写数字识别( o c r ) 往往与光学条码识别、人工辅助识别等手段相结合，完成邮政编码的阅读。随着国家信息化进程的加快，手写数字识别的应用需求将越来越广泛，因此应当加强这方面的研究工作。作者认为，应用系统的性能的关键与瓶颈仍然在于手写数字识别核心算法性能上，最终目标是研究零误识率和低拒谚! 率的高速识别算法。此外，尽早建立反映中国人书写习惯的、具有国家标准性质的手写数字样本库也是当务之急。【i 】 2 南京邮i u 人学颂j j 研究生学位论文第一章绪论 1 2 课题来源及本人主要工作本论文是自己在研究生学习期问对物体识别的了解和认识，结合自身在这一领域的学习和研究，在导师的指导下确定该课题作为毕业论文的题目。通过前期对自由手写数字识别这一课题的学习，了解了它的研究背景，当自仃研究现状，应用前景，以及目自订通常所采用的识别策略，在初期便确定自己对于该课题的最终认识，并确定识别算法。首先，该算法基于m n i s t 手写数字库，学习该库中样本文件格式，f 确读墩其中的四个文件，包括两个字符文件，还有字符文件所对应是实际值，也就是另外两个文件，了解了文件的格式，并正确的完成对任意字符的读取、操作、显示、写入等操作。虽然样本进行了初步的大小归一化，但字符还存在很多噪声，笔道存在断裂，没有进行闽值分割，而且没有进行细化，这样前期处理就是进行平滑去噪、阂值分割、闭合、细化操作，然后将处理的结果存入文件，以备后期处理。第二步，进行特征提取、特征甄选、结合，形成一个有效的特征集。第三步，分两步识别，对于各数字分类，在特征集中选择相关特征组合，确定合适参数直接完成对数字的识别，这个过程是建立在对特征和对识别结果的统计基础上的，保证了识别规则的准确性。对于不满足谚别规则的数字样本，将该样本的特征结合统计的特征集，计算隶属度，通过各特征的截断参数进行投票，得票最多的分类确定为最终识别结果，这个识别过程也是基于对特征的统计，识别结果也是有效的。利用形成的识别算法对1 0 0 0 0 个样本进行测试表明讵确识别率达到9 1 以上。表明该识别算法有效。该算法的优点是采用规则法和投票法，进行分层识别，算法简单，思路清晰，复杂度低，且易于实现，很多处理点都较其他处理方法有一定的改进，对于在该领域的深入研究有很好的参考价值和指导意义。 1 3 组织结构本系统处理过程如图1 1 所示：图1 1处理过程南京l l i i ；i 【1 人学硕i j 研究生学位论文籀一章绪论本文中其他各章节内容如下：第二章介绍样本的格式，读取方法，对样本的预处理和显示技术。第三章研究特征的提取技术，对特征进行甄选，最终形成有效的特征集，为接下来的分类器设计打下基础。第四章分类器的设计，通过对特征集的分析，比较各分类在特征集上与其它分类的差别，以确定分类规则，以及隶属关系。采用两个层次进行识别，首先对每一分类都在特征集中提取某一特征组合，直接输出到该分类，这一过程基于对特征的统计，以及在训练样本集进行的测试，确定该识别规则对于该分类的有效性：接着，第二步，对于每一分类中不满足分类规则的样本，进入到下一步的识别，对每一样本都在特征集上都进行隶属度的计算，取隶属最大的分类。以上两步完成了对样本的分类识别。 4 南京邮f u 人学坝j j 研究生学位论义第_ 二章材奉的顾处理 2 1 样本格式第二章样本的预处理手写体数字识别是光学字符识另j ( o c r ) 中一个非常重要的一个分支，有着广泛的应用前景。在长期的研究过程中，出现了几个比较标准的图像数据库，这些数据库中的图像已经做过相应的预处理，这样使用者就可以观察不同处理产生的结果哪个更好，而不用担心由于预处理的不同而对结果产生影响。m n i s t 数据库是一个免费的标准数字识别库。来自于 a t & t 实验室的y l e c u n 。m n i s t 数据库分成两个部分，一部分是有6 0 0 0 0 个手写数字样本的训练库，一部分是有1 0 0 0 0 个手写数字样本的测试库，训练库和测试库的手写体变化分伟是相同的。所有的图像都已经被规范成2 8 * 2 8 点阵的相同尺寸。m n i s t 可以从网络上免费下载。 m n i s t 数据库文件的存储格式采用了大多数非i n t e l 处理器所采用的m s bf i r s t 格式，也就是对于一个w o r d 型变量，首先读墩的八位组是w o r d 变量的低八位，这样在取一个w o r d 型，或d w o r d 型变量的值时，要对变量的大小进行个转换。库中包含四个文件： ( 1 ) t r a i n i m a g e s i d x 3 一u b y t e ：训练集的图像数据文件 ( 2 ) t r a i n l a b e l s - i d x l u b y t e ：训练集的每个图像数据所对应的真实值文件 ( 3 ) t l o k - i m a g e s i d x 3 - u b y t e ：测试集的图像数掘文件 ( 4 ) t l o k - l a b e l s i d x l - u b y t e ：测试集的每个图像数据所对应的真实值文件文件( 1 ) 包含6 0 0 0 0 个训练样本，所采用的格式为： o f f s e t 0 0 0 0 0 0 0 4 0 0 0 8 0 0 1 2 0 0 1 6 0 0 1 7 v a l u e 0 x 0 0 0 0 0 8 0 3 ( 2 0 51 ) 6 0 0 0 0 2 8 2 8 7 7 7 7 d e s c r i p t i o n m a g lcn u m b e r n u m b e ro fi m a g e s n u m b e ro fr o w s n u m b e r0 fc o lu m b s p i x e l p i x e l x x x x u n s i g n e db y t e?pixel p i x e l sa r eo r g a n i z e dr o w w i s e p ix e lv a l u e sa r e0t o2 5 5 0m e a n sb a c k g r o u n d ( w h i t e ) ， 2 5 5m e a n sf o r e g r o u n d ( b l a c k ) r r r r e e e e e e g g g g t t e e e e y y t t t t b b n n n n1111 d _ c u e e t t t t n n e1111 g g p b b b b1， y s s t 2 2 2 2 n n 3 3 3 3 u u 文件( 2 ) 内容为文件( 1 ) 中各样本所对应的真实值， o f f s e t 0 0 0 0 0 0 0 4 0 0 0 8 0 0 0 9 t y p e 3 2b i ti n t e g e r 3 2b i ti n t e g e r u n s i g n e db y t e u n s i g n e db y t e v a l u e o x 0 0 0 0 0 8 01 ( 2 0 4 9 ) 6 0 0 0 0 7 7 7 7 x x x x u n s i g n e db y t e ? ? t h el a b e l sv a l u e sa r e0t o 9 d e s c r i p ti o n m a g i cn u m b e r ( m s bf i r s t ) n u m b e ro fit e r n s 1 a b e l l a b e l l a b e l 文件( 3 ) 包含1 0 0 0 0 个测试样本，所采用的格式为： o f f s e t 0 0 0 0 0 0 0 4 0 0 0 8 0 0 12 0 0 1 6 0 0 17 l t y p e j 3 2b i ti n t e g e r 3 2b i ti n t e g e r 3 2b i ti n t e g e r 3 2b i ti n t e g e r u n s i g n e db y t e u n s i g n e db y t e v a l u e 0 x 0 0 0 0 0 8 0 3 ( 2 0 51 ) 1 0 0 0 0 2 8 2 8 7 7 7 7 x x x x u n s i g n e db y t e ? ? d e s c r i p t i o n m a g icn u m b e r n u m b e ro fi m a g e s n u m b e ro fr o w s n u m b e ro fc o i u m n s p i x e l p 1 x e l p i x e l 文件( 4 ) 内容为文件( 2 ) 中各样本所对应的真实值， o f f s e t 0 0 0 0 0 0 0 4 0 0 0 8 0 0 0 9 t y p e v a l u e 3 2b i ti n t e g e ro x 0 0 0 0 0 8 0 1 3 2b i ti n t e g e r1 0 0 0 0 u n s ig n e db y t e ? ? u n s i g n e db y t e ? ? x x x x u n s i g n e db y t e ? ? t h el a b e l sv a l d e sa r e0t o9 d e s c r ip ti o n ( 2 0 4 9 ) m a g icn u m b e r ( m s bf ir s t ) n u m b e r0 fi t e m s l a b e l 1 a b e 】 6 1 a b e l 南京l l i j i u 人学顺l j 研究生学位论文第_ 二章样奎的颅处理图2 1 样本的显示每个样本文件都是一个2 8 * 2 8 的点阵，将文件( 1 ) 的前1 0 0 个样本显示如图2 1 从图2 1 可以看出每个数字样本都进行了大小的归一化，且位置居中，但每个样本都没有进行细化，有些样本还有明显的噪声，这样在前期的操作，就是要对样本进行二值化、平滑、去噪、细化等操作。 2 2 样本文件的预处理各种预处理操作是否要进行，如何来做，具体由样本本身的情况，以及特征提取的要求来确定。原有样本并没有进行二值化，且存在噪声点，这样就需要对样本进行二值化，以及平滑去噪的处理，对样本数据的分析发现，笔道上的刍色数据点取值集中于2 5 5 ，而只有笔道边缘，及孤立点j 。存在介于0 到2 5 5 之问的“灰”色点，而背景部分的点值则一律取0 ，这样，二值化的操作将变得简单，坟i ，j ) 表示原有样本文件中点p ( i ，j ) 的取值，则二值化之后的取值f ( i ，j ) 如式2 1 ： f ( i ，) = 舻埘f ( i , j 垮) 厅p t ( 2 ” 由于样本中笔道上的点同背景点耿值差别十分明显，所以这罩就简单的选取一个分界南京l j i j j i u 人学坝i ：硼，e 生学位论文第一二章样奉的颅处理值，在该系统中p t 取为1 0 0 ，在后面的处理中证实这样简单的二值化处理就完全可以达到理想的效果。 p 3p 2p l p 4pp o p 5p 5p 7 图2 2p 的8 一邻域经过二值化，在样本中噪声点是以孤立的飞白点的形式出现的，去除孤立点要参照其周围点的分行情况来判断，在系统中采用了3 3 窗口( 如图2 2 ) 来检测的。1 2 】去除孤立白点的条件如式2 2 ： l p ，；0 0 p ，。2 5 5 1 i o f ，f 。 p = 口7 0 i 255 r ， = 2 & & c o u n t 1 胛gm i 】1 2 7 = ，善n 胛“聊 ( 3 1 0 ) f = o 7 1 8 、l ，l- p 0 = = 1 jr。l 聊甜玎南京岫jj u 人学硕i j 研究生学位论文第三章特缸提取纵向穿越统计方式如式3 1 1 ： 2 7 n u m j 】- p ( i ，j ) f = 0 行甜聊】- ：) ，? “m 【 1 即“，卵【 1 27 2 ，毛。刀甜珑】 3 2 6 特征六交叉点个数【8 】数字在手写时，笔划会存在交叉，比如在数字“4 ”中就有可能存在笔戈0 的交叉，当然在其它数字中也有可能出现交叉，由于手写的自由性，理论上应当出现笔划交叉的可能在实际书写中并不存在，而本应不出现交叉的样本也有能由于书写的不规范而出现交叉，这些不规范性的出现基本不会给人眼对数字的谚别带来太大麻烦，但对于计算机对数字的识别则会带来不准确性，这样就要求对特征的提取过程中尽量使特征更加精确，且尽量提取更多的特征以备后期识别算法的确定。笔划特征在数字识别中被广泛的使用，为更深入的进行识别打下基础，这也是符合人对事物的认识规律的。在对交叉点的提取上由于考虑的书写不规范性以及自，j 期的细化处理，系统定义交叉点为八邻域点中数据点大于3 个的点。这里要用到第二章中的图2 2 ，令点阵宽度为w ，高度为h ，点p ( i ，j ) 是否为交叉点引入c r ( i ，j ) 为交叉点时取直为1 ，否则取值为0 ，八个领域点如图2 2 ，其中： p o = l ；p i = l w ； p 2 = 一w ； p 3 = - l w ； p 42 1 ；p 5 = w ! l ：p 6 = w ：p 7 = 1 + w ；那么交叉点个数统计如式3 1 2 ： c r ( i ，j ) = 7 1 以3 七= 0 o 7 p k 3 膏= 0 1 9 南京邮l u 人学烦i j 倒f 究生学位论文第二三章特丌提取 272 7 2荨：毛n川012)i0 0 z ，= 3 2 。7 特征七端点情况【8 1 对于手写数字，端点也就一个独立笔划的进入点，一般来说，端点标明一个线段的起点或终点，对于整个数字，可以有多个这样的端点，每个端点有它自己的坐标，标明该端点在点阵中的位置，端点在系统中定义为八邻域中只有一个数据点的点，因此，那唯一的相邻数据点也标明了该端点的出方向，也就标明由端点引入的线段的走向，由于在下面识线段时还要用点端点信息，而往往一个线段以一个端点为起点，再以另外一个端点为中点，这样还需要给端点一个标识，标明该端点有没有在线段的提取中搜索过，这样避免线段因为起始的两个端点而被重复统计。根据上述对端点的描述，做以下定义： d ，( i ，j ) 用做对数据点p ( i ，j ) 八邻域中数据点的个数统计，端点数统计为特征如式3 1 3 7 d 。( f ，) = 丘( f ，) 尸 = 0 d p ( f ，) = ：挈，一对于样本，除了端点的个数信息，还要记录下各端点的情况：数组e n d p 4 记录端点信息，是否被访问过置为0 e n d p 1 ie n d p 2 端点在点阵中的坐标分别为 i ，j 端点方向，为唯一八邻接数据点的方向 k 2 0 o j io”li l i 厂1 南京j i f l j l 【1 人学颂i j 研究生学位论义第二章特征提取 3 2 8 特征八线段情、兄【9 】线段在本系统中可以认为是组成数字的各种笔划，这罩只取两种笔划，就是横和竖，因为这两种笔划更加容易判别，而且因手写的自由性所引入的偏差也较小，而“弧”这种笔划就不容易判别，到底弯曲的什么程度d 。算是弧，比如说数字“2 ”，如图3 3 中本应存在的弧，但因为手写不规范的原因而不能被判别出来，数字在点阵中显示为“横一折一横”的笔划走向，而无法判别出其中有弧。而底端的横则比较明显，在不同书写方式中，底端的横出现也比较稳定，那么这些随自由书写而出现频率较为稳定的笔划特征就是我们要提取的目标。这罩要提取的横或竖，仍然要做一些近似，因为，虽然理论上看来，每种数字在规范书写时横、竖都应当是 “横平竖直”的，且长度上也一定，然而真币把点阵输出出来发现，横、竖都很有可能为斜的，那么细化后，就会出图3 3 中的“打折”现象，而且很多人手写数字都有把数字写的比较倾斜的习惯，比如数字“1 ”，本来应当是一个标准的竖直线，然而由于人们手写的习惯，数字“1 ”就呈现一个斜直线的样子( 图3 2 ) 。图3 2 数字“1 ” 图3 3 数字“2 ” 在输出的点阵中我们看到，直正“横平竖直”的笔划并不多，而我们也不想放弃这一重要特征，那么就需要对我们要提取的这两种笔划进行一下规定和近似。 1 ) 所有提取线段必须以端点为起点： 2 ) 线段必须为连续满足某一提取条件的点集，点集中的点的个数不少于一设定值； 3 ) 线段具有方向性； 2 l 南京j i | j j l 也人学颇i j 研究生学位论文第三章特t i 丁提取 4 ) 对于起点、终点都为端点的线段不得重复计数；现对上述规则做进一步解释： 1 )只所以规定所提取线段必须以端点为起点是由数字本身的特点所决定的，不以端点为起点却满足提取规则的连续点集往往是由于书写的不规范引入的，例如图3 3 中数字“2 ”中间的“折”，本身近似于图3 2 中数字“l ” 的斜直线，后者符合提取规贝0 ，为一个由上向下的竖，而前者并不是从端点进入，而是由于书写不规范出现的，不应当被提取。 2 ) 由于所提取线段为近似的结果，所以必须规定严格的提取条件：由端点丌始进行八邻域生长，且始终沿一个方向生长，当生长条件不再满足时结束生长，且生长过程中不再回退到前面生长过的点，如果本次生长所搜索到的点数高于某一设定值，就认为本次生长有效，找到一个线段，由于点阵为2 8 x2 8 的，系统统一设定为l o 。 3 ) 点集的生长必须具有方向性且始终按同一方向尘长，以免将弧或环判定为所提取线段，系统定义了四种方向。由左向右的横( 0 )由右向左的横( i ) 田田曰回回回田园曰口田田南京| | l i ；l u 人学坝i j 研究生学位论义第二三章特缸提取由上向卜的竖( 2 )由卜向上的竖( 3 ) 图3 4 线段的方向示意图如图3 4 ，每次生长从端点出发依次尝试从方向o 4 四种方向进行生长，一种生长方式生长成功确定一线段则放弃对其它方向的尝试，如果一种方向生长失败，彳尝试从下一方向进行新的生长尝试。这样从一端点出发，最多确定一条线段。对于每种方向都以p 0 为主方向，由于自，j 述的“打折”情况的存在，可以有一次选择另一辅助方向的机会，一旦选择好辅助方向，p l 或p 2 则本次生长就只能沿着p o 或所选择的辅助方向进行，且不能再变动辅助方向，这样是为了避免把“弧”做为线段提取出来，例如数字“2 ”上边的弧顶，如果在点阵罩呈现一种弧的形式，那么在本规则下是不会被提取为线段的，很多情况下由于书写的原因，这些“弧”常以线段的方式出现，那么也就被提取出来，这是合理的，符合手写数字的自由性。 4 ) 线段的重复计数，如图3 2 数字“1 ”中有上下两个端点，上端点出发可生长出由上向下的竖，而由下端点则可生长出下往上的竖，显然，如果对样本中线段数量进行计数，那么这两个线段本应是同一线段。所以为了避免这种重复计数的m 现对端点标谚在提取线段过程中是否已被访问过，如果该端点已经在d ，j 面由其它端点发起的搜索过程中访问过，那么不再以该端点发起新的提取过程，保证了线段数量这一特征的准确性。线段的提取过程如下：南京邮i u 人学f 砚i ：州究生学位论义第二三章特行提取是足是得到线段，挺取线段垌l 天信息是图3 5 线段提取的s d l 图如图3 5 ，通过上述过程，可以得到每个线段的相关信息：线段的起点、终点、点数、方向，保存下来以备识别之用。对线段的提取过程中，便得到了线段个数这一可统计特征：：线段个数 2 4 南京| | l l j i u 人学坝i j 研究生学位论义第二三节特行提取 3 2 9 特征九闭合区域【9 1 书写一个数字的过程中，另外一个重要的特征是闭合环，在系统中作为闭合区域处理。理论上数字“0 ”“4 ”“6 ”“9 ”分别有一个闭合区域，数字“8 ”有两个闭合区域，而其它数字不应当出现闭合区域，而实际上，由于手写的习惯，这种闭合区域的出现也就不再那么绝对，然而这并不能阻止它成为数字识别中经常被利用的特征，在本系统中，该特征被准确提取，并在识别过程中起到很大作用。由于手写数字中出现的闭合区域，形状上会有很大的区别，而这种形状上的区别完全是由于手写的自由性引入的。在很多识别算法中都用到了闭合区域的形状特性来区分不同的数字，比如图3 4 中的数字“0 ”与数字“4 ”，认为数字“0 ”中的闭合区域更接近于圆，而数字“4 ”中的闭合区域b l , i j 更接近于三角形，那么数字“0 ”中闭合区域的离散度会大于数字“4 ”中闭合区域的离敞度。这样也不无道理，然而这只是理论上的猜想，实际的样本中来看，样本“4 ”由于书写习惯，出现闭合区域的机率才7 左右，而该闭合区域的书写现状也是因人而异，所以在本系统中对于所有闭合的区域同样处理，而不再区别圆、椭圆、三角形等不同现状的闭合区域。图3 6 闭合区域对比图南京j l j j j 也人! 学烦i j 研究生学位论义第三章特汀提取图3 7 多余的闭合区域另外在手写过程中还有可能由于书写不规则而出现多余的闭合区域，如图3 7 中的数字“2 ”和数字“3 ”，都是因书写习惯导致的，这些闭合区域的出现在很大程度上影响了特征提取的准确度，由于后边的识别阶段也是很大程度上利用了该特征，那么就应当尽量去除这些多余的闭合区域，系统中规定，闭合区域所包含点的个数小于某一设定值时便认定该闭合区域为多余的，该值取的太小就不能保证去除所以多余区域，比如图 3 7 中的数字“2 ”，多余闭合区域所包含的点过多，而数字“3 ”则容易去除：但该值也不是越大越越好，如果取的过大就会把真正的闭合区域给去除了，比如图中的数字“6 ” 中的闭合区域包含点并不太多；所以该值应设置的不宜过大也不应太小，在系统中该值取为6 ，如果闭合区域中所包含点小于6 ，则认定为多余的闭合区域。经过该处理，有效去除大多数多余闭合区域，而几乎没有损失诈常的闭合区域。还有另外一个问题就是本该出现的闭合区域却因手写习惯而没有出现，比如图3 7 中的数字“8 ”，本该出现两个闭合区域，而该样本中却只有一个，这也给后面的识别处理带来很大不便，但可以通过统计的方法，对陔问题进行弥补。提取闭合区域的方法有很多，有的采用对所有数据点进行迭代生长当一次完全生长 2 6 南京| | | | j i u 人学坝t j 例究生学位论义第三章特衍提取又回到起点则找到一个闭合区域，该方法效率较低，对临时区域的要求量也较大，当样本较大时就会造成系统栈的溢出，所以系统没有采用。通过对样本点阵的分析发现，样本的非数据点全为0 ，且所占比例较高，而数据点所占比例较小，且具有连通性。( 样本已进行细化) 这样可以反过末对非数据点的背景区域进行完全生长，由于数字笔划将背景进行了清晰的分割，那么如果数字中不存在闭合区域，那么背景就是一个未被分割的整体，经过一次生长就可以覆盖所有背景，而如果数字中出现一个闭合区域，比如图 3 7 中的数字“6 ”就把背景分割为两部分，一部分就是大背景区域，另一部分就是数字“6 ”所围起的小背景区域，在上面小背景区域用来判定区域是否多余。系统中对于区域的提取，是采用了生长的方法，那么生长过程中如何末定义连通性呢： jl 1一r r j j 。 j 7 1 r 图3 8 连通示意图图3 9 闭合区域如图3 9 中的闭合区域，显然已经把背景分割为两部分，而如果对背景进行生长，如果采用图3 8 中的八连通方式，那么就一定可以在图中所圈位置穿透闭合线进入到闭合区域所围起的小背景区域，所以对背景进行生长时应采用四连通方式，而如果要介定闭合线的连通性，如果采用四连通方式那么在也会在图3 9 中所圈位置发生断裂，所以对于闭合线确定连通性时应采用八连通方式。如果都采用八连通方式，通过背景的生长确定为一个背景区域，而通过线的生长可以分为两个背景区域，这显然是矛盾的。闭合区域的提取实现如下：术术书鬻 fo o ；| 卓木水水申木术术木木木卓，木南京| | i | j i u 人学颂l j 研究生学位论文第三章特缸提取 f m ，( i = o ：i m n h e i g h t ：i 什) f m ( j - - o ：j m n w i d t h ：j + + ) 避j 山并初始化幽中再点 p o i n t i n d e x = i ，i cm n w i d t h + j ：处理点( p ：i j ) i f ( 当前所遍历的点为黑也的点) ) 该点被标识为【叠域中的点； p l s ( 1 ( 该点破标识为轮廓卜的点； ) f o r ( i = 0 ：i m n h e i g h t ：i + 十) 遍历并处理符点，确定再点足俞足闭合区域i ：的点： f f o ) ( j = 0 ：j m _ n w i d t h ：j + + ) i f ( 该点为黑也区域中的点，并没何破搜索过) 记录该点的横坐标、纵坐标、所属k 域取值： f m ( k = 0 ：k 4 ：k + + ) 4 i 该点进行p u 方向( i 、下、左、右) 生k = i f ( p q 方向i ：的该点l 叫样为区域中的点月没 ! 搜索过) 记录该点的横坐标、纵坐标、所属区域耿值； ) ) j 。逸世谚区域的鸹卜点： w h il p ( 仍然角。记录的，区域中的数据点没仃托下血的过干口中边行处理) 4 i 记录的点队列中取该点： if ( 该点没自被搜索过) 记录该点已绛被访问过记录个数力1 ： f o l ( k = 0 ：k 4 ：k + + ) l 几j 样进行p q 方向的生k ： i f ( 没角被搜索过，日为区域中的点) f 记录该点的横坐标、纵坐标、所属区域取值记录个数加1 ：该点己被搜索过： 2 8 南京邮i 【1 人学顺l j 研究生学位论义第三章特仃提取 ) ) 访问指针退1 ：区域中生k 的点数加l ； i f ( 区域中点数小十5 ) j ，| ；j l j “j 合| x 城人小，1 i 认为返一纰点构成一个闭合的区域( 阴止书弓臼山忡，j i 入的小区域) 这些点所属区域值取做0 ( 1 i 足所找闭合区域) ：闭合区域支值减1 ； l j p ii f ) e n d - i ) ，一? o f l di 从算法上看没有使用迭代，这样时间复杂度上控制为0 ( n ) ，也提高了整个识别算法的效率。对数字样本进行闭合区域提取的效果如图3 1 0 ：画圆圈国国画国园国图3 1 0 闭合区域提取效果在对闭合区域进行提取个程中，我们得到了如下特征： f 1 3 闭合区域个数； f 1 4 闭合区域点所占比例； n 4 为闭合区域上闭合线的点数同样本总数据点数的比例，如果没有闭合区域则该特征取0 。 3 2 1 0 特征十特征提取结果经过提取，系统便得到了f l f 1 4 这1 4 个统计特征，而对于其中的端点、线段这两个特征还分别详细记录下它的坐标、点数等特征。下面就来分析一下特征提取的结果。 2 9 特征数字 - 0 - 一1 一一2 一3 -一4 一一5 一一6 一一t 一。8 一一9 。 0 字符离散程度：7 2 0 9 7 8 1 5 1 4 4 4 4 466 6 4 8 0 46 8 1 5 2 1 45 6 4 8 1 6 568 1 2 7 7 85 9 4 6 4 7 68 4 8 5 1 9 3 63 11 5 6 55 8 4 9 9 3 1 l 字符的绩纵比：0 9 4 6 0 o 3 0 1 3 7 90 ，5 7 4 3 鹅o5 3 7 5 5 210 1 8 9 4 40 ，5 5 1 2 3 2 0 ，7 9 9 5 9 70 5 6 11 4 20 5 0 2 2 0 1o 5 9 3 4 4 _ 2 闭合区域比例：09 9 0 0 6 7 00 0 0 0 0 00 4 5 0 5 1 9 o5 0 4 4 4 106 5 9 4 4 905 0 8 2 9 30 5 7 6 4 7 303 7 7 5 7 808 0 7 2 7 407 11 6 7 6 3 左上区域比铡：0 1 8 6 1 6 0 0 0 3 3 3 6 20 1 2 1 9 7 0 1 6 8 6 2 50 1 8 5 4 9 102 1 1 7 8 1 0 z 2 _ 2 2 7o ，2 1 1 9 3 5 0 1 9 3 5 1 602 2 6 2 8 1 4 右上区域比例：0 2 7 4 5 5 5 04 4 9 9 9 10 3 0 6 2 4 30 3 0 1 6 7 802 3 9 7 1 202 7 0 4 1 80 1 5 5 6 6 3 02 9 4 8 5 202 8 2 8 4 702 6 1 0 3 9 5 左下区域比例：0 2 8 0 8 7 5 0 2 3 0 7 4 10 2 6 2 4 9 60 1 9 0 6 8 40 2 2 9 0 1 2 02 3 0 4 5 50 2 5 4 1 8 10 1 6 0 0

人人文库> 全部分类> 毕业设计 > 毕业论文

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

（计算机应用技术专业论文）基于结构特征的自由手写数字识别系统.pdf

文档简介

温馨提示

最新文档

评论

（计算机应用技术专业论文）基于结构特征的自由手写数字识别系统.pdf

文档简介

温馨提示

最新文档

评论

相关文档