(电力电子与电力传动专业论文)神经网络模式识别在金融票据特征识别中的应用.pdf_第1页
(电力电子与电力传动专业论文)神经网络模式识别在金融票据特征识别中的应用.pdf_第2页
(电力电子与电力传动专业论文)神经网络模式识别在金融票据特征识别中的应用.pdf_第3页
(电力电子与电力传动专业论文)神经网络模式识别在金融票据特征识别中的应用.pdf_第4页
(电力电子与电力传动专业论文)神经网络模式识别在金融票据特征识别中的应用.pdf_第5页
已阅读5页,还剩53页未读 继续免费阅读

(电力电子与电力传动专业论文)神经网络模式识别在金融票据特征识别中的应用.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

东南大学倾 :学位论文 a b s t r a c t p r e s e n t l y , w i t ht h ed e v e l o p m e n to fe c o n o m ya n dt h ed e e p e n i n go ff i n a n c e ,m o r ea n dm o r e a t t e n t i o ni sp a i dt ot h er e c o g n i t i o no ff i n a n c i a ln o t e sb ya c a d e m i ca n df i n a n c i a ld e p a r t m e n t s i ni t s a f f a i r s ,al o to fk i n d so fn o t e sa r ea p p l i e d t h e s en o t e sa l w a y sn e e dt ob eh a n d l e db yp e o p l ei nt h e p a s t a n dt h e p r o c e d u r e i sn o t o n l y s l o wb u ta l s o e a s yt o m a k ew r o n g t h ef i n a n c i a ln o t e s p r o c e s s i n gs y s t e md o e sb ec o n s t r u c t e dt os a t i s f y t h en e e do fb a n ks y s t e m ,b u th o wt o i n p u t i m p o r t a n ti n f o r m a t i o ni ss t i l lad i f f e r e n tt e c h n i c a lp r o b l e m i nt h ei m p o r t a n ti n f o r m a t i o n ,f i n a n c i a l n u m e r a l s ,t h en a m eo fc l i e n ta n dt h en u m e r a l so fc l i e n t si dc a r da r em a i nk i n d s i fc o m p u t e rc a n b eu s e dt or e c o g n i z et h e m ,t h ec a p a b i l i t yo fp r o c e s s i n gs y s t e mi st ob er a i s e d ,t h ep r o b l e mo f a u t o r e c o g n i t i o nf o rt h e mi sf o c u s e di nt h i sp a p e r i nf i n a n c i a ln o t e st h e r ea r em a n yh a n d - w d t t e nc h a r a c t e r sa n dr e c o g n i t i o nf o rt h e mi ss t i l l d i f f i c u l t b e c a u s ed i f f e r e n tp e o p l eh a v ed i f f e r e n ts t y l ei nw r i t i n ga n dt h ed i f f e r e n tw r i t i n gt o o l s a l s oe n h a n c et h ed i f f i c u l t i na d d i t i o n ,t h er a t i oo fr e c o g n i t i o nf o rf i n a n c i a ln o t e ss h o u l db eh i g h a n dt h er m i oo f w r o n g r e c o g n i t i o nf o rt h e ms h o u l db el o w 1 1 * c o m b i n eo f t h ep a r e mr e c o g n i t i o n o fn e u r a ln e t w o r ka n dt h ef e a t u r ee x t r a c t i o ni su s e dt os e t c l et h ep r o b l e mi nt h i sp a p e r t h ek e y so fh a n d w f i a e nc h a r a c t e r sr e c o g n i t i o na r ef e a t u r ee x t r a c t i o na n dc l a s s i e rd e s i g n t h r o u g hc o m p a r i n go fe x p e r i m e n t a t i o n , s o m eb d t e rf e a t u r ea r es e l e c t e da n dc o m b i n e dw i t ht h e s t a t i s t i c a la n ds t r u c t u r a lj n f o r i l l a t i o no fc h a r a c t e r sf o rc h a r a c t e rr e c o g n i t i o n i nt h ec o u r s co f r e c o g n i t i o n ,ap a r a l l e l n e u r a ln e t w o r kb a s e do nt h e i m p r o v e db pn e t w o r k i su s e df o rt h e r e c o g n i t i o no f n u m e r a lc h a r a c t e r sa n dam i x e dn e u r a ln e t w o r kb a s e do nt h es o f mn e t w o r ka n d i m p r o v e db pn e t w o r ki su s e df o rt h er e c o g n i t i o no fc h i n e s ec h a r a c t e r s a n dt h et r a d i t i o n a lb p n e t w o r ki sm e n d e d w i t l lt h e s em e t h o d s t h ec a p a b i l i t yo fr e c o g n i t i o no ff i n a n c i a ln o t e si s i m p r o v e d k e y w o r d s :f i n a n c i a ln o t e s ,p a t t e m r e c o g n i t i o n ,n e u r a ln e t w o r k , f e a t u r ee x t r a c t i o n 东南大学学位论文独创性声明 本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我 所知,除了义中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成 果,也不包古为获得东南大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同 志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。 研究生签名: ;杰筮日 期:“加 东南大学学位论文使用授权声明 东南大学、中国科学技术信息研究所、国家图书馆有权保留本人所送交学位论文的复印件和 电子文档,可以采用影印、缩印或其他复制手段保存论文。本人电子文档的内容和纸质论文的内 容相一致。除在保密期内的保密论文外,允许论文被查阅和借阅,可以公布( 包括刊登) 论文的 全部或部分内容。论文的公布( 包括刊登) 授权东南大学研究生院办理。 研究生签名:毒客轧导师签名经日期:。弓,岳m 第章绪言 1 1 选题背景与意义 第一章绪言 当今社会处于高度信息化的时代,亟对日益增艮、不断膨胀的“海量”信息,人 f l 广 泛地采_ 1 4 计算机、网络等信息处理技术来适应日新月异的信息化世界。过去,一般采用书 写或印刷在纸张上的方式来存放并处理信息。但现在这种方式已无法适应信息时代的要求, 信息化的必然趋势是信息处理的自动化。通常采用光电转换设备( 扫描仪、传真机、摄像 头等) ,把字符图像变为电信号,输入计算机,由计算机自动识别。 随着经济的发展和金融业务的扩大金融票据的自动识别成为银行等金融行业信息化。 电子化的一个重要课题,在银行系统的各种业务中,各种票据被大量应用。而这些票据以 往都需要人工进行处理。录入的过程既慢而且容易出错。银行金融票据自动处理系统正是 根据银行业务处理的需要而提出来的。金融票据自动处理系统借助计算机及相关设备的强 大功能,将票据中的信息高速的输入到计算机中,并且建立数据库,对输入的信息进行管 理,保证铌行及金融系统业务往来的顺利进行。但是如何高速准确的将金融票据中的重要 信息输入计算机是一个技术难题。普遍采用的办法是用高速的扫描设备将票据扫描后形成 图像输入计算机,再对票据图像中的重要信息区域进行定位、提取。在票据的重要信息中, 金额数字、身份证数码和客户姓名是其中很重要的一部分。如果能使用计算机对其准确的 识别,将是金融票据自动处理系统的最关键部分。 经过几十年的发展,字符识别技术已经取得了巨大的发展。但是金融票据上的字符多 为手写字符,对自由书写的手写字符的识别仍然是一个难题。这主要是因为自由书写的字 符风格各异不同的人有不同的书写习惯。甚至同一个人所书写的多个相同字符,字型也 不尽相同,仍然存在比较明显的差剐,所使用的书写工具妁不圊也会造戏手写汉字魄笔道 粗细不同- 这些都提高了手写字符识别的难度。而且针对金融票据的特点,对识别系统的 性能要求比较高,不仅要求有比较高的识别率而且误识率要比较低。采用什么方法才能使 识别系统达到上述要求,对此的研究将是一项十分有意义的工作。本研究课题的主要目的 旨在用神经网络模式识别方法解决金融票据中金额数字、身份证数码和客户姓名等的自动 识鄹问题,并侵识别结果能在识别率较高的基础上有较低的误识率,满足票据识别的要求。 1 2 票据识别的当前研究状况 由丁金融票据自动处理系统具有重要的意义,引起了许多国家和金融机构的重视。包 括中国在内法国【j l 、美国【2 j 、意大利口l 等国家的学者对金融票据,特别是银行票据的自动 识别问题进行了研究,并取得了一定的成果。 法国学者s k n e r r 等第一个研制了一个用了识别法国银行票据上数字金额的软件。该 软t l 二任配有一个2 4 0 d p i 的二值图像扫描仪的u n i s y s d p s 0 0 文档处理机上。对17 6 0 0 0 张票 据的处理结果显示;票据识别率为7 5 。 , lh e u t t e d 等”为了能处理法国不同银行的各类票据,深入研究了黎据上的数字金额的 识别识圳率达到8 5 8 。 引对美国银行票据,d z u b a 等学者研究了银行票据阅读系镜,其方法是基于最佳置信 度,识驯譬可达到8 5 。 东南人学缺i 学位论义 g d i m a u r o 和s i m p e d o v e 等意人利学者构造了一个意大利银行票据处理系统,他们对组 成系统的各部分进行了测试,但没有给出整张票据的识别率。 今年米我国学者对金融票据的识别也进行了一定的研究,但目前还没出现这方面的产 品。 可以看到金融票据的识别综合了多项技术,包禽了多个部分,尽管目前有不少学者 对此在作进一步的研究,还仍有一些技术有待于进一步探索与改进,如金融数据的分割、 特祉矬,文、识别率的提高承1 跌弧一 、的降低等。本文在j 述儿l 面作了。些探索与尝试。 1 3 金融票据的特点 金融票据的样式繁多棒写个性化,也就是说因票据类型和使用者的不同,票据的模 式有很大的随机性,归纳起来有如下几点”】: ( 1 ) 目前多数金融票据是手写的,手写的随意性很大,致使识别手填票据比较困难; ( 2 ) 金融票据信息的书写格式不同,书写用笔不同,书写场合不同等等: ( 3 ) 目前国内或一个地区内尚无标准的、统一的金融票据格式,各种票据的印刷格式 五花八门,用户填写信息域的位置、大小、颜色等区别很大,此外各种背景色使 得票据的图像更加复杂。 基于以上特点,使得金融票据的自动识别实现时有一定困难,因此必须选择好的字符 特征和性能良好的分类器,并采用多种方法的综合来提高识别率。 1 4 金融票据识别的过程 金融票据的识别是利用计算机模式识别与图像处理技术,自动将金融票据的数据转换 成计算机可以处理的信息代码,代替票据手工键入的方式。它主要包括两个过程;票据的 版面分析和数据的自动识别,是图像处理与模式识别的重要研究领域,也是金融票据自动 处理系统中的最关键部分。 版面分析是指分析给定的图像结构。提取相互独立的图像单元的处理过程。其主要任 务是进行文本与图形、表格以及它们相互之间的几何结构分离过程,目的是获得分离的单 个数据。金融票据版面分析的主要工作是实现票据填写域与非填写域的分离和数据的切分 等。 图l l 金融票据识别的流稳图 数据识别是指处理版面分析的结果,对版面内的图形、图像信息和结构关系进行识别 第一章绪言 和理解的过程。金融票据的数据识别的主要任务是实现票据语义的理解,具体而吉,是对 填写域的金额数字的识别。 我们可以将金融票据的版面分析看成票据识别的前处理过程,将数据识别看成后处理 过料,两者相互联系、相互作用,在整个过程中具有同等重要的作片j 。 金融票据识别的整个流程可用图l ,1 表示。 票据的扫描和矫正:要对票据进行识别,必须首先将票据通过扫描设备转化为图像输 入计算机。在扫描过程中往往会造成图像的倾斜和位置平移,这会影响到所需信息的提取, 冈此需要对票据图像进行倾斜矫正。 票据信息的定位与提取:对于信息处理者来说,需要的不是整个票据图像,而是用户 填写的些信息,必须首先从票据中提取这些信息。本文所关心的是如何把金融票据中的 金额数字、身份证数码和客户姓名提取出来。 信息区域的图像二值化:在识别过程中,最终往往是对黑白二值图像操作的。灰度图 像转换为黑白二值图像的操作称为二值化,或阈值化。本文对从票据图像中提取出来的信 息区域采用了基于最大方差闽值的整体二值化方法。 字符的分割:任何字符识别技术的基础是单个字符的识别因此要从票据上将字符分 割出来。本文中对数字字符和汉字字符的分割采用了不同的方法。 字符图像的预处理:对于已经取得的区域,存在噪声、文字边缘模糊、粘连等现象, 我们需要对其进行平滑去噪并对每个图像先进行去毛刺、空洞等修饰,再规范化为相同 大小的图像,为识别作好准备。 特征提取:特征提取是相当重要的一个环节,它是从规范化后的图像中提取统计特征 或结构特征的过程。提取的特征的稳定性及有效性,将直接决定识别的性能。在本文中, 我们通过比较,把稳定性好且相互互补的特征结合了起来使用。 识别:运用神经网络模式识别的理论,对票据中的所需字符进行自动识别。在本文中, 我们分别采用了并联网络和混合网络对数字和汉字字符进行识别。 1 5 金融票据识别的关键技术 1 5 1 特征提取 特征抽取是模式识别的一个重要环节,它可以降低字符信息量、去除无用的冗余信息, 提高识别系统效率。因此一直是字符识别领域中的关键点,它直接决定了识别系统的性能。 根据字符识别分类器使用特征的不同字符特征可以大概分为结构特征、统计特征。而统 计特征根据特征抽取区域的不同又可粗略地分为全局统计特征和局部统计特征两大类。最 早的结构特征使用字符的笔段或基本笔画作为基元,由这些基元再构成部件( 子模式) ,由 部件的组合来描述字符( 模式) 。但是从字符图像中抽取笔画等基元比较困难。通常,为 了抽取笔画特征,需要将原始点阵图像进行细化处理,但是细化算法不仅速度慢,而且容 易产生伪笔画段。如将一个四义点变成了二个三叉点,给准确的抽取基元造成了困难。为 ,解决这个问题,有些学者试图不经过细化直接从字符点阵图像中抽取笔画等基元,但效 果仍不尽如人意。因此,有些研究人员放弃了抽取笔画或笔段作为基元然后进行文法推断 的思路而采用字符轮廓结构信息作为特征,这一方案的识别结果优于基于基元抽取的方 法,但耗时严重,而且对于笔划较模糊的字符图像抽取内轮廓会遇到极大困难外轮廓 的抽取也不太稳定。也有些学者采用抽取字符图像中关键特征点来描述字符,字符的关键 特征点包括端点、折点、交点、歧点、背景特征点、局部曲率最大点等 6 1 ,但是特征点的 东南人学颂士学位论义 抽取易受噪声点、笔画的粘连与断裂等影响。可以说,单纯采用结构特征无法满足手写字 符识别系统的要求。与结构特征相比,统计特征具有良好的抗噪声、抗干扰的性能。传统 的全局统计特征主要包括:全局变换特征( 对字符图像进行各种变换,利用变换系数作为 特征常耀的变换有f o u r i e r 变换、h a d a m a r d 变换、d c t 变换、w a l s h 变抉、r a p i d 变换、 k l 变换等。) ;不变矩( m o m e n t ) 特征;笔画穿透数目特征:全局笔画方向特征( 反映 r 在整个宁符点阵中笔画的复杂度、方向及连接关系) ;背景特征。常用的局部统计特征主 要包恬:局部笔画方向特征、细胞特征、相补特征、方向线素特征、g a b o r 特征、四编码 特征等。统计特征虽然对噪声和字符的微小畸变不敏感,但是,可以用来区分“敏感部位” 的差异也随之消失,不能很好的反映出字符的结构信息,因此区分相似字的能力较差。由 此可以看出,在手写体字符识别系统中,单纯的采用结构特征或统计特征都无法取得令人 满意的结果【7 l 。因此,我们考虑将字符结构特征和统计特征相结合。利用结构特征对字符 结构较敏感,区分相似字的能力较强的特点和统计特征备棒性强的特点,将两种特征结合 起来使用。在本文中,我们针对字符的一些特征提取方法进行了试验比较,在比较的基础 上从中选择了几种稳定性好且相互互补的特征提取方法结合使用。 1 5 2 分类器的设计 字符特征被提取后,就要送入字符分类器进行识别。字符分类器是字符识别中最为重 要的环节。分类器设计的好坏直接关系到字符的识别率。多年来,人们对此进行了大量的 研究,提出了若干非常有价值的分类方法。目前用于手写体字符识别的算法主要有模板匹 配算法、人工神经网络算法、基于模糊理论的算法、马尔科夫场理论方法以及各种算法相 结合的混合识别算法。基于模板匹配的识别过程是:将待识别字符尺寸规范化为字符数据 库中模扳的大小然后与所有的模板直接进行匹配。最后选取最佳匹配作为结果。但由于 同类的手写体字符间存在着较大的差异,在实际应用中,为提高正确率往往需要使用多个 模板进行匹配,雨处理时间则随着模板个数的增加而增加基于特征信息的模板匹配算法 对传统的模板匹配算法进行改进嘲,此算法先对待识别字符进行特征信息提取。即对字符 进行拓扑分析得到字符的特征信息对特征信息进行模式匹配确定其分类。使用特征信息 进行模板匹配有效的减少了模板中象素点的个数,既提高了识别速度,又具有较高的识别 率。由于手写体字符的特点,要求对字符的识别算法具有较强的抗噪性、容错性。基于此 点,近年来,人们采用了人工神经网络、模糊理论、隐形m a r k o v ( 咖) 等方法。隐形 l a r k o v ( 删m ) 方法 9 1 通过对字符集提取特征并v h 练形成字符集中所有字符的删参数集,输 入带识别字符后提取特征向量观察序列,计算观察序列与参数集的匹配情况,将最佳匹配 作为结果输出。手写体字符模糊识别法将模糊理论应用于识别其过程是首先构建字符类 模糊矩阵,然后对待识别字符依照同样的方法构建模糊矩阵。计算待识别字符糊矩阵与模 式类的贴近度将贴近度塌大的模式类作为识别结果输出。 近年来,人:神经网络以其抗噪声、容错、自适应、自学习能力强、融若干预处理和 识别方法下一体识别速度快等特点受到人们的重视,在模式识别领域中得到了广泛的应 用【l ”j 。人1 神经网络( a r t i f i c i a ln e u r a ln e t v c o r k 。以下称a n n ) 是一种模拟人脑神经元细 胞的网络结构它是由大量简单的基本元件一神经元相互连接成的自适应非线性动态系统。 虽然目前对丁人脑神经元的研究还很不完善,我们无法确定a n n 的工作方式是否与人脑神 经元的运作方式相同但是a n n 正在吸引着越来越多的注意力。a n n 中的各个神经元的结 构与功能较为简单,但大量的简单神经元的组合却可以非常复杂,我们从而可以通过调整 神经元间的连接系数完成分类、识别等复杂的功能。a n n 还具有一定的自适应的学习与组 织能力,组成网络的各个“细胞”可以并行工作,并可以通过调整“细胞”间的连接系数 4 第一章绪茸 完成分类、识别等复杂的功能。这是冯诺依曼的计算机无法做到的。a n n 可以作为单纯 的分类器( 不包含特征提取选择) ,也可以用作功能完善的分类器。在英文字母与数字的识 别等类别数目较少的分类问题中常常将字符的图像点阵直接作为神经网络的输入。不同 于传统的模式识别方法,在这种情况f ,神经网络所“提取”的特征并无明显的物理含义, 而是储存在神经物理中各个神经元的连接之中,省去了由人来决定特征提取的方法与实现 过程。从这个意义上来说,a n n 提供了一种“字符自动识别”的可能性。此外,a n n 分类器 是一种非线性的分类器,它可以提供我们很难想象到的复杂的类间分界面,这也为复杂分 类问题的解决提供了+ 种可能的解决方式。 使用人工神熊网络方法实现模式识别,可处理一些环境信息十分复杂,背景知识不清 楚,推理规则不明确的问题,允许样品有较大的缺损、畸变。目前用于字符识别的人工神 经网络模型有:h o 西e l d 神经网络、前向多层神经网络 1 时,激活函数的梯度增加, 加快网络收敛速度:当 t l ,输入层与中间 层权值调节量是输出层与中问层权值调节量的 t 倍,两层权值调节量不平衡状况得到解决。 同时由于x 。引入使激活函数变陡,易陷入平坦区,这里采用网络前传和反向误差计算分开 来处理的办法,既避免了陷入平坦区的问题,又解决了权值的平衡问题。算法总结如f : 凡( ia w 扯j ) ( l w i 。加。 神经网络前传运算时,1 保持不变,以保证网络对系统的正确辨识。 在误差反传运算时,根据步骤动态变化x 。 ( 2 ) 增加附加动量 附加动量的方法使网络在修正权值时,不仅考虑误差在梯度上的作用,而且考虑在误差 曲面上变化趋势的影响,其作用如同一个低通滤波器,它允许忽略网络的微小变化特性。在 没有附加动量的情况下网络可能陷入局部极小值,利用附加动量的作用则可以滑过这些极小 值。改方法在误差反向传播的基础上在每一个权值的变化上加上一项正比与前次权值变化量 的值,并根据反向传播法来产生新的权值变化,具体如下: a w “( 七+ 1 ) = 0 一a ) r l s ,x s + a ,w 1 ,( 七) 巩( 七+ 1 ) = ( 1 一口) ,争最+ 6 e 玩( 戽) 其中k 为训练次数,n 为自适应动置因子。 根据附加动量搜则,当修正的权值在误差中导致太大的增长结果时,新的权值应被取消 而不采用,并使动量作用停止下来,使网络不进入较大的误差曲面;当新的误差变化率对其 旧值超过一个事先设定的最大误差变化率时,也得取消所计算的权值变化。其典型的最大误 差变化率为1 o i 。所以n 的调整公式为: 1 0 s e e ( k ) s e e ( 七一1 ) 1 0 4 口( 女) = o 9 5s e e ( k ) s e e ( k - 1 ) i a ( k 1 )其他 n 的初次取值为0 9 。 ( 3 ) 采用自适应学习速率 调节学习速率的准则是:检查权值的修正是否真正降低了误差,如果是,可以对其增加 一个略太于1 的量;如果不是表明产生了过调,就应该减少学习速率。具体如下: 1 1 0 5 叩( k 1 )s e e ( k ) 1 0 5 s e e ( k 1 ) i ,7 ( 七一1 )其他 初始的n ( 0 ) = o ,1 。 ( 4 ) 误差梯度的改进 _ , 误芳梯度改进方法是指在计算输出层梯度占 、,= ( f 。一y ) f 2 ( x ) 时,对厶加上一 第二章神经网络模式识别 , j 个小量o 1 ,即j 女,= ( ,k y 女) ( ( x ) + 0 1 ) a 这样一方面 对鹅个网络的作用不会 改变,另一方面,如果当输入i x i 很大时,仍能使6 “有一定大小,避免网络发生麻痹现象。 2 4 3 3 改进的b p 网络与传统b p 网络的比较 把这种改进的b p 网络与传统的b p 网络进行试验比较,对如f 函数进行逼近:y = 5 0 c o s ( 2 x ) + 1 0 0 ,x 在 0 ,1 】区间均匀的取1 0 个点,x 严i l o ,i = o 一9 。采用的网络结构为1 一1 0 - 1 , 传统b p 网络的迭代次数为5 0 0 0 次,改进b p 网络的迭代次数为2 0 0 0 次,逼近结果比较如 下: 表2 1 函数逼近结果比较 传统b p 网络改进b p 网络 均方误差最大相对误差均方误差最大相对误差 i o 2 7 4 2 9 0 5 o 鹃8 5 0 0 0 0 0 1 6 60 o 1 0 9 20 4 0 3 4 1 6 21 2 9 6 5 0 0 0 0 2 0 2 60 0 2 7 7 30 7 4 0 1 1 3 91 7 0 4 4 o 0 0 1 9 2 5 80 1 0 8 6 4 0 3 5 2 1 2 3 41 1 8 4 4 o 0 0 2 7 3 9 1 0 1 6 6 5 50 2 2 2 9 8 9 4o 8 7 3 7 0 0 2 1 2 5 2 20 3 4 8 5 6o - 4 9 8 8 0 3 l1 3 5 4 7 0 0 0 0 0 1 9 40 0 1 2 7 7 0 4 5 1 4 6 4 01 2 5 1 l 0 0 i ,2 3 00 0 1 1 9 80 6 7 5 4 0 9 71 8 8 8 3 0 0 0 0 0 4 4 0o 0 1 6 1 90 2 5 “5 0 20 8 钙i o 0 0 0 5 6 1 4 8o 1 9 0 l 1 0o 2 2 0 3 0 5 50 9 8 1 9 0 0 0 2 礴0 0 1 5 1 其中均方差值网络在所有样本点处辕出的误差均方位,最大相对误差值样本点处相对输 出误差的最大值。由上比较,可见改进后的网络比传统的嗍络收敛速度与精度都有提高。 2 4 4 自组织竞争网络 在实际的神经网络中,存在着种“侧抑制”现象,即一个神经细胞兴奋后,通过它的 分支会对周围其它神经细胞产生抻制,这种侧抑制会使神经细胞之间产生竞争。虽然开始阶 段各个神经细胞都处于程度不同的兴奋状态,由于侧抑制的作用,各细胞之间相互竞争的结 果是:兴奋作用最强的神经细胞所产生的抑制作用战胜了它周围所有的其它神经细胞的抑制 作用面“赢”了。其周围的其它神经细胞都“输”了。 自组织人工神经网络正是基于上述的生物结构和现象形成的。它能够对输入模式进行自 组织训练和判断,并将其最终分为不同的类型1 1 3 挪l 。与b p 网络相比,这种自组织网络的学 习能力迸一步拓宽了人工神经网络在模式识别、分类方面的应用。下面介绍竞争网络中的 种科荷伦自组织映射网络( s o 两) 。 一、科荷伦自组织特征映射网络的拓扑结构 神经细胞模型中还存在着一种细胞聚类的功能柱。它是由多个细胞聚合而成的,在接受 外界刺激后,它们会自动形成。一个功能桂中的细胞完成同一中功能。 1 7 东南大学硕士学位论文 在科荷伦网络中就体现了生物细胞的这种现象。当外界输入不同的样本到科荷伦网络 中,一开始输入样本引起输出兴奋的位置各不相同,但通过网络自组织后会形成一些输出群, 它们分别代表了输入样本的分布,反映了输入样本的图形分布特征,所以科荷伦网络常常被 称为特征图。科荷伦网络使输入样本通过竞争学习后,功能相同的输入靠得比较近。功能不 同得输入分得比较开,从此将一些无规则的输入自动排开。在连接权值的调整过程中,使权 值的分布与输入样本的概率密度分布相似。一般情况下,科荷伦网络的权矢量收敛到所代表 的输入矢量的平均值,反映了输入数据的统计特性。当样本输入到科荷伦网络时,如果样本 足够多,那么在权值分布上可近似于输入样本的概率密度分布,在输出神经元上也反映了这 种分布,即概率大的样本集中在输出空问的某一卜区域。如果输入的样本有几种分布类型, 则它们会各自根据其概率分布集中到输出空间的各个不同区域,每一个区域代表同一类样 本,这个区域可逐步缩小,使区域的划分越来越明显,从而完成样本的聚类。 层 p l 见p , ( 1 ) 主神经元( 2 ) 邻屡1 ( 3 ) 邻层2( 4 ) 邻层3 图2 4 科荷伦网络结构图图2 5 神经元层示意图 从图2 4 中可知,科荷伦网络结构分为两层:输入层和竞争层竞争层可由一维和二维 阿络矩阵组成。现已二维结构为倒加 ;c 说明 网络上层有输出节点s 个,按二维形式捧成一个节点矩阵输入节点位于下方,有r 个矢量,即,个节点,所有输入节点到所有输出节点之问都有权俊连接,而且在二维平面上 的输出节点相互问也是局部连接的科荷伦网络的激活函数为二值型。一般情况下偏差b 值 固定。在竞争层中,每个神经元都有自己的邻域。图2 5 为一个在二维层中的主神经元。一 个直径为l 的领域包括主神经元及它的直接周围神经元所组成的区域;直径为2 的邻域包括 直径为l 的神经元以及它们的邻域。竞争层的竞争结果,不仅使加权输入和为最大者获胜而 输出为1 ,同时也使获胜节点周围的邻域也同时输出为l 。在权值调整的方式上,网络不仅 调整与获胜节点相连的权值,而且对获胜节点的邻域节点的权值也进行调整,即使其周围邻 域内的神经元在不同程度上也得到兴奋在该邻域外的神经元都被抑制。 二、科荷伦网络的训练过程 在科荷伦网络训练开始时,其输入节点竞争的胜利者代表某类模式。然后定义获胜节点 的邻域节点即以获胜节点为中心的某一半径内的所有节点。并对与其相连的权矩阵进行调 整。随着训练的进行,获胜节点的半径将逐渐减小,直至最后只包舍获胜节点本身。也就是 在训练初始阶段,不但对获胜节点作权值调整,而且对其周围较大范围内的邻节点也作相应 的调整。而随着训练过程的进行与获胜输出节点相连的权矩阵就越来越接近其代表的模式 类,此时,需要对获胜节点进行较细致的权矩阵调整。同时,只对其邻接较近的节点进行调 整。这样在训练结束后,几何上相近的输出节点所连接的权矢量即有联系( 即类似性) ,又 有区别保证了对某一类模式的输入,获胜节点能作出最大的响应,而相邻节点作出较少的 1 3 第二章神经网络模式识别 响应。几何上相邻的节点代表特征上相似的模式类别。 以下给出科荷伦网络训练的基本步骤: ( 1 ) 初始化 ( a ) 由输入矢量确定网络的结构; ( b )设置网络竞争层神经元的节点:一维s 或二维s = x x y ( x 为宽y 为高) : ( c )将输入矢量x 作归一化处理; ( d )归一化随机设置初始权值; ( e )设置晟大循环次数;m a xc y c l e ; ( f ) 设置初始学习速率n 。一般取0 0 1 一o 3 ; ( g )设置最大邻层数m a xn e i g h b :一维m a x _ n e i g h b = s 一1 ;二维 m a x _ n e i g h b = i n a x ( x ,y ) 一l ; ( 2 ) 循环训练f o rc y c l e = l t o m a x _ c y c l e ( a )计算输入矢量加权和并通过竞争求出获胜节点; ( b )根据获胜节点求出相邻层,并进行权值修正; 其中学习速率= 也是递减的。 2 5 神经网络模式识别 2 5 1 神经风络模式识别概述 ,7 ( k - o 是随着循环线性下降的t 而邻层数 神经网络模式识别方法是近几年兴起的模式识别领域的一个新的研究方向。由于神经网 络的高速并行处理、分布式存贮信息等特性符合人类视觉系统的基本工作原则;且神经网络 具有根强的自学习性、自组织性、容错性、高度非线性、高的鲁棒性、联想记忆功能和逻辑 推理功能等,能够实现目前基于计算理论层次上的模式识别理论所无法完成的模式信息处理 工作。所以。采用神经网络进行模式识别。突破了传统模式识捌技术的束缚开辟了模式识 别发展的新途径。同时神经网络模式识别也成为神经两缮曩成功和最有前途的应用领域之 一口 神经网络模式识别的过程分为两步:酋先是学习过程。通过大量的训练样本,对网络进 行训练,根据某种学习规则不断对连接权值进行调节,最后使网络具有某种期望的输出,这 种输出即是可以将训练样本正确分类到其所属类别中去,此时可以认为网络是学习到了输入 数据或样本阚的内在规律。接下来是分类过程,应用前而学习过程所u 练好的权值,对任一 送入网络的样本进行分类。 与传统的贝叶斯分类器不同,神经网络是一种非参数的模式识别方法,它可以根据不同 的网络结构实现不同的分类边界,一个单层的神经网络可以通过实现超平面分类边界而完成 一个线性分类器的功能,而一个多层网络则可以通过实现任意形状的分类边界而完成相当复 杂的模式识别任务”。“j 。 作为一种强有力的新的模式识别方法,神经网络与传统模式识别不同,它是通过直接作 用于输入样本用样本来训练网络并最终实现识别任务的。神经网络用于模式识别的最大特 点在于它是非参数型的模式识别方法,不用建模和对输入数据的兼收并蓄,不用建模使得它 为解决那些很难用精确的数学语言进行描述的模式识别问题提供了强有力的手段。而网络对 ,、 东南大学硕士学位论文 输入数据的包容性,使得无论怎样的数据,只要是对解决问题有用的,都可以同时送入网络 这就为一些由多种影响因素决定的识别问题。提供了方便。 2 5 2 神经网络和其它模式识别方法在字符识别方面的比较 上面介绍的儿种模式识别方法均可实现字符识别。但它们实现的特点不同,以下作一简 要的比较f 2 3 l 。 ( t ) 统计模式方法此方法比较成熟,能考虑干扰、噪声等的影响,识别模式基元能力 强。但对结构复杂的模式抽取特征困难;不能反映模式的结构特征,难以描述模式的性质: 难以从整体角度考虑识别问题,它的抗干扰能力不足,对这种存在较大噪声的手写字符的 识别比较困难。 ( 2 ) 句法结构方法此方法识别方便,可从简单的基元开始,由简至繁,能反映模式的 结构特征能描述模式的性质。对图像畸变的抗干扰能力较强,但当存在干扰及噪声时,抽 取基元困难。且易失误。因而对这种存在较大噪声的手写字符不合适。 ( 3 ) 模糊模式方法在模式识别过程中引入了模糊集的概念,由于隶属度函数作为样 品与模板相似程度的量度故能反映整体的、主要的特性。模糊模式有相当程度的抗干扰与 畸变,从而允许样品有相当程度的干扰与畸变,适于对这种存在较大噪声的手写印刷体数 字的识别。但准确合理的隶属度函数往往难以建立。目前有学者在研究,并将其引入神经网 络方法形成模糊神经网络识别系统。 ( 4 ) 神经网络方法是使用人工神经网络方法实现模式识别。可处理一些环境信息十分 复杂,背景知识不清楚,推理规则不明确的问题允许样品有较大的缺损、畸变,神经网络 方法允许样品有较大的缺损和畸变,这正是识别存在较大噪声的手写字符的识别所需要的。 另外,神经网络方法实现不必考虑其识别类不够多的问题。 另外,很多研究表明,利用神经网络识剃字符可以取得比较好的效果1 7 4 ”1 。鉴于上述原 因,神经网络方法在字符识别方面成为较好的选择,但往往和其他方法相结合。 第三章预处理 第三章预处理 票据识别时,首先将票据上的信息经光电扫描产生模拟电信号,再经过模数转换为带灰 度值的数字信号输入计算机。然后要对所需的信息进行定位与提取。在此基础上再对所在信 息区域的字符进行分割。而且纸张的厚薄、洁自度、光洁度、印刷或书写质量都会造成字形 墒变,产生污点、非白、断笔、交联等干扰。输入设备的分辨率、线性度、光学畸变、量化 过程也要产生噪声。这些噪声使特征的提取出现困难,为了能提取字符稳定、准确的特征, 在识别之前。要对带有随机噪声、干扰的字符数字信号进行预处理( p r e p r o c c s s i n g ) 。预处 理是识别处理的第一步,占有十分重要的地位,预处理的好坏将直接影响识别方法的难易及 识别结果的好坏、预处理工作做得好,使反映字符本质特征的部分得到保留甚至突出出来, 识别就容易进行,识别率高且识别速度快。反之,就会使识别变得困难,甚至造成误识等不 良后果。在本文中,票据图像预处理包括倾斜校正、信息的定位与提取、二值化、字符分割、 字符的平滑去噪、规范化和细化操作。 3 1 票据的扫描与和矫正 要对票据进行识别,必须首先通过扫描设备转化为图像输入计算机。在扫描过程中往往 会造成图像的倾斜和位置平移,这会影响到所需信息的提取。因此需要对票据图像进行倾斜 矫正。在对图像进行矫正时,我们采用下面的方法嗍 ( 1 ) 先在图像中确定票据所在的位置 晌l 角。为了方便定位,将扫描仪背景设定为黑色, 然后标记出票据的轮廓点。标记轮廓上边缘点的算法为: f o r 0 20 ;“i m a g ew i d t h ;时+ ) 一 f o rt y 2o ;,( i m a g e _ h e i g h ;1 一斗) i f 0 m a g e y 【司i sn o tb l a c k p o i n t ) m a r kp o i n t 饭力i su p - e d g e ;b r e a k ; ( 2 ) 利用h o u g h 变换求出四边的方程。直线方程形如0 + y s i n0 = p 。求票据上边界 方程的算法为: 作计数器c o u n t e r 【1 【】; f o rf a l lp o i n t s ) i f ( p o i n t 力i su p - e d g e ) f o r ( a 1 1 日) fp = x c o so + y s i n0 :c o u n t e r t o 】 e 】+ + : 最后计数器c o m l t e r 最大值对应的p 和0 即为边的直线方程在求出票据的四边方程 后,就确定了票据的位置形状,由此以后的讨论都可以认为是在票据水平放置的情况下进行。 3 2 信息的定位与提取 对于任何一类票据其自己固定的影刷格式,我们可以通过对空表的学习获得票据中各个 填写区域的分布情况。通过这些先验知识,根据所要提取的信息,我们可以菜类票据制定一 个票据模扳,如图3 1 所示。票据楗板的作用是实现初步分割,利用它在票据图像上提取相应 的区域。这个提取区域往往比较大,但包含了对应此区域的信息,然后在此区域上实行字符 东南大学硕j :学位论文 分割。 3 3 信息区域的二值化 图3 1 票据模板 经过票据模板提取后的区域图像仍然是一个灰度图像。而在字符识别中,最终往往是对 黑白二值图像操作的,因此我们必须把灰度图像转化为二值图像。灰度图像转换为黑f l - - 值 图像的操作称为二值化或阚值化1 2 7 1 。最简单的二值化可以通过设定阈值实现。如果图像 中某象索的灰度值小于该阈值,则将该象素的值设为0 ,否则设为2 5 5 。它的表达式如下 f0 x t o 1 ) 其中t 为指定的阈值。由上式可看到,二值化的关键是阈值t 的选择。习惯上常用三 元函数的形式表示阈值t l t = t ( f ( x , ,n ( x ,r ) ,( x ,y ) ) ( 3 2 ) ( x ,y ) 是象素坐标,f ( x ,y ) 是坐标为( x ,y ) 的象素的灰度值,n ( x ,y ) 表示坐标为 ( x ,y ) 的象素的局部灰度值t 票据图像的二值化就是要把图像f ( x ,y ) 分成对象物和背景两 个区域,尽可能地保存图形信息又尽可能地减少背景和噪声地干扰。常用的二值化方法分为 整体、局部和动态闽值二值化三类。 本文采崩的是整体阈值法。在选择整体阈值时,采用最大方差闺值设定法。此方法不管 第三章预处理 图像的直方圈有无明显的双峰,都能得到比较满意的结果。 对应于每个灰度值,求出在图像中具有该灰度值的像素数的图形叫做灰度直方图,或简 称直方图,灰度直方图能给出图像灰度值的概貌描述。设灰度值g 的取值是0 - - 2 5 5 间的整 数,g = o 为黑色,g = 2 5 5 为白色。p ( g ) 表示灰度值为k 的概率,表示灰度为k 的象素 的个数,n 为象素总个数。则有: p ( g t ) = 二兰0 g t 2 5 5( 3 3 ) 通常称以p ( 吼) 为纵坐标,g k 为横坐标的图形为十p ( g k ) 灰度直方图,在数字图像中,它是由离散点或线构成i 1 的。票据图像的灰度直方图通常有两个峰值,分别对i厂、 应文字的笔划和背景( 见图3 2 ) 。阈值应取两峰之间if 的波谷处,并且波谷愈深陡。二值化效果也愈好,这l 、 是根据图像和背景的灰度值确定整体阈值的方法。 l l 方图鬈兰蔷嚣募蠹慧譬聋璺勰晶篙蓦需打寺气方图在某一阈值处分割成两组,当被分成的两组闯方 。 “ 差为最大时,确定阈值。一张票据图像的灰度级为2 5 6 图3 2 灰度直方图 级,就是说每一象素有2 5 6 种可能的灰度值,分别用数。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论