(计算机应用技术专业论文)支票大写金额串的切分技术研究.pdf_第1页
(计算机应用技术专业论文)支票大写金额串的切分技术研究.pdf_第2页
(计算机应用技术专业论文)支票大写金额串的切分技术研究.pdf_第3页
(计算机应用技术专业论文)支票大写金额串的切分技术研究.pdf_第4页
(计算机应用技术专业论文)支票大写金额串的切分技术研究.pdf_第5页
已阅读5页,还剩51页未读 继续免费阅读

(计算机应用技术专业论文)支票大写金额串的切分技术研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 在金融电子化的趋势下,信息技术手段已成为金融行业新的业务增长点, 如何快捷、准确、高效地实现银行业务的信息化,缩短每笔业务的操作时间, 保护客户原始数据,并对其进行电子认证,成为银行自动化的研究课题。图 像处理与模式识别技术的不断发展,已使支票自动处理成为金融自动化的重 要组成部分,同时支票一体化规范化趋势也给国内支票识别带来了更广泛的 应用前景。但相比国外支票的应用,国内的支票识别率仍比较低、支票自动 化水平不够高。 对支票的自动处理可分为以下几个步骤:首先,把要处理的支票通过扫描 仪、摄像机、清分机等输入设备输入到计算机并作为图像数据存储下来;并 对支票图像进行倾斜校正;其次,对支票图像的信息区域定位及截取;第三, 对截取的信息区域进行切分和识别判定,并根据识别结果对支票进行分类输 入到数据库。 本文对支票自动处理的以下几个方面作了深入研究,提出了一些新颖的算 法,并通过实验进行了仿真实现。一、支票的倾斜校正,本文采用基于链码 的直线检测算法,然后根据检测出的直线的斜率计算出支票的倾斜角度并对 支票旋转校正:二、支票信息区域的截取,本文根据我国所有支票结构基本 相同的特点,首先确定每个待截取区域的大致位置,然后通过灰度投影、二 值化处理等方法截取每个信息区域;三、支票大写金额串的切分,它是支票 自动处理技术最核心的部分,也是最难的部分,本文主要思想是基于连通域 方法,首先对连通域进行上下合并,然后切分粘连字符,根据字符约束宽度 计算所有分割路径,最后识别切分结果选择最优分割路径。 关键词:直线检测,截取,切分,合并,识别 a b s t r a c t i nc o m p u t e r i z ef i n a n c i a ls e r v i c e st r e n d s ,i n f o r m a t i o nt e c h n o l o g yh a sb e c o m e am e a n st on e wb u s i n e s sg r o w t hi nt h ef i n a n c ei n d u s t r y 。h o wf a s t ,a c c u r a t e l ya n d e f f i c i e n t l yt oa c h i e v et h eb a n k si n f o r m a t i o nt e c h n o l o g yo p e r a t i o n s ,a n ds h o r t e n t h eo p e r a t i o nt i m eo fe a c hb u s i n e s s ,a n dp r o t e c tc u s t o m e rd a t aa n dt h ec o n d u c to f e l e c t r o n i cc e r t i f i c a t i o n ,t ob e c o m ear e s e a r c hs u b j e c to fa u t o m a t e db a n k i n gi s s u e s c h e c ka u t o m a t i cp r o c e s s i n gh a sb e c o m ea ni m p o r t a n tp a r to faf i n a n c i a l a u t o m a t i o ni nt h ee x p a n d i n go fi m a g ep r o c e s s i n ga n dp a t t e mr e c o g n i t i o n t e c h n o l o g y a tt h es a m et i m e ,t h et r e n do fc h e c ks t a n d a r d i z a t i o nh a sb r o u g h ta w i d e ra p p l i c a t i o ni nc h e c ki d e n t i f i c a t i o n h o w e v e r , c o m p a r e dt ot h ea p p l i c a t i o no f f o r e i g nc h e c k ,a n dd o m e s t i cc h e c kr e c o g n i t i o n r a t ei ss t i l lr e l a t i v e l yl o w , t h el e v e l o fc h e c ka u t o m a t i o ni sn o th i g he n o u g h t h ec h e c ka u t o m a t i cp r o c e s s i n gc a nb ed i v i d e di n t ot h ef o l l o w i n gs t e p s :f i r s t , c h e c kt ob ed e a l t 、7 l ,i t l lt h r o u g ht h es c a n n e r s ,c a m e r a sa n do t h e ri n p u td e v i c e s 邱u t i n t ot h ec o m p u t e r ,a n dm e m o r yi ta si m a g ed a t a ,a n dt i l tc o r r e c t i o nt ot h ec h e c k i m a g e ;s e c o n d ,i n t e r c e p ta n dp o s i t i o nt h ee f f e c t i v ei n f o r m a t i o no fc h e c ki m a g e ; t h i r d ,s e g m e n ta n dr e c o g n i z et h ee f f e c t i v ea r e ao fi n t e r c e p t i o n ,a n dc l a s s i f yt h e c h e c k sb a s e do nt h er e s u l t so ft h er e c o g n i t i o ni n t ot h ed a t a b a s e i nt h i sp a p e r , t h ef o l l o w i n ga s p e c t so ft h ec h e c ka u t o m a t i c a l l yp r o c e s s i n g w e r em a d ei n d e p t hs t u d ya n dp u tf o r w a r ds o m en e wa l g o r i t h m ,c a r r i e do u ts o m e s i m u l a t i o nt oa c h i e v et h r o u g he x p e r i m e n t s f i r s t ,t i l tc o r r e c t i o nt h ec h e c k ;s e c o n d , i n t e r c e p tt h ee f f e c t i v ei n f o r m a t i o no f c h e c ki m a g e ;t h r e e ,s e g m e n tt h ec h a r a c t e r s o fc a p i t a la m o u n ts t r i n g k e y w o r d s :s t r a i g h t l i n ed e t e c t i o n ,i n t e r c e p t i o n ,s p l i t t i n g ,m e r g i n g ,r e c o g n i t i o n 西南财经大学 学位论文原创性及知识产权声明 本人郑重声明:所呈交的学位论文,是本人在导师的指导下, 独立进行研究工作所取得的成果。除文中已经注明引用的内容外, 本论文不含任何其他个人或集体已经发表或撰写过的作品成果。对 本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标 明。因本学位论文引起的法律结果完全由本人承担。 本学位论文成果归西南财经大学所有。 特此声明 学位申请人:芗乡嚼也 母;月,阳 i 绪论 1 绪论 1 1 课题研究的背景及意义 随着信息技术和计算机技术的发展和普及,人类社会已进入了信息时代。 各种信息如爆炸般与日俱增,使人们每天都要接触到来自各方面的大量信息, 并对其中有关内容及时进行加工和处理,例如,文件资料的分类存储、整理 和利用,包括各种文件资料库、档案库的建立、情报资料的检索与通讯以及 文本的自动翻译等。当前信息的主要存在形式有纸质出版物和电子出版物两 大类别 1 。前者以纸质材料为载体,包括图书、报刊等,直接存储并显示传 统的文字与字符;后者以其他材料为载体,包括光盘、磁盘等,以数字化字 符形式存储,经计算机处理后,可以按多媒体方式显示传统的文字、字符。 二者相比较,前者在存储成本、记录密度、交换形式、共享手段、查阅方便 性等诸多方面均远落后于后者,因而当前电子出版物日益增多。但是纸质出 版物已有上千年的历史,内容繁多、数量巨大,并将在今后以其便于阅读与 长期保存等特点,而与电子出版物长期共存 2 。为此,如何对这两种出版物 取长补短,使电子出版物的优越性能在纸质出版物中得到应用,特别是对纸 质出版物的内容数字化,提高其转换过程中的自动化程度与工作效率,已成 为有效获取与利用信息待解决的问题。 当前解决这一问题的主要途经是发展光学字符识别技术。光学字符识别, 简称为o c r ( o p t i c a lc h a r a c t e rr e c o g n i t i o n ) ,是模式识别学科中一个开展 较早的研究领域,在模式识别的历史上具有重要的地位 3 4 ,经过几十年 的发展,已取得了很大的进展。在o c r 的各种应用系统中,支票的自动处理 系统以其较高的学术价值和应用价值越来越受到国内外众多著名研究机构以 及学者的广泛重视。 支票大写金额串的切分技术研究 支票处理是一个费时费力的过程,它包括支票数据信息处理( 如账号、日 期、金额) 、支票合法性验证及支票图像存档检索等多方面内容。虽然货币电 子化的过程正在加速进行,但即使是在美国这个信息化高度发达的国家,其 支票使用总量仍然以每年2 - 3 的速度递增。在我国,随着经济的迅速增长和 现代化进程的顺利进行,由于现代经济对金融工具的依赖性,支票的使用量 也在迅速增加,银行处理支票的压力也日益沉重。因此利用计算机技术对支 票进行自动分析、验证、检索,对于确保金融业务的安全、提高工作效率、 减轻劳动强度和增加处理准确性都具有重要现实意义。支票自动处理引起了 国内外研究者的广泛兴趣。支票自动处理系统的设计涉及到多个方面和多项 技术,这其中主要包括与金融和银行有关的法律及制度、计算机图像处理、 模式识别、计算机网络、数据库技术、密码学及档案管理及检索的有关法律 制度。 支票的自动处理系统是利用计算机图像处理技术与模式识别,首先在支 票图像上截取感兴趣的区域,然后自动将支票上的数据与文字转换成计算机 可以处理的信息代码,代替支票手工键入及处理方式。目前,我国银行普遍 应用电子计算机处理日常业务,但大量金融支票的手工录入,使得投入的人 力物力较多,劳动强度较大,并且影响计算机系统发挥更大的效益,特别是 事后监督业务,要求同样的数据重复输入。因此,支票自动分析与识别的处 理是金融业务自动化处理的关键。 1 2 支票自动处理技术的研究现状 国际上对支票自动处理系统的研究开始于二十世纪八十年代初期。法国、 美国、加拿大、意大利、日本、巴西等国的研究工作开展得比较深入,取得 了重要的成果,目前,已有多个系统在银行进行实验考核。对于国外的研发 方面,有以下几个比较有代表性的,也是很有影响的研究单位,如法国a 2 i a 公司研制的票据自动处理系统,加拿大c o n c o r d i a 大学的c e n p a r m i 中心研制 的票据自动处理系统,美国纽约州立大学c e d a r 中心研制的票据手写体金额 自动识别系统。其中,后面两个单位在字符识别上面有很好的研究。 2 1 绪论 目前在我国市场上还没有已完全应用的商业化支票自动处理系统。我国 票据自动处理系统研究工作始于1 9 8 8 年,最先研究的内容是票据印鉴真伪的 自动验证。在手写体金额识别的研究方面,我国的起步较晚,主要有清华大 学研制的基于密码校验的票据处理系统,南京理工大学与中创软件联合研制 的金融票据索引与督核系统。 1 3 目前存在的问题 目前支票的自动处理还存在很多问题,其中主要有下面几个方面。 1 3 1 支票的倾斜检测 由于支票的信息截取及识别等方面对扫描输入的支票图像倾斜都很敏 感,所以支票的倾斜检测是支票自动处理系统中一个重要的预处理内容。一 般对倾斜检测算法的要求是速度快,精度高,而实际上这两项指标是相互制 约相互影响的,越精确的算法,往往消耗时间越多。目前已经提出了许多针 对不同版面的倾斜检测算法,这些算法主要分为两类,即基于统计的方法和 基于先验知识的方法。其中基于统计的方法进行倾斜检测时,不涉及所处理 版面的内容,因而具有广泛的适应性,例如投影轮廓分析法、h o u g h 变换方法 等,但运算量大,且精度无法保证。而且利用支票的先验知识的方法,运算 的效率和精确度都会得到提高,但应用范围受到很大限制,例如基于文本行 的方法和聚类方法等。目前还没有一种较为通用的支票倾斜检测方法。 4 3 2 截取支票信息区域 支票信息区域的截取就是定位并截取支票图像中的有效信息,在实际应用 中,支票种类多样,在进行支票信息区域截取时,特征的选择、非线性因素 的影响和填写时的人为因素的介入增加了支票信息区域截取的难度。支票上 信息区域主要以下几方面,金额栏、磁码信息、银行l o g o 图标、银行及支票 名称、出票日期等。首先需要对这些信息区域定位并截取,然后进行识别处 支票大写金额串的切分技术研究 理。目前较常用的方法是基于模板匹配的方法来进行区域的定位及截取,本 文采用基于投影的方法,首先定位每个信息区域的大致位置,然后在对每个 区域确定边界截取目标,这两种方法各有优缺点。模板匹配算法速度快,但 是它首先必须求得所有支票的结构信息,即每种支票每个信息区域的位置坐 标,然后对不同种类支票制作不同的模板;投影方法直接对支票进行处理, 但是由于一些干扰信息( 如印章) 的存在,有时候信息区域的边界很难确定。 1 3 3 信息区域的截取及识别 支票自动处理系统最终目的就是对信息区域的正确识别,主要对下面几类 信息进行识别判断。银行l o g o 图标进行识别,判断该支票属于那个银行;对 银行及支票名称进行分割识别,银行及支票名称都为印刷体汉字,书写规范, 分割及识别较为容易;金额栏的分割及识别是支票自动处理的重点也是难点, 由于金额栏中汉字和数字书写的随意性,及银行印章及底纹对这些金额汉字 及数字的干扰,金额栏中金额汉字和数字的正确分割就成为一道难题,而且 对手写体汉字和数字的识别也不像印刷体那样简单;银行日期的切分及识别, 该切分及识别同样属于手写体汉字切分和识别。 1 4 本文的研究内容 根据上面的描述,支票自动处理技术可归纳为如下几个方面:一、支票倾 斜校正;二、截取支票信息区域;三、银行及支票名称切分及识别;四、数 字金额的切分及识别;五、汉字金额的切分及识别;六、出票日期的切分及 识别;七、支票信息的统计。对于每个方面又可细分为若干个小的方面,对 每方面问题分别采用相应技术对其进行研究处理。 本文主要研究以下几方面内容。一、利用基于链码的直线检测算法对支 票进行倾斜校正;二、采用投影方法截取支票信息区域;三、对金额栏大写 金额串进行切分。 4 2 支票图像的倾斜校正 2 1 引言 2 支票图像的倾斜校正 支票的扫描输入是支票自动处理系统的第一步,在支票图像扫描过程中, 由于人为因素和扫描仪走纸机械误差等的影响,支票被扫描成图像的过程中, 或多或少地会出现某种程度的倾斜。这常常会引发以下几个问题:一、倾斜 图像会给字符分割造成困难;二、大部分o c r 方法对倾斜变形的字符都比较 敏感,这会直接影响这些方法的识别精度;三、在表格处理中,图像的倾斜 会引起单元格的定位不准确,从而影响表格字符的提取。因此有必要设计出 一个算法,来自动检测支票图像的倾斜角度,并进行快速倾斜校正。只有对 支票图像的倾斜检测及校正之后,才能对支票图像信息区域截取以及后面任 务。本章内容主要研究支票图像的倾斜校正方法,包括支票图像的倾斜检测 及校正这两个方面内容。 现有支票图像倾斜检测及校正,有手动处理和自动处理两种,手动处理方 法是采用人机交互方式,由用户给出支票图像的倾斜角度,直接实现支票图 像的倾斜校正;自动处理方法则是由计算机自动分析支票图像的特征,计算 其倾斜角度,再通过图像旋转算子对支票图像进行旋转,从而实现支票图像 倾斜校正。显然,前者既耗费人力,又效率低下,已不能满足大量的支票图 像处理的需求。但是由于支票图像的复杂性特点,使得支票图像倾斜的自动 检测难度较大。因此,对支票图像倾斜检测与校正的自动处理方法,至今仍 是一个热点研究课题 5 6 7 8 。 支票大写金额串的切分技术研究 2 2 现有方法简介 人们对图像倾斜检测问题做了许多深入的研究,归结起来,主要的检测方 法可分为5 类:基于h o u g h 变换方法 9 1 0 、基于投影图的方法 1 1 、最近 邻方法 1 2 1 3 、交叉相关算法 1 4 ,基于f o u r i e r 变换的方法 1 5 1 6 。 2 2 1 基于h o u g h 变换方法 h o u g h 变换的基本策略是,由图像空间目标像素的直角坐标( x ,y ) 计算参 数空间中参考点的可能轨迹,并用累加器对计算出的参考点计数。设参数空 间是极坐标( p ,p ) ,则坐标变换公式为 p = x c o s 0 + y s i n o 可以看出,图像中的直线被映射到参数空间的一点( p ,p ) ,而图像中的一 点则对应参数空间中的一条曲线。所以,图像空间中,任意两点( x l ,y 1 ) 和 ( x 2y ,) 所对应的参数空间中的两条曲线将相交于一点( p ,0 ) ,进而通过 ( x l ,m ) ( 吃,儿) 直线的所有点对应参数空间中的曲线都将相交于该点。所以直 线检测问题即转化为在参数空间中寻找极大值的问题。虽然版面中不一定存 在直线,但文本行有很强的方向性,可以通过近似直线进行版面倾斜角度的 检测。由于h o u g h 变换是针对图像中的每个像素进行的,因此计算量大。在 实际应用中,通常采用一些改进算法以减少计算量 1 7 。h o u g h 变换最大的缺 陷就是不适合处理图像占多数的版面。 2 2 2 基于投影图的方法 基于投影图的方法是对投影图形状进行分析的方法。它将版面沿多个特 定方向作投影,得到相应方向上黑色像素点的统计图,描述出黑像素点在指 定方向上的分布情况,由此找出其中峰值最大的投影,从而得到整个版面的 倾斜角度。投影法是一种基于文字行的倾斜校正方法,不适用于版面复杂的 文档,由于要计算多个可能的倾斜角度的投影,计算量较大,而且精度不高。 6 2 支票图像的倾斜校正 2 2 3 最近邻方法 最近邻方法是先找出版面中所有的连通区域,然后根据欧式距离确定每 个连通区域的最近邻,并计算最近邻连通区域中心点间的方向。由于最近邻 主要为同一文本行中的相邻字符,因此可累计计算最近邻的方向矢量,生成 矢量方向的统计图,由此得到的峰值即为版面的倾斜角度。不同的近邻连通 区域可计算出多个倾斜角度,根据大多数倾斜角度的方向确定实际的倾斜方 向。最近邻法具有较高的估计精度,对于具有较多相互邻近的组成部分时, 计算量大,耗费时间长。 2 3 4 交叉相关算法 交叉相关算法是基于投影图方法的特例,它计算固定距离间垂直扫描线 上像素点的分布,同时生成相关矩阵: r ( x o ,s ) = 1 ( x o ,y ) z 1 2 ( x o + d ,y + s ) y 式中厶和厶为两条竖直平行线; d 为厶和厶的间距; s 为平移变量。 若版面存在倾斜现象,则位于同一文本行上的像素点在两条平行的扫描线 上会发生平移。对整幅图像计算上述相关矩阵,并作竖直投影,所得投影图 的全局最大值即为版面的倾斜角 1 8 。这种方法的计算结果比较精确,但是 计算量也大。 2 3 5 基于f o u r i e r 变换的方法 该方法采用基于f o u r i e r 变换的方法检测倾斜角,将版面中所有像素点 进行f o u r i e r 变换,版面倾斜角对应于使得f o u r i e r 空间密度最大的方向。 该方法存在的问题仍是计算量非常大,实际很少采用。 7 支票大写金额串的切分技术研究 2 3 支票图像倾斜检测 为了快速准确地检测支票图像倾斜角度并减少计算量,针对支票图像本 身特点,支票图像中主要直线都集中在支票金额栏区域,并且这些直线是和 支票图像平行和垂直的,所以只要能计算出这些直线的倾斜角度也就能求得 支票图像的倾斜角度,这样就要求首先检测出支票图像中的直线。本文采用自 动处理方法,采用了基于链码直线检测算法 1 9 的支票图像倾斜检测算法。 2 3 1 基于链码直线检测算法 早在2 0 世纪7 0 年代f r e e m a n 就提出了直线链码必须满足的三条准则 2 0 : 1 链码中至多出现两个方向码,且它们在模8 意义下相差1 ; 2 若有两个方向码出现,则其中之一必单个出现; 3 单个出现的方向码总是尽可能均匀地出现在链码串中。文献 2 1 中又 给出tf r e e m a n - 吴定理和增量式直线链码识别算法,进一步证明了这三条准 则是直线链码的充要条件。 但是,上述的准则仅适用于理想直线。众所周知,图像的获取过程中,噪声 的引入是不可避免的。在实际图像中,通过边界跟踪得到的链码几乎不能满足 这三条直线判别准则。因此,研究人员又不断改进,使之能够满足实际应用。 如文献 2 2 中采用上下边界和必经区域约束来检验链码是否属于当前直线段, 但该方法没有摆脱f r e e m a n 准则的束缚,抗噪性不强。文献 2 3 中采用b l 算法 进行直线链码检验,该算法抗噪性有所提高,在一定程度上能够解决一些实际 问题,但其判别方式也过于复杂。 在上述分析的基础上,提出了一种新的基于链码的快速直线检测算法。采 用以下形式表示目标边界的链码串: i :l e n ,x ,y ,4 ,吐,以 其中伪当前链码串的编号;l e n 为当前链码串中链码的总长度;x ,】,为 当前链码串起始点的图像坐标;碣,破,以为当前链码串上各像素的方向码。 1 判断当前链码串中链码的总长度是否满足最小直线段长度约束。如果链 8 2 支票图像的倾斜校正 码总长度小于预设的最小直线段长度阈值工丁,则认为该段链码中没有满足要 求的直线段,直接舍弃。 2 对链码串逐段进行直线段相似度检验。从起点开始,依次选择满足最小 直线段长度约束的子链码串。同时计算子链码串的实际长度和两个端点之间 的理想直线距离,并根据下面公式计算该段子链码串的直线近似度: s :! ! 垦二堡l l e n ( p , ,见) 其中i i 见一见i i 表示端点见与见之间的理想直线距离;l e n ( p , ,p c ) 表示子 链码串从端点p ,到端点见经过像素的实际长度;j 则表示直线段近似度。另 外,在计算链码串的实际长度时,若方向码为o ,2 ,4 ,6 ,则链码连接的两像素 间的实际长度为1 :若方向码为l ,3 ,5 ,7 ,则两像素间的实际长度为2 ,图2 1 为八链码示意图。 2 1 。 4 7 6 、 图2 1 八链码示意图 显然,s 值越大,该段链码串越能表示一条直线。如果s 值小于预设的阈值 s t ,则认为该段链码串不是一条直线。 根据上述分析,基于链码的直线检测算法具体步骤如下: 输入目标边界跟踪得到的链码串。 输出满足预设参数约束的直线段。 1 最小直线段长度验证 顺序判断各条链码串。 如果链码串的长度小于预设的最小直线段长度阈值r ,则舍弃该条链码 串。 2 根据直线段近似度准则从链码串中提取直线段 9 支票尢写金额串的切分技术研究 顺序判断各条链码串。 从起点开始,依次选择满足最小直线段长度约束的子链码串,计算该段 的直线段近似度s 。若s s t ,则该段满足直线约束,转,否则舍弃该段,继续 判断下一段子链码串。 若前一段子链码串也满足直线约束,则考虑相邻的两条子链码串能否 合并成一条更长的直线段。将前一段链码串的起点到本段链码串的终点间的 这段链码看作一条新的链码串,计算其直线段近似度s 。若s s t ,则进行合 并,否则将本段子链码串标记成一条新的直线段。 若己到达链码串终点,则结束,否则转继续判断下一段子链码串。 2 3 2 支票图像直线检测 在对支票图像进行直线检测之前,首先要得到支票图像上所有目标的边 界,这样就要求首先对支票图像进行预处理,然后获取目标的边界集合,目 的是求得支票所有直线边界的像素点集合。这里的预处理主要是对支票图像 进行二值化、平滑去噪等。 图22 原始支票样本 对图像二值化处理的关键是最佳闺值的选择。该阈值将图像分为两个区 域,分别为目标和背景每个区域有着相近的灰度值。二值化闽值选择过小 易把部分背景错误分为目标:阐值设置过大则会把部分目标分为背景。目前 有多种闽值选取方法依闽值的应用范围可分为全局阈值法、局部阈值法和 动态阈值法等。全局闽值法是指在二值化过程中只使用一个闽值;局部闽值 2 支票圈像的倾辫校正 法则是由像素的灰度值和像素周围局部灰度特性来确定二值化的阈值;动态 阈值法的阈值确定不仅取决于该像素的灰度值及其周围像素的灰度值,而且 与像素位置信息有关。一般来说全局阈值法对质量较好的图像较为有效; 而局部阈值法则适应于较复杂的图像。本节采用全局阈值法对支票图像进行 二值化处理。 对原始支票样本图像( 图2 2 ) 进行二值化处理,如图2 3 所示,然后计 算所有目标的边界。 圈23 二位化田像 对二值化图像中每个目标计算边界,选取目标边界像素个数大于最小直 线段长度阈值l t 的边界作为直线检测对象,本文选取l t = 1 0 0 。所有这些检 测对象如图2 4 所示。 圈24 检测对象 根据上小节23 1 直线检铡算法对所有检测对象进行直线检测。本文在 对支票进行直线检测采用的直线段相似度阐值s t = 09 2 。根据直线检测方法 判断其是否为一条直线,如果确定为一条直线则根据直线的像素点显示该条 支票大写金额串的切丹技术研究 直线,所有直线如图25 所示。 图25 检测出的直线 2 3 3 支票图像倾斜角度的确定 针对支票图像本身特点,支票图像中主要直线都集中在支票金额栏区域, 并且这些直线是和支票图像平行和垂直的,并且与支票图像平行的直线远多 余与支票图像垂直的直线,所以只要能计算出这些直线的倾斜角度也就能求 得支票图像的倾斜角度。对前面检测出的每条直线计算其倾斜角度,由于检 测出的这些直线都是以坐标形式表示的,所以对检测出来的每条直线运用最 小二乘法进行直线拟合,求出每条直线的斜率。 根据这些直线基本在与支票图像平行或者垂直方向,对这些斜率进行分 组,阈值为0 0 0 5 ,即斜率相差在00 0 5 范围之内的为平行线,这样就可以计 算出那些直线为支票的横线,那些为支票的竖线,并且可以根据那组的直线 数量最多就可以判定该组的直线段为支票图像上的横线。然后在对该组直线 的斜率计算均值,并且转化为倾斜角度这个角度即为支票的倾斜角度。 根据上面方法,依据前面检测出的直线计算支票图像的倾斜角度,计算 得倾斜角度k = 5 0 0 5 9 。 2 3 4 工程应用中的方法 在工程应用中为了节省时间开销,一般根据支票的边界进行倾斜角度的计 算。考虑实际支票在扫描过程中倾斜角度都非常小,一般在5 度以内,并且 2 支票圈像的倾斜校正 支票图像的边界清晰,边界像素与扫描背景像素相差非常大。首先对支票图 像二值化,计算图像上下左右四个边界点,根据这四个边界点截取支票图像, 即去掉大部分扫描背景。如图2 6 所示。接下来在左边界点和上边界点之间对 二值化图像从上至下计算其非零点,这些非零点组成的图像即支票图像的上 边界,如图2 7 。然后对这些边界点用最小二乘法进行直线拟合,计算直线的 斜率,将斜率转换成角度。该角度即为支票的倾斜角度。 图26 支票圉像 2 3 5 直线柱测意义 图27 支票图像的上边界 在扫描支票的时候,由于扫描背景的原因,对于支票在扫描后支票图像边 界的模糊情况,则采用上面工程应用中常用方法就不适合,这就需要应用支 票图像中内部直线进行倾斜校正,本文讲述的直线检测算法对于这种情况能 准确的解决,该算法实用性强。本节直线检测算法还可以应用到后面待处理 的金额栏截取中,首先根据前面方法检测出支票图像中的直线,然后根据金 额栏框线的长度约柬( 框线长度不应该小于一定的阈值) 及金额栏宽度约束 计算出金额栏横向的上下两条框线,根据计算出的上下框线位置在灰度图像 中截取相应图像即可。 支票大写金额串的切分技术研究 2 4 支票图像旋转校正及截取 2 4 1 校正及截取支票图像 根据233 节计算出的支票图像倾斜角度,对支票进行旋转校正 3 5 。由 于只是根据这个角度旋转还不能保证该支票就一定是正着旋转的,换句话说 就是可能在旋转后支票倒着摆放了,这个问题将在下节2 42 的再校正图像进 行处理。对原始支票图像按照上面计算出的倾斜角度进行旋转校正,如图28 所示。 图28 旋转后的图像 对旋转校正后的图像截取支票图像的有效区域。对校正后的支票图像进行 纵向和横向投影,可以明显看出边界像素差,选择合适的阈值就可以截取图 像上的支票。在这里选取横向为9 0 0 ,纵向为3 0 0 作为闽值,先截取支票的上 边部分,由上至下进行相邻像素和的比较,若相差9 0 0 或以上则该位置即为支 票的上边界,用同样的方法求取支票的下、左、右边界。根据计算出的支票 四个边界在图2 8 截取相应的图像就得支票图像,如图2 9 所示。 图29 截取的图像 2 支票图像的倾斜役 2 4 2 再校正过程 本节主要任务是对图像进行旋转校正后截取的图像可能存在图像倒立的 情况进行再校正,也是一个后处理过程。主要方法是对截取后的支票图像首 先进行二值化处理,然后对其横向投影。根据对支票的票面像素分析,其中 金额栏的框架在整个支票的上方位置,并且二值化后金额栏框线呈现堆大的 峰值。如果支票图像是正立摆放,则横向投影后这个最大或者次大的像素和 在整个支票的上方位置,如果支票图像是倒立摆放的则正好相反。这样就可 以根据横向投影后像素和中最大或者次大的位置进行判定图像是否正立。如 果在图像的上方位置则表示图像是正立的,不需要进行旋转。相反如果在图 像的下方位置则表示图像是倒立的,对图像进行1 8 0 度旋转即可。这样就得到 了需要的支票图像,如图2 1 0 所示。 圈21 0 再校正后的囱像 2 5 实验仿真及结果分析 从北京邮电大学提供的支票样本图像中随机选取5 l 张进行支票图像倾斜 校正实验,把每幅图像以5 度为步长分别逆时针旋转0 、5 、1 0 、1 5 、2 0 度。 对每张图像检测角度,得到了表2 1 的实验结果。以每种倾斜角度为一组进 行实验,得到一组实验结果,然后对这5 组数据进行统计,求方差值,得到 了表22 的实验结果。 表2 1 算法综合实验性能裹 l 角度 05 l o1 52 0 支票大写金额串的切分技术研究 l0 0 0 3 84 9 5 2 31 0 0 0 7 91 5 1 4 6 41 9 9 6 2 4 2- 0 1 7 5 84 9 6 6 91 0 0 4 7 31 5 0 0 8 61 9 9 9 9 2 30 1 5 8 45 0 6 81 0 0 0 5 3 1 5 0 4 0 42 0 0 1 1 3 4- 0 3 1 5 44 9 6 8 51 0 0 1 0 11 5 0 0 0 51 9 9 8 4 9 50 0 3 7 84 9 6 8 31 01 4 9 9 81 9 9 8 9 7 60 0 0 3 4 9 9 4 4 9 9 9 81 4 9 9 4 9 2 0 0 0 4 3 7- 0 0 5 6 45 0 1 21 0 0 0 7 91 5 0 0 6 41 9 9 9 9 4 8- 0 0 4 2 34 9 7 99 9 9 8 41 5 0 0 4 42 0 0 1 1 9 90 1 4 5 65 0 8 7 4 1 0 0 1 6 51 5 0 0 1 9 2 0 0 3 4 6 1 0- 0 0 4 1 45 0 0 6 71 0 0 1 8 71 5 0 2 72 0 0 1 1 10 0 3 9 35 0 3 4 81 0 0 0 5 41 4 9 1 8 41 9 9 1 5 6 1 20 1 1 5 55 0 0 2 29 9 9 5 91 5 0 0 7 41 9 9 9 6 1 1 30 0 4 7 34 9 9 29 9 8 8 71 4 9 8 6 72 0 0 1 5 1 40 0 7 3 84 9 9 6 19 9 9 71 5 0 0 1 62 0 0 1 4 2 1 50 0 1 3 94 9 2 91 0 0 0 0 11 4 9 9 0 32 0 0 1 3 4 1 6- 0 0 0 6 64 9 7 2 79 9 9 7 91 5 0 0 3 31 9 9 9 0 1 1 70 0 5 6 9 5 0 6 2 5 1 0 0 4 2 91 4 9 9 8 1 2 0 0 0 5 3 1 8- 0 0 4 5 55 0 1 5 31 0 0 0 7 11 4 9 9 6 12 0 0 0 2 6 1 90 0 6 2 95 0 0 8 29 9 9 6 31 5 0 0 52 0 0 0 6 1 2 00 1 2 3 2 59 9 9 7 21 4 9 9 4 71 9 9 9 0 4 2 10 0 5 3 74 9 5 4 91 0 0 0 6 11 5 0 0 5 72 0 0 0 3 6 2 2- 0 0 0 0 65 0 0 l1 0 0 0 3 31 5 0 6 1 52 0 0 0 4 3 2 30 0 0 5 6 5 0 4 6 19 9 9 7 11 5 0 3 1 61 9 9 9 6 5 2 4- 0 0 3 94 9 7 6 39 9 9 1 11 5 0 0 0 31 9 9 9 9 3 2 50 1 6 9 14 9 9 5 69 9 8 7 91 5 0 0 2 72 0 0 3 3 2 2 6o 0 1 7 24 9 9 3 4 9 9 8 9 81 4 9 9 7 21 9 9 9 1 6 2 70 0 1 7 54 9 9 2 89 9 9 8 51 4 9 9 62 0 0 0 0 5 2 80 0 5 4 84 9 5 0 31 0 0 0 1 81 4 9 9 0 82 0 0 0 0 3 2 90 0 0 1 4 4 9 8 7 41 0 0 0 8 31 4 9 9 6 91 9 9 9 3 0- 0 0 8 34 9 5 3 51 0 0 0 6 51 4 9 9 8 51 9 9 9 8 4 3 1- 0 0 0 5 34 9 9 9 1 0 0 0 0 2 1 4 9 9 6 32 0 0 1 3 3 3 2 0 0 4 3 7 5 0 0 9 61 0 0 1 0 71 5 0 0 5 22 0 0 0 5 1 3 30 0 2 l5 0 6 7 51 0 0 7 8 61 5 0 3 2 52 0 0 0 7 l 3 40 1 4 1 4 4 9 0 6 79 9 6 8 91 4 9 2 4 82 0 0 1 3 7 3 5- 0 0 8 5 94 9 8 0 59 9 9 4 21 4 9 9 61 9 9 8 9 9 3 60 0 6 l5 0 2 8 4 1 0 0 0 0 6 1 5 0 0 5 22 0 0 1 3 70 0 3 0 55 o l l9 9 9 9 51 5 0 3 1 52 0 0 0 7 9 3 8- 0 0 6 0 95 0 3 6 99 9 9 2 51 5 0 6 4 61 9 9 8 9 8 3 90 0 4 8 75 0 3 3 4 1 0 0 7 3 51 5 1 5 6 5 2 0 0 2 7 5 4 0一o 0 0 1 34 9 9 5 61 0 0 0 1 81 5 0 0 5 52 0 0 2 4 9 4 10 0 4 0 44 9 9 0 61 0 0 0 0 91 5 0 0 1 52 0 0 0 3 7 4 2- 0 0 1 5 9 5 0 2 6 81 0 0 0 5 61 4 9 9 5 9 1 9 9 8 2 4 4 30 0 5 2 45 0 0 7 99 9 9 9 41 5 0 0 4 41 9 9 8 2 4 40 0 8 5 94 9 0 1 9 9 2 1 5 1 5 0 0 31 9 9 1 7 1 1 6 2 支票图像的倾斜校正 4 50 0 0 2 94 8 2 1 71 0 0 0 1 51 5 0 1 5 3 2 0 0 0 4 4 6- 0 1 3 9 34 9 9 5 79 9 9 2 8 1 4 9 9 3 21 9 9 9 8 8 4 7一o 0 2 1 35 0 1 l ll o 0 0 5 71 5 0 1 4 12 0 0 4 4 2 4 80 0 8 4 55 0 0 7 39 9 9 8 61 4 9 8 61 9 9 8 4 5 4 9一o 0 1 5 l4 9 9 3 61 0 0 0 4 31 5 0 1 2 91 9 9 9 8 8 5 0- 0 0 7 6 85 0 3 7 39 9 9 6 31 4 9 8 9 81 9 9 9 8 1 5 l一0 1 3 85 0 1 0 91 0 0 6 1 41 5 0 6 92 0 0 8 0 4 表2 2 每组倾斜角度下的方差 角度 051 01 52 0 方差 0 0 0 7 60 0 0 7 60 0 0 0 50 0 0 1 50 0 0 0 6 该算法具有很多优点。一、精确度高。表2 1 中每张支票检测出的角度 与实际倾斜角度相差甚小,最大相差值小于0 2 ,且表2 2 每组结果的方差值 最大的为0 0 0 7 6 ,应正了精确度高的特点。二、速度快。平均每张支票图像 需要6 秒,较其他方法有大幅度提高。在实际的工程运用中,速度还会大大 提高。三、算法稳定。由于这5 1 幅支票样本图像均来自实际扫描的图像,这 些图像可能由于印章的干扰复杂,实验结果数据是反映这些情况一个综合指 标,所以该算法稳定。四、算法与文档图像的纹理无关。不管是文字、印章 及表格,均不会影响算法的性能。 1 7 支票大写金额串的切分技术研究 3 1 引言 3 支票信息区域截取 所有的文档都有自己的结构 2 4 ,或者是读者感觉到的,或者是定义好 的出版物的基本单元,如字母、单词、线或者分栏。前一种结构被称为文档 的逻辑结构,而后者则是文档的物理结构。文档的物理结构可能因为主观原 因( 不同的人对同一文档内容的结构安排认识不同) 或客观原因( 不同类型的 文档包含的逻辑单元各有不同) 而有所不同。文档的物理结构比逻辑结构要清 晰,它包含的元素少而且与内容无关。处理文档时,需要对不同性质的内容 进行不同的处理,譬如对文字区域进行字符识别、对图像区域进行图像压缩、 对图形区域进行矢量化,这就要求将文本行、黑白图像和图表分开,另外, 还必须指出文本分几列,这样才能按正确地顺序进行转换,这些都要求必需 对文档的版面结构进行分析和理解。 金融支票图像是信息的高度抽象与概括,制定支票的目的是使得从支票 各栏目中读取相应的信息非常容易。一般来讲,支票是一种严格定义的表格 式版面。内容包括标题、指示栏目( 定域) 及用户填写栏目( 变域) 。栏目由纵 横直线相交的矩形框构成,这些都是固有结构。需要用户填写的内容可能是 打印机打印的或手写的汉字、数字或符号等,因此金融支票图像是印刷体汉 字( 标题) 、印刷体字符、线图形、手写汉字、手写数字及手写符号多项识别 区域的集合。 支票图像信息区域截取的目的就是定位并分割栏目中的待处理识别区域 的有效信息,在实际应用中,支票种类多样,印刷支票由于非线性因素的影 响和填写时的人为因素的介入增加了支票图像信息区域截取的难度。支票信 息区域截取就是对扫描得到的支票图像进行结构上的分析,根据各区域位置 1 8 3 支票信息区域截取 的相对关系和区域性质,将支票图像分割为不同性质的独立分栏的过程。尽 管有相当多的研究,现行的大多数商业银行还是依赖于手工分割和分类,或 需要为自动处理进行仔细的区域定位。这两种约束都是不理想的,它使得整 个支票处理系统的自动化程度有很大缺陷。所以支票信息区域截取的研究越 来越受到重视。需要指出的是,支票信息区域截取问题与机械图中文本、图 像的分割问题不是相同的,后者文字标识和线性图案混在一起,而前者是不 同种类的物质混合。在一般o c r 系统中,图像中文本标号或线性图案通常被 忽略,重要是在字符识别中快速获得主要文本,而其他成分在以位图形式保 存

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论