(机械设计及理论专业论文)基于交叉点提取的工程图表图像识别系统研究.pdf_第1页
(机械设计及理论专业论文)基于交叉点提取的工程图表图像识别系统研究.pdf_第2页
(机械设计及理论专业论文)基于交叉点提取的工程图表图像识别系统研究.pdf_第3页
(机械设计及理论专业论文)基于交叉点提取的工程图表图像识别系统研究.pdf_第4页
(机械设计及理论专业论文)基于交叉点提取的工程图表图像识别系统研究.pdf_第5页
已阅读5页,还剩67页未读 继续免费阅读

(机械设计及理论专业论文)基于交叉点提取的工程图表图像识别系统研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

浙江大学硕士学位论文 摘要 扫描文档图像识别是c a d c a m 和模式识别领域中的一个重要研究方向,包 ,括扫描工程图纸识别、扫描表格票据图像识别和工程图表图像识别等多个方面, 本文主要研究工程图表图像的识别问题。 第一章对曲线图表图像计算机智能化识别的必要性进行了分析。以指导图表 图像识别研究为出发点,对国内外有关扫描工程图纸和表格票据图像的矢量化识 别方法进行了综述,并在此基础上建立了论文总体框架。 第二章通过分析图表识别系统的基本要求,探讨了此系统的开发环境的选择 等问题。并根据需求分析和模块划分原则将系统划分为用户查询模块和图表识别 模块,然后详细讨论了这两个模块的基本功能和相互关系。 第三章研究了图表图像的预处理技术,介绍了一种基于数学形态学的噪声过 滤方法,并设计了四类对图表图像进行平滑的数学形态学模板算子。基于h o u g h 变换,研究了图表图像的倾斜校正方法和图文分离方法。 第四章针对矢量化识别中出现的交叉点畸变现象,结合图表图像的结构特 征,提出了基于交叉点提取的坐标线提取算法和基于斜率跟踪的曲线识别算法, 分别提取图表图像中的坐标线和曲线图元,实现了图表图像矢量化识别。 第五章在分析一般印刷体数字识别技术的基础上,提出了一种基于数字质心 的模板匹配数字识别算法,不经过细化,直接实现图表图像中坐标刻度的提取和 定位。 第六章对图表图像识别系统的前后处理模块进行了研究。结合数字图像处 理、图元编辑和曲线拟合等相关技术,实现了图表图像的图元编辑、坐标线和曲 线拟合和重绘;并结合数据库技术,对用户查询模块进行了具体实现。 关键词:图表图像识别,矢量化,图像处理,数字识别,数学形态学,计算机辅 助设计 浙江大学硕士学位论文 a b s t r a c t t h er e c o g n i t i o no fs c a n n e di m a g eo fd o c u m e n t sd r a w i n gi sa ni m p o r t a n ts t u d y o b j e c ti nf i e l d so fc a d c a ma n dp a t t e r nr e c o g n i t i o n ,s u c ha se n g i n e e r i n gd r a w i n g a n df o r md r a w i n gr e c o g n i t i o n h o w e v e r , f e ww o r kh a db e e nd o n ei nt h ep a s ta b o u t s c a m l e di m a g eo f e n g i n e e r i n gd i a g r a m t h ef i r s tc h a p t e ro f t h i sp a p e rm a i n l yr e v i e w s t h ee x i s t i n gr e s e a r c h ,d e s c r i b e st h ea d v a n t a g ea n dw e a k p o i n t so f e a c hm e t h o d ,a n d a t t h es a m et i m eb u i l d so l l ro w n g e n e r a lt h e o r yf r a m e w o r k i no r d e rt og u i d et h er e s e a r c h o fe n g i n e e r i n gd i a g r a mr e c o g n i t i o n a c c o r d i n gt ot h es t r u c t u r ea n dc h a r a c t e r i s t i co f d i a g r a m ,t h ep r e - p r o c e s s i n gt e c h n o l o g y o fd i a g r a m i m a g e ,t h e v e c t o r i z a t i o no f c o o r d i n a t el i n e sa n dc u r v e si nt h ed i a g r a m ,t h er e c o g n i t i o no fc o o r d i n a t es c a l en u m b e r a n du s e r q u e r y f u n c t i o na r ed i s c u s s e di nd e t a i li nt h e r e m a i n i n gp a r t so f t h ep a p e r 。 t h es e c o n dc h a p t e rg i v e st h es y s t e m d e s i g no fd i a g r a mi m a g er e c o g n i t i o n s e l e c t sas u i t a b l ed e v e l o p i n ge n v i r o n m e n tb ya n a l y z i n gt h ef u n c t i o na n dc a p a b i l i t y r e q u i r e m e n to fd i a g r a mi m a g er e c o g n i t i o ns y s t e m t h ew h o l es y s t e mi sd i v i d e di n t o d i a g r a mr e c o g n i t i o nm o d u l ea n du s e rq u e r ym o d u l eo nt h eb a s i so fm o d u l ed i v i s i o n p r i n c i p l ea n df a c t r e q u i r e m e n t t h et h i r d c h a p t e rd e s c r i b e st h ep r e p r o c e s s i n gt e c h n o l o g y o fd i a g r a mi m a g e r e c o g n i t i o n a n o i s e f i l t e r i n g m e t h o db a s e do nm a t h e m a t i c a l m o r p h o l o g y i s i n t r o d u c e d b a s e do nh o u g ht r a n s f o r m ,t h em e t h o d so fd i a g r a m a d j u s t a n d i m a g e r c h a r a c t e rs e p a r a t i o ni sa l s op r o p o s e d i nt h e c h a p t e r t h ef o r t l lc h a p t e rd i s c u s s e st h ek e r n e la l g o r i t h mo fd i a g r a mi m a g er e c o g n i t i o n t h e a n a l y s i so f t h er e c o g n i t i o na l g o r i t h mo f e n g i n e e r i n gd r a w i n g sa n d f o r m d r a w i n g s h a ss h o w e dt h a tt h ed i s t o r t i o nn e a rc r o s sp o i n ta r e ai s a l w a y sah a r dp r o b l e mi n d r a w i n gv e c t o r i z a t i o n s od i f f e r e n tm e t h o d sa r eg i v e nt od e a lw i t hd i f f e r e n to b j e c t s s u c ha sc o o r d i n a t el i n e sa n dc u r v e si n d i a g r a mi a m g e t og e t i n f o r m a t i o no f c o o r d i n a t el i n e s ,av e c t o r i z a t i o nm e t h o db a s e do nc r o s sp o i n te x t r a c t i o ni sp r e s e n t e d c r e a t i v e l y , a n d f o rt h ec u r v e o b j e c t s i nt h e i m a g e ,a n o t h e ra d a p t i v et r a c k i n g p r o c e s s i n gm e t h o d b a s e do n s l o p e i sp r e s e n t e d t h ef i f t hc h a p t e rd e a l sw i t ht h ep r i n t e dd i g i t p r o c e s si nd i a g r a mi m a g e ap a t t e r n m a t c hm e t h o db a s e do nd i g i tm a s sc e n t e ri si n t r o d u c e dt oa c h i e v et h er e c o g n i t i o no f s c a l ed i g i t si nd i a g r a m i m a g e t h es i x t hc h a p t e ri n t r o d u c e st h ed e s i g no fp r e m o d l l l e sa n dp r o m o d u l e si n d i a g r a mi m a g er e c o g n i t i o ns y s t e m b a s e do nt e c h n o l o g yo fi m a g ep r o c e s s ,c o m p u t e r l j 浙江大学硕士学位论文 g r a p h i c ,a n dd a t a b a s e ,t h ed e s i g no f s u b - m o d u l e si sd i s c u s s e di nd e t a i l k e y w o r d s :d i a g r a mi a m g er e c o g n i t i o n ,v e c t o r i z a t i o n ,i m a g ep r o c e s s ,c a d ,d i g i t r e c o g n i t i o n ,m a t h e m a t i c a lm o r p h o l o g y i i j 浙江大学硕士学位论文 第一章绪论 ,摘要j 本章分析了图表图像计算机 y 3 4 的必要性,同时对现有工程图纸图像、 表格图像和图表图像识别技术进行了回顾,分析了图表图像的整体结构特征及其 与x - 程图纸图像、表格图像的异同,并介绍了本文的主要研究内容。 1 ,1 课题的提出 随着计算机图形学、计算机图像处理、模式识别和人工智能等技术的发展, 以及图像输入输出设备的大量出现,扫描图像的识别越来越受到人们的重视。如 工程图纸扫描图像的矢量化识别就是用扫描仪将大批的工程图纸扫描输入计算 机,经识别、解释后,将光栅图转储为在一般c a d 软件中可编辑的矢量文档, 以便于用户进行修改或进行创新设计。近年来,由于实际应用的需要,扫描图像 的识别技术在不同的领域得到了更为广泛的使用,如适合银行使用的银行票据识 别,在二维动画辅助制作领域的扫描铅笔稿图的矢量化研究等等。 曲线图表是工程设计中广泛使用的一种数据表达形式,由于能够直观、有效 地反映设计中出现的那些不宜用文字叙述的设计数据,在工程设计中具有很重要 的作用。实际设计中引用的曲线图表有相当一部分来自文献资料,由于这些资料 通常保存在纸介质上,为获取这些曲线图表中的数据,必须事先进行人工处理, 以往的处理方法一般有两种: ( 1 ) 在图表图形上均匀或非均匀地人工查出一系列离散点,而后利用这些离 散点建立二维表,当查找不在离散点上的数据时,采用插值方法计算; ( 2 ) 利用人工产生的离散点构造曲线拟合公式,如最小二乘法拟合、样条函 数拟合等,然后套用公式计算相应的设计系数。 这两种方法的最大缺点是准确性不高:人工获取离散点时会产生误差,在插 值计算时又会产生误差。当所得的系数参与设计运算时,上述误差还可能被放大, 从而使设计过程出现反复或使设计的产品不合格而造成经济损失。如通过将保存 在纸介质中的图表数据扫描录入计算机,得到曲线图表的点阵图像,然后应用计 算机图像识别技术,让计算机直接进行曲线图表数据的读取,不仅可以提高设计 精度,也便于实现产品设计的自动化,减少可能的损失。 曲线图表图像的结构和工程图纸图像、表格图像等的结构具有一定的相似 性,如:都包含大量的随机噪音,都需要进行预处理;与工程图纸图像类似, 处理的主要对象也为曲线,也都存在大量的曲线与直线,直线与直线的交叉点; 与表格图像类似,均具有一定的结构,如曲线图表图像中的坐标线和表格图像 浙江大学硕士学位论文 中间隔线基本上为水平线和垂直线,其间距具有一定的联系。 另一方面,曲线图表又具有其本身的固有特征。它们一般由坐标线、曲线、 刻度值等组成。工程图表图像中曲线形状比较复杂,种类多种多样,不像工程图 中所包含的主要是直线、圆、圆弧、椭圆等具有先验数学模型的标准元素,对它 们进行识别和拟合较为困难。 由于曲线图表图像的特殊数据结构,因此无法直接采用现成的工程图纸图像 或表格图像识别系统,根据其特点对其进行矢量化研究,不但具有较大的实用价 值也具有一定的理论意义。 1 2 扫描图像识别技术综述 工程中常见的图像数据包括工程图纸扫描图像、表格扫描图像、曲线图表扫 描图像等。扫描图像的识别技术是- f g 综合技术,涉及计算机图像处理,计算机 图形学,模式识别和人工智能等多个学科,其核心是图形识别,一般包括三个方 面的内容,即前处理、矢量化和后处理。其中矢量化完成光栅图骨架或芯线的提 取,是扫描图像识别的基石和难点。 扫描图像识别的前处理包括噪声过滤、图像平滑,倾斜校正,二值化、角点 检测、图文分离等;后处理包括直线、曲线的分离与识别,直线和曲线的逼近与 拟合,图形实体的参数如圆心、半径或直径、曲率、斜率等的求取,图形实体的 属性求取,图形与文字符号的相互印证等。 工程图像的矢量化其实质就是将图像的光栅数据转换为图形数据,并保持相 应的拓扑结构,图形包括直线、圆弧、曲线以及字符的笔划等。工程图像的一个 重要特征就是图像中存在大量由图线相交而形成的交叉点现象。交叉点信息不仅 包含了相交图线的类型和数目,而且反映了图线的矢量化跟踪方向信息,是表达 图像整体拓扑结构的一个重要特征,其有效识别和精确提取是扫描图像矢量化的 关键所在。 1 2 1 工程图纸图像的矢量化方法 工程图纸扫描识别的研究发展至今已有三十多年,国内外对其矢量化做了大 量的研究,综合起来主要有以下几类: ( 1 ) 基于网格的方法:网格法【】通过检测固定或大小可自适应变化的系列网 格上黑像素的分布趋向进行线跟踪。网格法虽然处理速度较快,但对交叉点的提 取与精确定位都存在困难。 ( 2 ) 基于轮廓跟踪和匹配的方法:轮廓跟踪法【5 。7 j 是依据线的双边轮廓信息进 行跟踪,从中抽取芯线,进而矢量化的方法。边缘轮廓法较易得到线宽信息,但 浙江大学硕士学位论文 对交叉点的处理比较困难,同时由于该算法是一种迭代算法,不但存在种子点的 选取问题,而且算法的时间较长。 ( 3 ) h o u g h 变换法:h o u g h 变换法 8 - t 0 j 是一种统计识别方法,当被检测的曲 线能够用参数方程表示时,通过将图像上的像素向参数空间映射,然后在参数空 间里选取具有较大值的点,从而得到描述图形的轨迹。h o u g h 变换法抗噪声性能 好,能够处理较模糊的图像,适合于从模糊图像中提取某种潜在的图线( 如直线) 。 但难以检测图线交叉的情形,且需要较大的存储空间,算法的计算量大。 ( 4 ) 基于扫描段的算法:扫描段法【l “”】采用扫描串( 行程编码) 作为基本处 理单元,利用预先建立的信息头指导后续跟踪,在交点图元与线段图元上实现线 与圆弧的矢量化,当前有一些整体识别方法采用的就是基于此类的算法,但由于 复杂交叉点的扫描段呈无序状态6 。,故较难处理交叉点的识别。 ( 5 ) 基于细化的算法【1 7 】i “】:细化方法是一种比较经典的方法,先通过细化处 理得到描述图形拓扑的骨架点列,再对骨架点列的跟踪、拟合得到骨架的矢量化 数据。从对细化算法的评价和实际应用来看i l9 1 ,细化一般会造成交叉点的畸变、 线宽信息丢失、产生伪分支与拐角钝化等问题,从而使后续的正确跟踪、拟合与 图形重构产生困难。同时细化算法一般比较费时。但由于基于细化的识别处理算 法是工程图纸识别处理中使用广泛的技术,所以近年有专门针对交叉点畸变校正 的研究【2 0 2 扪,但由于交叉节点的畸变复杂多样,故对交叉点的处理及过交叉点的 长线的矢量化问题一直没有很好解决。 ( 6 ) 基于视窗的算法:视窗法【2 3 】采用很小的视窗对图形进行连续跟踪,然后 将各窗口内的图形基元与预先定义好的几十种图形模式,如直线、端点、x 型和 y 型交叉点模式等进行匹配,先判定窗口内图形基元的种类,再将其矢量化,然 后再由跟踪控制图中的链码的连通关系配合拟合算法实现整图的矢量化。该算法 抗噪声性能好,能得到图线的线宽信息。但窗内图形基元与预设的模式库中的图 形模式如何有效匹配的算法问题没有很好的解决,也没有提出适应性强的对窗内 图形基元矢量化的一般方法,且匹配的准确性受库中的图形模式的种类、数量、 典型性等因素的影响。同时窗口跟踪步长的选取也影响整图的矢量化精度。 ( 7 ) 基于知识的整体识别方法:基于知识的方法【2 4 】是近年来尝试研究的整体 图形解释方法,其基本思想是先建立包含各类图形实体关键属性的知识库,对于 从图中某部分提取的基元,先根据知识库中的知识判别基元的类型,然后依据该 基元与周围图形的关系网络( 几何及结构联系网络) ,进一步识别其它基元或合 并同类基元,从而达到矢量化的目的。由于该类方法依赖几何及结构联系网络进 行推理,而这种网络的构建需要搜索与当前基元相关的各个图形区域,显然缺乏 效率,同时图形中各相关图形之间的几何与结构联系一般较复杂,难以用某种决 策或知识自动有效地描述。 浙江大学硕士学位论文 1 2 2 表格图像的识别算法现状 表格作为一种特殊的文本,其最大的特点为结构化,即直线和明确的空白分 隔符将文字分隔成独立的表格单元。表格线基本上由水平线和竖直线组成,目前 大多数表格识别也正是运用这一特点得到各个单元。表格识别过程大致可分成3 个步骤【2 5 】:1 ) n 过表格分析得到表格的版面结构;2 ) 表格文字提取:3 1 对提取的 文字使用o c r 进行识别。 表格分析作为表格处理的第一步,其结果的正确性直接影响到能否正确提取 表格中的信息。目前大部分对表格分析的研究都针对特定的表格,根据已知的先 验知识获得表格的结构。 同工程图纸一样,表格图像分析所面临的主要问题是如何建立整体的表格结 构,并从整体结构出发处理局部细节,如断线和多余线等。如果抽取的表格线是 完全理想的,即没有断线和多余线,则在仅由表格线构成的图像中跟踪它内部的 矩形就可以得到全部的矩形块,但实际上这一点并不能很容易地得到实现。 文献1 2 6 1 采用基于投影方法检测表格线位置,然后用在相应位置寻找角点 的办法抽取矩形块。文献e 2 7 1 采用细化后再提取特征点的方法,但细化会产生 畸变,而且没有好方法把字符中和表格线上的特征点区分开来。文献 2 8 先用 连接块分析去掉一些孤立的字符,然后用行相邻图( 1 i n ea d j a c e n tg r a p h ) 检测表格 线段,再从图像搜索关键点,由关键点搜索单元。该方法可以处理字符和表格线 粘连的情况。文献 2 9 用h o u g h 变换抽取表格线段,然后将其组成一个图, 再在图上进行搜索。文献 3 0 3 用块相邻图抽取表格框架而不抽取单元。上述4 种方法都没有考虑表格线可能的断线问题。文献 3 1 结合了从原图像和缩小后 图像得来的轮廓。由于一些在原图像中跟踪不到的矩形块的内环会出现在缩小后 的图像中,这种方法对小的断线效果较好,但是当断线超过相邻字符行距离的一 半或表格线与相邻字符距离的一半时,连接断线的缩小比例会连接相邻行字符或 者表格线与相邻字符,从而在缩小后的图像中丢失矩形块。文献 3 1 的结果证 实,这种方法可以克服0 3 2 m m 的断线。文献e 3 a 1 概述了一种连接表格线交叉 点以克服断线的方法,它需要先去掉非真实表格线上的线段而留下真实表格线上 的线段,这是很难做到的。文献e 3 3 1 提出了一种新的独立模型表格单元分析方 法,给出了一种矩形块抽取算法。它以抽取的表格线为基础,在扫描水平表格线 和垂直表格线的过程中校验矩形块的边,抽取矩形块。在分析矩形块之间的约束 关系之后,引入迭代法来使抽取结果满足这些约束关系。迭代还进一步用来处理 一些特殊情况和知识。校验边时兼顾表格线信息和原图像信息,通过增加一些搜 索,可以处理很多复杂的情况。 由于表格图像结构与曲线图表图像结构有一定的相似性,故其处理的方法中 浙江大学硕士学位论文 有许多思路和方法可以借鉴。通过对有关图表图像识别算法的分析可以看出:虽 然考虑问题的基点不同,但大多数算法中都是首先从提取图表图像的表格结构出 发,而且有些文献也已考虑到可能出现的断线和假表格线段等情况。另外,从各 种研究结果还可以得出这样的结论:如仅由局部的区域来抽取矩形块单元,则很 难解决出现断线和假表格线段等问题,只有从整体出发才有可能较好地实现这一 目标。对此,文献 3 3 1 和f 2 9 1 给出了一些可行的思路。 1 2 3 图表图像的识别算法现状 以往对曲线图表图像的处理方法主要以人工处理为主。目前虽然也有人通 过图像处理来解决图表图像的问题,如文献 3 4 l 从数学形态学的角度对图表图像 进行处理,提出了图像细化以及图像增强的一些算法,同时也取得了一定的效果, 但是对于如何解决工程图表处理所涉及到的线图元素的分割和识别等问题,如坐 标轴及网格的检测与识别、坐标轴及网格与曲线的分离,以及标注符号的处理等 都未加考虑。文献【3 5 】基于w e b 的曲线图表系统研究一文中充分考虑了坐标线 和网格的检测和识别,采用细化的方法提取图线上的点。因为细化一般采用逐步 剥离轮廓像素的方法获取图线的骨架,而不同的图线( t k 平垂直线、斜线、曲 线等) 被剥离的速度一般都不一致,所以在交叉节点会引起严重的畸变,而曲线 图表中的交叉点恰恰是表征图表参数对应的关键点,所以该文对交叉点的处理还 不理想。 1 3 曲线图表图像的结构分析 对现有工程图纸和表格图像矢量化和识别算法研究与分析的结果表明,在 图像的识别过程中必须注意整体拓扑结构与局部图像的联系。如果局限于一个窗 口内的局部图像信息,就必然会增加归并、判断的难度,甚至会产生错误的结果; 而将整体与局部信息相结合,根据整体的拓扑结构对局部信息进行归并、判断, 就能够产生比较正确的结果。因此在图表图像识别前对其进行结构分析,研究其 固有的结构特征,是正确建立图像整体拓扑结构的关键问题。 1 3 1 图表图像的总体结构 遥常机械设计中常见的曲线图表中往往包含若干条曲线,根据其坐标线结 构可分为两类,一类是有网格坐标线,另一类是无网格坐标线的,尤其以第一类 居多。其数据形式一般有包含坐标线和曲线的图线数据和包含坐标刻度、文字说 明,符号标识等的字符型数据,本文将坐标轴箭头也处理为一种符号信息,根据 其两种数据形式的分布位置又有图线字符独立分布型和图线字符交叉分布型。对 浙江太学硕士学位论文 于图线交叉型的图表图像,由于其图文分离比较复杂,需要进行些人工处理, 去除图线区域的字符数据,方能进行下步的识别处理。 无论哪种图表类型,其结构至少应包含一条横坐标轴和一条纵坐标轴,唯 一可能不同的仅是坐标系的形式不同( 直角坐标系、对数坐标系等) 。这正是图 表图像的共性,从图表的坐标线入手,建立图表的整体拓扑结构,从而提高识别 的可信度和精度是一种非常有效的方法。 1 3 2 线宽信息 曲线图表图像中的图线主要有坐标线和曲线两种,而且线形一般均为实线, 很少出现虚线情形。工程图表图像中曲线的线宽明显大于坐标线的线宽,在 3 0 0 d p i 分辨率的扫描图像中,坐标线的线宽一般为2 4 个像素,一般以3 像素 宽居多,而曲线线宽一般5 8 个像素。 1 4 本课题的主要研究内容 当前的图表图像矢量化算法还没有很好地解决图线交叉时交叉点的有效识 别、提取与精确定位问题,这一方面给后续的图线跟踪和拟合带来了困难,造成 识别后图线的类型和数目与原始图形中真实的情形不相符合,从而影响了整体识 别的准确性;另一方面由于曲线图表其特殊的结构形式,交叉点往往是表达图表 参数间坐标对应关系的关键位置,决定着曲线的整体走势,不仅全图的矢量化非 常重要,而且交叉点的提取也是拟合的关键所在。为此本文在借鉴其它扫描图像 识别方法的基础上,在分析图表图像中交叉点特征的基础上提出了一种适合曲线 图表的识别算法,建立了一个适合曲线图表图像的识别系统。 本文以工程曲线图表图像为处理对象,在将扫描所得的曲线图表图像进行适 当的预处理后,直接在原图上进行坐标线和曲线的数据提取,不存在类似细化方 法等人为引起的交叉点畸变和伪分支等问题。 本文主要内容有: ( 1 ) 曲线图像的去噪和平滑,实现图像的倾斜校正和图文分离,获取曲线图 像的有效识别区域; ( 2 1 交叉点的正确识别,提取与精确定位,获取线宽信息,实现坐标网格线 和曲线的分离,完成曲线的矢量化跟踪; ( 3 ) 文字识别,提取坐标刻度信息。重建坐标系。 浙江大学硕士学位论文 1 5 结论 本章通过对曲线图表图像的应用背景、结构特征以及相关工程扫描图像识别 技术的分析,得出以下几个结论: 一、目前在各类设计资源中曲线图表图像数据是较难用计算机理解、识别的 但又是设计中必不可少的资源; 二、曲线图表识别算法的研究可阻借鉴工程图纸和表格图像的矢量化识别算 法: 三、建立适合曲线图表的识别系统将是解决以上问题的关键所在。 浙江大学硕士学位论文 第二章图表识别系统总体设计 r 摘要j 本章对图表识别系统的基本要求进行了分析,并在此基础上对开发平台 和不同功能实现时的开发工具选择问题进行了探讨。根据系统的具体性能要求和 模块划分原则对系统的基本框架进行了设计,明确了各子功能模块的基本功能和 相互关系。 2 1 系统要求以及开发平台和工具的选择 工程图表识别系统是一个具有明确工作对象的项目工程,不仅包含了许多 基础技术和实现算法,而且还有适合图表识别的专用算法,所以,在开发之前, 选择合适的开发平台和开发工具是很有必要的。 2 1 1 图表识别系统的基本要求 作为一个图表识别的实用软件系统,必须满足o “: 一、友好的人机界面,操作方便,易用性高,用户端无需增加任何附加软 件,不需经专门培训用户就可以在短时间内掌握软件的使用; 二、使用自由度大,使用时应无时间和空间的限制,用户可以在任何时间、 任何地点访问本系统。如采用基于w e b 的访问及控制方式; 三、有效性、鲁棒性,此项性能是系统的关键。能够有效而快速地完成矢 量化和识别工作是识别系统的基本功能;此外,由于需要识别的图像可能质量较 羞,也可能在扫描时混入了较多的噪音信号,这就要求图像识别算法具有一定的 鲁棒性,能够正确处理这类图像: 四、高效性,在图像较大或比较复杂的情况下,图像处理所需的时间可能 比较长。为此需要对图像处理识别算法进行必要的优化,尽可能减少运算时间以 缩短用户的等待时间; 五、系统要具有一定的先进性、灵活性。系统要易于维护,并为将来的工 作流程和内容的变化保持一定的弹性。 2 1 2 开发平台和开发工具的选择 w i n d o w s 是一个功能强大,使用广泛的操作系统,具有操作简单和使用简便 的特点。w i n d o w s 对大型数据库提供了有力的支持,而这一点又是图表识别系统 所必需的由于在图表矢量化后会有大量的数据产生,为避免重复识别需要将 浙江大学硕士学位论文 这些数据保存到数据库中。同时w i n d o w s 也提供了对多媒体、国际语言以及互联 网通讯软件的支持。 图表识别是图表识别系统的核心功能,其实现具有以下特点:( i ) 由于图表 识别中含有大量的对图像像素的操作,运算量很大,因此需要较高的执行效率; ( 2 ) 图表识别经常要求对内存进行某些处理,且需要能够处理栈、队列、链表等 复杂数据结构,因此编码语言要灵活、功能强大;( 3 ) 图表识别系统是应用级系 统,要求编码方便、简洁、界面友好。基于图表识别的这些特点,我们在图表识 别功能模块中采用了w i n d o w s 操作系统下的c c + + 语言编码。 c c + + 语言是当前最流行的编程语言之一,有许多突出的优点1 3 ”: 一、语言简洁、紧凑,使用方便。程序书写形式自由,语言中运算类型和 数据类型极其丰富; 二、语言灵活,程序设计自由度大。c 语言的设计思想之一是让编程者知道 自己正在做的事,可以按照自己的意愿进行编程; 三、c 语言集低级和高级语言为一体,可用与汇编语言类似的方法直接进行 伎、字节和端口操作,同时又拥有众多高级语言的数据类型及控制结构。口+ 具 有面向对象的特性,支持模块化的程序设计,不仅使编写庞大复杂的程序变得容 易,而且使程序结构清晰,易于维护、扩充; 四、c c + + 语言生成的目标代码质量高,程序执行效率高。它仅比汇编语言 生成的目标代码效率低1 0 2 0 。这一点对于图像处理软件来说是非常重要的, 在图像较大或图像较复杂时,高效快速的代码会加快处理的速度; 五、用c 语言写的程序可移植性好,各种型号的计算机和各种操作系统都 支持c 语言类库,且各个系统提供的类库又相差不大。 2 2 图表识别系统的基本构成 根据程序模块化设计的基本要求,模块划分应遵循以下原则口哪:模块的内聚 度要高,模块间的耦合度要低,模块的功能要尽可能单一等。由于系统中用户查 询和图表识别属于两个不同性质、不同要求的功能,为此将本系统分为图表识别 和用户查询两个模块。 图表识别模块是整个识别系统的核心模块,由图像预处理子模块,图元编辑 子模块,图像矢量化子模块,图像后处理子模块和数据库管理子模块组成,其基 本工作流程如图2 - i 所示。 一、图像预处理子模块。该模块对扫描图像进行预处理,达到改善图像质量、 校正图像倾斜度的目的。 二、图元编辑子模块。该模块对预处理后的图像进行编辑,以便消除图像的 浙江大学硕士学位论文 缺陷,提高图像质量。 j 嚣睁;f 裳箬!l 精化 _ i l i 拟合l翼 耻 鬟; 图2 - i图表识别工作流程图 三、图表识别模块。该模块为本系统的主要模块,包括图线的矢量化识别 和图表中文字识别。 四、后处理子模块。 入、曲线拟合处理等。 五、用户查询模块。 展现给用户。 该模块实现对图像识别工作的进一步完善,如刻度输 该模块完成图表信息数据库的查询,并以w e b 的方式 用户查询模块主要提供用户查询界面,提供图表图像数据查询等功能。图 表识别模块与用户查询模块通过后台数据库建立联系,而用户查询模块需要发布 于i n l e m e t ,故此模块需要w e b 服务器的支持,系统的组成关系见图2 2 1 3 s 】。 w e b 服务器 图2 - 2 图表识别系统的组成图 2 3 图表识别系统框架的整体分析设计 2 3 1 图表识别模块框架分析与设计 图表识别模块采用v i s u a lc + + 开发,并使用m f c 类库。m f c “文档一视图” 结构是应用框架的核心,在m f c 库应用程序中,文档和视图是由c + 类的实例来 描述的。 一、框架类的选择 匿 ll,j 识 =焉一= 豳袭识模块 一 卜 ,;,f_ 陌恢一 ,;:甚。:; _ 1 1_1_j_jj_j1_、-j-l_j_1_】一u 浙江大学硕士学位论文 框架窗口最重要的角色在于充当应用程序的主窗口,它拥有更多类的对象, 包括菜单和各种各样的控制条窗口( 工具条、状态条、对话条) 。框架还能拥有所 有类型的数据窗口,如m f c 文档视图应用中视窗窗口以及对话框控制等。p i f c 提供了5 个不同的框架窗口类【4 叭,如表2 一l 所示。 为便于用户对多个曲线图表文档进行比较,应建立多文档的应用框架。允 许同时打开多个文档,这也符合w i n d o w s 应用的规律。当使用a p p w i z a r d 建立多 文档应用( 即m d i ) 时,它会为应用的主窗口创建一个c m d i f r a m e w n d 类对象,并 且使用该类作为不同类型的数据编辑视图窗口的内部框架。 表2 - 1m f c 中的框架类 i类描述 c f r a m e w n d单文档应用( s d i ) 的主窗口 !c m d i f r a m e w n d多文档应用( m d i ) 的主窗口 c m d i c h i1d w n dm d i 中嵌入c m d i f r a m e w n d 窗口中的框架窗口 c m i n i f r a m e w n d可移动的工具条框架窗口 c o l e f r a m e w n d用于对象嵌入与连接( 0 l e ) 现场活动的框架窗口 二、文档类的选择 文档类对象的作用【3 9 】是提供数据源,它将视图对象视为友元类,保证视窗 对象能读到欲在窗口中显示的数据。常用的文档类有:c d o c u m e n t ,c 0 1 e d o c u m e n t , c r i c h e d i t d o c 等。 c o l e d o c u m e n t 类主要为容器服务器程序所选择,该类提供了o l e 容器或服 务器中管理文档的嵌入、连接等功能;而c r i c h e d i t d o c 类提供了丰富的文字编 辑功能。在图像识别模块中数据源为打开的图像数据,同时也不需要o l e 容器、 文字编辑等技术的支持,故在本系统中选择c d o c u m e n t 类。 三、视图类的选择 视图类对象用于显示各种媛体。m f c 提供的视图类1 3 9 】有c v i e w 、c s c r o l i v i e w 、 c f o r m v i e w 、c e d i t v i e w 。c v i e w 为视图类的基类,c s c r o l i v i e w 支持对内容的滚 动,c f o r m v i e w 支持对话框的显示,c e d i t v i e w 类支持很多功能的文本编辑功能。 在图表识别模块中图表图像的大小常常超出一屏,因而窗口滚动功能是必 须的,同时也不需要其他功能,所以选择c s c r o l i v i e w 类为本模块的基类。 浙江大学硕士学位论文 除使用m f c 提供的框架结构之外,为了方便用户使用本系统进行图表处理, 还需要增加c f l o a t t o o l b a r 类创建浮动工具条,方便用户处理图像,同时实时观 测处理状态。 本模块中图表识别算法是本系统的核心部分,同时也是发展很快的部分, 为在系统框架保持不变时方便地更新算法,对图表识别算法部分将采用全局函数 的形式。这样如果有新的更为高效的算法提出后,只需要更新此部分全局函数而 系统的整体框架可以不做任何改变。 四、图表识别模块内部子模块设计 图表识别模块是采用m f c 提供的视图类、文档类、框架类和应用程序类搭 建起来的系统。在图像识别模块内部根据模块划分原则和功能需求进一步划分 为:系统框架子模块、图表识别算法子模块、菜单子模块、图元编辑子模块、数 据库存储子模块等功能模块。 系统框架子模块为其他子模块提供基础平台;图表识别模块为本文重点模 块,完成图表识别工作,通过全局函数调用与其他模块联系;菜单子模块主要完 成部分人机交互功能;图元编辑子模块完成基本图元编辑功能;数据库管理子模 块通过o d b c 将此模块与后台数据连接起来并完成部分数据库操作功能。各个子 模块之间的关系如图2 3 。 图2 3 图表识别模块内部子模块关系图 2 3 2 用户查询模块框架分析与设计 用户查询模块主要提供用户查询界面,实现图表图像数据的查询。在系统 运行时用户查询模块将承担为用户提供灵活、良好的图表数据查询任务,因此该 模块应能承担较大的访问量,并具有较好的稳定性。另一方面,由于此模块将发 布于w e b ,任何人都可以通过网络访问此模块,这就存在了一定的安全隐患,因 此还要求此模块有较高的安全性以及信息隐蔽性。 浙江大学硕士学位论文 本文考虑到系统的安全性要求以及实际工作流程的需求,采用四层分布式 w e b 框架模型1 4 “,如图2 - 4 所示。也就是将传统的应用服务器中的用户接口、商 业逻辑和后端服务分割开来,向开发者提供了一种创建、部署和维护企业规模的 w e b 应用的模块化方式,为要转向w e b 的用户提供了高性能多线程的环境。 分布式四层框架结构h ”,即在传统的w e b 服务器和数据服务器之间加入 一层,称为应用服务器( a p p l i c a t i o ns e r v e r ) ,四层即用户表现层( 用户界面部 分) 、应用表现层( w e b 服务部分) 、业务逻辑层( 业务逻辑部分) 、数据服务层( 数 据访问部分) 。用户表现层只提供应用程序的用户界面,负责与用户交互,它根 据用户的操作调用相应的业务逻辑,不能直接访问后台数据库;应用表现层主要 负责处理客户的请求同时负责与业务逻辑层通讯;业务逻辑是应用系统的关键, 它负责处理所有用户请求,进行具体的运算和决定程序的流程,并把处理结果返 回给表现层;服务器层提供的仍然是数据库支持、维护和更新应用程序的数据。 图2 4b r o w s e w e bs e r v e r a p ps e r v e r 叩s e r v e r 模型 用户查询模块内部实现以及在整个系统的关系如图2 - 5 所示。用户通过w e b 浏览器使用交互式图表查询界面,这就是用户界面层。这一层通过i n t e r n e t 与 应用服务器联系,应用服务器再与w e b 服务器联系,w e b 服务器和应用服务器分 别对应应用表现层和业务逻辑层。后台数据库为数据服务层,它是连接用户查询 模块和图表识鄹模块的桥梁。 霹 j 口b 膊崭繁曩k 图2 - 5 用户查询模块框架以及在系统中位置 用户查询模块按照模块划分原则和模块的工作流程分为:用户客户端子模 块、用户服务器子模块。用户客户端子模块主要通过用户交互完成图表查询和服 务器通讯功能,用户客户端子模块是采用a p p l e l 技术,并且在用户的w e b 浏览 器中运行并需要j a v a 虚拟机支持;而用户服务器子模块主要完成对用户请求服 务和数据库操作的功能,用户服务器子模块采用s e r v l n 技术,工作在w e b 服务 浙江大学硕士学位论文 器,需要i i s ( i n t e r n e ti n f o r m a t i o ns e r v e r ) 1 1 t o m c a tw e bs e r v e r 支持。用户客户端 予模块与用户服务器子模块通过s o c k e t 通讯,用户服务器子模块与后台数据 库通过j d b c 连接,如图2 - 6 所示。 图2 - 6 用户查询内部子模块 2 ,4 界面设计 界面是用户与计算机进行人机交互的接口,其设计是软件设计中的一项重 要工作,界面设计包括显示界面和操作男面的设计,一般界面设计的总体要求是 画面精美简洁、按钮图标通俗易懂、按钮位置安排方便灵活、对用户友好、易学 易用。 界面设计有多种方法和款式,不应拘泥于一点,但它又不是随意的,本系 统的界面包括两个部分:图表识别模块界面、用户查询图表模块界面。 用户查询图表模块界面使用界面统的w e b 浏览器界面。浏览器为人们所 熟悉,具有统一的图形用户界面( g u i ) ,故方便用户查询和使用。 图表识别模块界面包括菜单条、工具栏、浮动工具栏、客户区、状态栏等 部分,其中菜单条、工具栏、浮动工具栏主要是属于操作界面,为用户提供方便 的使用环境。客户区、浮动工具栏和状态栏属于显示界面,显示当前运行结果和 运行状态以及鼠标当前区域的状态等。多样的操作方式和多角度的显示当前各方 赢状态,为用户提供了良好的工作环境。 2 5 结论 本章对图表识别系统的特点、性能需求等方面进行了详细的探讨,并结合 开发环境选择原则和模块划分原则等理论对图表识别系统进行了总体的设计,主 要得出了以下几点结果: 一、在分析本系统的基本性能的基础上,结合图表识别和用户查询的需求, 选择了合适的开发平台和开发工具: 二、根据系统的特点、实际的需求以及相关的技术性能,将系统划分为用户 查询和图表识别两个模块: 浙江大学硕士学位论文 三、对用户查询模块进行详细的设计。通过对w e b 模式的分析采用了一种新 的四层框架模式,较好的实现了高负载情况下提供稳定良好的图表

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论