(机械设计及理论专业论文)图形特征阈值分割及其矢量化的研究.pdf_第1页
(机械设计及理论专业论文)图形特征阈值分割及其矢量化的研究.pdf_第2页
(机械设计及理论专业论文)图形特征阈值分割及其矢量化的研究.pdf_第3页
(机械设计及理论专业论文)图形特征阈值分割及其矢量化的研究.pdf_第4页
(机械设计及理论专业论文)图形特征阈值分割及其矢量化的研究.pdf_第5页
已阅读5页,还剩66页未读 继续免费阅读

(机械设计及理论专业论文)图形特征阈值分割及其矢量化的研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

图形特征阈值分割及其矢量化的研究 摘要 工程图纸自动识别技术是工程图纸处理集成系统中一项重要的图形、图像 处理技术。但是以前的工程图纸大多是采用手工绘制的形式,这些图纸是企业 重要的技术资料,然而由于是纸质图纸,给保存和检索方面造成了很大的障碍, 且还不能方便的应用到后续设计之中。工程图纸自动识别技术旨在将扫描的工 程图样转换为与c a d 系统相兼容的矢量数据格式,将扫描所得到的光栅图像 加以处理、分析和识别并最终转换成矢量图形的格式,这样就能够方便的修改 和编辑。工程图纸自动识别不仅可以实现对工程图纸的有效、自动输入,还可 以在计算机中建立起图形数据库以及减缩c a d 系统的开发周期。 本文对已有的成果进行了相关分析,综合利用了计算机图形学、模式识别 及数字图像处理等学科的理论知识,对工程图纸扫描图像自动识别的各主要组 成部分的算法与实现进行了研究,包括图像分割、图像去噪、图文分离、图像 细化、图形矢量化及数字字符的识别。其中,图像分割部分对现有的几种阈值 分割方法进行了比较,并改进了迭代法;图像去噪部分则是采用自适应滤波方 法去除二值图像的噪声;图文分离采用包围盒技术将图像中的字符从二值图中 分离出来;图像细化对细化的要求比较高,传统的h i l d i t c h 法容易产生畸变, 本文采用索引表细化法避免了这种情况;矢量化本文提出了采用基于细化的方 法和自适应网格相结合的方法,解决了传统基于细化方法容易在交叉处产生畸 变的情况。本文对字符识别也进行了研究,主要是针对工程图中的数字识别, 通过对b p 神经网络进行的改进,设计了一个数字识别系统。 本文在工程图自动识别中进行了算法的改进,并进行了相关的实验和分析, 对工程图纸自动识别技术的研究有一定的理论意义和实用价值。 关键词:工程图纸;阈值分割;矢量化;字符识别 a s t u d yo ff e a t u r e st h r e s h o l ds e g m e n t a t i o na n d v e c t o ro fg r a p h i c s a b s t r a c t e n g i n e e r i n gd r a w i n go fa u t o m a t i ci d e n t i f i c a t i o ni sa ni m p o r t a n tg r a p h i c sa n d i m a g ep r o c e s s i n gt e c h n i q u ef o rt h ee n g i n e e r i n gd r a w i n g sr e c o g n i t i o ns y s t e m b u t t h ep r e v i o u se n g i n e e r i n gd r a w i n g sa r em o s t l yd r a w nb yh a n d sa n dt h e ya r ef a i r l y i m p o r t a n t t h e s ee n g i n e e r i n gd r a w i n g sa r eb a d l yd i f f i c u l t yt om a i n t a i na n di n d e x , a n dc a n tb eu s e de a s i l yf o rr e a rw o r k e n g i n e e r i n gd r a w i n gr e c o g n i t i o nt e c h n i q u e a i m sa t c o n v e r t i n gs c a n n e de n g i n e e r i n gd r a w i n gi m a g e s i n t ov e c t o rf o r m a t s c o m p a t i b l ew i t hc a ds y s t e m s ,p r o c e s s i n g ,a n a l y s i sa n di d e n t i f yt h er a s t e ri m a g e a n de v e n t u a l l yc o n v e r t e di n t ov e c t o rg r a p h i cf o r m a t ,t om o d i f ya n de d i te a s i l y t h e e n g i n e e r i n gd r a w i n g so fa u t o m a t i ci d e n t i f i c a t i o nc a nr e a l i z ee n g i n e e r i n gd r a w i n g a u t o m a t i ci n p u te f f e c t i v e l y i tc a na l s os e tu pad a t a b a s ei nt h ec o m p u t e rg r a p h i c s a n ds h o r t e nd e v e l o p m e n tc y c l eo fc a d s y s t e m t h i sp a p e rs y s t e m a t i c a l l yd e s c r i b e st h es t r u c t u r e ,m a i na l g o r i t h m sa n dt h e i r i m p l e m e n t a t i o no ft h eo f f l i n er e c o g n i t i o ns y s t e mf o rs c a n n e dd r a w i n g s ,a n ds t u d i e s t h em a i nc o m p o n e n t so ft h ei m p l e m e n t a t i o no ft h ea l g o r i t h mf o re n g i n e e r i n g d r a w i n g s c a n n e d i m a g e s ,i n c l u d i n gi m a g es e g m e n t a t i o n ,i m a g ed e n o i s i n g , s e p a r a t i o no ft e x ts t r i n g sf o r mg r a p h i c s ,i m a g ec l a s s i f i c a t i o na n dg r a p h i c sv e c t o r r e c o g n i t i o no ft h ed i g i t a lc h a r a c t e r s a m o n gt h e m ,s o m eo ft h e c u r r e n ti m a g e s e g m e n t a t i o n s e v e r a lt h r e s h o l ds e g m e n t a t i o nm e t h o da r ec o m p a r e d ,a n dt h e i t e r a t i v em e t h o di si m p r o v e d ;i m a g ed e n o i s i n gp a r ti su s i n ga d a p t i v ef i l t e rm e t h o d t oe l i m i n a t et h en o i s eo ft h eb i n a r yi m a g e ;t h ei m a g eo fr e f i n e dr e f i n e m e n to f d e m a n di sh i g h e r ,t h et r a d i t i o n a lh i l d i t c hm e t h o de a s yt op r o d u c et h ed i s t o r t i o n ,t h e i n d e xt a b l er e f i n i n gm e t h o di nt h i sp a p e rc a na v o i dt h i ss i t u a t i o n ;t h ev e c t o ru s e s m e t h o dc o m b i n e do fb a s e do nd e t a i l e dm e t h o d sw i t ha d a p t i v eg r i d ,c a na v o i dt h e d i s t o r t i o no ft h ec r o s s i n go ft h et r a d i t i o n a lb a s e do nt h i n n i n gm e t h o d i nt h i sp a p e r , t h ec h a r a c t e rr e c o g n i t i o nw a sa l s os t u d i e d ,m a i n l yo nt h en u m b e rr e c o g n i t i o no ft h e e n g i n e e r i n gp i c t u r e ,d e s i g n i n gad i g i t a li d e n t i f i c a t i o ns y s t e mb yi m p r o v i n gt h eb p n e u r a ln e t w o r k i n t h i sp a p e r ,s o m ea l g o r i t h m so fe n g i n e e r i n gg r a p ha u t o m a t i cr e c o g n i t i o n h a v eb e e ni m p r o v e d ,a n ds o m ee x p e r i m e n t sa n da n a l y s i sh a v eb e e nd o n e ,a n dh a s s o m ea c a d e m i ca n d a p p l i e d v a l u e st ot h e t e c h n o l o g y o fr e c o g n i t i o na n d u n d e r s t a n d i n gf o rs c a n n e de n g i n e e r i n gd r a w i n g s k e y w o r d s :e n g i n e e r i n gd r a w i n g s ;t h r e s h o l dc o n n e c t i o n ;v e c t o r i z a t i o n ; c h a r a c t e rr e c o g n i t i o n 致谢 本论文是在导师刘炀副教授和工程图学系的各位老师的悉心指导下完成 的。 三年来,导师不仅一直对我的学习进行了指导,而且在生活也给予了关心。 导师的正直、谦和以及开明的学术思想、脚踏实地的工作作风,都给我树立了 榜样的印象。此外,导师还因人而异,对我和师兄弟们因材施教,针对我们身 上不同的特性来指导我们,让我们在读研期间就规划好自己的人生道路和目标, 然后再朝着目标努力。在导师的身上我学到了许多,知道我们需要学会的不仅 是知识,更重要的是为人处世的道理。不仅如此,导师还给了我们广阔的研究 空间,让我能自由地对感兴趣的内容进行研究,这使我受益匪浅。在此谨向我 的导师致以深深的敬意和衷心的感谢! 在我的论文选题、学习及完成期间,工程图学系的各位老师在我的论文课 题上给了我很多的建议和帮助,我受益良深;各位师兄弟在工作、学习和生活 上也给予了无私关心和帮助,在此一并深表感谢! 感谢和我一起同窗战斗的同学! 感谢理解、关心和支持我的亲人和朋友! 作者:石文莹 2 0 1 2 年3 月1 2 日 插图清单 图1 1 工程图自动识别流程图4 图1 2 工程图中的几种不连通情况8 图1 3 不连通情况的像素表示8 图2 1 几种边缘算子的处理效果1 2 图2 2 脑部图像和区域生长法分割的结果1 2 图2 3 区域分裂合并分割后的图像1 3 图2 4 原灰度图像及灰度直方图1 4 图2 5 用双峰法处理的理想灰度直方图1 6 图2 6 工程图阈值分割效果对比1 7 图2 7 目标点和背景点的灰度分布1 9 图2 8 迭代法的算法图2 0 图2 9 自适应滤波的九种模板2 2 图2 1 0 二值图像一2 2 图2 1 1 自适应滤波后的图像2 3 图2 1 2 图文分离后得到的工程图2 5 图2 1 3 图文分离后得到的标注信息2 5 图2 1 4 像素p 的8 邻域2 6 图2 1 5h i l d i t c h 算法识别效果2 7 图2 1 6 点的8 邻域情况2 7 图2 1 7 索引表细化效果2 9 图2 18 自适应网格31 图2 一1 9 网格区域矢量提取3 2 图2 2 0b r e s e n h a m 算法所用误差项的几何意义3 4 图2 21b r e s e n h a m 法直线生成图3 4 图2 2 2 第一象限圆及下一像素情况3 5 图3 1 字符识别原理图3 8 图3 2b p 神经网络机构4 0 图3 3b p 神经网络的数字识别系统图4 3 图4 1m a t l a b 界面4 5 图4 2v b 界面4 6 图4 3 灰度图4 7 图4 4 灰度直方图4 8 图4 5 几种方法的识别效果4 8 图4 6 细化后的工程图5 0 图4 7 细化后的图的像素值5 1 图4 8 工程图二值图形51 图4 9 基于细化的矢量方法5 2 图4 1 0 本文提出的基于细化和自适应网格方法5 2 图4 1 1 包含有噪声及无噪声的数字识别实际测试情况5 3 图4 1 2 网络训练过程图5 3 图4 13 训练结果和理想中的误差平方和的比较一5 3 图4 1 4 梯度、验证检查和学习速率的情况5 4 图4 1 5 无噪声和含噪声训练情况下的网络容错性测试5 4 图4 1 6 输入与输出的训练5 5 图4 1 7 数字识别结果5 5 图4 1 8 二种数据的均方误差曲线5 6 表格清单 表1 1 工程图样光栅图像的特性7 表2 1 基本图像分割算法总结1 4 表2 2 几种基于非细化的矢量算法的比较3 0 表4 1 三种算法比较5 6 表4 2 本文提出的算法比较5 6 第一章绪论 1 1工程图纸自动识别的研究背景和意义 工程图纸是工程界用来表示研发与生产信息的重要来源。长期的生产过程 中,企业累积了的大量的工程图纸。怎样把如此多的存档图纸快速、有效的输 入到c a d 系统中,并和己生成的图形数据进行汇总对比,这是c a d 技术需要 马上解决的困难之一i l j 。因此工程图纸自动识别是现在图形、图像和c a d 研究 领域的一个热点,工程图纸自动识别可以实现对工程图纸的有效、自动输入, 还可以在计算机中建立起图形数据库并缩短c a d 系统的开发周期,这项内容 技术上涉及到图像处理、计算机图形学和模式识别等领域,它的研究对提高 c a d 系统整体的自动化和智能化,实现图纸的计算机文档管理具有重要的理论 和实际意义 2 1 。 工程图纸自动识别在实际中的深入研究,给c a d 系统的智能化和自动化 水平带来了有效的提高,并且在设计进程方面也得到了迅速的发展。计算机图 形处理技术在企业界c a d c a m 技术中有很好的基础。然而若是想将聚积的大 量原有设计图纸,用来分析、编辑、修改以及反复的利用,以促进生产的发展 以及加快信息的处理,这为企业界和学术界带来了一个富有意义而又严峻的挑 战。 工程图纸是工业界表达制造信息和设计的主要技术性文件,目前二维和三 维c a d 已经普遍应用,但是各类保存的纸质介质的工程图纸仍在生产中起到 重要的作用。在我国电力系统、建筑设计和工程机械等行业都有大量的图纸, 随着生产过程的延续,各行业积累的图纸与日俱增。在加拿大及美国每年约有 3 5 亿各种类型的工程图纸,且以每年二千六百万的速度递增,每年需要拷贝、 访问和分配这些图纸的造价就超过了十亿美元1 3 l 。想要将生产中使用的大量、 丰富的原有设计图纸输入到计算机中进行分析、参与和再利用,以加速信息的 处理,促进生产的发展,就需要将图纸信息输入到c a d 系统,并与其中已生 成的图形数据汇总起来。随着计算机技术、光纤传感技术、网络技术的发展和 图形扫描仪的问世,可以通过扫描将图纸转换成光栅图像文件。以图像格式保 存的工程图,不但信息量大,而且无法和现有的c a d 软件进行接口。通过自 动矢量化系统可以把光栅图像转换成与现有的c a d 格式兼容的矢量图像格式, 然后利用c a d 软件强大的功能进行编辑改型设计,即对矢量化后的图纸进行 后处理,这样手绘的工程图纸被输入到计算机数据库中,便于查阅、修改和管 理,适于长期保存,也为企业走上信息高速公路甚至进行网络虚拟制造做好了 准备。 工程图纸自动识别具有以下意义【4 j : 首先,它解决了档案库库房面积不足、图纸容易损坏的问题。图纸由缩微 胶片及纸质形式转换为电子文档,所需要的存放面积大大减小。而且可以灵活、 高效的编辑和重复使用已有的工程图,因此有很高的应用价值。 其次,在设计方面,它将图像格式转换为矢量格式,将对原图的修改变的 容易,仅需在计算机上对i e t 图局部修改即可完成新的设计,减少了重复劳动, 提高了设计效率。 再其次,它利用网络技术,由计算机统一管理。使资源得以共享,可以方 便资源的管理和检索,提高了信息的使用率及流通速度。形成了强大的c a d 数据库,同时还提高了c a d 出图的效率。 最后,工程图纸自动输入与识别的建立,可以充分利用丰富的计算机工具、 资源和先进的计算机技术,标志着设计部门在软、硬件应用水平上实现了质的 飞跃,大大提高了企业的整体综合实力。电子文档的形成,再加上以计算机通 信为基础的现代通信的软、硬件手段,使用户进入信息高速公路产生了可能。 1 2工程图纸自动识别的研究现状 工程图纸自动识别的提出可以追溯到2 0 世纪7 0 年代末、8 0 年代初,这一 领域的工作在国内外开展的均比较晚,其中一个原因是因为图形识别软件研制 要求高、难度大并且存在许多困难如字符的分离和识别、尺寸数字的识别、圆 弧及各种工程曲线的识别等【5 j 。然而不少学者在7 0 年代就已经预见到上述技术 应用的有效性,并在这方面进行了大量的研究,希望能将工程图纸自动识别成 为现实。那个阶段对此项的研究,很大部分只是对工程图纸自动识别的简单步 骤进行浅显的探讨【6 j ,所以国内外对于工程图纸自动识别的研究工作应该是从 8 0 年代后期开始兴起的,它至今依然是模式识别和图像处理领域的一个热点【_ 7 1 。 当时对工程图纸自动识别的研究主要集中在机械图纸矢量化和工程语义的 理解上。因为该课题研究还是存在一定难度的,所以国内外研究者几乎都是将 工程图输入与识别分离开来,分别进行处理。c a d 技术在国内外已经广泛使用, 传统的手工绘制图纸已经无法适应时代的步伐,取代它的是由计算机绘制的 c a d 图纸,这将会成为工程设计领域的核心。再者计算机还有外部设备的发展 也提供了在硬件上实现的可能性。这一时期主要是开始了一些普通的研究和实 验性研究,且关于工程图纸自动识别处理的基本过程及概念思想已初步形成。 到了2 0 世纪8 0 年代末、9 0 年代初,关于工程图纸自动识别系统的研究进 入到了一个新的阶段,研究也更加广泛深入。人们对系统的认识也扩展到工程 图纸的各个部分,文字符号和图形识别等工作成为新的研究重点【8 j 。国外一些 大公司和大学开始投入了相当多的人力、物力和资金致力于图形信息的输入及 识别的研究和开发。于是工程图纸自动识别进入了广泛研究阶段【9 j 。2 0 世纪9 0 年代末,形成了矢量化研究的高潮,表现为一些专门性组织的成立和一系列国 际会议的召开【l 。当时的工程图的矢量化较多是针对机械图、建筑图和电子图 2 的研究,并且已经提出了多种矢量化方法。 目前,一些商品化的矢量化软件也已问世,比如出自德国s o f t e l e c 公司的 v p s t u d i o 、来自美国a b l e 公司的r 2 v 以及挪威r a s t e r e x 公司的r x s p o t l i g h t 等等【1 1 。其中,v p s t u d i o 一直是独立运行的光栅矢量化软件中相对最出众的, 其产品由1 9 9 0 年的单一的光栅矢量化软件问世,现在己演化至更复杂、功能更 加强大的图像处理软件,它问世的每一个新版本,都象征着当时的图像处理技 术的前沿i l 引。 国内对矢量化技术的研究起步相对较晚,不过也取得了诸多成就:清华大 学的t h d a i m s 系统和东大阿尔派的s e a s 系统是目前国内开发的比较成熟的 图纸自动输入与管理系统;还有华中理工大学c a d 中心所研制的工程图信息 系统e d i s 也比较成熟;以及若干研究机构,如浙大c a d & c g 国家重点实验室 以及工程及计算机图学研究所,他们主要是从工程语义入手,基本实现了对工 程图样的理解,从而可以对工程图样的三维重建等加以研制。 国际上模式识别领域的著名的组织为i a p r ( i n t e r n a la s s o c i a t i o no fp a t t e r n r e c o g n i t i o n ) ,其第十个技术分会就是专门面向图形识别领域的。该领域的重要 期刊( ( p a t t e r nr e c o g n i t i o nl e t t e r s 就是i a p r 主办的,且已经有二十多年历史 的国际模式识别会议也是它主办的。 此外,m a c h i n ev i s i o na n da p p l i c a t i o n ;c o m p u t e rv i s i o n ,g r a p h i c s ,i m a g e p r o c e s s i n g ;c o m p u t e rv i s i o na n di m a g eu n d e r s t a n d i n g ;i m a g ea n dv i s i o n c o m p u t i n g :p a t t e r nr e c o g n i t i o n 等都是矢量化研究领域非常活跃的国际著名期 刊。 多年来,国际上许多学者在工程图矢量化领域做了大量的研究,如法国的 k t o m b r e ,美国的r k a s t u r i 以及以色列的d d o r i 等。他们分别研究出各自的 矢量化系统,并提出了性能评价方案,当然也发表了许多学术论文,在矢量化 技术发展方面做出了非常大的贡献。 图像处理及模式识别领域的专家k a r lt o m b r e 认为在矢量化研究中现有的 方法还不够成熟,这种不成熟表现在:速度、精度等方面还没达到要求,且对 缺损及噪音的敏感度低下,从而不能完全满足工程及办公自动化的需要。 这些年,国内外各界不断地完善光栅图像的矢量化研究及改进矢量化的方 法。然而现有矢量化软件的水平还不是很高,主要表现在处理速度、抗噪性和 各种字符、曲线的识别还不是非常理想,所以不能发挥极大的效益,离实现实 用化还有一定的差距。 1 3工程图自动识别中涉及的相关问题 工程图自动识别是图形、图像处理和模式识别的一个热门课题,也是c a d 系统一直努力奋斗的一个目标,此项的研究在近三、四十年来引起了国内外大 量专家、学者的关注,并在此领域孜孜以求,做出了很多贡献。工程图识别的 过程一般可以分成以下几个步骤:扫描输入、二值化( 即图像分割) 、滤波去噪、 图文分离、图线细化、直线矢量化、圆和圆弧矢量化、字符的识别、矢量化后 处理以及结果合成的矢量化格式的文件1 3 1 。图1 1 是工程图自动识别的工作流 程。 图1 - 1 工程图自动识别流程图 1 3 1涉及的几项关键技术 工程图纸自动识别的过程首先是将工程纸质图纸经扫描仪扫描输入得到灰 度的光栅图像。再进入预处理的阶段,此阶段中先用二值化的处理技术,将扫 描获得的2 5 6 级灰度图像处理成为只有黑白两种颜色的二值图像;接着通过滤 波去噪,去除工程图纸上原来就有的以及在二值化处理中带进来的噪声,然后 根据图纸的质量和二值化处理的效果,依图来开始断线修补等操作。鉴于工程 图中包含着各种字符、标注等信息,故对字符识别和各种线图元素矢量化所关 注的侧重点就应有所不同,故而在预处理阶段中一般都会存在图文分离这一阶 段,来把各个字符和标注信息分离开来,这样可使下面的操作处理起来更加方 便。 经预处理阶段后,图像便进入到了矢量化的阶段,主要包括对直线、圆、 圆弧等的矢量化,根据矢量化的处理效果,矢量化过程可能会包括其它的各种 后处理,例如提取直线和圆或曲线的交点信息的处理、将圆弧合成圆、对同心 圆的校正处理等【1 4 】。 综上所述,工程图纸自动识别所涉及的关键技术如下【”】: 1 图像预处理 经扫描输入的图纸的光栅图像往往夹杂着噪声及缺陷,需要经过扫描图像 的预处理来减轻和消除。工程图的图像应该只有黑白两种颜色,但是经扫描仪 扫描输入的光栅图像通常为多级灰度图像,所以需要经过二值化处理将光栅图 像转化为只有黑和白的二值图像。好的二值化过程可以将扫描后的光栅图像中 4 噪声减轻,但并未达到理想的要求,此时可以通过滤波去噪来将残留的噪声消 除。二值化及滤波去噪的算法有很多种,具体选用什么算法要依据被处理图像 的特征,经过实验得出最优算法。 2 图文分离 工程图纸通常由图形和文字符号两部分组成,对图形和文字的处理策略是 不同的,故有必要将工程图中的图形和文字进行分离【1 6 】。 常用的方法有基于轮廓的分割方法、基于连通域检测的分割方法和基于区 域生长的分割方法。各种方法中几乎都采用f r e e m a n 链码对各图元的连通体做 轮廓线的跟踪。 3 工程图矢量化处理 矢量化处理主要是针对几何层,即图形部分进行处理,此阶段要把光栅文 件的位图转化为直线或圆弧矢量组成的图形。矢量化算法是扫描识别系统的核 心技术。 现有的矢量化方法主要分为基于细化的方法和整体识别方法。基于细化的 方法主要有距离交换法、边界重复细化法及适当骨架化法等;整体识别方法主 要有基于h o u g h 变换的方法、正交方向搜索法( o z z ) 及基于游码的方法等。 4 图形基本图素识别 图形基本图素识别是对矢量化处理后的几何层中的基本图素进行提取与识 别的操作,包括直线段、箭头、圆、圆弧等的识别。这是工程图理解的第一层 次。 5 注释层的理解 工程图理解的第二层次是在矢量化处理及基本图素识别的基础上进行注释 层的识别与理解,包括尺寸标注识别、尺寸数字识别、尺寸校正等语法分析。 注释层理解的重点之一是对文字和符号的分离与识别操作。 6 图纸功能性分析 工程图理解的第三层次是面向二维平面的图纸信息理解,即图纸功能性分 析,包括图素关系理解、视图对称性分析、实体基元建立与组合、符号或特殊 图形的物理涵义,其目的是为了获得更多的语义信息。 7 实体重构 工程图理解的最高层次是面向三维立体的实体重构。形象地说,识别和理 解工程图就是从工程图的三视图重建其3 d 形体,在基本图素识别和注释层分 析理解基础上实现基于知识的特征建模。 1 3 2基本概念 1 工程图分类 工程图是科技部门和工业生产部门的一项重要技术资料,被称为“工程界 的语言”。工程中使用的图形种类复杂多样,对工程图的类别,常常根据所表达 对象的工程领域来进行分类,而对各个领域还会由其表达对象的属性来分类。 这种分类方法虽然对工程人员的交流及学习有利,然而这样的分类却并不一定 合适计算机理解。 由计算机理解的一些特点,可以从描述对象的方式和表达对象的属性来综 合考虑工程图的分类,可以把工程图分为:结构简图、逻辑框图和实体图样三 种【17 1 。 ( 1 ) 结构简图 它采用特定的线段和符号来表达工程对象中各个元件之间的连接关系。这 种图主要用于电子电气工程中的线路图,机械工程中的机构图等。其表达方式 高度符号化,工程中对它进行自动分析处理有实际要求,处理难度适中,在技 术上也比较成熟。 ( 2 ) 逻辑框图 它用箭头、方框、文字及特定的符号等,来反映工程对象总体性的功能结 构及逻辑结构。主要用于流程图、数据流图、模块图和控制工程中的信号流图、 方块图等。特点:是一种半语言、半几何的表达方式,目前对它进行自动处理 似乎没有强烈的实际要求。 ( 3 ) 实体图样 它采用几何投影的方法,根据一定的比例,借助一定的符号严格反映出对 象的真实几何属性及一些附加的信息。一般应用于船舶工程、机械工程、航空 航天、车辆工程及电子工程等领域的装配图和零件图等。它采用画法几何方法 反映对象的几何性质,内容和实体相一致,内容复杂多变,处理起来难度比较 大。 本文着重研究实体图样的计算机理解问题,并着重研究机械工程的实体图 样的矢量化转换问题。 2 二值图像和背景点、目标点 二值图像:是指每个像素不是黑就是白,其灰度值没有中间过渡的图像。 二值图像一般用来描述文字或者图形,其优点是占用空间少。在二值图像 中所有的像素只能从o 和1 这两个值中进行选取,因此在m a t l a b 中,二值图像 是一个用0 和1 组成的二维矩阵来表示的。l 对应于关闭,表征此像素在背景 状态;而0 则对应于打开,表征此像素在前景状态。用此方法进行操作,可以 简易的识别出图像的结构特征。二值图像的操作仅仅返回与它的结构或形式有 关联的信息,若欲对其他类型的图像进行相同的操作,则必须先将其转换为二 进制的图像格式。 在二值化后的工程图的扫描图像数据中,我们把灰度级为0 的像素点叫做 目标点,就是这些点才构成了工程图中的符号、文字、图形等这些我们需要的 信息,而灰度级为1 的像素点则叫做背景点。 6 1 3 3工程图光栅图像的特征 工程图样经过扫描后得到的光栅图像由于其文字、符号及图形等均符合工 程制图的规范标准,故而不仅包含一般数字图像的特征,而且还存在其一些特 性,如表1 1 。在进行工程图样识别的时候就可以充分利用这些特性来进行分 析、处理以及识别18 1 。 表1 1 工程图样光栅图像的特性 特性描述 工程图纸经扫描生成的光栅图像的像素点有多个灰度级,故应该将多灰度级图 二值性像变换成只具有两个基本灰度级的二值图像。二值图像仅含有白和黑两种颜 色,这样便降低了图像处理的难度;同时二值化还有效地压缩了数据。 从尺寸标注方面来看,实形性为尺寸标注提供了可行性。从投影表达方面来看, 实形性各种表达手段正是为实形性服务的,比如旋转视图的表达,斜视图和局部视图 的配合表达等。 机械图样不管是基本视图还是其它视图,外边界轮廓线均为闭合的边界。除了 封闭性点划线、波浪线之类的特殊形态外,不可能有挂线的情形出现,而且同一视图 也不会出现分离、相互间没有任何关系的几块。 视图的内部轮廓线一般都是连续的,即图线之间或者以端点相连接,或者图线 连续性的端点落在了别的图线上。如果一根图线横跨另一根图线,则这两根图线将通 过交点而被分割为四根图线。 工程图经扫描工程图纸得到的光栅图像中,不同视图间是互不相连的,但同一视图中 的连通的大多数图形元素是彼此连通的,如尺寸线、轮廓线及剖面线等。故工程图具 性与非有连通性。但在有些情况下,除了不同视图间互不相连外,同一视图中的图形 连通性元素之间也不连通,如图1 2 中标注文字与标注线之间不连通;行与行之间、 文字与文字之间不连通,如图1 3 。所以,工程图又有非连通性: 线型的机械工程制图规则规定:工程图中,轮廓线为粗实线,辅助线则应为细实线, 宽度属在扫描分辨率为3 0 0 d p i 的情况下,粗线的宽度在图中一般是6 2 4 个像素,而 性细线的宽度一般是3 1 2 个像素。可以利用工程图样的线型属性,在工程图样 中识别出轮廓线与辅助线,并将其分别保存在不同的层次结构中。 7 ( a ) 文字与标注线不连通 ( b ) 文字之间和行之间不连通 ) 同一视图中具有包含关系图块之间的不连通 图1 2 工程图中的几种不连通情况 l7 图1 3 不连通情况的像素表示 1 4 本课题的主要工作 1 本文第一章主要是对工程图纸自动识别的研究背景、意义及研究现状进 行总结,并分析了这项内容所涉及的相关关键技术。 2 在第二章中,首先分析了对图像分割的几种方法,经过对比选出了适合 工程图分割的阈值分割法,并对阈值分割进行了重点阐述,用阈值分割的几种 算法对实际的工程图进行了试验,通过分割试验对比,选出了处理效果较为理 想的算法,在此基础上对这种算法加以改进,从而使工程图的分割效果令人满 意,最后对各算法进行了总结和评价。 对图像分割完后,接着就是对还存在少数噪声的二值图像进行滤波去噪, 除去工程图在分割步骤中余留的噪声。 然后对图像进行了图文的分离,使工程图中的图形和字符分离开来。 对分离后的图形,先采用比较常用的经典算法进行细化处理,发现这种方 法对工程图并不合适。试验发现,索引表细化法对工程图的细化处理效果比较 令人满意,可以达到预期的要求。 本文提出采用基于细化和自适应网格的矢量方法,因为基于细化的矢量 算法常常在交叉处产生畸变,本文提出的方法对交叉处的处理较好,最后用集 合求交法进行拟合,从而完成了线条的矢量化。 3 第三章中对字符识别进行了研究,分析了b p ( b a c kp r o p a g a t i o n ) o 经网 络算法的特点,改进了这种算法并设计了数字识别系统,取得了良好的识别效 果。 4 第四章先介绍了m a t l a b 、v b 以及两个软件间是怎样实现交互的,然后 分别对图形识别和数字识别进行了的试验和结果分析。 5 第五章中对本文的工作进行了总结,并在取得一些成果的同时,指出了 工作中还不够完善的地方。 9 第二章工程图识别的部分关键技术 工程图纸通过扫描仪输入到计算机后,得到的一般是2 5 6 级灰度图像,就 需要进行图像分割将灰度图像转化为二值图像。手绘工程图纸一般都或多或少 的含有噪声,可以通过滤波去噪将噪声去除。鉴于图形和字符处理时的侧重点 的差异,需要将二值图像中的图形和字符部分分离开来,然后对图形部分进行 矢量化识别,而对字符部分进行字符识别。 2 1工程图纸图像分割 图像分割是把图像分成若干个特定的、具有独特性质的区域并提出感兴趣 目标的技术和过程。它是图像处理中的主要问题,是由图像处理到图像分析的 关键步骤,也是计算机视觉领域低层次视觉中的主要问题。 2 1 1 几种分割方法的比较 1 基于边缘的分割方法 基于边缘的检测代表了一大类基于图像边缘信息的方法,其中边缘检测算 子是一组用于在亮度函数中定位变化的非常重要的局部图像预处理方法,边缘 是亮度函数发生急剧变化的位置【l 圳。 ( 1 ) r o b e r t s 算子 r o b e r t s 算子是一种利用局部差分算子寻找边缘的算子。因为它仅使用了像 素的2 x 2 邻域,故计算比较简单。其卷积掩模为: - 10 厂01 啊2 10-1l 坞2i 一1 o q 。1 ) r o b e r t s 算子的边缘幅值为: l g ( i ,) 一g ( i + 1 ,j + 1 ) l + l g ( i ,j + 1 ) 一g ( i + 1 ,) l ( 2 2 ) 其中,g ( i ,) 是具有整数像素坐标的输入图像。 r o b e r t s 算子计算简单但其对噪声具有高度敏感性,因为它只用较少的几个 像素来近似梯度。 ( 2 ) c a n n y 算子 c a n n y 算子是j o h nf c a n n y 于1 9 8 6 年开发出来的一个多级边缘检测算法。 这种方法的实现,需要搜寻图像梯度的局部极大值,它的目标是找到一个最优 的边缘检测算法,梯度是通过用高斯滤波器的导数来计算的。这种方法使用整 个阈值来分别检测图像的强边缘和弱边缘,并且只在强、弱边缘相连时,弱边 缘才会包含在输出中。故而此方法不易受噪声的干扰,能够检测到真正的弱边 缘【2 0 1 。 ( 3 ) p r e w i t t 算子 p r e w i t t 算子近似一阶导数。它是一种一阶微分算子的边缘检测,对于3 3 的卷积掩模,利用像素点上下、左右邻点的灰度差,在8 个可能方向上估计梯 度,在边缘处达到极值检测边缘,去掉部分伪边缘,对噪声具有平滑作用。 1 0 对于每个算子可以给出3 3 掩模,其他的可以通过简单的旋转而得到,如 曩= b 立立也= 三立到 梯度方向是由具有最大响应的掩模给出的。 s o b e l 算予有两个,式( 2 4 ) 是检测水平边缘的,式( 2 5 ) 是检测垂直边缘的。 ”睢立f 陋4 , ”j - 三。0 习 陋5 , 卜1 0 1 i 如果h z 的响应是x ,h 2 的响应是y ,那么就可以根据式( 2 6 ) 得出强度: 4 x + y 2 或h + f y i( 2 6 ) + 或j 工i + i( 2 6 1 边缘图像中近乎没有0 值的像素,然而,小的边缘值则是对应于由弱且不 规则照明、量化噪声等引起的不太显著的灰度变化。可以对边缘图像做个简单 的闽值化处理来排除一些小的数值。此方法是基于图像边缘幅度,由合适的阈 图2 - 1 ( b ) 图2 一l ( e ) 为几种边缘算子对图2 1 ( a ) 的处理结果。由图可见对图 2 - 1 ( a ) ,用p r e w i t t 算法的处理效果较好,能够较为准确的提取出物体的边缘信 ( a ) 灰度图像 、j吲 数 导 阶似近 l的 o o o 隋 1 j 1 j 1 l 一, o o o 下 吃 和这 ( d ) p r e w i t t 算子检测结聚 图2 1 儿种边缘算子的处理效果 2 基于区域的分割方法 区域生长和分裂合并法是串行区域技术的两种典型方法,它们的分割过程、 后续步骤的处理,都要根据先前步骤的结果来加以判定【2 l 】。 ( 】) 区域生长 区域生长法的优点:计算简单,能较好的分割较均匀的连通目标。它的缺 囊:种子点需要人为确定;对噪声比较敏感,还可能导致区域内有空洞;是f ; 每子的重对种邻续 。 先的相继了 首邻将素好。柑则像长 域点 ,子就区这质种域 成与性的区构对的新个 来后似为一 起然类作此 合 ,者素如 集点或像 。 素长同的素像生柑新像的其有些的质为子这件 性作种将条似素的再足 相像取 ,满有子选中有 将种与域没:个素区再 想一像的至思到的素宜 本找邻像 ,基域相子骤的区果种步长的如到的 生割 ,并而 域分析合l 区要分也行需行素进个进像复 行算法,故而当目标比较大时,分割速度会比较慢。所以对此算法设计时,一 定要尽量提高它的效率。 ( 2 ) 区域分裂合并 分裂合并的过程几乎与区域生长的正好相反,其基本思想是:先确定一个 准则,然后对于整个图像,连续进行分裂从而形成多个小的子区域,最后合并 f 讨景区域,从而就完成了对目标的提取。因为分裂合并是在整幅图像上进行假 设的,组成前景区域中的像素具有连通性,所以若是将图像分裂到像素级,便 可判定该像素是否为前景像素。而当完成了所有的像素点或子区域的判断之后, 再将f j 仃景区域或像素进行合并,就可以得到d i 景目标。图2 3 就是用这种方法 分割图像的。 图2 3 区域分裂合并分割后的图像 3 基于闽值的分割方法 阈值分割法在图像分割中是一种简单且高效的技术。其基本思想就是通过 设定不同的特征阈值,把图像的像素点分成若干类。在一幅图像中是用灰度等 级来表示各像素点的特征的,许多阈值分割法根据一维灰度直方图或二维灰度 直方图从背景中提取出感兴趣的目标。闽值分割法的结果很大程度上都依赖于 阈值的选择,因此阈值分割技术的关键在于阈值的选取。阈值选取过高,则过 多的目标点可能会被误归为背景;而阈值选取过低

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论