(计算机应用技术专业论文)工程图自动识别中图像预处理的研究与实现.pdf_第1页
(计算机应用技术专业论文)工程图自动识别中图像预处理的研究与实现.pdf_第2页
(计算机应用技术专业论文)工程图自动识别中图像预处理的研究与实现.pdf_第3页
(计算机应用技术专业论文)工程图自动识别中图像预处理的研究与实现.pdf_第4页
(计算机应用技术专业论文)工程图自动识别中图像预处理的研究与实现.pdf_第5页
已阅读5页,还剩51页未读 继续免费阅读

(计算机应用技术专业论文)工程图自动识别中图像预处理的研究与实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 计算机辅助设计因其高效、便捷的特性,己被工程技术人员广泛应用。但是以前的工程图纸 犬部分采用蓝图、手工绘制的形式,这些图纸是重要的技术资料。这些纸质图纸在保存、检索方 面都存在极大的困难,并且不能被后续设计方便使用。如何将工程图纸输入到计算机并转化成能 被计算机辅助设计软件使用的矢量化格式一直是计算机图形图像领域的重要课题。 本文对工程图自动识别涉及的相关技术进行分析和研究。提出了工程图分块处理的思想。分 别对工程图的b m p 文件格式结构和操作、二值化、噪声去除、细化、智能校正、轮廓跟踪及直 线拟合等各个过程和内容进行了分析、比较和实现,并对二值化中的阈值确定进行了深入分析和 算法改进,对智能修正提出了实现方法。 在研究有关技术和算法的基础上,开发了一个具有工程图预处理、图像矢量化以及其他图像 处理功能的软件系统,该软件具有分块选取图像并分块处理的功能。工程图处理技术对相关理论 的发展具有促进作用,对其它智能系统具有参考、借鉴作用。 关键字:工程图纸,二值化,阈值分割,直线拟合 j i a b s t r a c t c o m p u t e ra i d e dd e s i g ni su s e da b r o a db ye n g i n e e r sb e c a u s eo fi t sc h a r a c t e r i s t i ch i g he f f i c i e n c y a n de x p e d i e n c y b u tt h ep r e v i o u se n g i n e e r i n gd r a w i n g sa r em o s t l yb l u e p r i n ta n dd r a w nb yh a n d s ,a n d t h e ya r ef a i r l yi m p o r t a n t t h e s ee n g i n e e r i n gd r a w i n g sa l eb a d l yd i f f i c u l t yt om a i n t a i na n di n d e x ,a n d c a l l tb eu s e de a s i l yf o rr e a rw o r k h o wt oi n p u te n g l n e e r i n gd r a w i n g sa n dc o n v e r tt h e mi n t ov e c t o r d r a w i n g sw h i c hs o f t w a r eo fc a dc a nu s ei sa l li m p o r t a n ts u b j e c ti nt h ea r e ao fc o m p u t e rg r a p h i c sa n d i m a g e t h er e l a t e dt e c h n o l o g yi sa n a l y z e da n ds t u d i e di nt h ep a p e r am e t h o do fb l o c ks e g m e n t a t i o ni s b r o u g h tf o r w a r d s t r u c t u r ea n do p e r a t i o no fb m pf i l e ,b i n a r yi m a g et r a n s f o r m i n g ,n o i s e - r e d u c i n g ,l i n e t h i n n i n g ,m o d i 轴gi n t e l l i g e n t l y , c mt r a c i n ga n ds t r a i g h i - l i n ef i t t i n ga r ea n a l y z e d c o m p a r e da n d r e a l i z e d a l g o r i t h m sf o rb i n a r yi m a g et r a n s f o r m i n ga r ed i s c u s s e dt h o r o u g h l ya n dm o d i f i e d am e t h o do f m o d i f y i n gi n 把l l i g e n f l yi sb r o u g h tf o r w a r d o nt h eb a s i so ft h ed i s c u s s i o no ft e c h n o l o g i e sa n da l g o r i t h m s t h ep a p e rf i n a l l yr e a l i z e sa e n g i n e e r i n g 出州抽秘p r o c e s s i n gd e m os o f t w a r ee d p s ,c a p a b l eo fa c c o m p l i s h i n gp r e u e a t m e n to fi m a g e , r a s t e rt ov e c t o rc o n v e r s i o na n do t h e rp r o c f s so fi m a g e ,w h i c hp r o v i d e sab a s i sf o rt h el a t t e rs t u d y t h e t e c h n o l o g yt h a ti su s e di nt h ep a p e rc a np r o m p tr e l a t e dt h e o r ya n db eh e l p f i f lf o ro t h e ri n t e l l i g e n c e s y s t e m s k e yw o r d s :e d g i c 洳gd r a w i n g s ,b i n a r yi m a g e ,t h r e s h o l ds e g m e n t a t i o n ,s t r a i g h t - l i n ef i t t i n g i u 独创性声明 本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成 果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发 表或撰写过的研究成果,也不包含为获得中国农业大学或其它教育机构的学位或证书 而使用过的材料。与我同工作的同志对本研究所做的任何贡献均已在论文中作了明 确的说明并表示了谢意。 研究生签名:匀鸣百钧 时间:埘年多月,日 关于论文使用授权的说明 本人完全了解中国农业大学有关保留、使用学位论文的规定,即:学校有权保留 送交论文的复印件和磁盘,允许论文被查阅和借阅,可以采用影印、缩印或扫描等复 制手段保存、汇编学位论文。同意中国农业大学可以用不同方式在不同媒体上发表、 传播学位论文的全部或部分内容。 ( 保密的学位论文在解密后应遵守此协议) 研究生签名:彩j 孑斫锑时间:删年月,臼 导师魏计濒疋 帆娜年石月彩日 中国农业大学硕士论文第一章 绪论 第一章绪论 1 1 工程图矢量化的背景和意义 工程图是工程技术人员描述设计对象、表达设计思想的主要工具。在长期的设计和生产过程 中,人们积累了大量的纸质工程图,据国际数据与文档管理杂志估计,在全球现有的8 0 亿余张 工程图纸中,超过8 5 以上是人工绘制的。这些图纸是人们经验和智慧的结晶,是进行新产品设 计与开发的重要依据和基础。然而由于图纸璧大和纸质的自身缺点,给图纸的保存、管理和使用 带来了不便,对交互输入的工程图和其他方式( 如扫描辕八、摄像输入) 生成的工程图进手亍再设 计,对提高产品设计质量、降低设计成本及缩短产品开发周期具有不可低估的作用。 随着信息技术的发展,计算机辅助设计( c a d ) 技术日益广泛的应用到了工程设计的各个领 域,c a d 的准确性、智能性和易编辑性显著的提高了制图效率,得到了人们的广泛认可并逐渐 成为主流的设计方式。但是,现在的大多数c a d 软件只能在图形数据文件格式下进行绘制和编 辑,对于图像文件则不能直接进行操作。由于纸质工程图纸经扫描设备输入计算机时都采用图像 文件格式存储,这就造成现行的c a d 系统对原有的纸质工程图纸无法直接使用;于是,人们面 临着这样一个难题,即如何将原有的纸质工程图纸转抉成图形数据文件。这一难题一旦解决,不 仅籍使得保存在纸质图纸上的泪设计可以迅速方便地为今天所和用,也会促使人们彻底抛弃纸质 图纸而转向c a d 设计方式。工程图的识别与解释是c a d 技术一直追求的目标。 现行的c a d 系统主要采用人机交互的方式输入工程图纸,由人读图,逐个图素地输入图形。 这种图形输入方式相当于对原图进行了重新绘制,存在着繁琐、低效的弊端,严重影响了生产效 率和增加了劳动强度于是,人们希望开发出一种高度自动化和智能化的系统来解决这一难题, 这种系统被称为工程图纸处理及识别系统或工程图纸自动化处理系统。工程图纸矢量化是将纸质 工程图扫描输入到计算机后,对所得的扫描图像经过处理、分析和识别,最终重建其中的图形对 象的过程,它是图纸复用、自动理解等应用的基础,技术上涉及计算机图形学、图像处理、人工 智能和模式识别等多个领域,处理过程也包含多个方砸和多个层次,有很多问题值得深入研究, 具有很高的学术价值和应用价值。 计算机中的图像有两种袭示方式,一种是光栅图像表示方式,一种是矢量图形表示方式。光 栅图像,也称为援格图像或点阵图像,是指在空间和亮度上都己经枣敖化了的图像。如果把一幅 光栅图像考虑为一个矩阵,那么矩阵中的任一元素对应于图像中的一个像素点,数字矩阵中的元 素叫做像素,而相应的值对应于该点的灰度级或者颜色。数字图像是由一系列像素组成的矩形图 案,如果所有的像素有且仅有两个灰度级( 黑或白) ,则称其为二值图像:如果象素具备多个灰度 值,或者彩色值,贝l j 图像称为灰度图像或彩色图像。 与光栅图像对应的是矢量图形。所谓矢量,就是使用诸如长度、方向等参数来综合描述对象。 例如画面上的一段直线,一个矩形,一个点,一个圆,一个填充的封闭区域等。矢量图形文件就 是由这些矢量对象组合而成的描述性文件。矢量图形则是由计算机软件通过一定算法,将矢量对 象的描述信息在显示终端显示出来。 中国农业大学硕士论文第一章绪论 工程图纸矢量化技术的最终目标是把经扫描所得到的工程图纸光栅图像加以处理、分析、识 别并最终转换成矢量图形格式。以矢量图形格式存储工程图纸信息有以下优点。 ( 1 ) 可以和c a d c a m 系统集成 目前市场上的各种c a d 系统都毫无例外地使用矢量格式的图形文件,因为矢量图形格式包 含图形的各种数据信息,c a d 系统可以作进一步处理。例如:计算面积、体积、重量、参数化 设计、生成三维图形、模具设计等。 ( 2 ) 存储空间小 以矢量格式存储的工程图纸所占的磁盘空间往往只是光栅图像的1 5 1 1 0 。因矢量化技术也 是一种图像压缩技术,在图像通信系统中也常常得以应用。矢量图像利用点和线等矢景化的数据 描述图像,并在图形中包含色彩和位置信息。矢量图像的最大优点是分辨率独立。当显示或输出 i 訇像时,图像的品质不受设备的分辨率影响,能够提供高清晰的画面。矢量图相对位图而言,更 适合用于直接打印、印刷或输出到一些小型设备如手提装置上。放大和缩小矢量图不会影响图 像品质;而且矢量图通常占的存储空间要比光栅图小得多。任意缩放不失真,常用以制作插图、 工程技术绘图、标志图等。光橱图像如位图每个象素单独记录颜色等信息,与别的象素是相互独 立的,在放太时在边缘会出项锯凿现象。 ( 3 ) 有利于图形的编辑和管理 、 矢量图形之间可以进行透明叠加,有利于揭示图形之间的内在关系;对图形可以进行无级放 大或缩小,也可以拖拉图形,使图形漂移浏览;对图形可以方便地再编辑,并可以对其进行赋值 和标注等- 5 可以方便地建立起图形数据库,对图形进行操作、分析和管理等操作。 工程图纸矢量化技术是工程图纸集成处理系统,包括图纸档案管理系统、图纸通信系统、图 纸理解系统的前期必经步骤和关键环节,也是近年来c a d 技术的研究热点之一。此项技术有着 广阔的应用前景和较大的研究空间。同是又由于它涉及到诸多学科,如图形学、图像处理、模式 识别和人工智能等学科,决定了它具有重大的研究意义同时又有较大的研究难度。 1 2 工程图矢量化国内外研究现状 长期以来国内外科研院所对工程图的自动识别和计算机管理进行了深入、广泛的研究,并取 在不同方面取得了成果,开发出有一定使用价值的软件系统。由于该问题涉及的学科多、难度大, 目前的研究结果普遍存在处理效果不好、智能程度低以及适应能力差等缺点。从总体而言,目前 的系统识别能力有限,在矢量化方面,主要表现在识别能力有限、交互过多、可靠性差、处理速 度低等。当前人们对于此问题的解决办法主要有两种思想。第一种主张工程图经过扫描仪扫描 输入后不追求自动识别处理,认为自动识别处理后仍有不少错误需人工干预,强调提供强有力 的光栅图像处理方法,经压缩存放,便以使用与复制,这种方法对工程图的管理是有效的,但没 有提供c a d 图形系统所能处理的矢量文件格式,所以当利用j 舯q 工程图纸进行设计时,还需要 在c a d 系统中从新绘制图形。第二种思想是采用多种方法识别工程图,获得适合于c a d 图形系 统的内部数据文件格式表示,以达到方便应用c a d 技术,在已有的工程图纸的基础上,进行更 新换代的设计。但是+ 目前利用识别算法得到的识别结果都不同程度的存在错误。因此也提供功 2 中国农业大学硕士论文 第一章绪论 能越来越强,使用越来越方便的光栅图像编辑手段,让用户可以迅速改正识别中的错误。两种思 想各有各的使用场合,在特定情况下分别满足不同的需求,而且正在取长补短,相互结合。在光 栅图像编辑和工程图自动识别结合的较好的有由大连理工大学机械学院自主版权开发的通用机 械设计工程绘图系统( c a d ) 。 1 2 1 工程图矢量化的方法 工程图的矢量化有不同的实现方法,典型的有以下四种。1 : ( 1 ) 细化的方法 细化方法采用某种细化模板逐层删除图像的边界象索点,直到获得宽度为个象素的骨架。 骨架信息基本保存了图线的方向、起点、终点、长度等参数。细化的结果用链码表示,最后将链 码信息进行矢量化。也可以直接对细化结果进行跟踪,在跟踪的过程中同时进行直线或者圆、圆 弧拟合。 基于细化矢量化的优点是骨架信息能够较好的保留原有图像的拓扑信息,同时降低了矢量化 时处理数据量。图像细化的过程和结果都很直观,从而细化方法在工程图识别中得到广泛的应用。 不足之处是细化法会在图线交点部分发生畸变,不光滑的边缘会产生毛刺,从而影响后续矢量处 理的准确性;同时,矢量化的结果丢失了图线宽度信息。需要通过其他处理来恢复。本文采用该 方法。 ( 2 ) 整体识别方法 近年来,比较多的文献开始讨论整体矢量化。整体矢量化算法大致有两类,一类是基于连通 域结构处理的矢量化,这类算法首先扫描图像中的所有扫描段,组成连通域结构,然后再将所有 图形的图段组织成扫描段结构,寻找符合备类线型特征的种子图段,据此确定线型的初始集合参 数。然后根据图段之闯的位置关系,跟踪出组成同一线型的所有圈段,井确定最终几何参数。另 一类算法不需要首先对连通段进行扫描归类而是在对图形扫描的过程中,对行程段直接进行编 码,通过检测圈线的不同前进方向,动态获取线宽信息,得到跟踪方向,进而进行后续矢量化处 理。在整体矢量化算法中,首先通过扫描段,按照“线宽相同”的准则,将整个图像划分成很多 宽度相同的条块,然后将宽度相同的条块合并,对合并后的条块进行矢量化,最终完成对整个图 形的矢量化工作。 整体识别算法能够在矢量化的过程中同时获得图线宽度信息,同时,可以通过采用不同的跟 踪方式降低噪声以及直线缺损、断裂的影响,能够获得较好的识别效果。但是,整体识别算法在 交点部分处理中,仍然存在着一定的困难。 ( 3 ) 轮廓矢量化的方法 轮廓矢量化的原理是:用一组矢量将图像的区域描述出来。基本操作过程为:1 、检索图像 的边沿象素。2 、将相邻的边沿象素依次连接起来,并依f r e e m a n 链码形式保存。3 、对链码进行 拟合处理,得到由直线和圆弧等图素组成的轮廓矢量。用轮廓矢量化方法处理图像的最大优点是: 能传递大部分图像信息,并能很好地保持原图像的形状细节。缺点是得到的轮廓矢量的数据量较 大。因为用轮廓矢量来表示图线时至少需要对其两侧的形状进行描述,且两侧的形状很可能被相 交的圈线分割为多段。 3 中国农业大学硕士论文第一章绪论 曩簟量置蔓l i 鼍篁量| 寡寡| 舅量皇量! 蔓蔓曼曼曼蔓 ( 4 ) h o u g h 变换的方法 h o u g h 变换方法是与以上几种直接在图像和图形数据上进行分析和处理的矢量化方法完全 不同的一种图像变换方法,h o u g h 变换将图像上每个象素按给定的参数方程影射到几个可能的参 数组中,然后对这些参数组进行优选,得到由最佳参数组描述的参数方程。h o u g h 变换方法能处 理非常模糊的图像,但在图像的细节描述中有比较大的困难,同时计算量很大,一般不宜在j :程 圈识别中大量采用。 1 2 23 - 程图处理系统介绍 国内外科研院所对工程图自动识别进行了广泛的研究,取得了不同的成果和相关的产品。国 外的有德国s o f t e l e c 公司的v i h y b r i d c a d 、美国g t x 公司的g t x r a s t e r c a d s e r i e s ,挪威r a s t e r c x 公司的r x a u t o l m a g ep r o 等。国内主要有清华紫光的t h - d a i m s 图纸处理系统、华中科技大学的 e d i s 工程图信息系统,西北工业大学c a d 中心的n p u - e d r s 工程图输入与识别系统,东大阿 尔派的s e a s 系统,中科院计算所的v m a n 等。 ( 1 ) v p h y b r l d c a d v ph y b r i d c a d 是德田s o f i e l e c 公司开发的光栅图像矢量化软件,s o f t e l e c 公司是在工程图像 转换领域处于困际领先地位的专业软件开发商。据美国c a d 领域的专业杂志o d l y s t 杂志 在2 0 0 6 年1 月份测评显示是矢量系统中在功能最完善、最有效、用户界面最友好和最智能的光 栅编辑和矢量化软件。该系统能输入和输出所有的标准格式,最显著的特点是具有极快的矢量化 速度。能够将单色和彩色光栅图像进行各种编辑处理和矢量化。实现了光栅图像校正、去斑点孔 洞、镜向、旋转、复制、剪切、删除、穆动、缩放等,从而使图像得到净化和更新,它能自动识 别线、圆、圆弧、文字( 0 c r ) 、剖面线、多义线、拟台曲线、箭头、圆箭头、线宽、线型、各 种符号等。它能自动将将各种矢量实体按类型、宽度、线型分层。 ( 2 ) g t x r a s t e rc a d g t x r a s t e rc a ds e r i e s 系统是美嗣g t x 公司开发的光栅编辑、矢量化软件。g t x 公司在图 纸处理尤其在机械和工程图纸处理方面世界范围内处于领先地位。在图像净化、光栅编辑和矢量 化方面做得较好。在光栅编辑上采用智能实体拾取。能识别光栅实体。在图纸矢量化上,圆弧的 矢量做的较为突出,能自动将大小不等的实线或虚线圆、弧识别出来。可以识别箭头等图形符号。 ( 3 ) r x a u t o l m a g ep r o 该系统是挪威r a s t e r e x 公司设计的光栅编辑、光栅一矢量混合编辑及全自动矢量化软件。美 国c a d 领域的专业杂志 c a d a l y s t 对它的设计评语为:它是现在能找到的近乎完美的光栅编 辑和矢量化软件,它几乎包含您所期望的一切光栅编辑和矢量化工具。 ( 4 ) s e a s 2 0 0 0 系统 s e a s 系统是中国东大阿尔派公司采用面向对象方法设计的应用软件。可以对大型工程图纸 进行自动输入、自动处理,光盘压缩存储等。可以管理各种格式的文件、文本、图纸、矢量图实 现了档案的综合管理。图纸的自动处理技术包括对图纸的消篮、去污、净化、滤色以及格式转换。 在光栅矢量化方面采用光栅矢量混台编辑技术,提供局部矢量化以及交互矢量化的功能。提供档 案管理功能、灵活的分类检索和模糊检索及方便的图纸浏览和强劲的光栅矢量化混台编辑设计系 4 中国农业大学硕士论文第一章绪论 统。其特点是在图纸及档案的管理,在矢量化上作局部实现。 f 5 ) t h - d a i m s 图纸处理系统 图纸自动输入及管理系统t h - d a i m s 是清华大学c a d 中心与清华紫光公司联合开发的,是 一个面向大中型企业进行工程设计的c a d 软件,该系统遥过扫描设备输入工程图纸,同时,对 扫描输入的图纸进行消蓝去污处理。系统有丰富的图像编辑修改手段,可以对扫描输入的图纸进 行多种设计,包括各种图像编辑、拼接、裁剪、贴补、矢量图形文件调用、汉字字符输入,并可 提供标准图形符号库,该系统还提供有图纸管理数据库,将工程图纸的设计与管理融为一体。 ( 回n p u e d r s 工程图输入与识别系统 该系统是由陕西o d 中心开发的工程图智能输入与识别系统,该系统实现了工程图图纸到 c a d 矢量图形自动转换和智能识别。自动实现工程图扫描图像的预处理,包括噪声去除、光栅 图像放缩显示漫游、光栅图像编辑、图形符号的分割等。具有工程图各种图素的自动分类与识别 功能。如机械工程图的轮廓线、尺寸线及各种辅助线,正确识别出宣线和圆弧。实现了工程图标 注符号的智能识别功能,如机械工程图的尺寸数字、公差符号与外国文字等。还能自动生成符合 国家标准的标越栏,并提供标题栏信息、技术条件等文本信息和交互编辑功能。最终生成c a d 系统能直接使用的d x f 文件。 1 3 数字图像处理的应用 人类感知外界信息,以上是通过视觉得到的,而图像实际上正是对这种感知能力的一种 人为增强形式,因此对图像的研究为我们感知外部世界很有帮助。随着图像数字技术的成熟,图 像作为更直接更丰富的信息载体,正在成为越来越霞要的研究对象。 人类是通过眼睛与大脑来获取、处理与理解视觉信息的,周围环境中的物体在可见光的照射 下,在人眼的视网膜上形成图像,由感光细胞转换成神经脉冲信号,经神经纤维传入大脑皮层进 行处理与理解。视觉,不仅指对光信号的感受,它包括了对视觉信息的获取、传输、处理、存储 与理解的全过程,信号处理理论与计算机出现以后,人们试图用摄像机获取环境图像并将其转换 成数字信号,用计算机实现对视觉信息处理的全过程。这样,就形成了一门新兴的学科一计算机 视觉。计算机视觉的研究目标是使计算机具有通过一幅或多幅图像认知周围环境信息的能力,这 种能力将不仅使机器能感知环境中物体的集合信息,包括它的形状、位置、姿态和运动等,而且 能够对它们进行描述、存储、识别与理解。由此可知,计算机视觉是与图像数字技术密切相关的, 在很大程度上研究的内容是相同的。而图像的数字技术和计算机视觉技术正在得到越来越多的应 用。 ( 1 ) 图像处理 图像处理技术狭义来讲就是把现场获取的图像转换成具有所希望特性的另一幅图像。例如, 可通过处理使输出图像有较高的信噪比或通过增强处理突出图像的细节,以便操作员的检验或为 别的处理打基础。在计算机视觉研究中经常利用图像处理技术进行预处理和特征抽取。比较狭义 的图像处理主要是指对图像进行各种加工以改善视觉效果,并为图像识别打下基础。 ( 2 ) 图像分析 图像分析则主要是对图像中感兴趣目标进行检测和测量,以获得它们的客观信息从而建立对 5 中国农业大学硕士论文第一章绪论 图像的描述。如果说图像处理是一个从图像到图像的过程,则图像分析是一个从图像到数据的过 程。这里数据可以是对目标特征测量的结果,或是基于测量的符号表示。它们描述了图像中目标 的特点和性质。 ( 3 ) 图像理解 图像理解是在图像分析的基础上,进一步研究图像中各个目标的性质和他们之间的相互关 系,并得出对图像内容含义的理解以及对原来客观场景的解释,从而指导和规划行动。一幅图像 的图像理解程序不仅描述图像本身,而且描述和解释图像所代袁的景物以便对图像代表的内容做 出决定。在人工智能视觉研究的初期经常使用景物分析这个术语以强调二维图像与三维景物之间 的区别。图像理解除了需要复杂的图像处理以外,还需要具有景物成像的物理规则的知识以及与 景物内容有关的知识。 1 4 本文研究内容 工程圈进行二值化时阈值确定的研究,图像二值化是重要的一步,直接影响后续的细化、轮 廓跟踪和最终的识别。对常用的阈值确定方法进行了研究对比。有基于图像直方图的峰谷法、0 t s u 法、逼近迭代法,选择了逼近迭代法作为二值化中阈值选取方法。 扫描的工程图具有各种类型的噪声:黑色斑点、空洞、毛刺和凹陷,针对不同的噪声采用不 同的去除方法,对常用去噪方法进行了研究。对于斑点用中值滤波去除,对于空洞和凹陷噪声用 数学形态学中的膨胀运算去除 在细化过程中,会出现断线和毛刺,对后续的轮廓跟踪和矢量化造成影响;对这种情况可以 采取智能化修正。本论文根据相关的工程图的规定和特性,采用交互和智能相结合的方法进行修 正。 对细化后的图像轮廓进行跟踪,用定步长进行直线拟台。 在识别过程中。采用分块识别的方法,对其中的某一视图进行识别处理。对有些工程图,用 矩形框选择质量好、信息丰富、关键的图块进行识别处理,这既可减少处理量,又可提高识别效 果,满足用户的需求。 1 5 本论文的结构 第一章主要阐述本课题的背景和意义,阐述了工程图矢量化的必要性和重要性,是发展 c a d c a m 必需解决的难题之一。介绍了工程图矢量化的国内外现状,介绍了该课题进展情况。 工程图的自动识别已经进行了长时间的研究。在单图元的矢量化较成熟,但识别程度和深度都还 不够,实际的应用的系统交互过多,还不能满足用户的需求。分析了其产生的原因。 第二章分析工程图自动识别系统的结构、处理流程,包括工程图的扫描输入、文件的打开、 二值化、空洞填充、去除噪声、细化、细化后智能校正、轮廓跟踪、直线和曲线的拟合、生成欠 量化文件格式输出等过程。阐述了图像预处理在工程图自动识别中的重要性。对本文采崩的文什 格式b m p 进行了结构分析。并创建一个类c d i b 进行操作、管理。对b m p 文件的打开操作 6 中国农业大学硕士论文第一章绪论 进行了改进和实现。 第三章主要分析和研究了图像预处理的过程、步骤和算法实现。重点分析、研究了二值化处 理的中阈值选取的算法,并进行了改进。对二值化的原理和所涉及到的技术进行了阐述,井用双 峰法、最大类间方差法、逼近迭代法进行分析、试验、比较,结果显示逼近迭代法较适合工程图 的二值化处理。对工程图的孔洞填充、噪声去除、细化进行了分析,选择了适合丁程图的算法, 并实现。对细化后的智能校正进行了分析,就毛刺去除、断裂连接提出了处理算法和步骤。 第四章对细化后的图形轮廓进行跟踪,采用f r e e m a n 链码法记录轮廓象素。然后对所记录的 象素进行直线拟台,阐述了拟合的原理,采用定步长跟踪法来实现拟合,可以减少处理的象素, 提高矢量化效率。 第五章首先对本文所采用的面向对象的编程思想进行分析、介绍,因其继承、多态的特性解 决了代码重用和移植的问题,展示用本文的工程图处理演示系统处理的结果并对结果进行分析。 第六章概括了本文取得的结论、成果,并对以后的研究工作提出了展望。 7 中国农业大学硕士论文第二章工程国自动识别涉及的相关问题 | 曼孽曼墨鼍皇| 董鼻鼍_ i i 皇皇| 量曾舅| 曼皇皇皇曼曼皇奠 第二章工程图自动识别涉及的相关问题 i = 程图纸输入与自动识别是图形图像工程的一个热门课题,也是c a d 追求的目标之一,引起 了广大的专家、学者的广泛关注。同时也开发了一些应用系统,因为目前还没有真正了解人的识 别过程,所以利用计算机还不能完全模拟人的识别过程,从而只能对某一类型的工程图在一定程 度上达到识别。通常把识别的过程分成在计算机上可以实现的步骤这些步骤包括:工程图的扫 描输入、图像文件读取、二值化、噪声去除、图文分离、细化、细化后的智能校正、直线矢量化、 圆和圆弧矢量化、矢量化后处理及生成矢量化格式文件。其工作流程图如图2 - 1 所示。 ! :二二:二二二j ;f 图像文件读取f f ! 一; l 二值化 l :一一一一一一, ;茵;匦固! ! : 匝堕h 匦一匝困h 匦 ; 二三圈i 矢量化衙处 ! 广 ;! ! ! i 智能校正ii 。 。l _ = _ = :d: 矢董化 整个过程首先从工程图纸经扫描仪扫描输入开始,然后进入预处理阶段。在预处理操作中, 首先通过二值化操作,将扫描获得的2 5 6 级灰度工程圈转换成黑e t - 值图像;然后经过噪声消除 操作,去掉图纸本身存在的以及二值化过程中引入的各种噪声,根据图纸质量以及二值化的效果, 进行断线修补等操作。由于工程图纸中包含了大量的字符标注信息。而对于字符的识别与备种图 线元素矢量化的关注重点不同,所以矢量化预处理中一般会包括图文分离操作。将各种字符标注 信息分离,以便在其他操作中处理:根据关注的重点不同,预处理中还可能包括了对丁程图中各 种标注符号的分离。再进行细化和细化后的智能校正。 经过预处理的图像,开始进入矢量化阶段。矢量化中主要包括了对直线、圆、圆弧以及其他 二次曲线等进行矢量化。根据矢量化的最终效果,矢量化过程中还可能包括各种后处理,比如对 于各种圆的合并、圆弧合成圆、同心圆的校正、各种直线和圆的交点信息处理以及剖面线等特殊 区域的处理等其他操作。 8 中国农业大学硕士论文第二章工程圈自动识荆涉及的相关问题 2 1 图像预处理重要性 图像预处理是工程图自动识别的第一步,也是重要的一步,特别是其中的二值化处理和细化 处理。图像= 值化是为了节省存储空间,减少后续处理的数据,将目标从图像中分割出来。而二 值化处理的关键是阈值的选取,如果阚值选取不当,会产生误分割,误分割包括将目标误判为背 景和将背景误判为目标两部分。细化就是抽取轮廓的骨架,用单象素来表示原图形的拓扑关系。 如果细化处理得效果不好,产生大量的断线、畸变,将对后续的正确跟踪、拟合产生重要影响。 l 虬。,一 (c)(d) 圈2 - 2 工程田不向分啊效果 图2 - 2 中,图( a ) 是扫描进来的一短轴的灰度图像;图( b ) 经过分割后的图像,边界轮廓产生较大 的断裂现象不利于后续的处理:图( c ) 经过分割后产生线条粘连,将部分背景噪声误选出来,不 利于后续的识别处理;图( d ) 是分割得较好得一幅图,轮廓清晰,线条完整,将背景噪声基本去 除,为后续准确识别处理打下基础。 造成当前存在的识别率不高的因素是多方面的,在许多论文中对识别的方法进行了大量的研 究,提出了不同的识别算法,对工程图识别率、识别速度的提高都有很大的帮助。而在预处理方 面研究相对较少,本文就在预处理方面作一探讨。 9 2 2 工程图的扫描输入 图纸经过扫描输入计算机后是依点阵存储的。扫描仪的分辨率可以从几点,英寸到千余点英 寸。常见的以3 0 0 点英寸分辨率扫描一幅a 4 图纸,其全部图像信息即使按二值图像存储也需大 概1 m 字节,扫描一幅a 0 图纸其信息量多达8 m 字节。一般的工程图纸中的粗实线宽度是0 8 毫米细实线是粗实线宽度的一半,因此要保证不断线,并且有足够的精度,分辨率应取2 0 0 - 3 0 0 点,英寸,如果分辨率过高,只会大大增加计算量,而没有其它的益处。本文采用3 0 0 点英寸的 分辨率。选择适当的图形扫描分辨率和合理的图像数据存储格式,既有利于信息压缩存储,义有 利于提高处理速度。 本文采用爱普生p e r f e c t i o n2 4 0 0p h o t o 扫描仪作为输入设备进行图纸输入,该扫描仪的最大 分辨率可达4 8 0 0 ,可扫描a 4 图纸,采用3 0 0 点膜寸分辨率扫描一张a 4 图纸需大概1 2 秒。扫 描图像可以用p c x 、b m p 、册等多种图像文件格式存储。本文用a d o b ep h o t o s h o p7 0 将扫描 进来的工程图转换成2 5 6 色的b m p 位凰格式,这可方便后续的处理,又不会因色彩信息的丢失 而影响工程图的识别。 2 3 文件的读取 2 3 1 位图文件结构 b m p 文件格式是一种常见的文件格式,是所有图像格式中较为简单的一种,也是w i n d o w s 操作系统的标准文件格式。一个完整的b m p 位图文件一般包括以下四部分:位图文件头、位图 信息头、颜色表和位图数据比1 。图2 _ 3 说明了b m p 文件的组织方式。位图文件头包含文件标识、 文件长度等信息,位图信息头则包含图像宽、高、颜色和压缩方法等信息。在w i n d o w s a p i 中, 有专门结构b i t m a p f i l e h e a d e r ( 位图文件头) 、瑚1 1 出世瑚f ( 婀队d e r ( 位图信息头) 等来描述。 颜色表b m p c o l o r 用于说明位图的颜色,它有若干个表项,每一个表项是一个r g b q u 如类型 结构,定义了一种颜色。r g b q u a d 的定义如下: t y p e d e fs l r u c tt a g r g b q u a d b y t er g b b l u e ; b y t e r g b o r e e n ; b y t er g e r e d ; b y t er g b r e s e r v e d ; r g b q u a d ; 在r g b q u a d 定义的颜色中,蓝色的亮度由r g b b l u e 来定,绿色的亮度由r g b g r e e n 米定, 红色的亮度由f g b r e d 来定,r g b r e s r v e d 是保留值。b m p c o i o r 【l 表项的个数由信息头 b l t m a p i n f o h e a d e r 中的象素位数b i b i t c o u n t 来定,b i b i t c o u n t 的值可为1 、4 、8 、2 4 ,分别 对应单色( 1 位) 、1 6 色( 4 位) 、2 5 6 色( 8 ) 和真彩色( 2 4 位) 位图。当b i b i t c o u n t = l 、4 、8 时,b m i c o l o r 分别具有2 、1 6 、2 5 6 个表项。每个像素点所占字节数为2 4 、1 6 4 、2 5 6 * 4 。当b b i t c o u n t - 2 4 中国农业大学硕士论文第二章工程图自动识别涉及的相关问题 _ i i 曼曼蔓奠皇量| 曼曹奠曾| 奠| 墨奠皇鲁量皇寡葛 时( 真彩色位图) ,b m i c o l o r 的表项为空,每个象素点直接表示颜色值。图像数据以阵列的形式 保存在b m p 文件的中,其保存格式依赖于编码每个象素所用的位数。对于一个8 位位图来说, 每个象素占用文件中位酎数据部分的一个字节,象素的值不是嘲) 颜色值,而是文件颜色表中的 一个索引。所以在颜色表中如果第一个r g b 值是2 5 5 0 0 ,那么象素值为0 。表示它是鲜红色。 b 1 1 哺虚a p f i l e h e a d e r b 玎飞l a p i n f o r m a t i o n p a l e t t c ( 调色板1 d i b d a l a 圈2 - 3 呻文件结构示意田 象素值按从左到右的顺序存储,通常从最后一行开始。所以在个2 5 6 色的文件中,位图数据中 第一个字节就是图像左下角的象素的颜色索引,第二个就是它右边的那个象素的颜色索引。如果 位图数据中每行的字节数是奇数,就要在每行都增加一个附加的字节来调整位图数据边界为1 6 位的整数倍 图像数据的保存形式可知,1 位、4 位和8 位位图中,图像数据中保存的不是真实的颜色, 而是图像颜色的索引值,那么,如何从颜色表中提取图像颜色呢? 假设,已经得到位图中像素点( x ,y ) 的索引值为m 如x 驾,即它的颜色值是颜色表中索引值i n d e x f f i 勰所对应的颜色。取值过程如下: ( 1 1 先确定h d c x f f i 2 8 在颜色表中的位置 文件头b i t m a p f i l e h e a d e r 占1 4 个字节,信息头b m a p 矾鼻( 厄a d e r 占4 0 个字节。 每个索引值占4 个字节,所以索引值i n d e x 2 8 在颜色表中的位置:s i t e 2 8 = 1 4 + 4 0 + 2 8 4 f f i l 6 6 。 ( 动提取颜色 从位图文件的第1 6 6 字节开始连续读取三个字节,从而得到像素点( x ,y ) 的颜色值i g b ,这样, 一幅图像无论在哪台主机上都可以根据自己的颜色表示确定各个像素点的颜色值,而不依赖硬件 设备。对于2 4 位位图图像阵列信息中每个像紊点的颜色值占3 个字节,每个字节正好是r g b 三种 颜色的颜色值,所以它无需颜色表另外,需要指出的是: ( 1 ) 位图是按逆序存储图像颜色值或索引值的。 假设一幅位图共有m 行n 列,在位图阵列信息中实际存放的格式是首行依次存放( m - i ) 行的 ( m - 1 。o ) ( m - i ,n 1 ) 像素的颜色值或颜色索引值,其次为( ( m - 2 ) 行,直到位图阵列的最后行 依次存放( ( o ,o ) ( o ,n 1 ) ) 像素的颜色值或颜色索引值。 ( 2 ) 每行的字节数 假设记录一行像素需b 个字节,b 谢鳓咖、b i w i d t h 为图像尺寸( 象素单位) ,b i t c o u m 为幽像 位数( b i h e i g h t 。b i w i d t h 和b i t c o u n t 在文件头中定义) 。 位图阵列信息的大小为b b i h e i g h t 个字节。为了对图像文件的存取方便,b 的取值规则如 下: 当( c o i w i d t h b i t c o u n 0m o d3 2 ) 时,b = ( b i w i d t h b i t c o u n t ) 8 ;( m o d 表示求余) 当( b i w i d t h * b i t c o u n t ) m o d3 21 = o 时,b = ( b i w i d t i t * b i t c o u n t ) 8 + 4 。 1 1 中国农业大学硕士论文 第二章工程图自动识别涉及的相关问题 上式中+ 4 的原因是为了使得每一行的象素值占用位图阵列信息的字节数为4 的倍数,不足的 用0 填充。 2 3 2 位图文件读取 清楚地了解了位图文件的结构,就可以象普通文件一样读取位图文件,图2 4 描述了这一过 程;打开文件,依次提取文件头、信息头、颜色表和图像数据等信息,读取完毕,关闭文件。 与普通文件不同的是,读取位圈数据时,一般不能一次全部提取。因为位图数据是以阵列的 形式存放的,占用很大的一块连续内存,尤其是尺寸较大的图像,占用更多。如果一次全部提取, 势必要占用同样大小的一块连续内存,由于机器的内存是有限的,使得可供c p u 支配的内存大 大减少,极大的影响了程序的运行速度。而且,大块连续内存常常不能成功分配,结果造成文件 读取失败。为避免上述不利因素,本文采用逐行的图像数据读取方法,具体如下: 圈2 - - 4 读取b 文件流程朗 假设图像为8 位,尺寸为w i d t h + h e i g h t ,则图像数据每行的字节数为w b y t c s = ( w i d t h * 8 + 3 i ) 3 2 * 4 图像数据为w b y t c s h e i g b i 的矩阵。 定义指针i p s r c 指向源图像数据,指针l p d e s t 指向目标数据,临时指针变量c u r r c n t s r e = l p s r c c u r r e n t d e s t = l p d e s t 。 中国农业大学碗士论文 第二章工程图自动识别涉及的相关问题 读取第一行w b y t e s 字节的数据:c o p y m e m o r y ( c u r r e n t d e s t , c u r r e n t s r c ,w b y t e s ) ,由此,读取整 个图像数据的过程如下: f o r ( i n ti - 0 ;i b i h e i g h t ;i + + ) c o p y m e m o r y ( c u r r e n t d e s t , e u r r e n t s r c ,w b y t e s ) ;逐行读取 c u n e n t r a w + = b i w i d t h ;源图像数据指向下一行 c u r r e n t d e s t + _ b i w i d t h ;目标图像数据指向下一行 ) 这种逐行的数据读取方式,每次只需w b y t e s 太小的内存,这就降低了程序对内存的需求, 提高了读取的成功率。 2 4 本章小结 本章分析了工程图自动识别所涉及的有关问题,包括工程图的扫描输入、图像文件读取、二 值化、噪声去除、图文分离、细化、细化后的智能校正、直线矢量化、圆和圆弧矢量化、欠量亿 后处理及生成矢量化格式文件。 阐述了工程图预处理的必要性和重要性,由于

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论