




已阅读5页,还剩47页未读, 继续免费阅读
(计算机应用技术专业论文)基于知识库推理的建筑矢量图纸构件自动识别的研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 图纸识别技术是近些年计算机应用领域的热点之一。特别在建筑领域中存在着大 量的工程图纸,对这些图纸若实现计算机的自动识别,就能够完成对图纸上建筑工程 量信息和数据的自动计算和提取。从而简化人工读图,改变手工计算工程量的传统做 法,使得建筑工程量实现全部自动化计算成为可能。 在本课题中,主要完成了以下两个阶段的任务: 一、对h u t o c h d 电子文档的读取,即d x f 文件读取。a u t o c a d 图纸信息存贮在图形 交换文件( d x f ) 中,对a u t o c a d 电子文档格式的研究是本课题的入手点。通过对a u t o c a d 电子文档结构的详细分析,从中获得有关点、线段、圆、弧、图层、标注等各种信息。 这些信息是后期图纸识别的数据基础。必须将获得的信息进行持久化操作。所以,选 择了以x m l 文件为存贮形式的持久化方法对获得的信息进行保存。并编制算法,实现 了d x f 文件和x l l 文件的转换。 二、构建识别知识库,形成识别规则,对从d x f 文件中提取出的基础数据进行分 析,这是本课题的核心所在。 知识库是计算机智能的基础。在本课题中,根据国家建筑制图统一规范( g b t 5 0 0 0 1 - - 2 0 0 1 ) ,结合图形特点,对图形进行了形式化的定义,形成了识别墙体,识别 门窗的识别规则。根据复杂墙体特点,设计了墙体分解算法,实现了对墙体的细分处 理提出了中轴线模型+ 属性的设计思想。最终实现对建筑图纸中基本建筑元素( 如: 墙体的厚度、长度,门窗的个数等) 工程量的提取。 关键词:d x f 识别,知识库,识别墙体,识别门窗 a b s t r a c t t h ed r a w i n g s r e c o g n i t i o ni sah o ts p o ti nc o m p u t e ra p p l i c a t i o n st e c h n o l o g yi nr e c e n t y e a r s e s p e c i a l l yi nb u i l d i n gf i e l d s ,t h e r ea r eal a r g en a r n b e ro fa r c h i t e c t u r a ld r a w i n g s ,i f t h e s ed r a w i n g sc a l lb er e c o g n i z e da u t o m a t i c a l l yb yc o m p u t e r , t h a ta l lw o r kq u a n t i t yo ft h e d r a w i n g sc a r lb ec a l c u l a t e da n dd r a w na u t o m a t i c a l l y t h u ss i m p l i f yb l u e p r i n t sa r t i f i c i a l l y , c h a n g et h et r a d i t i o n a lm e t h o dt oc a l c u l a t ep r o j e c tq u a n t i t yb yh a n d s h lt h i ss u b j e c t t w os t a g e sh a v ef i n i s h e d 签f o l l o w i n g : f i r s t , t or e a da u t o c a de l e e 仃o m cf i l e ,d x fd i s c e r l l s a u t o c a dd r a w i n gi n f o r m a t i o n s t o r e si nt h ed r a w i n ge x c h a n g e st h ef i l e ,i ti sa ne n t r yi nm ys u b j e c tt 0s t u d yo na u t o c a d e l e c t r o n i cf i l e t h r o u g ht h ed e t a i l e da n a l y s i st oa u t o c a de l e c h o n i cf i l es t r u c t u r e ,w eh a v e g o tr e l e v a n ti n f o r m a t i o ns u c h 越p o h a t ,l i n es e g m e n t , c i r c l e ,a r c ,l a y e ra n dm a r k i n g ,t h i s i n f o r m a t i o na n dd a t ai st h ef o u n d a t i o nt h a tt h ed r a w i n gi sd i s c e r n e do nl a t e rs t a g e m u s tb e p e r s i s t e n tm e s s a g e ,s oc h o o s i n gx m lf i l e 舔t h em e l l l o do fp e r s i s t e n t ,t ok e e pt h e i n f o r m a t i o n w o r ko u ta l g o r i t h m s ,h a sr e a l i z e dt h ec o n v e r s i o no f d x ff i l et ox m lf i l e s e c o n d ,t oc o n s t r u c tt h er e c o g n i t i o nk n o w l e d g eb a s e 。t of o r mt h er o l eo fr e c o g n i t i o n , a n dt oa n a l y z et h ep r i m i t i v ed a t at h a te x t r a c t e df r o md x f , t h i si sak e yo f t h i ss u b j e c t t h ek n o w l e d g eb a s ei saf o u n d a t i o no ft h ec o m p u t e ri n t e l l i g e n c e i nt h i ss u b j e c t , a c c o r d i n gt on a t i o n a l 缸e h i t e c t u r a ld m v 向g sa n du n i 母t h en o t l l l ( g b f i 5 0 0 0 1 2 0 0 1 ) , c o m b i n et h ef i g u r ec h a r a c t e r i s t i c s ,d e f i n e da n df o r m a l i z e dt h ef i e l dk n o w l e d g e ,f o r m e dr u l e s o fr e c o g n i t i o no ft h ew a l l ,d o o r sa n dw i n d o w s a c c o r d i n gt ot h ec h a r a c t e r i s t i co f c o m p l i c a t e dw a l l ,h a sd e s i g n e da l g o r i t h m s 协d e c o m p o s ec o m p l i c a t e dt h ew a l l ,r e a l m e dt o s u b d i v i d i n ga n dd e a l i n gw i t ht h ew a l l p r o p o s et h ed e s i g np h i l o s o p h yo ft h em o d e lc e n t r a l a x i so fw a l la d d i n ga t t r i b u t e f i n a l l y , r e a l i z ei tt ot h ea b s t r a c t i o no ft h ee l e m e n tp r o j e c t q u a n t i t yo ft h eb a s i cb u i l d i n ge l e m e n t s ( f o ri n s t a n c e :t h i c k n e s s ,l e n g t io ft h ew a l l ,t h e n u m b e ro f t h ed o o r sa n dw i n d o w s ) i nt h eb u i l d i n gd r a w i n g k e y w o r d s :d x fr e c o g n i t i o n , t h ek n o w l e d g eb a s e ,r e c o g n i t i o no f t h ew a l l ,r e c o g n i t i o no f t h e d o o ra n dw i n d o w 长存t 业人学硕i 学位论文 原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究工作 所取得的成果。除文中已经注明引用的内容外,本论文不含任何其他个人或集体己经 发表或撰写过的作品或成果。对本文的研究做出重要贡献的个人和集体,均已在文中 以明确方式标明。本声明的法律结果由本人承担。 论文作者签名:1 丢参 日期:知 年;月弘日 k 存t 业人掌硕l 学位论立 第一章绪论 l 1课题开发背景 本论文的题目是“基于知识库推理的建筑矢量图纸构件自动识别的研究”它是实 现建筑工程预算计算机自动化的一个重要组成部分。 建筑工程概预算从总体上可分为工程量计算和工程预算编制两个阶段。过去,这 两阶段的工作都是由手工完成的,工作量大,数据繁多,消耗了工程预算人员大量的 时间和精力。近年来,随着计算机和信息技术的迅猛发展,建筑工程概预算领域中出 现了大量的预算软件,但这些软件只是在人工读图,并计算出工程量的基础上解决定 额的自动套用、调整、费用计算、报表编制等工作。工程量计算工作还停留在由预算 师人工识别图纸的阶段。因此,如何实现工程量的自动计算是目前建筑工程概预算领 域研究的主要热点之一。而建筑工程图的自动识别问题是制约工程量计算自动化水平 提高的主要瓶颈。通过对大量相关文献的阅读,笔者试图利用计算机容量大、速度快、 易操作、便管理、可视性强等特点,模仿人工识图的思路与方法,设计实现一套能与 建筑设计软件a u t o c a d 对接的建筑工程图自动识别系统,从而解决a u t o c a d 与工程量 计算的接口问题,实现建筑工程量计算的全部自动化。 1 2课题研究目的 课题研究目的在于,从a u t o c a d 的电子文档( d x f 文件) 出发,研究出一套读取、 分析已有图纸信息的算法,并根据事先设定的推理逻辑( 规则) ,识别出图纸中的基 本图形构件。进而实现对建筑实体的识别,其中包括墙体、梁柱、门窗、标注等的识 别。在此基础上,最终达到提取建筑工程量的目的。 1 3与其他研究方法的比较 图纸计算机智能识别技术是当今计算机应用中比较热门的技术之一。从总体上看, 图纸的识别技术的发展方向是从平面图形识别向立体构件识别方向发展。 从图形识别的数据源来看可分为两类。 一类是从纸介质图纸出发的图形识别,这类方法一般要经过图纸扫描、预处理、 矢量化、后处理等几个步骤。这类图形识别主要功能是矢量化,即将图纸由点阵格式 转换为c a d 矢量数据格式。如:国内华中理工大学、中科院和清华大学等研究机构正 在从事这方面的研究。在国外,以k a r lt o m b r e 为核心的研究小组提出了一种基于矢 量的对建筑图的解释方法,以图形( 图元) 作为各c a d 系统之问信息交换的媒介。在 他的一篇名为t e ny e a r so fr e s e a r c hi nt h ea n a l y s i so fg r a p h i c sd o c u m e n t s : a c h i e v e m e n t sa n do p e np r o b l e m s 的文章中,总结了他们团队在近十年内所作的研 长春t 业j ( 学硕j 学位论文 究和取得的研究成果( 包括:图纸分析、符号识别、空间分析、工程图纸向c a d 模式 转换等) 。在此基础上,所实现的系统能够分析和解释建筑平面图中的墙、门、窗和确 定的模板符号,并建立所给图形表示的面向对象的计算机建筑模型。l p c o r d e l l a 等人研究了建筑图的矢量化和自动识别问题,研究的核心是基于人工智能和模式识别 理论基础上的应用。认为建筑图的自动识别应该集中于高层次的基于知识的建筑物功 能部件和空间清晰度的识别上。1 。d o s c hd e s i g n 公司重点研究构建各种三维模型。1 。类 似的国外大公司,大都开发的是基于设计的平台系统和软件( 如a u t o c a d 、3 d m a x 等) 。 特别是在建筑、机械加工等领域,还没有后续的比较智能的评估分析系统相伴随。后 续的开发基础就是对已经设计好的图纸的识别。但是至今仅有少数工作应用于研究建 筑工程图中的构件识别和理解,在深度和广度上均处于起步状态。 另类图形识别是从a u t o c a d 软件出发进行识别。但目前在这方面的研究还处在 起步和空白阶段。 以a u t o c a d 为基础的识别技术又可以分为两大方向: 其一,基于对a u t o c a d 的二次开发研究。开发出专门用于建筑设计的软件。在这 些软件中,将a u t o c a d 包容在系统之内“1 。在工程图纸设计的同时形成对构件的记录。 这种方法的缺点是对a u t o c a d 的高度依赖,在没有与a u t od e s k 公司协商的情况下, 直接引用a u t o c a d 存在着知识产权问题。 其二,利用图纸文件的数据结构直接识别并理解图纸中的各种信息,提取所需要 的数据,这类图形识别技术目前主要是针对d w g 和d x f 格式的图纸文件进行识别。由 计算机读入d x f 文件,采用面向对象、建立规则库和方法库的方法自动识别图形对象。 本课题主要采取第二种方法,通过读取d x f 数据文件,理解数据并建立基于规则 库和方法库识别原则,对a u t o c a d 的建筑设计文件d x f 进行的自动识别理解研究。 1 4 课题研究主要内容 在整个课题的研究过程中,存在着三个主要核心问题。 如何分析读取a u t o c a d 的d x e 文件数据, 夺如何将读取的数据重新组织存贮。 如何有效识别并形成逻辑抽象。 首先,对d x f 文件的分析和信息读取是整个课题的基础,在对d x f 文件进行深入 的分析后,可以将图形中的基本图元和对应的属性值读取出来,包括p o i n t 、c i r c l e 、 l i n e 、a r c 等”1 。这些是构成建筑工程图纸设计的基本元素。同时,还可以提取图层、 单位标注、文字说明、坐标系设定等一些环境信息,这些环境信息的识别有助于在识 别过程中对图形进行重构。 其次,必须选择一种方法,将读出的数据进行持久化操作。在本课题的研究方法 中,将读取的数据以x m l 的形式进行保存。这即有利于今后的图形识别,使识别系统 长奋t 业人学硕l :学位论史 脱离对数据库的依赖而可以独立运行,同时也有利于识别软件的网络化“1 。将d x f 转化 为x m l 的技术在同类应用中还没有先例。关于如何将d x f 文件读取,并将信息转化为 x i d l 的技术和算法,在基于d x f 文件格式的读取与x m l 转化论文中都有详细论述。 基于以上解决方案,设计出了读取d x f 文件信息和存贮到x m l 的算法,并已经进 行反复多次的试验,取得比较理想的试验结果。并且,在n e t2 0 0 3 平台环境下开发 了读取转化d x f 的软件,实现了对d x f 文件中点、线段、弧等基本数据元素的准确统 计,并将有效数据存入x m l 文件中。 最后,是对读取出的离散数据进行组合,并根据规则库和方法库进行推理,形成 建筑构件,最终形成建筑工程量的数据信息。 长奋t 业,学碗f 。学位论文 第二章d x f 图形交换文件格式的研究 2 1d ) 【f 文件的总体结构分析 d x f 文件是采用a s c i i 码形式组成的文本文件,同时也是一种被多数图形设计软件 接受的文件存贮格式。d x f 文件格式实际上已经成为一种行业标准。随着a u t o c a d 的新 版本不断推出,对d x f 文件格式做了进一步调整,但基本框架保持不变。 d x f 文件本质上由代码及关联关键值对组成。代码( 通常称为组码) 表明其后的 值的类型。使用这些组码和关键值对,可以将d x f 文件组织到由记录组成的区域中, 这些记录由组码和数据项目组成。在d x f 文件中,每个组码和关键值都各占一行。每 个段都以s e c t i o n 开始,后面紧跟字符串为o 的组码。其后是组码2 和表示该段名称 的字符串( 例如,h e a d e r ) 。每个段都由定义其元素的组码和关键值组成。每个段都 以一个后跟字符串e n d s e c 的组码0 结束。 研究d x f 文件的最好办法是从小图形中生成d x f 文件,打印出来并在阅读本文时 参考,可能会有助于读者理解本文的内容。 d x f 文件按先后顺序分为七大段,每段表示为一个独立的。s e c t i o n ”“3 ,以下分 别是七个段的说明: 标题( h e a ds e c t i o n ) 段。包含有关图形的基本信息。由a u t o c a d 数据库版 本号和一些系统变量组成。每个参数都包含一个变量名称及其关联的值。 类( c l a s s e ss e c t l 0 n ) 段。包含应用程序定义类的信息,这些类的实例出现 在文件的b l o c k s 、e n t i t i e s 和o b j e c t s 段中。类定义在类的层次结构中是 固定不变的。 表( t a b l e ss e c t i o n ) 段。包含了关于图层、标注、线型、文字样式、用户 坐标、视图等的定义。 a p p i d ( 应用程序标识表) b l o c k _ r e c o r d ( 块参照表) d i m s t y l e ( 标注样式表) l a y e r ( 图层表) l t y p e ( 线型表) s t y l e ( 文字样式表) u c s ( 用户坐标系表) v i e w ( 视图表) v p o r t ( 视口配置表) 块( b l o c k ss e c t i o n ) 段。包含构成图纸中每个块参照的块定义和图形图元。 夺、实体( e n t i t i e ss e c t l 0 n ) 段。包含图纸中所有图形对象( 图元) 。 4 长备t 业人学坝 。学位论文 夺对象( o b j e c t ss e c t i o n ) 段。包含图纸中的非图形对象。除图元、符号表 记录以及符号表以外的所有对象都存贮在此段。 预览( t h u 船n a i l i m a g es e c t i o n ) 段。包含图形的预览图像数据。此段为可 选项。 在以上七个段中,实体段是我们研究的主要目标,在实体段中保存着所有离散的 图形图元。 2 2a u t o c a d 不同版本间d x f 的差别 2 2 1d x f 文件格式的发展与版本比较 美国a u t o d e s k 公司于1 9 8 2 年推出a u t o c a d 的第一个版本。a u t o c a d r l 2 于1 9 9 2 年7 月正式推出,这是一个主要基于d o s 系统的版本。当时正值中国微机普及的快速发 展时期,r 1 2 在中国的使用曾经相当普遍。r 1 2 的d x f 文件只有h e a d e r ,t a b l e s ,b l o c k s 和e n t i t i e s 四个段。由于r 1 2 不是面向对象的,所以没有c l a s s e s 和o b j e c t s 段。 分别于1 9 9 4 年和1 9 9 7 年推出的r 1 3 和r 1 4 版本是第一代以w i n d o w s 为平台的 a u t o c a d 版本,再加上硬件水平的处理能力的提高,使得a u t o c a d 的功能大大增强。同时 还支持了面向对象技术,使得这些版本的d x f 格式有了相当大的变化:加入了c l a s s e s 和o b j e c t s 段,并增加了e l l i p s e ( 椭圆) 、l w p o l y l i n e ( 多义线) 、s p l i n e ( 样条曲线) 等大量实用图元类型。其后推出的a u t o c a d 2 0 0 0 ,及2 0 0 0 以上版本分别在设计环境、 人机界面和i n t e r n e t 等功能上做了改进。这些版本d x f 文件格式改进不大,只做了局 部的修改,另外增加了一个可选的t h u m b n a i l i m a g e 段。 d x f 文件版本信息存储在h e a d e r 段的开头,其中的第一个组码9 组值为$ a c a d v e r , 标志版本变量开始,第二个组码1 组值为标志版本号的字符串。表2 1 列出版本号字符 串与a u t o c a d 对应版本的对照列表,在设计d x f 文件的二次开发图形软件时可以据此 进行版本号的判别。各版本s a c a d v e r 组码对照如表2 1 所示( 具体对照可以查看附录 二:d x f 部分内容) 。 s a c a d v e r 值a u t o c a d 版本 a c l 0 0 6a u t o c a d r l 0 a c l 0 0 9a u t o c a d r il r 1 2 a c l 0 1 2a u t o c a d r l 3 a c i o l 4a u t o c a d r l 4 a c l o l 5 a u t o c a d r l 5 r 2 0 0 0 a c l 0 1 5 0 5 a u t o c a d 2 0 0 0 以上 表2 1a u t o c a d 各版本的d x f 版本号 k 存t 业j :学倾i 。学位论文 2 2 2d x f 文件格式主要变化的分析比较 r 1 2 与r 1 4 版本间的d x f 文件格式变化较大,r 1 2 与r 1 4 版本的a u t o c a d 都是曾经 广泛使用的版本,下面仅就r 1 2 与r 1 4 的d x f 文件格式的主要变化加以分析。 a u t o c a d 从r 1 3 开始支持面向对象技术,这时的图形信息除了可以显示的图元外, 还增加了其他代表各种参数信息的对象。在d x f 文件格式中新出现的段c l a s s e s 和 o b j e c t s 分别存储了用户和程序定义的类和对象。 另一个较大的变化是在图元类型上,以前r 1 2 的d x f 文件只支持一些简单的图元 类型,对于圆锥曲线等复杂曲线都是用p o l y l i n e ( 多段线) 来表示,记录的内容为曲 线上采样的各个点。由于需要取得较多的点以使曲线平滑,所以导致了最后的d x f 存 盘文件尺寸变大。以一个简单的椭圆为例,在缺省精度下要记录1 2 9 个顶点( v e r t e x ) , 每个顶点在文件里占1 4 行,共需1 8 0 6 行。 从r 1 3 开始补充了大量的新图元类型,图元的表示上也有了简化和改进。以前的 v e r t e x ,p o l y l i n e 等图元类型予以保留,增加的图元在数据表示上更加灵活高效。多 数复杂曲线图元只记录对象的属性值,而不像r 1 2 以前版本那样采用多段线表示。以 椭圆为例,r 1 3 以后版本只需记录圆心坐标、长轴端点坐标、长短轴比例即可,每个椭 圆在文件里只占3 6 行,比r 1 2 少占用大量空间。 2 3d x f 文件格式详细分析 2 3 1h e a d 段 下面是h e a d 部分例子: 0 0 表示一个段的开头和结束 h e a d 段的开头 9 表示一个系统变量的开始 系统变量 ( 变量) 图形右上角的坐标 ( 组码) w c s 坐标系中的x ( 值) ( 组码) w c s 坐标系中的y 6 一。呦9德卿钞9加一加 堡查二些:兰竺! ! :兰些堡兰一 3 0 0 0 0 3 0 0 o 0 e n d s e c | | 值) 组码) w c s 坐标系中的z 值) 2 3 2e n t i t i e s 段 下面是e n t i t i e s 段的例子: 0 s e c t i o n 2 e n t i t i e s 0 c i r c l e a 9 7 3 3 0 1 f 1 0 0 每个图元定义一个条目 图元类型 f 旬柄 指向所有者的指针 a c d b e n t i t y 8 8 代表图层 0 图层号 1 0 0 a c d b c i r c l e 类名 1 0以下为数据区 2 0 0 0 0i o 代表圆心x 坐标 2 0 3 0 0 0 01 1 2 0 代表圆心y 坐标 3 0 0 03 0 代表圆心z 坐标 4 0 4 0 代表半径 8 7 3 6 4 2 5 3 3 8 5 2 7 0 6 8 7 长存t 业人学预1 学位论文 0 e n d s e c 在实体段中包含了:p o i n t 、l i n e 、c i r c l e 、a r c 、t r a c e 、s o l i d 、p o l y l i n e 、v e r t e x 和3 d f a c e 等图形图元。上面的例子中反映了在a u t o c a d 中画的一个圆。在上面的例子 中,描述了一个圆,圆心坐标用组码1 0 ,2 0 ,3 0 后面的数字表示,半径用组码4 0 后 面的数字表示,组码8 后面表示的是图层信息。 2 3 3t a b l e 段 下面是t a b l e 部分的例子: o s e c t i o n 2 t a b l e s。 o t a b l e 2 每出现一个表记录便重复一次 5 i 0 0 a c d b s y m b o i t a b l e 7 0 0 e n d t a b 0 c i r c l e e n d s e c l i n e 图2 1 2 4读取d x f 算法分析 通过以上对d x f 文件的分析,可以在编程设计时,只考虑有用的实体信息,而忽 略其他信息,这样就可以使编程简化。另外,根据d x f 文件格式的特点,在读入数据 信息时,保证从文件的开头每次读进两行,这样,就能保证读取的第一行一定是组码, 而第二行一定是值或对象名称。 长备t 业久学硕i 。学位论文 在具体程序处理上,可以把实体段中的所有图元定义成基础类,然后用这些基础 类去说明一些集合类,从而将实体段中的同一类对象存放在同一个集合中。基本图元 的存贮结构如图2 1 所示。 以下是识别过程中d x f 读取的核心算法: p u b l i cv o i dr e a d d x f ( s t r i n gd x f f i l e ,s t r i n gs t r s e c t i o n , s t r i n gs t r o b j e c t ,s t r i n g s t r c o d e l i s t ) s t r i n gt m p c o d e ,l a s t o b j : o p e nd x f f i l e : c o d e s = r e a d c o d e s ( ) : 获取第一个代码值对 w h i l e ( c o d e s ( 1 ) ! = 4 e o f 。) f 遍历整个文件,直到“e o f ”行 i f ( c o d e s ( o ) = ”0 ”c o d e s ( 1 ) = ”s e c t l 0 n ”) 如果组码为。0 ”,并且值为“s e c t i o n ” 这必须是一个新的段,以便获取下一个代码值对。 c o d e s :r e a d c o d e s0 : i f ( c o d e s ( 1 ) 一s t r s e c t i o n ) ( 找到要读取的段 c o d e s = r e a d c o d e s0 : w h i l e ( c o d e s ( 1 ) ! = ”e n d s e c 。) 遍历此段直到。e n d s e c ” 在某一段中所有的。0 ”代码都表示对象 如果找到了“0 ”代码后面的就是对象名 i f ( c o d e s ( 0 ) = = ”0 ”) ( t h e nl a s t o b j = c o d e s ( 1 ) : j s w it c h ( 1 a s t o b j ) c a s e ( c i r c l e ) 对圆的相关处理 c a s e ( l i n e ) 对线段的相关处理) ) 读取其他代码值对 c o d e s = r e a d c o d e s ( ) : 9 鉴! 三些盔兰堡! :兰垡丝兰一 遍历段循环结束 1找到读取的段结束 e l s e c o d e s = r e a d c o d e s ( ) : 整体d x f 文件读取结束 是 , 当 前 段 结 束 是结束 否 , 没 结 束 图2 2 读取d x f 文件算法流程图 1 0 长奋丁业人学卿il 学位论丘 2 5 算法实现 根据以上的核心算法,在m i c r o s o f tv i s u a ls t u d i o n e t2 0 0 3 平台下开发了读 取d x f 图像转换文件的应用程序。在该应用程序中,实现了对建筑图纸中各种基本图 像图形元素的提取,以下是应用程序的主界面。 d x f 识别技术 长春工业大学2 0 0 4 级计算机技术研究生王志勃 图2 3 读取d x f 算法界面 在上面图纸中,统计出的基本图形元素包括: 点数:0 线段数:7 3 圆数:0 弧数:2 图层数: j 一 髓一黻一矗一。一。l- 一 长誊丁业人学碘仁学位论史 以上算法,经过大量实验证明,是完全准确的。这为进一步进行图纸识别打下了 基础。但这些数据目前还是离散的,没有构成完整意义上的建筑图形构件,还要利用 知识库规则推理做进一步的识别。 在编程实现过程中,分别将图纸中的各种元素定义成独立的类,并在r e a d f i l e s 类中实现。具体类与类之间关系如下图所示。 a r c 黝a y e r :s t d n g 勃1 :s t n n g 勃1 :s t n n g 殷1 :s t n n g 鼢:s t r i n g 鼢r l :s t d n g 叠矧1 2 :s t d n g m a r c o 黔e t x l 0 黔e t y l ( ) 辫e t z _ l ( ) 黪g e t x l ( ) 渤e t y l ( ) 黔t z l ( ) 黔e l r ( ) 黝r o 黔e t d r l 0 黔e t d r 2 0 狲t d r l 0 猕t d r 2 0 g 黔e t 哪e i i ) j b 2 目u a y e r 0 p o i n t 渤封口:s t n n g 鼢1 :s t n n g l 渤1 :s t n n g 敏1 :s t n n g l 裹 p e i n t 0 l 熟e t x l ( ) l 黔e t y t 0 i 狲e t z l ( ) 1 狲t x l ( ) l 瀚e t y l 0 i 狲t z l ( ) l 蠹s e l l 斜鲫 l m g e t l a y 州) c i r c b 黪l a y e r :s t r i n g 黪x 1 :s t n n g g 赫1 :s t n n g l 趾1 :s t d n g 韪r :s t n n g 愚i c i r c l e ( ) 爨 s e t x l ( ) 镕黔e t y l ( ) 黔e t z 1 ( ) 黝e t x l ( ) 淞t y l ( ) 2 9 e t z l ( ) 臻s e t r ( ) 爨g e t r ( ) a 黔e t l a y e f 0 蕊1 9 e t l a y e ) 图2 4 读取算法的类图 1 2 l i n e 鼢a y e r :s t n n g 黝1s t d n g 黝1 :s t n n g 殷1 :s t r i n g 歇2 :s t r i n g 勃2 :s t n n g 戡2 :s t n n g 飘i n e 0 黔e t x l 0 熟e t y l ( ) 狳e t z l ( ) 黝e t x l 0 瓤e t y l ( ) 渤e t z l ( ) 黔e t x 2 ( ) 黔e t y 2 ( ) 黔e t z 2 ( ) 瀚e t x 2 ( ) 獭e t y 2 ( ) 瀚e t z 2 ( ) 辫e t l a y e ) 漱e t l a y e r ( ) k 存t 业人学坝l 学位论上 第三章将d x f 信息转存到x 虬 3 1生成后的x 札文件格式信息 在成功读取d x f 文件的基础上,就要考虑到信息的存贮问题涮。本课题将d x f 文件 转换成x 池文件。可以利用c 革或d a v a 实现。例如在c # 中,可以使用抽l 丁e x t 耵i t e r 类和x m l d o c u m e n t 类的s a v e 方法,向x m l 文件中写入节点。在生成x m l 的过程中,要 依据d x f 原文件的数据存贮顺序排列,以段为单位进行存贮。 将a u t o c a d 的图像信息转存到) c i v i l 中也是为了适应网络发展的需要,有了图像信 息x m l 格式的支持,可以实现远程异地多方对图纸进行交互修改和工程量提取。 x m l 只能有一个根节点,定义为 ,下面是图2 3 中房间平面图读取后,生 成的关于实体段的部分x m l 文档: 6 3 9 2 0 0 6 8 9 9 7 7 6 7 1 5 1 2 0 5 2 2 2 4 0 3 8 7 6 4 8 0 o 6 3 9 2 0 0 6 8 9 9 7 7 6 7 1 3 5 6 6 7 1 8 9 8 8 7 0 7 9 0 3 o o w a li 6 3 9 2 0 0 6 8 9 9 7 7 6 7 1 3 5 6 6 7 1 8 9 8 8 7 0 7 9 0 3 0 0 o 。o w a l1 7 8 5 4 4 7 7 8 8 6 8 3 7 7 7 6 5 6 6 7 1 8 9 8 8 7 0 7 9 0 3 0 o 7 8 5 4 4 7 7 8 8 6 8 3 7 7 7 6 8 6 8 9 6 9 11 4 3 9 5 5 2 7 o o w a l l 1 3 长备t 业j ( 学硕 学位论上 7 8 5 4 4 7 7 8 8 6 8 3 7 7 7 6 8 6 。8 9 6 9 1 1 4 3 9 5 5 2 7 1 1 0 5 6 7 8 5 1 6 6 7 0 1 2 5 1 1 8 4 4 2 1 6 3 6 6 4 1 5 7 9 o o w i n d o w s 8 1 0 6 6 2 8 0 6 9 1 1 6 6 5 11 6 6 8 3 8 5 8 9 4 9 3 7 2 7 0 o 11 0 5 6 7 8 5 1 6 6 7 0 1 2 5 i1 6 6 8 3 8 5 8 9 4 9 3 7 2 7 o o w i n d o w s 1 8 2 4 3 0 6 5 1 1 6 1 0 1 7 3 2 5 1 1 1 9 5 0 2 0 4 9 8 2 6 7 0 o 1 6 0 7 0 4 4 7 4 3 2 9 2 6 9 1 8 0 o 2 7 0 o d o o r ( x 1 3 3 0 0 9 2 1 6 8 3 7 4 8 6 3 4 9 2 4 1 5 8 4 1 2 3 0 4 4 5 0 o 1 6 1 5 8 9 5 5 3 4 8 4 9 4 3 3 1 8 0 o 2 7 0 o ( l a y e r d o o r 1 5 k 存工业人学坝i 瘩位论义 3 2生成) 鲫。算法和类图 c o u n t p o i n t i 瑟p o i n t a n a y :a r r a y ! j s t 爨跏u n t p 。i n t o、 【黪s e t p o i n t a r r a y o i 陵c 叫n t p o i n t n u m o 图3 1d x f 转换x i v l l 算法类图 在具体处理过程中,采用了m i c r o s o f tv i s u a ls t u d i o n e t2 0 0 3 中的d a t a s e t , 通过将数据以表的形式存入d a t a s e t 中,再调用w r i t e x m l 方法将信息写入x m l 文档中。 如下算法中,首先通过r e a d f i l e s 类,将a u t o c a d 文件中图元信息存贮到相应的 列表中( l i n e a r r a y l i s t 、p o i n t a r r a y l i s t 、a r c a r r a y l i s t 等) 。之后,将列表中的数 据转到对应的d a t a t a b l e 中,并将各个表附加到以d x f r o o t 为根的d a t a s e t 中。 1 6 长春t 业大学帧i + 学位论文 将元素压未对应表中 图3 2d x f 转换x m l 算法流程图 1 7 k 奋t 业人学硕l 学位论史 第四章离散数据的预处理 从d x f 文件中读取的信息之间还处在离散状态。1 ,他们之间没有任何联系,在进行 知识库推理识别之前,还要对这些离散数据进行必要的分类处理,使他们基本上满足 识别需要。这些工作就要针对建筑制图中各种图元的特点,采用不同的分类标准。 4 1构件图形特点分析 在房屋建筑制图统一标准( g b t5 0 0 0 1 - - 2 0 0 1 ) 文件中,国家规范对建筑制图中 的各种图形元素画法都做出了非常具体的规定。 4 1 1 门的特点 门一般分为单开和双开两种,无论是单开还是双开,其画法特点都是由一线 段和一段弧形组合而成,并且标准中弧开度应该为9 0 度开口。 门连接在两段墙体之间。 旦 口a 图4 1 国标中门的画法 4 1 2 窗体的特征 窗体位于两墙的端点。 夺图形构成是由四条等长的线段构成。 童蜜耍画 图4 2 国标中窗的画法 4 1 3墙体的特点 夺任何一段墙体都构成一个封闭的区域,并且构成墙体的线段数要大于或等于 4
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 硅藻土综合利用项目环境影响报告书
- 入河排污口整治工程施工方案
- 教育教学质量提升研讨会校长讲话:从倒数到前三这些班级靠3个反常识做法实现逆袭
- 社交敬酒礼仪知识案例分析试题及答案
- 2025年人造革厂岗前安全生产试题及答案
- 2025年高中二年级数学导数周试题及答案
- 物理竞赛科普赛试题及答案
- 饮用水安全知识大会试题及答案
- (正式版)DB65∕T 4916.5-2025 《羊智慧养殖数字化应用与管理第5部分生产管理》
- (正式版)DB2311∕T 067-2023 《黑龙江省北部地区小粒大豆标准化生产技术规程》
- SMP-05-004-00 受托方化验室监督管理规程
- CJT 399-2012 聚氨酯泡沫合成轨枕
- 中小微企业FTTR-B全光组网解决方案
- 第七单元单元任务“视频拍摄脚本写作”统编版高中语文必修上册
- 提高感染性休克集束化治疗完成率工作方案
- 山东省汽车维修工时定额(T-SDAMTIA 0001-2023)
- 《采一束鲜花》教学设计
- 初级中药师考试试题
- 福建省永霖锂电材料有限公司 废旧锂电池梯次利用及回收处理项目 环境影响报告
- 高考英语1600个必考高频词汇
- 单桩承载力详细计算书
评论
0/150
提交评论