一类建筑平面图识别与理解论文.pdf_第1页
一类建筑平面图识别与理解论文.pdf_第2页
一类建筑平面图识别与理解论文.pdf_第3页
一类建筑平面图识别与理解论文.pdf_第4页
一类建筑平面图识别与理解论文.pdf_第5页
已阅读5页,还剩73页未读 继续免费阅读

一类建筑平面图识别与理解论文.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中国科学技术大学 硕士学位论文 一类建筑平面图的识别与理解 姓名 贾哲明 申请学位级别 硕士 专业 计算机应用 指导教师 戴国忠 20031001 中国科技太学硕士研究生毕业论文 一类建筑平面圈的识别与理解 一类建筑平面图的识别与理解 摘要 虚拟家居设计系统目的在于帮助用户直观 快速 自然地设计家庭装修方 案 通过对二维建模 三维建模 人机交互技术和实时交互漫游等技术的应用 使得用户不但可以从任意角度去观察室内设计装饰的静态效果 也可以通过漫 游动态地观察房间的装饰效果 本文研究的目标是实现对一类建筑平面图的识 别与理解 通过对建筑平面图中各种建筑符号的识别以及在此基础上对整个建 筑平面图语义的理解 得以在虚拟家居设计系统中重建建筑结构模型 本文的主要工作包括以下几个方面 1 从应用领域和模式识别方法两个方面介绍了工程图识别理解的研究现 状以及关键技术 阐述了工程图识别理解中建筑平面图领域的研究方法 和最近进展 并在此基础上针对虚拟家居设计系统的建筑平面图识剐理 解提出了具体的需求 2 详细分析了一种用于建筑符号识别的约束网络方法 在总结该方法利弊 的基础上 结合虚拟家居设计系统的需求 提出了一种用于描述建筑符 号形状特征的矩形网格结构 并提出了基于这种结构的符号识别方法 3 通过分析建筑平面图中一类墙体符号的构成特点 提出了一种基于几何 约束的规则表示和逻辑推理的墒体符号的识别方法 4 1 给出了用于综合墙体及其它建筑符号的识别结果描述建筑结构的二维 信息模型 羡键字 符号识别 建筑平面图 虚拟家居 几何约束 中国科技大学硕士研究生毕业论文 一类建筑平面图的识别与理解 r e c o g n i t i o na n di n t e r p r e t a t i o no f ak i n do fa r c h i t e c t u r a ip l a n s a b s t r a c t o n es i g n i f i c a n to b j e c t i v eo fv i r t u a li n t e r i o rd e c o r a t i o n v i d s y s t e mi st o h e l p u s e r st od e s i g np l a no fh o m ed e c o r a t i o nd k e c t l y r a p i d l ya n dn a t u r a l l y t h r o u g h2 d m o d e l i n g 3 dm o d e l i n g h u m a nc o m p u t e ri n t e r a c t i o na n dr e a l t i m et r a v e l u s e r sc a n n o t o n l yo b s e r v es t a t i ce f f e c tf r o ma n yd e g r e eb u ta l s oo b s e r v ed y n a m i ce f f e c t t h r o u g ht r a v e l t h er e s e a r c hg o a lo ft h i s p a p e ri s t o i m p l e m e n tr e c o g n i t i o na n d i n t e r p r e t a t i o no fak i n do fa r c h i t e c t u r a lp l a n s t h ev i ds y s t e mc a nr e b u i l dt h e a r c h i t e c t u r a lm o d e lb yr e c o g n i z i n ga r c h i t e c t u r a ls y m b o l si np l a n sa n di n t e r p r e t i n g t h em e a n i n go f t h ee n t i r ep l a n t h em a i ne f f o r t sa n dc o n t r i b u t i o no f t h i sd i s s e r t a t i o na r ea sf o l l o w i n g 1 t h ea u t h o ri n t r o d u c e s t h er e s e a r c hs i t u a t i o na n d k e yt e c h n o l o g y o f r e c o g n i z i n ga n di n t e r p r e t i n go fe n g i n e e r i n gd r a w i n gf r o ma p p l i e df i e l da n d p a t t e r nr e c o g n i t i o n t h i s p a p e r o f f e r sr e s e a r c hm e t h o d a n dl a t e s t d e v e l o p m e n to fa r c h i t e c t u r a lp l a n sf i e l di nr e c o g n i z i n ga n di n t e r p r e t i n go f e n g i n e e r i n gd r a w i n g a n dp r o v i d e s c o n c r e t ed e m a n d a i m i n g a tt h e r e c o g n i z i n ga n di n t e r p r e t i n go f a r c h i t e c t u r a lp l a n s i nv i d s y s t e m 2 t h e a u t h o ra n a l y s i ss p e c i f i c a l l yt h ew a yt ot h en e t w o r ko fc o n s t r a i n t su s e d i n r e c o g n i z i n go fa r c h i t e c t u r a ls y m b o l s o nt h eb a s i so fa d v a n t a g e sa n d d i s a d v a n t a g e s c o m b i n i n gt h ed e m a n d f o rv i ds y s t e m t h i s p a p e rp u t s f o r w a r dak i n do fr e c t a n g l eg r i ds t r u c t u r ed e s c r i b i n gs h a p ec h a r a c t e r sa n d p r e s e n t ss y m b o lr e c o g n i t i o n b a s e do nt h es t r u c t u r e 3 a f t e rt h ea n a l y s i s o ft h ec o n s t i t u t i o n a lf e a t u r e so ft h ew a l l s y m b o l s i n a r c h i t e c t u r a lp l a n s t h i sp a p e rp r o v i d e sam e t h o df o rr e c o g n i t i o no ft h ew a l l s y m b o l sb a s e d o nt h er u l e s e x p r e s s i n gg e o m e t r i c c o n s t r a i n ta n dl o g i c r e a s o n i n g 中国科技大学硕士研究生毕业论文 一类建筑平面图的识别与理解 4 t h ea u t h o rg i v e st w o d i m e n s i o ni n f o r m a t i o nm o d e lw h i c hc a nb eu s e dt o d e s c r i b ea r c h i t e c t u r a ls t r u c t u r et h em o d e lc o m b i n e st h er e c o g n i t i o nr e s u k o f w a l la n do t h e rs y m b o l r e a l i z i n gt h et o t a li n t e r p r e t a t i o no f t h e p l a n k e y w o r d s y m b o lr e c o g n i t i o n a r c h i t e c t u r a lp l a n v i r t u a l i n t e r i o r d e c o r a t i o n g e o m c t f i cc o n s t r a i n t l i l 第一章绪论 1 1 引言 第一章绪论 图 是工程界的语言 工程技术人员用图来表达思想 进行交流 图也 是施工 分析问题和解决问题的依据 而房屋建筑图就是表示 栋房屋的内部 和外部形状的图纸 有平面图 立面图 剖面图等 这些图纸 般都是运用正 投影原理绘制的 一个建筑从建造到最终拆除要经历设计 施工 销售以及交 付使用等许多阶段 期间还可能经历多次的交易活动 而各种类型的房屋建筑 图都在相应的阶段发挥着关键作用 同时也作为重要的档案资料被保存起来 传统的建筑制图都是依靠手工在工程图纸上完成绘铡的 这样经过漫长的 历史发展就积累了大量的建筑图纸档案 而现在因为各种数字化图形输入设备 的完善以及计算机辅助设计软件的进步 使得人们逐渐从手工绘制转移到使用 计算机进行绘制 产生的电子图形文档则可以永久保存在各种存储设备中 同 时人们建立起建筑图的数据库以实现对大量图纸的信息化管理以至更高级别的 信息处理 正是在这一变革时期也产生了许多有待解决的问题 比如历史积累下来的 数量庞大的建筑图纸如何转换为电子文档得以永久保存 简单的将图纸扫描得 到数字图像并不是最终的解决方法 人们希望通过图像处理与分析得到图纸中 所包含的信息 这样做得好出之一就是可以在一个c a d 环境中对重建建筑图以 便能作更进一步的处理 比如更新修改结构或进行室内设计 另 个显而易见 的价值是实现建筑图科学高效的信息化管理 图纸所包含的信息需要人来识别 和理解 所以对于上面提到的图纸的处理有一个办法就是首先依靠人工识别理 解然后在计算机上人工重新绘制 但这是不现实的 重绘的工作费时费力而且 得不偿失 由此提出了工程图识别与理解这一技术 依靠这一技术可以实现图 纸处理的全自动化或者仅需人的少量局部干预就可以获得并重建图纸中的大量 信息 不同的建筑设计 绘制软件会产生不同格式的图形文档 要实现不同软件 第一章绪论 之间的文档共享也可以利用工程图识别理解的技术 忽略文档特定的格式以及 语义信息 仅仅依靠建筑图的相关知识从图形的角度处理 这虽然可能降低效 率 但是却可以带来尽可能大的通用性 1 2 建筑平面图简介 设计工作是完成建设任务的重要环节 首先要经过初步设计确定设计的初 步方案 画出比较简略的主要图纸用以及工程概算和方案审批等 然后进行技 术设计 在已审定的设计方案的基础上进一步解决各种使用和技术问题 统一 协调各工种之间的矛盾 进行深入的技术经济比较以及各种必要的计算等 绘 制出全套施工图纸 一套施工图是由建筑 结构 水 暖 电 预算等工种共 同配合 经过上述的设计程序编制而成的 是进行施工的依据 房屋建筑完工后仍然离不开这些施工图 比如房屋的验收 施工图就是重 要的参考依据 用来评价所建房屋是否达到了图纸上标出的各种设计要求 此 外 在房屋销售 使用以及未来的各种交易活动中 施工图以及由其衍生出的 各种其它类型的图纸 比如平面布置图 房屋功能图 房屋效果图等 又是人 们快速了解房屋结构 功能等信息以及讨论问题 交流思想的重要工具 以住 宅建筑图为例 住宅建筑平面图就是购房者了解住宅平面形状 方位 朝向和 住宅内部房间 楼梯 走道 门窗 固定设备如浴缸 洗面盆 炉灶 厨柜 便器 污水池等的空间位置的重要依据 人们在购买或选择住房时往往出现这 种情况 即欲购买的住房还没竣工 甚至还没有建造或己建造竣工 但不能前 往查看 这时人们只得依据住宅的平面图以及立面图 剖面图 透视图 表现 图和住宅模型来了解住宅的基本情况 施工图纸按工种分类 由建筑 结构 给排水 采暖通风和电气几个工种 的图纸组成 各工种的图纸又分为基本图 详图两部分 基本图纸表明全局性 的内容 详图表明某一构件或某一局部的详细尺寸和材料做法等 建筑施工图 主要表示建筑物内部布置情况 外部形状以及装修 构造 施工要求等 基本 图纸包括总平面图 平面图 剖面图 墙身剖面图等 详图包括楼梯 门 窗 厕所 浴室及各种装修 构造等详细做法 其它还有 用来表示承重结构的布 第一章绪论 置情况 构件类型 大小以及构造做法等的结构施工图 用来表示管道的布置 和走向 构件做法和加工安装要求的给排水施工图和采暖通风施工图 用来表 示电气线路走向及安装要求的电气施工图 其中建筑平面图是建筑设计的核心 是生成其它图形的基础 总平面图表明一个工程的总体布局 主要表示原有和新建房屋的位置 标 高 道路布置 构筑物 地形 地貌等 作为新建房屋定位 施工放线 土方 施工总平面布置的依据 房屋建筑的平而图就是一栋房屋按 定比例绘制的水平剖面图 即假想用 一水平面把一栋房屋的窗台以上部分切掉 切面以下部分的水平投影图 即将 切面以下部分用直线和各种图例 符号直接绘制在纸上得到就叫做平面图 7 以 直观地表示建筑物在设计和使用上的基本要求和特点 参见 1 2 图ll 建筑平面图 图1 1 是一栋单层房屋的平面图 一栋多层的楼房则有屋顶平面图和各层 平面图 平面图的基本内容有 1 1 表明建筑物形状 内部的布置及朝向 包括建筑物的平面形状 各种 房间的布置及相互关系 入口 走道 楼梯的位置等 第一章绪论 2 表明建筑物的尺寸 在建筑平面图中 用轴线和尺寸线表示各部分的 长宽尺寸和准确位置 3 表明建筑物的结构形式及主要建筑材料 4 表明各层的地面标高 5 表明门窗及其过梁的编号 门的开启方向等 6 表明剖面图 详图和标准配件的位置及其编号 7 综合反映其他各工种对土建的要求 8 表明室内装修做法 9 对平面图中不易表明的内容使用文字说明 建筑平面图一般比较详细 通常采用较大的比例 如l 1 0 0 1 5 0 并 标出实际的详细尺寸 也有的小比例建筑平面图并不用专门的符号标出内部附 置设备 这种图是供设计建设施工人员使用的 一些房地产开发和销售企业 为了使购房者更全面地了解房屋基本情况 往往在平面图上再描绘室内应配置 家具的尺寸和空间位置 有的还用颜色加以区分显示 建筑施工图从制图方式来说分为手工制图和计算机制图 计算机制图主要 依靠各种建筑c a d 软件来实现 它们提供了许多图形绘制以及其它建筑设计的 辅助功能 主要内容包括 平 立 剖面和三维绘图 尺寸 标号标注 文字 表格 日照计算 图库管理和图面布置等 3 不管是手工制图还是计算机制图 有一套需要共同遵循的房屋建筑制图国家标准 包括 房屋建筑制图统一标准 g b t 5 0 0 0 1 2 0 0 1 总图制图标准 g b t s 0 1 0 3 2 0 0 1 建筑制图标准 g b t 5 0 1 0 4 2 0 0 1 建筑结构制图标准 g b t 5 0 1 0 5 2 0 0 1 给水排水制图标准 g b t 5 0 1 0 6 2 0 0 1 和 暖通空调制图标准 g b t 5 0 1 1 4 2 0 0 1 这些制图标准为建 筑施工图的识别提供了依据 1 3 工程图识别与理解技术 工程图纸识别理解的处理流程见图1 2 1 4 其中关键的两个过程是矢量化 4 第一章绪论 和图形元素的抽取和识别 1 3 矢量化 图1 2 工程图纸识别理解的处理流程 对输入的图纸需要通过预处理进行误差纠正 经过倾斜度纠正 去噪 二 值化和细化等处理 使图纸变为易于计算机处理的形式 预处理后 图纸巾的 线的宽度都减为 1 个像素点 因此 对于条线 可用其上点的坐标序列柬 描述 但是它们不能很形象地描述一条线 这样会占用大量存储空间 所以必 须将这些坐标序列变换为矢量数据形式 点坐标序列转换成矢量数据的过程 实际上是对点序列进行直线近似的过程 矢量化包括三个过程 1 1 识别出所有交点 并对它们自动命名 2 选择图纸中某条线的某个中间点为跟踪的起点 从该点开始向线两边 跟踪 直到图纸上所有的线都被跟踪完毕 3 对跟踪所得到的信息进行简化 经过这三个过程的处理 实现图纸从光栅数据到矢量数据的转换 进行数 据压缩 建立初始图形数据库 第一章绪论 1 3 2 图形元素的抽取和识别 图纸中最普遍出现的图形元素为线条 文字 符号和尺寸标注 在矢量化 后要将它们从图纸中分离出来进行识别 这属于模式识别地研究范畴 而具体 的分离和识别算法则根据图纸的工程应用领域的不同而有很大差异 例如建筑 平面图 电路图 地图等 建筑平面图的构成特点是其组成成分主要是线状符号符号而非块状符号 而且虽然有1 2 节提到的建筑制图的国家标准 但是许多符号图例在标准中未 作具体规定 这导致在建筑平面图中可能出现大量自定义符号或相对某种常用 符号原型的变形 这些都对识别的方法提出了具体的要求 1 4 虚拟家居设计系统 虚拟家居设计系统 v i r t u a li n t e r i o rd e c o r a t i o ns y s t e m 的目的是能够直观 快速 自然地实现家庭装修方案的设计 它通过对二维建模技术 三维建模技 术 交互技术 三维真实感图形渲染和实时交互式漫游等技术的应用 使用户 设计 装饰自己的属室 通过变换在房间中的位置 可以从任意角度之观察室 内设计装饰的静态效果 也可以通过漫游动态地观察房间的装饰效果 设计师 及其客户可使用虚拟家居设计软件来观察建筑模型和评估建筑设计 从而在普 通客户与专业设计人员之间建立起高效的沟通桥梁 使普通的客户能够直接参 与自己的家居设计 虚拟家居设计系统具有其现实意义 对专业人员而言 工程师使用虚拟家 居设计系统对灯光 声音和火进行仿真 这些仿真的结果能够增强剧建筑物口j 用性和安全性的了解 在建筑领域的专业人员可以用3 d 模型来估算费用 并 规划性价比最高的建筑顺序 从而能在第一时间发现设计错误和冲突 对于非专业人员而言 除了使用基于建筑学的语言文字 更多的是以线条 来表达设计人的设计理念 非专业人员很难相互沟通 为了了解设计意图 设 计师通常用透视图传达设计意图 但是 由于时间和精力所限 设计师不可能 将四面透视点的情况一一反映出来 借助虚拟现实技术 将所设计的建筑物进 6 第一章绪论 行数字化建模 投射到虚拟的真实环境中 让业主或使用者进入虚拟现实中 充分感受建筑物内部功能布局和外部环境设计 获得真实的建筑体验 从而能 够做出客观的评价 虚拟家居设计系统的功能主要由四部分组成 如图1 3 所示 分别是三维 空间屋的构建 家具布局 房间表面装饰和实对漫游 图1 3 虚拟家居设计系统的功能 虚拟家居设计系统各种功能的实现离不开房屋二维平面结构的生成 它是 整个系统实现的基础 可以在虚拟家居设计系统中增加一个二维平面的房屋绘 制编辑环境 同时完成部分的家居设计操作 但是对于己经存在其它形式建筑 平面图的情况来说 利用工程图识别理解技术输入图纸并在虚拟家居设计系统 中重建房屋的建筑结构是 个更好的选择 1 5 论文背景和研究内容 对一个完整的 多功能的图形系统而言 大量的原始数据都来源于现有的 图纸 利用数字化手工输入图纸的方法速度慢 代价高昂 因此实现工程图纸 的识别理解 就是要将绘制在工程图上的图纸输入到计算机中 并精确的提取 第一章绪论 出它所有的各种信息 通过处理 正确分析出原图上所含的各种拓扑关系 最 后建立起图形数据库 即达到数据的高度压缩又便于在图形系统中重建和处理 目前流行的虚拟家居设计软件 如a r c h i c a d 和c h i e f a r c h i t e c t 的主要操作 对象足墙体 主要输出对象为墙面 这类软件的主要特点是在二维空间中编辑 完成墙体的设计 墙体编辑过程中用户可随时切换到三维模式中观察设计结果 的立体效果 但是此类软件的三维模式只显示二维的设计结果 不具备三维编 辑的功能 交互性很差 并且不能进行实时漫游 其生成的墙面通常不能保存 三维的编辑结果 而从数据输入的角度来说 其二维的设计和编辑过程完全依 赖操作人员的手工作业 无法利用已有的建筑平面图纸或其它c a d 软件绘制的 建筑平面图获取建筑结构信息 要精确还原己知的建筑结构将是一件费时费力 的工作 本文作者通过深入的学习 对工程图的识别理解及其相关领域的广泛了解 以及同其他研究人员广泛的交流探讨 h i 程图的识别理解有了较深刻地认识 本文以虚拟家居设计系统的建筑平面图识别理解为主题 对本文作者所作的相 关工作进行了系统地论述 本文的主要工作包括了如下的几个方面 l 工程图识别理解的研究概述 本文从具体的应用领域和模式识别方法两个方面对工程图识别理解的研究 现状以及关键技术进行了概要性的介绍 阐明了最近的研究进展和未来研究面 临的挑战 2 1 分析了建筑平面图理解的现状和需求 本文阐述了工程图识别理解中建筑平面图领域的研究方法和最近的进展 并在此基础上针对虚拟家居设计系统的建筑平面图识别理解提出了具体的需 求 3 1 提出了一种识别建筑符号的新方法 本文分析了 种用于建筑符号识别的约束网络方法 在总结该方法利弊的 基础上 结合虚拟家居设计系统对所输入建筑平砸图的需求 提出了一种用于 描述建筑符号形状特征的矩形网格结构 并提出了基于这种结构进行符号特征 第一章绪论 描述的建筑符号识别新方法 4 提出了一种用于建筑平面图墙体符号的识别方法 本文通过分析建筑平面图中一类墙体符号的构成特点 提出了一种基于几 何约束的规则表示和逻辑推理的对墙体符号的识别方法 5 提出了描述建筑平面结构的信息模型 本文提出了虚拟家居设计系统中用来综合墙体及其它建筑符号的识别结 果 描述建筑结构的信息模型 以实现对整个建筑平面图所包含的结构语义的 理解 本文受国家自然科学基金 自然 高效和主流的多通道用户界面的研究 6 0 0 3 3 0 2 0 以及国家高技术研究发展计划 8 6 3 计划 2 0 0 1 a a l l 4 1 7 0 的 支持 1 6 本文的组织 全文共分五章 第一章 绪论 介绍了建筑平面图和工程图识别与理解技术 概述了虚拟 家居设计系统 分析了虚拟家居设计的含义及其重要性 提出虚拟家居设计系 统的功能 提出了作者的论文研究方向 主要研究内容和论文结构安排 第二章 建筑平面图的识别理解和需求分析 从具体的应用领域和模式识 别方法两个方面对工程图识别理解的研究现状以及关键技术进行了概要性的介 绍 阐明了最近的研究进展和未来研究面临的挑战 阐述了工程图识别理解中 建筑平面图领域的研究方法和最近的进展 分析了一种用于建筑符号识别的约 束网络方法和一个建筑平面图识别理解的应用实例 并在此基础上针对虚拟家 居设计系统的建筑平面图识别理解提出了具体的需求 第三章 基于几何约束的建筑符号识别 在总结约束网络方法利弊的基础 上 结合虚拟家居设计系统对所输入建筑平面图的需求 提出了一种用于描述 建筑符号形状特征的矩形鄹格结构 并提出了基于使用这种结构进行符号特征 第一章绪论 描述的符号识别方法 根据建筑平面图中墙体符号的构成特点 提出了一种基 于几何约束的规则表示和逻辑推理的墙体符号识别方法 第四章 建筑结构信息模型 给出了用于综合墙体及其它建筑符号的识别 结果重建建筑结构的信息模型 第五章 总结和展望 本章是对全文的系统总结 提出有待改进的方向 第二章建筑平面图的识别理解和需求分析 第二章建筑平面图的识别理解和需求分析 2 1 工程图识别理解 工程图识别理解的核心是对工程图的分析解读 而图形图像分析的目标是 确定图像中的线条 符号 图块和其它图形组件 并最终提取出可被人所理解 的语义信息 图形图像分析的典型的处理步骤是 1 获取数据 2 像素级处 理 3 线条级分析 4 特征检测和文本及图形的识别 通过比如光学扫描仪等图形输入设备可以由图纸文档获取图像数据 获得 的数据以像素方式存储在图片文件里 这些像素的值可能是 二值图像的0 和 1 灰度图像的0 2 5 5 彩色图像三原色各自o 2 5 5 的色度值 举例来说 在一 片85 1 1 英寸 分辨率为3 0 0 d p i d o t sp e r i n c h 的纸上可以产生一幅2 5 5 0 x 3 3 0 0 像素的图像 因此对一幅3 4 4 4 英寸的工程图纸而言 如果要求1 0 0 0 d p i 的高分辨率 其图像将多达3 4 0 0 0 4 4 0 0 0 个像素 这些像素将交给图形分析 的下一个步骤来处理 像素级处理阶段包括二值化 去噪 信号增益和分割 二值化的目的是自 动选择一个可以将图像的前景和后景分开的闯值 虽然获取的图像本身就是二 进制形式的 但是最好可以得到图像的一个灰度范围 以便在这个范围内通过 适应算法进行二值化 这样可以去掉一些多余的信息 而不是仅仅依赖扫描仪 的二值化结果 由于图像的转换 复制或图纸的自然退化 将导致获取的图像数据存在噪 声 而对工程图而言 它的蓝图本身可能就存在大量的噪声 因此需要为各种 不同的噪声设计相应的过滤器来减少噪声 信号增益同去噪的原理相似 但是它要依赖图像的领域知识来获知那些本 来应该是图像的局部但却已经丢失的部分 以便重建图像 信号增益经常用来 填补图像中线条之间的间隙 将一条断裂的线条重新连贯起来 图像分割发生在两个级别上 第一个级别要将文本和图形区分开以便使用 不同的方法来处理 对文本使用o c r o p t i c a lc h a r a c t e rr e c o g n i t i o n 对图形 第二章建筑平面图的识别理解和需求分析 则要使用图形分析技术 第二个级别是要将组成图形的各种符号和线条分离升 来 例如 在一幅带有标题的流程图中 首先要把文本和图形分离开 然后分 别迸一步的分割 对文本得到标题文本和图表中的文本 对图形则分离出矩形 圆 连接线 填充区等 像素级处理之后就是线条级分析阶段 角 曲线 直线以及矩形 圆和其 它几何形状都是通过线条来构成的 为了对图形中各种线条组成部分进行特征 分析 有许多方法用来检测角和曲线的临界点以及线条和曲线的拟合 而形状 描述方法则用于填充区的分析 图形分析的最后一个阶段是特征检测和识别阶段 图形中的各组成部分是 具有语义的标志 组合起来就构成了完整的图像文档 在这个阶段需要应用大 量的领域知识 最后得到的结果是一个对图像文档的语义描述 例如一个电路 图 我们讨论的不是圆 矩形以及连接它们的线条或者其它形状 而是与门 晶体管 导线等电子部件 这些部件及其相互间的连接描述了一个特定的电路 在相关领域具有现实意义 实现这种对工程图的语义描述将极大提高存储效率 并且对一些工程图的再操作 如建立基于内容的索引或者重新编辑修改带来便 利 本文的主要工作是从图形的特征检测和识别阶段的角度来研究如何实现工 程图中的一类建筑平面图的识别理解 下面将就这一部分展开详细论述 2 2 建筑平面图识别理解 2 2 1 建筑平面图分析系统框架 直到最近才开始对建筑平面图的识别理解展开一系列的研究 主要进展是 提出了一种使用约束网络识别建筑符号的方法 5 6 7 以及 组剥建筑 f 向 图的手绘草图的识别处理方法 8 9 1 0 而 1 1 1 2 1 3 j j 提出了其它一些建 筑平面图的识别方法和相关问题 早期研究的目标是实现从印刷图纸到c a d 系 统可处理格式的转换 以达到存储和编辑的目的 高效的矢景化算法是这种系 统的核心 手绘草图的判读代表了一种c a d 的输入技术 是一个能够处理具有 第二章建筑平面国的识另 理解和需求分析 一定失真或变形的符号的识别过程 根据图形识别系统的总体框架 一个建筑平面图分析系统是由三个阶段组 成的 见图21 首先 词法级 1 e x i c a ll e v e l 阶段是关于图元的抽取 这 些图元如线条 弧和图块组成了完整的图像 这一阶段通常包含一个预处理的 步骤 来进行量化 去噪和细线化等运算 从图形中辨识文本也由这一步骤来 完成 第二阶段是 语法级 s y n t a c t i cl e v e l 要求把图元根据输入文档的每 个符号标记进行分组 并建立符号之间的结构关系 最后一个高级别的阶段是 语义级 s e m a n t i cl e v e l 的 这一阶段的目标是理解文档 如果把前两个阶 段作为局部符号以及文字的识别过程 则第三阶段就是要分析识别阶段得到的 符号结构之间的关系 并且将符号整合为高级别的实体 使之带有符合特定应 用领域的专有语义 通过对高级别实体的识别 如墙 门 窗 家具 楼梯等 以及对它们之间关系的分析 可以实现对整个图像文档的理解 而后建筑图将 被转换到一个c a d 环境中进一步处理 如设计编辑 3 d 显示以及在建筑物中 虚拟漫游 图2 1 建筑平面图分析系统框架 1 3 第二章建筑平面图的识别理解和需求分析 2 2 2 建筑平面图识别理解应用实例 2 2 2 1b m g 系统简介 r i c kl e w i s 的b m g b u i l d i n gm o d e lg e n e r a t o r 系统 4 通过对建筑平面 图的识别理解来建立3 d 建筑模型 整个过程几乎不需要用户的干预 基本实 现了自动化 3 d 建筑模型表示建筑物内部空间或外部形体与实际所能看到的建筑本身 相类似的主体图像 常用于观察了解建筑物内部及外部结构 它非常直观地表 现了建筑的造型 空间布置 色彩和外部环境 一般都是在建筑设计和销售时 使用 对3 d 建筑模型进行绘制上的艺术加工后又可以生成建筑效果图 其透 视效果非常逼真 运用虚拟现实技术人们还可以在3 d 建筑模型建立起来的虚 拟环境中主动的行走漫游 但是为了得到3 d 建筑模型 人们不得不花费数天 数周甚至几个月的时间来精确绘制构成3 d 模型的成百上千的多边形 这是一 件非常费时费力的工作 自然也就增加了成本 b m g 系统的出发点就是简化 3 d 模型的绘制过程 基本实现从a u t o c a d 产生的2 d 建筑平面图文档自动识 别理解后生成相应3 d 建筑模型 使得人们得以从繁重的3 d 模型的绘制工作中 解脱出来 将工作重点转移到富有创造性的3 d 建筑模型中的设计和艺术加工 上 比如绘制材质纹理 设计光照效果等 为了实现从2 d 平面图到3 d 模型的转换 b m g 系统基于平面图中房间区 域是由封闭的多边形轮廓 即墙壁 构成的这样一个事实 通过对平面图的识 别理解获得房间区域位置及其轮廓边界 然后将边界线段拉伸到3 d 空间中就 生成了墙壁也就得到了一个3 d 的房间 如图2 2 所示 匣 一譬 图2 2 从2 d 拉伸封闭轮廓边界产生3 d 房间 第二章建筑平面图的识别理解和需求分析 从建筑平面图可以看出 构成房间区域的边界在门窗位置会有开口 为了 得到一个封闭的轮廓 必须先查找定位门窗符号的位置 然后用两条与边界连 接的线段替代门窗符号 这样每条线段都参与构成一个房间区域的边界 如图 23 所示 在拉伸边界线段时对门窗符号所在位置要特殊处理 也就是要在拉伸 出来的墙壁面上开洞以表示3 d 的门和窗户 如图24 所示 在这一过程中需要 用户输入门的高度和窗户距地面的距离及其自身高度 因为从平面图上无法获 知这些信息 但总的看来 从2 d 到3 d 的转换过程基本上不需要用户的干预 图2 3 门窗符号的处理 图2 4 在墙上开洞表示门和窗户 在得到了单个的房间区域以及附属的门窗后 为了描述整个建筑平面结构 还要建立起相应的语义信息模型 b m g 系统建立的语义模型描述了用门联系起 来的房间之间的相邻情况 如图2 5 所示 从图中可以确定 个人可以从a 房 间穿过一道门走到e 房间 而无法从a 房间直接走到同样在隔壁的b 房间 第二章建筑平面图的识别理解和需求分析 图2 5 建立描述房间相邻的语义模型 上述过程处理的结果最后输入3 d s t u d i o 以及伯克利的w a l k t h r u 等系统 进行3 d 造型以及对获得的3 d 建筑模型作更进一步的加工处理以至实现在虚拟 环境中的行走漫游 表示b m g 系统整个工作流程中各阶段效果的示意图见图 26 图2 6b m g 系统工作流程各阶段示意图 第二章建筑平面圉的识别理解和需求分析 2 2 2 2b m g 系统中建筑平面图识别理解的局限性 b m g 系统输入的是用a u t o c a d 绘制的建筑平面图 在识别理解的过程中 大量利用了a u t o c a d 定义的数据模型 从中可以很方便的获得许多关键信息 从而绕过了一些建筑平面图识别理解应有的步骤 这使得b m g 系统对建筑平 面图的处理方法不具有通用性 首先 a u t o c a d 允许用户在不同的图层上绘制不同类型的图形实体 b m g 系统就利用分离平面图的各图层的方法 直接从绘制墙体 门 窗户以及楼梯 等实体的图层中获取图元 这些实体都将转换为3 d 模型而忽略了其它图层的 数据 其次 为了确定构成房间区域的封闭轮廓 需要先确定门窗的位置以闭 合门窗符号在轮廓上的开口 a u t o c a d 又提供了一种图块的结构 一个图块包 含了一个具有一定含义的相对完整的几何图形 它可以作为一个整体插入图层 同样也可以作为一个整体从图层中提取出来 各种类型的门和窗户的符号一般 就是以图块的方式来操作的 b m g 系统也是这样处理门窗符号的 也就是说 有了图层和图块这两个工具 b m g 系统可以很方便的从保存建筑平面图的 a u t o c a d 图形文档中直接获知一个图块所代表的含义及其位置 这样就不需要 类似在工程图识别理解中关键而又困难的提取候选符号子图的步骤了 b m g 系统对已经获取的代表门窗符号的图块 也仅仅用来确定其位置以闭 合房间区域的轮廓以及生成3 d 模型时在墙上开洞 对于符号所代表的门窗类 型并没有从其几何形状上进行分析识别 综上所述 b m g 系统对用来生成3 d 建筑模型的2 d 建筑平面图的绘制提 出了较高的要求 而且对于门窗符号也没有进行真正意义上的识别 这使得 b m g 系统对建筑平面图的处理有很大的局限性 当然也可以认为b m g 系统的 目标就是简化3 d 建筑模型的绘制而不是研究通用的建筑平面图的识别理解算 法 2 3 符号识别 象建筑 电子 工程 地图等领域都使用它们各自的图形标记来进行设计 1 7 第二章建筑平面图的识别理解和需求分析 要自动理解那些工程图就要求能够识别相关领域的符号集 因为工程图的应用 领域相当广泛 而每个领域的符号都有各自的特征 所以很难找到 种可以对 所有符号精确定义的方法 一般情况下 一个符号作为一个图形实体在相应应 用领域的背景中具有特定的含义 因此 根据不同的应用结合可视化特征可以 找到不同种类的符号 比如建筑领域中使用线段组成的 用 和j 值数据表 示的二维形状 或者那些具有复杂灰度甚至彩色的各种标志 从应用的观点出发 最近图形识别的许多研究已经定位在图形文档如何自 动转换到可以被c a d 系统所理解的格式 完成从光栅图到c a d 格式的转换应 该最终提供对工程图的语义描述和解释 在这个背景下 符号识别要求对各种 工程图中表示符号的图形实体进行识别 符号识别属于图形图像识别的范畴 而图形图像识别则是模式识别众多应 用领域中的重要内容 所以符号识别方法可以根据模式识别方法的分为两大类 即统计学方法和结构识别法 前一类方法是建立在被研究对象的统计知识上 也就是对图像进行大量的统计分析 抽出图像中本质的特征而进行识别 这是 一种数学方法 它是受数学中的决策理论的启发而产生的识别方法 在这种方 法中很大的力量用在抽取图像特征方面 也就是把图像大量的原始信息减缩为 少数特征 然后再提取这些特征 把它作为识别的依据 另外一种结构识别法 或语言学法 它是立足于分析图像结构 把一个图像看成语言构造 例如一个 英文句子 它是词和短语组成的并按一定的语法表达出来 其中最基本的元素 是单词 与此类似 图像是由一些直线 斜线 点 弯曲线及环等组成 剖析 这些基本元素 看它们是以什么规则构成图像 这些是结构分析的课题 这些 基本元素相当于句子中的单词 那些直线 曲线的组合相当于短语 它们全体 如何构成图像就相当于语法规则 此时 图像识别就相当于检查图像所代表的 菜一类句型是否符合事先规定的语法 如果语法正确就识别出结果 由此可见 这种方法主要是利用了图像结构上的关系 这和统计学方法不同 1 s 1 6 2 2 1 统计符号识别 在统计模式识别中 每一个模式用一个从图像中提取的n 维特征向景柬表 第二章建筑平面图的识别理解和需求分析 示 通过将特征空间分割成不同的区域 而每个符号都会有对应的区域 以此 实现对符号的分类 所以具体实现这种方法时有两个相关的问题 特征的选择 和特征空间分区方法的选择 特征空间的选择取决于将要分类的模式的特点 主要的依据是在最小化同 类模式间差异的同时最大限度的扩大非同类模式间的距离 其它要关注的特征 值的性质包括仿射变换时的不变性和在噪声及失真下的鲁棒性 在文献 1 7 1 中 作者调查综述了应用于字符识别相关领域的一些特征抽取方法 在符号识别中 仅仅使用了所有已被使用特征的一个子集 这些特征分成四组 基于图像的像 素 基于几何特征 基于几何矩和基于图像变换 最简单的特征空间就是图像空间 由所有像素值对应的特征组成了特征向 量 这种方法通常首先要将图纸规格化为固定大小的尺寸 这种方法的优点是 简单 低复杂度并且与图像的视觉效果直接关联 不过 这种特征表示的缺点 是图像旋转时不具备不变性并且对噪声和失真非常敏感 另一类方法使用几何 特征 矩心 惯性轴 环 面积 线交叉点 洞 投影剖面等 该方法与图像 空间方法相比可以减小特征向量的维数 为了得到高辨识力以及对仿射变换的 不变性 对相关特征的选择提出了很高的要求 特征的抽取方法必须足够可靠 和健壮足以减少由于噪声和失真的影响而造成的特征的扰动 不变矩是另一个 已经应用于符号识别的特征 比如常规矩 1 8 1 9 1 f f t z e r n i k e 矩 2 0 1 不变矩容易 计算 它们与图像的几何特性相关 例如重心 惯性轴等 而且它们对仿射变 换保持不变 最后 特征也可以通过一些图像的转换来定义 从图像在变换卒 间的表示可以得到相关特征 已经用于符号识别的图像变换包括傅立叶变换 f 1 8 2 1 1 傅立叶 m e l l i n 变换 2 0 或其它一些特别的变换 它们可以从图像中得 到有用的信号 2 2 一旦选择了特征集 就要选择一个方法来分割特征空间 并且将每个特征 向量归于一个预先定义的图像类型以实现分类 在符号识别的相关文献l 巾可以 找到基于相似度概念的方法 基于神经网络以及基于决策树的方法 最简单的 分割特征空间的方法是定义一个关于特征向量距离函数 将每个输入的图像归 于与样本最接近的类型 k 最近相邻规则有一些不同 对一种类型会指定几个 第二章建筑平面图的识别理解和需求分析 样本 对每个输入模式 要建立k 最接近样本集 哪种类型在样本集中会有最 多的对应样本 模式就归属于这种类型 神经网络已经在许多不同领域显示出 出色的分类效果 它们的优势之一是可以根据训练集的特征来进行自适应的学 习能力 学习是自动的 可以提供网络的最优参数来识别训练集中的符号 在 决策树中 每个树节点对应一个特定的特征值 分类就是根据状态检测的结果 不断沿着树的分支行进直到到达一个树叶 而树叶就对应识别出的符号 2 2 2 结构符号识别 在结构模式识别中是用形状的描述来表示符号 而对形状的描述离不开构 成符号图形的几何图元和它们之间的关系 用这些图元建立起每 个竹弓 i j 恕 形状的样本 一个输入图像分类后到底属于什么符号 要看图像的结构表示与 哪一个符号样本最匹配 通常用于描述符号形状的图元是直线和弧 尽管有时 也使用其它几何图元 比如环 简单形状 圆 矩形等 的轮廓线 因此 这 种方法要求先对图像进行矢量化处理 矢量化可能导致图像的表示产生噪声和 失真 所以通常必须使用容错的匹配方法 一类主要的结构方法是基于对符号的图形化描述 2 3 2 4 2 5 2 6 2 7 图形的节点和边分别对应图像中的点和线 这种方法提供一个对符号非常自然 和直观的描述 匹配过程就是查找输入图像和符号样本之间的最佳子图同构 i s o n l o r p h i s m 通过这种方法 符号可以作为整个图像的子图被找出来 而 图像分割和识别则是同时进行的 失真的处理是通过使用容错予图同构图形编 辑操作来定义一个误差模型 图形匹配主要的缺点是计算比较复杂 现在已经 开发出一些可以减少运算时间的方法 形式语法一通常因为符号的二维结构也称为图形语法一是另一种结构方法 2 8 2 9 3 0 3 1 3 2 语法可以高效的表示出一个符号的所有有效实例或符 号的一个类型 对输入图像的识别要通过分析其表示来验证它是否能够被某个 语法所产生 为处理失真 提出了多种纠错分析方法 语法方法在符号的形状 可以用一些规则精确定义的情况下是有非常有用的 例如 在工程图中对尺寸 符号的识别 3 3 3 4 3 5 1 并n 由纹理组成的符号的识别 3 6 j o s e p h 和p r i d m o r e 3 7 2 0 第二章建筑平面图的识别理解和需求分析 阐述了语法不仅可以描述符号的结构 而且可以引导剥整个图纸的解释 另一种方法使用一组规则来定义组成符号的图元之间的几何约束 然后使 用这些规则在输入图像中来查找符号 3 8 3 9 4 0 在文献 4 1 中提出了一种基 于 黑板结构 b l a c k b o a r d a r c h i t e c t 2 z r e 的引导规则使用的方法 当识别出任 何图元或符号的同时选择并且启动 组过程来寻找图形中的新元素 4 2 使用 了类似的方法 在文献 5 中 通过约

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论