(地图制图学与地理信息工程专业论文)gis空间数据处理与质量控制系统.pdf_第1页
(地图制图学与地理信息工程专业论文)gis空间数据处理与质量控制系统.pdf_第2页
(地图制图学与地理信息工程专业论文)gis空间数据处理与质量控制系统.pdf_第3页
(地图制图学与地理信息工程专业论文)gis空间数据处理与质量控制系统.pdf_第4页
(地图制图学与地理信息工程专业论文)gis空间数据处理与质量控制系统.pdf_第5页
已阅读5页,还剩88页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

保密2 年 ad i s s e r t a t i o ns u b m i t t e dt o n g j iu n i v e r s i t yi nc o n f o r m i t yw i t ht h er e q u i r e m e n t sf o r t h ed e g r e eo fm a s t e ro fp h i l o s o p h y d a t ap r o c e s s i n ga n dq u a l i t yc o n t r o l o fg e o g r a p h i c a li n f o r m a t o ns y s t e m s c h o o l d e p a r t m e n t :s c h o o lo f c i v i le n g i n e e r i n g d i s c i p l i n e :s u r v e y i n gs c i e n c ea n dt e c h n o l o g y m a j o r :c a r t o g r a p h ya n dg e o g r a p h i c i n f o r m a t i o ne n g i n e e r i n g c a n d i d a t e :j u nq i a n s u p e r v i s o r :p r o f x i a o h u at o n g f e b ,2 0 0 7 关部门或者机构送交论文的复印件和电子版;在不以赢利为目的的前 提下,学校可以适当复制论文的部分或全部内容用于学术活动。 分纩 灰 纭日 :召 名 , 别 月 者罗 作 年 文 论7 位 刀 剿 进行 论文 表的 作品的内容。对本论文所涉及的研究工作做出贡献的其他个人和集 体,均已在文中以明确方式标明。本学位论文原创性声明的法律责任 由本人承担。 签名: 钐文良 2 6 。7 年;月3 日 间数据质量的自动检验与评价方法,并开发出相应的软件,实现对g i s 空间数 据质量的跟踪检查、实时修改以及成果评价,使成果数据满足质量要求。 本论文分为四个部分,第一部分对空间数据的质量问题进行了分析,重点 研究了当前质量控制的研究成果、误差来源以及质量描述框架等内容;第二部 分探讨了空间数据处理与质量控制的方法,分别从基于空间实体的数据质量检 查与处理、基于拓扑构面的数据质量检查与处理、位置几何精度质量控制、属 性数据质量检查与处理以及完整性与正确性的质量检查等方面作了归纳整理; 第三部分结合自行开发“g i s 数据处理与质量控制软件v 1 0 的设计,阐述了 空间数据处理与质量控制方法的实现技术。最后,根据笔者在土地房产g i s 基 础数据的处理与质量控制的项目建设实践经验,将g i s 数据处理和质量控制的 技术运用于实际工作中,取得了较好的效果。本课题的研究对于提高g i s 数据 质量控制的工作效率、保证g i s 空间数据成果质量、建立高质量的基础地理信 息数据库均具有重要意义。 关键词:空间数据,数据处理,质量控制,质量检查 s o ,t h ea u t o m a t i ce x a m i n i n ga n da p p r a i s i n gs o f t w a r ef o rg i sd a t aq u a l i t y c o n t r o l l i n gi sn o to n l yt h ed i r e c t i o no fr e s e a r c hi nt h eg i sd a t aq u a l i t yc o n t r o l ,b u t a l s ot h ec o n t e n to ft h i sa r t i c l e ,t h i sp a p e rh a sf o u rp a r t s ,p a r tia n a l y s e st h ep r o b l e mo f d a t aq u a l i t yc o n t r o l ,p r e s e n tr e s e a r c ho nq u a l i t yc o n t r o l ,钮t o r - s o u r c ea n dd e s c r i l o l t i o n f r a m e ;p a r t i n v e s t i g a t e st h ea l g o r i t h m so fd a t ap r o c e s s i n ga n de x a m i n a t i o nb a s e d o ns p a t i a le n t i t y , t o p o l o g y , l o c a t i o na n da t t r i b u t e s ;p a r ti l le x p a t i a t e st h et e c h n o l o g y f o rg i sd a t aq u a l i t yc o n t r o lu s i n gt h es o f t w a r e p r o c e s s i n ga n de x a m i n i n gs o f t w a r e v1 0f o rt h eg i sd a t a w h i c hi sd e v e l o p e db yt h ea u t h o r a c c o r d i n gt ot h ee x a m p l e s o fd a t ap r o c e s s i n ga n dq u a l i t yc o n t r o li nt h eg i so fr e a le s t a t e t h el a s t p a r t i n t r o d u c e st h ep r a c t i c eo fd a t ap r o c e s s i n ga n dq u a l i t yc o n t r 0 1 t h er e s e a r c hh a s s i g n i f i c a n c e f o rc a r r y i n go u tg i sd a t a q u a l i t yc o n t r o lm o r ee f f e c t i v e l ya n d e s t a b l i s h i n gt h eh i g l l q u a l i t yg e o g r a p h i c a li n f o r m a t i o nd a t a b a s e i i i t r o lf o rg i s ,q u a l i t y 1 2 2 3 4 6 6 6 7 2 1 3 应用误差9 2 2g i s 数据质量内容9 2 2 1 位置( 几何) 精度9 2 2 2 属性数据精度1 0 2 2 3 逻辑一致性1 1 2 2 4 要素的完整性及现势性1 2 2 3g i s 数据质量描述框架1 3 2 3 1g i s 数据质量元素1 3 2 3 2g i s 数据质量概述元素1 4 2 4 本章小结1 5 第3 章g i s 空间数据处理与质量控制的方法1 6 3 1 基于空间实体的数据质量检查与处理1 6 3 1 1 概述1 6 i v 目录 查与处理1 6 查与处理2 0 查与处理2 7 检查与处理3 0 量检查3 3 3 q 【 3 5 3 6 3 6 3 3 属性数据质量检查与处理3 7 3 3 1 属性项检查3 7 3 3 2 属性值检查3 7 3 4 完整性与正确性质量检查3 8 3 4 1 数据组织形式检查3 9 3 4 2 文件命名检查3 9 3 5 附件质量检查4 0 3 6 本章小结4 0 第4 章g i s 数据处理与质量控制的软件设计4 1 4 1 软件的目标设计4 l 4 2 软件的开发环境和开发模式介绍4 2 4 2 1c o m 技术与g i s 的结合组件式g i s 4 2 4 2 2 基于c o m 技术的a r c o b j e c t 简介4 3 4 2 3 基于a r c o b j e c t 的开发模式4 4 4 3 软件的详细设计4 5 4 3 1 工程管理功能模块4 7 4 3 2 视图管理功能模块5 0 4 3 3g i s 基本功能模块5 1 4 3 4g i s 数据质量功能模块5 2 v 5 8 6 0 6 0 6 l 6 1 6 2 6 2 6 2 6 3 6 4 6 4 5 2 结构设计6 5 5 3 功能设计6 5 5 3 1 数据转换与预处理子系统6 6 5 3 2 数据质量检查与处理系统6 7 5 3 3 数据维护与更新子系统6 8 5 4 土地房产g i s 数据处理和质量控制的关键技术6 9 5 4 1 含岛多边形的处理6 9 5 4 2 多边形变更的处理7 1 5 4 3 图形与属性关联的处理7 2 5 4 4 图形与属性一体化更新处理7 5 5 5 本章小结7 6 第6 章总结与展望7 8 6 1 全文总结7 8 6 2 展望7 9 致谢8 0 v i i 8 1 8 3 第1 章引言 第1 章引言 1 1g i s 空间数据处理和质量控制的研究意义 地理信息系统( g e o g r a p h yi n f o r m a t i o ns y s t e m 简称g i s ) 是一种以采集、 存储、管理、分析和描述整个或部分地球表面与空间和地理分布有关的空间信 息系统,由计算机、地理信息系统软件、空间数据库、分析应用模型、用户界 面及系统人员组成,可以对空间数据按地理坐标或空间位置进行各种处理、对 数据进行有效的组织、管理、分析和输出、研究各种空间实体及相互关系【1 2 1 。 自二十世纪五十年代以来,随着信息技术的发展,地理信息系统( g i s ) 的应用日 益广泛,涉及资源管理、土地利用、城市建设、交通、通讯、水利和重大灾害 监测等各个领域,而且国民经济各部门和社会各方面对基础地理信息需求日益 增长,需要大量的数字地理信息产品。美国前副总统戈尔在1 9 9 9 年1 月3 1 日 的报告数字地球对二十一世纪人类星球的理解中首次提出了“数字地 球 的概念,空间数据基础设施是“数字地球的核心和基础,世界各国都在 努力开展国家空间数据基础设施( n s d i ) 的建设。 国家基础地理信息系统是其他各种信息的空间载体和参考框架,是国民经 济可持续发展科学化决策的依据,是政府信息化和网络化的重要信息源。当前, 我国按照基础测绘分级管理的原则,国家负责1 :1 0 0 万、1 :2 5 万和1 :5 万比例 尺的基础地理信息数据的生产、服务和更新,省级政府负责1 :1 0 0 0 0 、1 :5 0 0 0 比例尺甚至更大比例尺的基础地理信息数据的生产服务和更新。自上世纪八十 年代到1 9 9 8 年,我国已先后建成1 :4 0 0 万、1 :1 0 0 万、1 :2 5 万比例尺的国家基 础地理信息系统,并于2 0 0 6 年2 月完成1 :5 万基础地理信息系统的数字化生产 和建库工作,是我国基础地理信息数据库建设工作达到世界先进水平;各直辖 市和部分省市已建成1 :1 0 0 0 0 基础地理信息数据库,其他各省( 自治区) 正加快 进行省级1 :1 0 0 0 0 基础地理信息数据库的建设工作【】。 在基础地理信息数据库的建设过程中,空间数据始终是g i s 中最基本、最 重要、最重要的组成部分,也是投资比重最大的一部分。【l 】而g i s 空间数据的核 心则是质量,数据的生产与质量控制是一个相互作用的过程,生产数据是为了 第1 章引言 应用,数据质量的优劣将直接影响g i s 应用的分析结果的可靠程度和应用目标 的实现。质量符合标准的空间数据是系统进行复合、综合分析的基础。空间数 据生产和质量控制是一项集管理和技术与一体的综合性的工作,是一项涉及诸 多方面的复杂的系统工程。在我国g i s 发展初期,李德仁院士( 1 9 9 1 ) 指出:如 何建立g i s 的质量模型、用什么尺度来度量g i s 中的精确数据和非确定数据、 定量数据与定性数据等是g i s 发展必须解决的问题。g i s 数据质量和不确定性以 及由此产生的g i s 数据质量控制技术成了国内外g i s 研究的热点问题之一【6 】。 1 2g i s 空间数据处理和质量控制的研究历史、现状和趋势 1 2 1g i s 空间数据处理和质量控制的研究历史 在g i s 诞生不久的6 0 年代,学者们就开始关注g i s 的质量问题,例如,p e r k a l 提出了线元不确定性的线模型,g o o d c h i l d 给出了检验多边形叠置过程的统计 量,m a c d o u g a l l 用实例说明了不考虑空间数据误差所带来的严重后果【5 1 。还有 学者提出了拓扑匹配误差估计公式和矢量数据转换为栅格数据的精度估计方 法。 g i s 数据误差问题真正受到重视是从8 0 年代开始的。1 9 8 8 年1 2 月,由美 国地理信息分析中心( n c g i a ) 主持召开了来自大学、研究所、g i s 公司等部门5 0 多位专家学者参加的空间数据库精度专题讨论会,其宗旨就是为g i s 空间数据 误差研究拟定方向和立题。这是g i s 误差理论研究史上的一个里程碑,标志着 人们对g i s 数据误差问题进行系统研究的开始【6 1 。 1 9 9 0 年以前,g i s 质量方面主要研究的内容时:在g i s 数据结构和数据模 型的研究中考虑某些误差的影响,研究g i s 空间要素如点、线、面的不确定性 模型的建立方法,以及对空间数据处理和分析过程中误差传播形式的研究。9 0 年代后,随着g i s 研究者对数据质量的重视,已从数据误差研究体系的各个方 面进行深入的分析,并已经取得了一系列研究成果。 其中,在对地图数字化数据的误差来源、误差性质、误差模型等方面的研 究中,史文中、刘文宝、朱光、张保钢等应用时间序列分析方法初步探讨了地 图曲线数字化误差的性质;童小华、割盔查等通过实验和统计检验的方法进一 步分析了数字化误差,认为其统计分布不一定是正态分布,而可能是由正态分 第1 章引言 布与拉普拉斯分布组合而成的n l 分布,或者是p 一范分布( 1 p 5 0 成立,那 么就认为其为重复线的可能性较大,将其记录在错误信息列表中。 5 判断是否存在下一线图元,存在则转入2 进行检查,不存在,则转入6 ,将 检查结果告知检验员。 6 检查完成后,将错误信息以列表的形式告知检验员,由检验员通过人机交互 的方式进行错误确认并改正。( 在图形列表的每一行双击可在地图中心显示 重复线位置) 。 其二为对每条线图元整体进行空间分析( 即建立弧段缓冲区进行空间分 析) ,算法示意图如图3 6 所示,具体算法如下: 图3 6 重复线的弧段缓冲区示意图 1 获取检查图层( l a y e r ) ,确认是否为线图元图层,是则读入一条线图元 ( l i n e f e a t u r e ) ,否则返回提示信息告知检验员。 2 以首先读入的线图元作为比较基准线段l 0 ,以线划位置偏移中误差的两倍 作为缓冲区宽度d ,建立线图元的缓冲区,两条边界线段为l 1 ,l 2 。 3 计算、比较l o 、l 的最小外接矩形,判断l 和l 0 是否可能重复。当l 与l 0 的范围存在交叉时,则l 与l o 可能重复;否则,不可能重复。 4 如可能重复,则计算l 上的节点( 包括线段的起止点) 到相邻的l 1 和l 2 上的 直线段的垂直距离d 1 d 2 。 5 计算d 1 d 2 之和,并与d 比较,当d l + d 2 d ,则l 上该节点可能位于l 0 上: 否则,不可能位于l o 上。 6 当l 上各个节点到l 1 ,l 2 上相邻的直线段的垂直距离d 1 d 2 之和均小于设 定的缓冲区宽度d ,则l 与l o 两条线段可能整体重复。并将判断出来的重 复线记录在错误信息列表中。 第3 章g i s 空间数据处理与质量控制的方法 7 判断是否存在下一线图元,存在则转入2 进行检查,不存在,则转入8 ,将 结果告知检验员。 8 检查完成后,将错误信息以列表的形式告知检验员,由检验员通过人机交互 的方式进行错误确认并改正。( 在图形列表的每一行双击可在地图中心显示 重复线位置) 。 重复线的处理方法与重复点的处理方法类似。 3 1 3 4 打折线的检查与处理 打折线的定义:打折即一条线本应该沿原数字化方向继续,但由于数字化 员手的抖动或其他原因的影响,造成线的方向与原来的数字化前进方向产生了 一定的夹角,如图3 7 所示的两种情形,画圈部分即为打折错误。 图3 7 打折线的错误情形示意图 目前,检查d l g 中的打折线的具体算法如下: 1 获取检查图层( l a y e r ) ,确认是否为线图元图层,是则读入一条线图元 ( l i n e f e a t u r e ) ,否则返回提示信息告知检验员。 2 对读入的线图元,提取其所有的组成节点数据,去除该线图元的首尾节点, 将所有的非首尾节点存放于节点数组中( p o i n t a r r a y ) ,并将节点总数记录于 p o i n t c o u n t 中。 3 从节点数组中依次取出三个相邻的节点坐标,计算其组成的夹角( 用余弦定 理求解) 。 4 如果角度值 4 5 。,则有可能存在打折线的错误,将判断出来的打折线记录 在错误信息列表中。 5 判断是否存在下一线图元,存在则转入2 进行检查,不存在,则转入6 ,将 检查结果告知检验员。 6 检查完成后,将错误信息以列表的形式告知检验员,由检验员通过人机交互 第3 章g i s 空间数据处理与质量控制的方法 的方式进行错误确认并改正。( 在图形列表的每一行双击可在地图中心显示 打折线位置) 。 打折线的处理方法:在系统返回打折线的位置后,选中需要处理的打折线 的打折位置的中间结点,利用处理菜单的移动图元结点的功能,并结合系统提 供的捕捉功能,修改打折线即可。 3 1 3 5 自相交线的检查与处理 自相交线的定义:线段自身相交是指同一条折线或曲线自身存在交点【2 0 】。 若存在线段自身相交错误,在构建拓扑关系的时候,会出现无意义的小多边形, 影响利用数据进行空间分析的质量。因此,此类错误必须在数据入库前排除。 分析各种线段自身相交的错误,可归纳为如图3 8 所示的三种情形。 i 3 l 23 图3 8 自相交线的错误情形示意图 由图3 8 可知,自相交线即一条线段的相邻两个直线段相交,一条线段非 相邻两个直线段相交,一条线段存在多处自身相交。 目前自相交线的自动检查算法可基于求线段直线段的交点坐标并判断交点 的位置是否在线段上,从而判断是否存在线段自相交的错误,具体实现步骤如 下: 1 获取检查图层( l a y e r ) ,确认是否为线图元图层,是则读入一条线图元 ( l i n e f e a t u r e ) ,否则返回提示信息告知检验员。 2 对读入的线图元,计算组成该线图元的所有直线段的最小外接矩形。即从起 点开始,求得相邻的两个节点组成的直线段的最小外接矩形。 3 比较最小外接矩形。以第1 条直线段的最小外接矩形为基准,依此与第3 条、 第4 条、第n 一1 条直线段的最小外接矩形进行比较;然后,以第2 条直 线段的最小外接矩形为基准,依此与第4 条、第5 条、第n - 1 条直线段 8 检查完成后,将错误信息以列表的形式告知检验员,由检验员通过人机交互 的方式进行错误确认并改正。( 在图形列表的每一行双击可在地图中心显示 自相交线位置) 。 自相交线的处理方法和打折线的处理方法类似。 3 1 4 基于面实体的数据质量检查与处理 面实体数据,有时也称为多边形或区域数据,是描述地理空间信息的最重 要的一类数据,可以定义为由各种线型要素封闭而成的闭合实体。面实体主要 用来表示面状地物,如宗地、房屋、国家等。针对面实体的检查与处理包括: 面与线的关系( 主要为面与线的相交性或相邻性的检查与处理) 、面与面的关系 ( 主要为面与面的相交性、包含性或相邻性的检查与处理) 。 3 1 4 1 面与线的关系的检查与处理 在面与线关系的检查中,主要做面与线的相交性、相邻性检查。面与线的 关系如图3 9 所示 面 与 线 桐 离 面与线的相交性定义为:某线图层上的所有线实体都不应与某面图层的任 一面图元相交。该项检查可应用于如检查房屋层和道路层是否存在相交性等。 面与线的相邻性定义为:某线图层上的所有线实体都应与某面图层的某一 面图元相邻。该项检查可应用于宗地界址线层是否与宗地层相邻等。 面与线关系的自动检查算法: 1 获取检查图层( l a y e r ) ,进行面线关系检查的图层应包括一个面图层和一个 线图层,两者是对应关系,如果设置检查图层与之不相符,应返回提示信息 告知检验员。 2 从点图层读入一个线图元,对其作是是否与面相交的判断。判断的依据是对 该线图元做线的相交性( w i t h i n ) 的空间分析,查找包含该线图元相交的面图 元个数,如果个数大于等于1 ,说明其与面图元存在相交的错误,应返回错 误信息。 3 对读入线图元,如对其作是否与面相邻的判断。判断的依据是对该线图元做 线的接触性( s p a c i a lt o u c h ) 的空间分析,查找接触该线图元的面图元个数, 如果个数小于1 ,则说明该线没有相邻的面实体,视为错误,返回错误信息。 4 判断是否存在下一个线图元,存在则转入2 继续进行检查,不存在,则转入 5 ,将检查结果告知检验员。 间数据处理与质量控制的方法 表的形式告知检验员,由检验员通过人机交互 ( 在图形列表的每一行双击可在地图中心显示 面与线的关系的处理方法:对不该相交或者应该相邻的线图元,可采取移 动图元或移动图元结点的方法取完成处理,具体可依据实际情况需要。 3 1 4 2 面与面的关系的检查与处理 在面与面关系的检查中,主要做面与面的相交性、包含性检查。面与面的 关系如图3 1 0 所示 面与面包含 图3 1 0 面与面关系的检查示意图 面与面的相交性定义为:某面图层的所有的面状实体都不应出现相交的情 况。该项检查可应用于如检查房屋层不能出现相交等情况。 面与面的包含性定义为:某面图层的所有的面状实体都不应出现包含的情 况。该项检查可应用于如检查宗地层不能出现岛宗等情况。 面与面关系的自动检查算法: 1 获取检查图层( l a y e r ) ,确认是否为面图元图层,是则读入一个面图元 ( p o l y g o n f e a t u r e ) ,否则返回提示信息告知检验员。 2 从面图层读入一个面图元,对其作是否存在与面相交的判断。判断的依据是 对该面图元做面的相交性( i n t e r s e c t ) 的空间分析,查找与该面图元相交的 面图元个数,如果个数大于等于l ,说明其与面图元存在相交的错误,应返 第3 章g i s 空间数据处理与质量控制的方法 回错误信息。 3 对于读入的面图元,如需对其作面的包含性的判断。判断的依据是对该面图 元做面的包含性( w i t h i n ) 的空间分析,查找包含于该图元的面图元个数,如 果个数大于1 ,说明存在面图元包含的错误,返回错误信息。 4 判断是否存在下一个面图元,存在则转入2 继续进行检查,不存在,则转入 4 ,将检查结果告知检验员。 5 检查完成后,将错误信息以列表的形式告知检验员,由检验员通过人机交互 的方式进行错误确认并改正。( 在图形列表的每一行双击可在地图中心显示 面面关系出错位置) 。 面与面的关系的处理方法与面与线的关系的处理方法类似。 3 1 5 基于拓扑构面的数据质量检查与处理 3 1 5 1 拓扑构面的数据结构设计 在空间数据的拓扑结构设计中,笔者用节点、弧段和多边形来分别代表点 实体、线实体和面实体,并根据针对节点、弧段和多边形的特点和在拓扑构建 过程中承担的角色,分别进行拓扑结构设计。 结点是空间数据拓扑自动建立的主要要素,在空间拓扑关系的三种重要形 式中,主要是建立点实体与线实体的连通性关系,即获取穿过每个点的弧段i d 信息。所以对结点我们设计的数据结构是: s t r u c tt o p o p o i n t i n tm i d ; 节点标志号 t o p e l i n e l i s tm l i n e l i s t : 用于保存节点相关的弧段编号 ) 弧段是进行空间数据拓扑自动建立的中间要素,在空间拓扑关系的三种重 要形式中,起着承前启后的作用,即既要建立起与点实体的连通性关系,也要 建立起与面实体的封闭型关系。所以对弧段我们设计的数据结构是: s t r u c tt o p o l in e i n tm i d : 弧段标志号 第3 章g i s 空间数据处理与质量控制的方法 i n tm h e a d n o d e p o i n t i d :弧段开始节点的标志号 i n tm t a i l n o d e p o i n t i d : 弧段结束节点的标志号 i n tm l e f t p o l y g o n i d ; 弧段左侧多边形的标志号 i n tm r i g h t p o l y g o n i d ; 弧段右侧多边形的标志号 ) 多边形是进行空间数据拓扑自动建立的最终要素,在空间拓扑关系的三种 重要形式中,主要就通过线实体的拓扑建立和面实体与线实体的拓扑关系,来 构建连续完整的面空间拓扑关系,实现空间数据拓扑构建的全过程。所以对多 边形我们设计的数据结构是: s t r u c tt o p o p o l y g o n i n tm i d : 多边形标志号 t o p e l i n e l i s tm l i n e l i s t :组成多边形的弧段数组 采用上述设计的空间拓扑数据结构,信息直观,易于软件实现,而且又可 以完整地表达实际的空间拓扑关系,如果采用复杂的拓扑数据结构,那么在软 件实现的过程中可能会出现意想不到的错误,所以在软件的设计中,设计的空 间拓扑数据结构不宜过于复杂。 3 1 5 2 自动拓扑构面的方法 空间数据拓扑自动构建的一般过程为:( 1 ) 弧段自动断开,使得整幅图形无 相交或自相交弧段:( 2 ) 结点匹配:建立点和弧段的关系;( 3 ) 建立多边形,以 左转算法或右转算法跟踪,生成多边形,建立多边形与弧段的关系; 1 弧段自动断链 目前,在进行数据采集时,目标主要以点和线的方式进行跟踪采集,并且 一次性采集完毕。按要求,线在交点处应断开,但为了采集的方便性,通常在 采集时交点处不进行线的断开,而是继续跟踪线目标的其余点。这就必然造成 线的自相交或线群之间互相交的情况,因此,在拓扑关系生成的过程中,首先 应该将相交的线和自相交的线自动断链,使整个图幅无相交和自相交的弧段, 实现把一条线分成首尾相连的子弧段,这些子弧段除首尾结点外不与其它子弧 段相交。通过这样,建立起结点集和弧段集,把线的顶点和线与线之间的交点 生成结点集,把原线根据交点分割成多条弧段,形成弧段集,结构如上节介绍。 第3 章g i s 空间数据处理与质量控制的方法 该过程在软件实现的时候可通过线与线之间的相交性空间分析来实现。但 如果对每一条线都与其余所有的线目标进行相交关系判断,则计算量相当庞大。 为了减少计算量,在实现过程中可利用线的外接矩形来判断,只有与外接矩形 相交的线目标才有可能相交,这样可提高计算的效率。 2 结点匹配 在实现了断链获得了结点集和弧段集之后,由于每个弧段都有首末两个结 点,而断链后相邻结点之间存在一定的限差,所以必须统一结点,进行结点匹 配。结点匹配就是将坐标限差在一定范围内的结点合并为1 个结点,并建立与 那些弧段相关联的拓扑关系。如果有n 条弧段,则有2 n 个结点,将其编号为 卜2 n 。在自动断链之后势必几条弧段公用一个结点,则其编号总数将远远少于 2 n 。结点匹配之后的结果就是得到点与线、线与线之间的网络拓扑关系,在此 基础上,我们就可以实现多边形拓扑关系的自动构建。 该过程在软件设计的时候可采用3 1 1 节重复点的检查和处理的方法。 3 建立多边形 多边形自动构建的过程是:先求出每个结点相邻的弧段在该节点处的夹角, 再用搜索算法找出所有的封闭区域,得到相应的多边形。其基本思路是,在弧 段集中取任何一条弧段开始,弧段的起始结点为多边形的起始结点,取其终止 结点编号,然后在结点集中查找对应的结点,再对与此弧段相连的所有结点重 新进行排序( 按照最小夹角法) ,依次取与它相连的各条弧段作为后继弧段( 如果 弧段的遍历次数为2 ,则中断本次搜索) ,后继弧段的另一个结点作为搜索的下 一个结点,依次类推,当下一个结点为多边形的起始结点时,多边形搜索完毕, 构成多边形的所有弧段遍历次数加1 ,按照此方法直至弧段表中的所有弧段遍 历完毕。 3 1 5 3 基于拓扑构面的数据质量检查与处理 通过拓扑构面的实现,可将线实体转化为封闭的面实体,对构面的结果进 行分析,我们可以发现正确的拓扑构面结果如图3 1 1 ( a ) 所示,错误的情况是 存在“面碎片 或“面裂缝。文献 1 9 中指出相邻多边形叠置时,可能会产生 共享边界的不一致。这种不一致分为3 种情况:( 1 ) 相交型:两多边形边界相交 且只有两个交点,表现为产生“面碎片,如图3 1 1 ( b ) 所示;( 2 ) 相离型:两 多边形边界不相交,且边界之间的距离小于视觉邻近阈值入,表现为产生“面裂 缝 ,如图3 1 1 ( c ) 所示;( 3 ) 交织型:两多边形的边界相交且交点数目多于两 第3 章g i s 空间数据处理与质量控制的方法 既有“面碎片 ,也有“面裂缝,如图3 1 l ( d ) 所示; b ) 翻竞曩 【c ) 翻毒爱 l d ) 吏欲爱 图3 1 l 拓扑构面的共享边界示意图 或“面裂缝 问题的处理,其实质是如何构建一条新的边界 一致的两局部边界,新产生的边界应该是对原边界最近似的拟 提出了咬合式和平差式两种方法进行处理,咬合式处理是指对 精度占优的多边形a 独自获得相交区域c ,与其相邻的多边形b 则失去相交区 域c ,即a = a + c ,b = b c ;平差式处理是指对于a 和b 多边形都采取均分c 的方 法进行平分,即a = a + c 2 ,b = b + c 2 。平分相交区域c 是以c 的中轴线为基准进 行划分。 笔者在进行软件实现中,对于咬合式处理和平差式处理的选择,认为其依 据在于相交区域c 的面积和形态,面积大,则适用于平差式处理,面积小,则 适用于咬合式处理;形态是指周长与面积的平方根之比的大小( g o o d c h i i d 1 9 9 1 ) ,形态扁长者,该比值较大,适用于咬合式处理,形态方圆者,该比值较 小,适用于平差式处理。 3 2 空间数据位置( 几何) 精度质量检查 g i s 数据的位置( 几何) 误差是指数据集( 如地图) 中的物体的地理位置与其 真实的地面位置之间的差别,常以坐标数据的精度来表示。它包括数据的数学 基础精度、平面位置精度、高程精度和接边精度,是反映几何数据质量的指标 【l6 1 。其中,数学基础是指采用的空间坐标系的正确性和控制点、图廓点、公里 格网交点等与已知坐标值、理论值的一致性。接边精度是指两相邻图幅接边处 数据的重叠情况。通常检验几何精度的方法是按照规定的方式选择一些特定的 据处理与质量控制的方法 的信息源的定位系统进行比较。几何精度 描述真实位置与表达位置之系统差别,理 点的平均位置误差度量。精度是数据元素 的检测点的标准离散差的计算来估计。一 范围相对较小,量测的数据精度越高,使 精度通常采用野外测量法。是将野外采集 ,通过比较g i s 图上一定数量的点坐标与 其相对应的野外实测坐标,获得g i s 数据的位置精度。 3 2 1 检测点的个数 由于不可能测试g i g 数据中的所有点,只能抽取一定数量的点( 样本) ,采 用统计的方法,由样本的标准差s 近似地估计数据集的总体标准差西,即数据 集的位置精度。如果抽样点数目n 相当大,根据概率的大数定律可以确信,子 样标准偏差s 与总体标准偏差西之差可以小到任意程度,即当抽样点数n 为无 穷大时,m s ,计算误差的大小决定于抽样点数n 【1 6 】,如式( 3 1 ) 所述: 册= s + o j 压s 酬压 ( 3 1 ) 由( 3 1 ) 式可知,抽样点数n 越多,由样本标准偏差估计数据集总体标准偏 差的误差就越小,即估计的精度越高。已有研究表明,g i s 数据位置误差呈正 态分布。点数越多,误差的分布越接近真实分布,分析误差分布中出现的异常, 有利于检测数据中存在的系统误差和粗差。因此,通过抽样的方法评价g i s 数 据位置精度,有必要探讨检测点的个数,即需要对函s 的精度和可靠度0 c 作出 估计: p ( s 一 o 。 0 ,为s 和o o 的误差) ( 3 2 ) 对一幅图进行位置精度评价,采集的检测点数通常是2 0 个以上。由概率统 计理论可知,当抽样点数n ) 2 0 时,统计量f2 ( s 0 0 ) o 。也服从正态分布,其中 g 。:“压s 压,则: 以吨 t 、? 、 、 、 2 非空性 非空性是指某些属性必须输入其特征值,不允许为空,所以在检查时,如 果哪个字段为空,则按错误记入数据库。 3 频率法 频率是指某一个值出现的次数,由于属性表中某些字段值在每个文件中出 现的次数是固定的,因此,当其出现的次数与其预定的次数不等时,则存在错 误。频率法主要用于主关键字段的检查。例如某一个字段的值一定要求是唯一 值的时候,频率法是最有效的检查方法。 4 固定长度 固定长度是指属性值的长度为某一定值,当其长度不等于设置值时,则存 在错误。如一些代码只能是四位,即不会多,也不会少。 5 有效范围法 属性数据的有效值检查包括属性的可能取值和属性取值范围两种。 ( 1 ) 属性的可能取值是指某一属性项的值可以列举出来。因此,用于属性数 据的有效值检查。例如,如果属性数据是电压的话,它的有效值通常应该是3 8 0 v 、 2 2 0 v 等;如果属性数据是土地利用,那么有效值只可能是工业用地、居民用地、 道路、林地等。如果属性值不是这些可能的值,则作为错误记录。 ( 2 ) 属性取值范围是指属性项的值在一定的范围内,不会超出既定范围。如 某些取值只能取正整数等,如果属性值不是这些值则作为错误记录。 对于属性值出错的处理方法可进行编辑修改保存。 3 4 完整性与正确性质量检查 完整性与正确性检查内容内容包括数学基础、文件命名。数据文件、数据 分层、要素表达、数据格式、数据组织、数据存储介质、原始数据等的完整性 和正确性。 空间地理特征的完整性,主要是检查所有的内容是否均被数字化。检查方 法包括:回放检查图套合检查、矢量和栅格套合屏幕漫游目视检查。 第3 章g 。s空间数据处理与质量控制的方法 3 4 1 数据组织形式检查 数据组织形式检查,主要检查当前采集的数据是否齐全,文件格式是否正 确等问题【2 3 1 。数字地图数据库一般以图幅的方式进行管理,每一图幅包括1 1 个要素层数据文件,分别是测量控制点文件、独立地物文件、居民的文件、交 通文件、管线文件、境界与政区文件、水系文件、地貌文件、等高线文件、土 质文件、植被文件,以及一个地名文件、一个文本文件和一个公用文件。上述 各个文件是必不可少的。其中属性文件记录要素的属性信息;坐标文件记录要 素的定位信息;地名文件记录要素的定位信息、属性信息等;文本文件记录图 幅的图外信息,如三北方向线、接图表等;公用文件记录图幅的图名、图号、 成图日期、生产单位以及数据精度等信息。 g i s 数据文件通常用树形目录存储管理,例如主目录为“测区名称 ,子目 录为“百万分区号 ,其下建立“图号子目录,“图号”目录下存放相应的层 文件、元数据文件。根据上述数据组织形式,可以对数据组织形式正确性、数 据完整性等进行检查,在所有的编程平台中,都提供了查找文件是否存在的函 数,这些函数可以完成数据文件完整性的检查。 3 4 2 文件命名检查 对于按国家标准地形图分幅和编号的g i s 数据,文件命名共1 3 个字符,数 据文件名具有如下规则: ( 1 ) 首位为字符,代表百万比例尺带号,中国的代号为a - n ,对于被检查的 某一测区范围,可以确定首位字符的可能取值; ( 2 ) 第2 3 位为分区号数字,中国为4 3 - 5 3 ,根据被检查的测区范围,可 以确定分区号的可能取值; ( 3 ) 第4 位为字符,与系列比例尺对应( 例如,“e 代表1 :5 万,“g 代表 1 :1 万等) 。对于一批被检的数据,第4 位取值为固定值; ( 4 ) 第5 7 ,8 1 0 位分别为图幅所在的行列号,其取值范围与比例尺有关, 对于一批被检的数据,图幅所在行列号的取值范围为固定值; 根据以上规则,笔者提出了“文件命名格式检测模版 的概念,实现对数 据文件命名的格式检查。首先,从文件中取出任一记录和“文件命名格式检测 模版”进行匹配,判断文件命名格式是否正确,比如是否存在多余的空格,是 第3 章g i s 空间数据处理与质量控制的方法 否缺失记录等一系列问题。最后,以图表的形式提示错误信息。按照此方法就 可以对数据文件的命名格式进行检查,查出错误信息。此方法的另一优点在于: “文件命名格式检测模版 是可以变化的,针对不同的数据格式可以设定不同 的模版,这样提高了数据文件命名格式检查的灵活性。 3 5 附件质量检查 附件质量检查的内容包括元数据、图历簿、技术设计书及其它文档资料的 齐全性,项目填写内容的正确性【2 4 】。 图历簿、技术设计书及其文档资料只能通过手工方法检查,元数据文件可 以通过建立“元数据项标准名称模板 、“元数据用户定义模板”实现自动检查。 元数据自动检查实现的方法: ( 1 ) 建立“元数据项标准名称模板”( 数据库表) 。 ( 2 ) 建立一个空数据库表( 包括5 个字段:被检元数据项名称、被检元数据 项的值、元数据项标准名称、标准名称取值说明、标准名称取值) ,作为“元数 据用户定义模板”,将“元数据项标准名称 与“被检元数据项名称 关联起来。 ( 3 ) 在制定检验方案时,将被检查测区d o m 数据的元数据项名称读入“元数 据用户定义模板 第一列,由用户定义对应的元数据项标准名称、元数据项标 准名称取值说明及元数据项标准名称取值,完成“元数据用户定义模板 定义。 ( 4 ) 通过“元数据用户定义模板”中的“取值说明 、“取值”,对元数据文 件实现自动检查。 3 6 本章小结 本章有针对性地归纳整理了适合计算机软件实现的g i s 空间数据数据处理 和质量控制的方法,笔者对基于空间实体的数据质量检查和处理和基于拓扑构 面的数据质量检查与处理方面做了重点研究,根据点、线、面三类空间实体的 六种组合关系以及拓扑构面的结果来分析数据质量问题,并提出了相应的处理 方法。另外也对位置几何精度、属性精度和完整与正确性等方面进行了软件算 法的设计,为后期在a r c o b j e c t s 环境下实现人机交互检查软件的开发打下了较 好的理论基础。 第4 章g i s 数据处理与质量控制的软件设计 第4 章g i s 数据处理与质量控制的软件设计 4 1 软件的目标设计 在目前的技术条件下,根据数据的内容和要求、数据采集的方法和作业流 程、工作人员的技术水平以及所使用的软件工具等多方面的因素,我们将空间 数据质量的检查分为三种方法【2 5 】: 1 人工实物对照检查 利用g i

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论