




已阅读5页,还剩1页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
空间数据质量特性与质量控制范志坚1,2,方源敏1,汪虹2(1.昆明理工大学国土资源工程学院 昆明 ;2.云南省基础地理信息中心 昆明 )摘要:本文主要讨论空间数据质量特性、质量控制所涉及的内容。结合笔者最近从事空间数据库建库的具体实践和工作体会,探讨从位置精度、属性精度、时间精度、数据完整性和逻辑一致性等方面对数据质量进行全面控制,最终建成一个质量可靠的空间数据库。关键词:地理信息系统;空间数据库;空间数据;质量特性;质量控制 Quality characteristic and Quality control of Spatial dataFan Zhi-jian1,2,Fang Yuan-min1,Wang-Hong2(1.Faculty of Land Resources Engineering,Kunming University of Science and Technology,Kunming,China;2.Yunnan Provincial Geomatics center,Kunming ,China)Abstract:This paper mainly talks over contents which are involved with quality characteristic and quality control of spatial dataIntegrating with concrete practice and work experience which the writer has recently been engaged in establishing spatial database,a very comprehensive control of data quality should be discussed from aspects of positional accuracy、attribute accuracy、temporal accuracy、data compression、as well as logic conformance and so onFinally,a dependable spatial database should be set upKey words:GIS;spatial database;spatial data;quality characteristic;quality control0 引言空间数据库是随着地理信息系统(GIS)的开发和应用而发展起来的数据库新技术,它是地理信息系统的重要组成部份,是地理信息系统应用部份的前题和基础。空间数据库为此建立了如实体、关系、数据独立性、完整性、数据操作、资源共享等一系列基本概念。以空间数据存储和操作为对象的空间数据库,把被管理的数据从一维推向了二维、三维甚至更高维。空间数据库是一种应用于空间数据处理与信息分析领域的具有工程性质的数据库,它所管理的对象主要是空间实体。在空间数据库中,空间数据质量的好坏,直接影响到空间数据库的经济效益和社会效益。要得到高质量的空间数据,最重要的是在空间数据生产和使用过程中进行质量管理和质量控制。通过质量管理和质量控制,可以分析影响产品质量的原因,进而提高空间数据的质量。空间数据的质量是空间数据库生存和发展的保障,缺少质量指标的空间数据将无法得到用户的信任,且直接影响到地理信息系统应用、分析、决策的正确性和可靠性。由此可知,空间数据质量是空间数据库的生命线。1 空间数据库中的误差空间数据库建立后,数据库中的误差包含了原始数据的误差和数据库建库所引入的误差。1.1 原始数据的误差原始数据是指空间数据库建设时所包含的基本的数字化数据。它未经过任何地理信息系统的分析处理。原始数据的误差可分为源误差、处理误差和应用误差等三种类型。源误差:源误差是指数据采集和录入中产生的误差。包括遥感数据、测量数据、属性记录、GPS数据、地图、地图数字化精度等的误差。处理误差:处理误差是指数据录入后进行空间数据处理过程中产生的误差。包括几何改正、坐标变换和比例变换、投影变换、几何数据的编辑、属性数据的编辑、空间分析(如多边形叠置、数据层叠加时的冗余多边形等)、图形化简(数据压缩和曲线光滑)、数据格式转换、计算机裁切误差、空间内插、矢量栅格数据的相互转换等。使用误差:使用误差是指空间数据被使用过程中出现的误差。包括数据的完备程度、时间的有效性(即现势性)、拓扑关系的正确性、缺乏数据的质量报告、由应用模型引起的误差等。以上三种误差中,数据处理误差远远小于源误差,使用误差看来不属于数据本身的误差,但是这些因素直接影响到应用的效果,所以也应列为空间数据误差的范畴。1.2 空间数据库建库所引入的误差空间数据库中的多源数据,经过基础地理信息数据库系统管理平台的各种分析、处理后,可以形成新的数据和最后产品。在这个过程中还会产生新的误差,这些误差包括:计算误差、拓扑叠加分析引起的数据误差以及GIS中的误差传播问题。计算误差:计算机能否按需要的精度存储和处理数据,主要取决于计算机字长。在计算机字长不够的情况下进行许多大数据的运算时,会出现较大的舍入误差。图形图像处理的算法选择也与计算误差相关。数据处理过程中引入的计算误差一般还是较小,特别是与数据源误差相比,此项误差是可以忽略不计的。拓扑叠加分析引起的数据误差:叠加分析是地理信息系统中很常用的一种分析方法。通过同一地区不同内容的多幅地图的叠加组合,产生新的图形和属性信息。在这个过程中,往往产生拓扑匹配、位置和属性方面的数据质量问题。由于叠加时,多边形的边界可能不完全重合,从而产生若干无意义的多边形。对这些无意义多边形进行处理的结果往往会改变边界线的位置。叠加后形成的新的多边形,其属性值的确定也可能存在属性组合带来的误差。地理信息系统中的误差传播问题:地理信息系统中,由于从数据来源、空间数据库建立到空间数据库的操作和使用都引入了各种误差因素,特别是空间数据集成与整合所引入的误差。因此空间数据库系统应用分析的最终结果中也包含了这些误差因素的影响。误差传播的研究目的就是研究初始过程和中间过程中引入的误差因素对于最后结果的影响,并模拟误差的变化。目前,由于对地理信息系统误差传播机理的认识还不够深入,误差传播的很多方面都还处于研究和试验阶段。但是,对于地理信息系统的专业人士来说,了解数据的各类误差均会以某种方式在系统中传播并将对地理信息系统的最后应用结果的质量产生影响,对理解地理信息系统数据、数据产品和空间数据库的可靠性将是十分有益的。以上讨论了空间数据库中原始数据本身含有的误差和随后空间数据库操作中引入的误差。一般来说,原始数据的误差远远大于空间数据库操作中引入的误差,因此,要想控制空间数据库的数据质量,数据获取生产过程中的质量控制及良好的入库空间数据是至关重要的。2 空间数据质量与评价2.1 空间数据质量空间数据是空间数据库中管理和处理的主要对象。空间数据是指用来表示空间实体的位置、形状、大小及其分布特征诸多方面信息的数据。它可以用来描述来自现实世界的目标,它具有定位、定性、时间和空间关系等特性。定位是指在一个已知的坐标系里空间实体都具有唯一的空间位置;定性是指有关空间实体的自然属性,它伴随着实体的地理位置;时间是指空间目标随时间的变化而变化;空间关系通常又称拓扑关系,在数据库中的表示可以是显示的,也可以是隐式的。空间数据分矢量数据(DLG)和栅格数据,栅格数据又分为点阵式的影像数据(DOM、DRG)或格网数据(DEM)。空间数据(几何数据和属性数据)质量是指空间数据的可靠性和精度,通常用空间数据的误差来度量。空间数据的质量控制是针对空间数据的特点来进行的,主要包括数据完整性、数据逻辑一致性、位置精度、属性精度、时间精度以及一些关于数据的说明 。空间数据的质量控制就是通过采用科学的方法,制定出空间数据的生产技术规程,并采取一系列切实有效的方法在空间数据的生产过程中,针对关键性问题予以精度控制和错误改正,以保证空间数据的质量。空间数据质量标准要素的具体内容为:空间数据的完整性主要是指数据是否覆盖到应该覆盖的范围,如全国的数据就应该覆盖到全国范围,一个省的居民地就应该包括全省的居民地数据;空间数据的逻辑一致性主要是指数据定义的统一性,在同一个基础地理信息数据库中,数据的定义应该保持一致;空间数据的位置精度主要是指数据的地理位置精度;空间数据的属性精度主要是指数据所载负的地理信息的正确性,比如同一线状地物的分类码赋值是否连续、合理,一条河流的名称及分级是否正确和一致,一个居民地的名称及其行政隶属关系是否正确等等;空间数据的时间精度是数据本身所代表的时间信息的正确性,如50年代的湖泊数据与90年代的湖泊数据就有很大的差别;关于数据的说明称为元数据,是对基础地理信息数据源的注释,如数据种类、投影方式、平高系统、生产单位和时间等;空间数据表达形式的合理性是指数据抽象、数据表达与真实地理世界的吻合性,包括空间特征、专题特征和时间特征表达的合理性等。2.2 空间数据质量评价空间数据质量是众多影响因素共同作用的结果。因此质量评价模型的确立应充分考虑这些因素后确立其质量元素。按照数据质量评价方法的不同,空间数据质量评价可分为直接质量评价和间接质量评价。直接质量评价是对数据集通过全面检测或抽样检测方式进行质量评价,又称验收度量;间接质量评价是通过对数据源、生产方法、数据处理等间接信息的检查方式进行数据集质量评价,又称预估度量。为了度量和描述方便起见,空间数据的质量按其元素可分为一级质量元素和二级质量元素。2.2.1 直接质量评价空间数据质量直接评价是通过表1规定的质量元素来评价的。表1空间数据质量元素一级质量元素二级质量元素基本要求文件名称、数据格式、数据组织数学精度数学基础、平面精度(DLG、DOM、DRG)、高程精度(DLG、DEM)、接边精度(DLG、DOM、DEM)、分版套合精度(DRG)、格网精度(DEM)图形或影像质量分辨率(DOM、DRG)、反差(DOM)、清晰度(DOM、DRG)、灰度(DOM)、色彩一致性(DRG、DOM)、外观质量(DRG、DOM)属性精度(DLG)要素分类与代码的正确性、要素属性值的正确性、属性项类型的完备性、数据分层的正确及完整性、注记的正确性、属性表字段定义的正确性逻辑一致性(DLG)拓扑关系建立的正确性、多边形闭合、结点匹配完备性要素的完备性(DLG)、注记的完备性(DLG)现势性数据获取或更新时间附件质量文档资料的正确、完整性,元数据文件的正确、完整性注:斜体字表示适合各类数据2.2.2 间接质量评价空间数据质量间接评价是通过表2规定的质量元素来评价的。表2空间数据评价元素间接评价元素直接评价元素(质量元素)数据源质量图形(像)数据质量数学精度、现势性、影像质量、完备性属性数据质量属性精度、现势性、完备性模型转换质量扫描处理、数字化质量数学精度、属性精度、逻辑一致性、完备性数据生成质量计算误差数学精度拓扑分析质量数学精度、属性精度图层叠置质量数学精度其他基本要求、附件质量2.2.3 空间数据质量度量模型采用任何一种质量评价方法都可以用一致的元素来度量空间质量。由于直接评价方法使用得更多,质量表达得更为准确,更适于用户判定产品适用性,因此常选用直接评价元素来作为数据质量度量的元素,并建立空间数据质量度量模型。空间数据质量度量模型见表3。表3空间数据质量度量模型一级质量元素二级质量元素质量度量评价基本要求文件名称、数据格式、数据组织正确错误合格不合格数学精度数学基础平面精度、接边精度套合精度、高程精度格网间距正确错误平面中误差高程中误差正确错误合格不合格分值分值合格不合格图像或影像质量(DOM、DRG)分辨率反差清晰度灰度色彩一致性外观质量较差均差(同类地物在相同光照下的色彩值、光亮值、对比度差值的平均值)分值属性精度(DLG)要素分类与代码的正确性要素属性值的正确性属性项类型的完备性数据分层的正确及完整性注记的正确性正确、完整错、漏分值逻辑一致性(DLG)拓扑关系的正确性、多边形闭合、结点匹配正确错误分值完备性要素的完备性(DLG)注记完整性(DLG)完整遗漏分值现势性数据获取或更新时间现势状况合格不合格附件质量文档资料的正确、完整性元数据的正确、完整性正确、完整错、漏分值注:斜体字表示适合各类数据2.2.4 空间数据质量评价方法的选取直接质量评价方法为主,间接质量评价方法为辅。采用直接质量评价方法对数据集进行质量评价后,可不再使用间接质量评价方法,但采用间接方法进行质量评价的,在正式提交成果时,还应使用直接评价方法进行质量评价。3 空间数据入库时的质量控制原始数据是直接由测绘部门按照数据生产的相关规范进行生产,并以数据的形式提供。对于数据生产的数据质量控制在这里暂不赘述,而主要针对入库的原始数据,按照空间数据的质量评价和质量度量模型,进行数据入库时的数据质量再检查。3.1 空间数据的检查其内容主要包括:(1)入库数据文件是否齐全、完备;(2)空间数据的地理参考系统是否正确,是否满足整个数据库入库的基本要求;(3)数据格式检查:不同软件数据格式及转换的可行性;(4)空间位置的几何精度;(5)空间地理特征的完整性:是否所有的内容均数字化,数据是否漏空或重叠等;(6)空间特征表达的完整性:面状特征是否以面状的多边形进行表达;(7)类型一致性检查:分类、分层,线状地物是否连续,代码的一致性,矢量几何精度一致性、影像像元大小一致性、DEM格网大小一致性等;(8)拓扑一致性检查:拓扑关系、多边形闭合关系等;(9)数据接边检查:同比例尺接边处理、相邻图幅要素属性及几何图形接边检查、各时期各种类型数据接边检查。空间数据的质量检查因产品类型和数据采集的手段不同,检查方法也略有不同,但检验内容大致相当见表4。表4空间数据的检查检验内容DLGDRGDEMDOM数学基础位置精度平面高程接边精度注:表中“”表示应做的检查内容对图形数据进行检查的方法有:(1)在屏幕上进行目视检查,将数据显示在屏幕上,对照原图检查数据的错误,如点、线、面目标的丢失,相互关系错误等;(2)利用软件进行检查:主要指应用建库软件本身的功能,检查数据拓扑关系的一致性,或者开发一些检查程序,检查数据的逻辑一致性和完整性,同时将发现的错误显示或打印出来;(3)绘制检查用图进行检查:利用数据生成绘图文件,绘制分要素或全要素的检查用图,与原图套合进行检查。这些方法,往往交替使用,以便能够对图形数据进行认真、全面地检查。3.2 属性数据的检查与方法属性数据的检查主要包括要素分类与代码的正确性、要素属性值的正确性、空间数据连接关系的正确性等。检查时可以通过“库查图方式”逐级逐类检查其面状闭合性,线状地物的连续性或一致性。在屏幕上逐一显示要素,依据地图要素分类代码表抽样检查要素分类属性、代码的正确性,也可按属性取值调出图形元素,检查各属性值的正确性以及与图形元素关系的正确性。3.3 空间数据之间关系正确性的检查与方法空间数据之间关系正确性的检查(也称逻辑一致性和完整性)主要包括:多边形闭合状况、结点匹配精度、拓扑关系的正确性等。检查时可填充颜色以检查其面状闭合性,或采用屏幕漫游目视检查以及计算机程序检查面状要素是否封闭、线状要素是否连续、同一地物在不同图幅的分类、分层属性是否一致,以保证空间数据之间关系的正确性。4 结束语通过上述讨论不难理
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 一棵开花的树1500字12篇
- 杭州宋城游记650字9篇
- 小王子读后感900字(9篇)
- 早期育儿知识培训方案课件
- 纪检业务知识培训目的课件
- 统编版语文四年级上册《语文园地八》课件
- 早期埃及课件
- 农村资源开发综合利用合同书
- 农村环保技术应用合作合同书
- 六年级观后感八佰观后感十五550字12篇
- 浪浪山携志奔赴新学期-2025年秋季开学第一课主题教育班会-2025-2026学年初中主题班会
- 管道吊装方案范本
- 黑龙江省五大连池市2025年上半年事业单位公开招聘试题含答案分析
- 拍摄与剪辑基础知识培训课件
- 小学英语课堂教学规范操作手册
- 人事经理工作汇报
- 2025年时事政治考试100题(附答案)
- 中小企业网络安全解决方案概述
- 官方兽医考试题及完整答案详解(名校卷)
- 水质分析 题库及答案
- 2025年小学英语教师业务理论考试试题及答案
评论
0/150
提交评论