浅论GIS数据质量控制.doc_第1页
浅论GIS数据质量控制.doc_第2页
浅论GIS数据质量控制.doc_第3页
浅论GIS数据质量控制.doc_第4页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

浅论GIS数据质量控制学号:08430025 姓名:刘强 学院:草业与环境科学学院专业:环境工程浅论GIS数据质量控制摘 要:在分析GIS数据质量特点的基础上,提出了按照数据的生产过程划分的原始数据,一次性数据、二次性数据、三次性数据。并基此以矢量化数据为例说明了数据质量控制流程。详细分析了数据的检验方法,井以测量数据为例详细说明了数据质量控制过程。关键词:地理信息系统 (GIS)数据质量 质量控制数据不仅是地理信息系统(GIS)的操作对象,也是GIS的最终产品。GIS作为一个产业,有必要建立起对其产品生产的全程质量控制体系,以此保证G1S产品的质量,促进GIS的健康发展。GIS数据是有关空间位置、专题特征以及时间信息的符号记录,而数据质量是空间数据在表达这3个基本要素时所能达到的准确性、一致性、完整性以及它们三者之间统一性的程度。由于现实世界的复杂性、模糊性以及人类认识和表达能力的局限性,CIS数据在采集、存储、处理、分析、表达、显示、传播等过程中存在一定的质量问题。保证GIS数据在数据的加工、传播过程中的质量,加强质量控制,从理论和方法两个方面着手建立质量控制体系。本文先阐述GIS数据质量特点,然后分析了数据质量控制的体系的建立和控制流程,以及数据质量的检验方法。1 数据质量特点数据是CIS作用的对象,利用计算机存储、处理、输出的各种信息的总和,或者“事实”的集合。ClS数据通常为空间数据和属性数据。它可表示为一个三元组G,A,R,其中G表示“空间几何特征”,A表示“属性特征”,R表示二者之间的一致性关系。GIS数据质量特点主要为抽象性、完备性、隐蔽性。抽象性主要指空间几何数据的位置不确定性,例如栅格数据的几何属性虽然隐含在栅格编码中,但是由于栅格具有一定的固定尺寸,因此其表示的只是尺寸段;属性数据主要反映对客观实体的特性抽象的逼真程度或者说对客观文体的特征反映的相似度。完备性主要指几何数据和属性数据对客观实体特征的反映的真实度。隐蔽性则是从数据使用的方便性和安全性出发;对不同的使用目的展示不同的数据属性组合。GIS数据质量不仅体现在空间数据的几何数据和属性数据表达方面。由于客观实体并不能完全用几何和属性完整的描述,有时还需要完全的语义描述。因此需要注重数据语义表达,即语义抽象性、概括性、有效性和完备性。语义表示就是指数据世界对现实世界的表达;语义质量则是指数据世界对现实世界物体的映射过程中。2 GIS数据质量控制体系 GIS数据除了包括已有的数据资料外,为了满足实际的生产需求,需要对原有数据进行验证、补充。这就需要采集新的数据资料,或对原有资料进行整理,或用新的表述方法描述原有的信息。这是数据的再生产过程。无论新的数据生产,还是对原有数据的再生产,都需要一个严格的数据质量控制体系,以保证数据生产的质量。按照数据在生产、加工、处理、利用、传播过程中的性质分为:原始数据(现场采集数据)、次性数据(原始数据的加工、处理、分析的结果)、二次性数据(对一次性数据进行集成、综合)、三次性数据(对二次数据进行空间分析、查询分析、统计分析的结果)。上述的数据的加工处理过程是一个抽象的、概括性的过程。 根据相关的质量控制标准,以及生产实际的需要,有必要建立二级检查、一级验收的质量控制体系。3 GIS数据质量控制方法具体生产过程中数据质量的控制方法主要有:(1)矢量化地图数据质量的检验方法手工方法:质量控制的人工方法主要是将数字化数据与源数据进行比较,图形部分的检查包括目视方法、绘制到透明图上与原图叠加比较,属性部分的检查采用与原属性逐个对比或其他比较方法。元数据方法:数据的元数据中包含了大量的有关数据质量的信息,通过它可以检查数据质量,同时元数据也记录了数据处理过程中质量的变化,通过跟踪元数据可以了解数据质量的状况和变化。地理相关法:用数据集所描述对象的特征性质检查分析数据质量的信息。如:叠加河流和等高线两层数据时,若河流的位置不在等高线的外凸连线上,说明两层数据中必有一层数据有质量问题,如不能确定那层数据有问题,可将它们分别与其它质量可靠的数据层叠加作进一步分析。(2)数据库建立过程中数据质量控制方法人工检查:将原始数据与计算机中的数据逐个对比;统计方法将录入数据利用统计分析方法,生成相关图表,查找异常点;图形生成法将录入数据生成对应的图件,利用地理相关法检查图件的异常点。4 GIS数据质量控制过程下面以测量数据为例,初步说明地理信息系统建立过程中数据获取、入库过程中的质量控制过程。测量数据的获得主要有三种方式:现场生产的测量数据的直接录入、原有量测数据的转换和推算以及从异构数据库系统中的转入。对于现场生产的测量数据,从生产到入库过程中的质量控制主要有:现场的一级检查。现场要分工明确、责任清晰,测量点的定位、钻进、取样、记录、描述、数据的整理、图件的清绘等一系列生产过程都有明确的责任人,并签字负责。作业组之间进行质量的互检互查,这次检查是全面的检查。最后,负责生产的现场负责人对总体质量负责。对从现场采集回来,并经过整理的数据,再经由负责生产的主管部门进行二级检查。检查内容有生产设计计划、生产流程、作业标准、测量数据的完整性和准确性、图件质量、测量点描述的正确性等,抽取数据量的30进行检查。并由检查人、负责人签字。数据生产作业完成以后,委托生产单位再对生产数据的完整性、作业流程的合理性、参照标准的权威性等方面进行验收检查。委托方可以自己组织力量进行检查,也可以委托第三方(主要为负责生产质量管理的相关部门)进行检查。检查内容不少于实际生产数据量10,检查结果由检查人、负责人签字负责。生产完毕的数据进行数据库的入库建设。对于测量数据主要以手工录入为主,录入内容以手工检查为主,首先是录入人员的自我检查,然后由他人进行第二次检查。利用测量数据利用相关软件生成相关图件,利用地理相关法,检查录入数据的质量;或将生成的图件与原始图件作对比,逐一检查;或者将所生成的等值线图与原有的地形图作对比分析,查找录入过程中可能存在的数据一致性问题。对推算和转换的测量数据的数据入库的质量控制,按第一种方式的第四步进行。从异构数据库系统中的转入,主要是数据格式的转换,在转换的过程中有可能引起数据的丢失或数据歧义,转换后的数据要生成图件与元数据库中的图件进行对比,寻找出异常,分析引起误差的原因,排查错误。在数据库的转录过程中需要知道原有测量数据质量的描述信息:测量数据采集时间、负责单位、参照标准、比例尺、质量评定单位、质量评定标准、入数据库时间、入数据库方式、存储方式等。5结语本文针对数据的生产流程中产生数据质量问题进行了分析,并针对性的分析其控制流程。并根据工业流程的方法建立二级数据检查机制,对数据质量控

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论