下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、,第七章 空间数据的质量控制,Geographic Database,Query and Analysis,Spatial Data Input and Management,Output: Display,Help Prevent “Garbage in,Garbage out!”,G I S,一、空间数据质量,1.空间数据质量的定义 空间数据质量是指数据适用于不同应用的能力 空间位置、专题特性以及时间是表达现实世界空间变化的三个基本要素。数据质量则是空间数据在表达这三个基本要素时, 所能够达到的准确性、一致性、完整性以及它们三者之间统一性的程度。 完整性:能否完全地表达要描述的给定目标 空
2、间数据质量的好坏是一个相对概念,2.数据质量的描述框架,导致数据质量问题的十大原因: 多重数据源 数据生产中主观的判断与技术 过松或过严的输入规则 大量的数据 分布式异构系统 复杂的数据表达,如文本和图像 不同功能领域的编码数据 客户改变数据需求 安全与可访问性的权限 有限的计算资源,数据质量主要侧重问题: 数据的可信度,这是在数据生产过程中形成的质量,为本征质量 数据的可用度,从用户或数据共享的角度出发描述数据质量,将用户要求的满意程度作为衡量数据质量的重要指标,此时的数据质量表现为满足使用要求的相对状态,(1)数据可信度,精确性 完整性 一致性 有效性 唯一性,精确性,数据的准确度: 被定
3、义为结果、计算值或估计值与真实值或者大家公认的真值的接近程度。即一个记录值(测量或观察值)与它的真实值之间的接近程度。它可用误差来衡量。 数据的精密度:数据表示的精密程度, 用数据的有效位数来表示, 它表现了测量值本身的离散程度。 数据的精确度:精密度的实质在于它对数据准确度的影响, 同时在很多情况下, 它可以通过准确度而得到体现, 故常把二者结合在一起称为精确度, 简称精度, 即对现象描述的详细程度。精度低的数据并不一定准确度也低.,完整性,指地理数据在范围、内容和结构等方面满足所有要求的完整程度,包括数据范围、空间实体类型、空间关系分类、属性特征分类等方面的完整性。,一致性:指地理数据关系
4、上的可靠性,包括数据结构、数据内容,以及拓扑性质上的内在一致性 有效性:数据是否具有实际意义 唯一性:数据记录与特征信息是否存在一一对应关系,(2)数据可用度,时间性:数据的现势性,稳定性 可得性:来源、版权、使用期限 满意度:是否满意、是否清晰易懂、能否动态扩充,3.影响空间数据质量的原因,(1)空间现象自身的不稳定性,(2)空间数据生产中的误差,系统误差:在相同的测量条件下的测量值序列中数值、符号保持不变或按某确定规律变化的测量误差 随机误差:在实际相同条件下,多次测量同一量值时,其绝对值和符号无法预计的测量误差 粗差:在相同的测量条件下的测量值序列中,超过三倍中误差的测量误差,常见空间数
5、据误差分析,逻辑误差:数据的不完整性是通过上述四类误差反映出来的。事实上检查逻辑误差, 有助于发现不完整的数据和其他三类误差。对数据进行质量控制或质量保证或质量评价, 一般先从数据的逻辑性检查人手。,(2) 几何误差。由于地图是以二维平面坐标表示位置 , 在二维平面上的几何误差主要反映在点和线上。 a. 点误差。 关于某点的点误差即为测量位置(x,y)与其真实位置 ( x0 ,y0)的差异。坐标误差定义为: x = x - x0 y = y - y0 为了衡量整个数据采集区域或制图区域内的点误差, 一般采用抽样测算(x,y)。抽样点应随机分布于数据采集区内, 并具有代表性。这样抽样点越多, 所
6、测的误差分布就越接近于点误差的真实分布。,b. 线误差。线在系统数据库中既可表示线性现象, 又可以通过连成的多边形表示面状现象。 第一类:线在真实世界中是可以找到的, 如道路、河流、行政界线等, 这类线性特征的误差主要产生于测量和对数据的后处理 ; 第二类:现实世界中找不到的, 如按数学投影定义的经 纬线、等高线、气候区划线和土壤类型界限等, 这类线性特征的线误差, 被称为解译误差。 解译误差与属性误差直接相关, 若没有属性误差, 则可以认为那些类型界线是准确的, 因而解译误差为零。,数据质量的描述通常分为不同层次,但目前尚未形成用于表示这种层次性的统一术语 确保空间数据质量难度较大:不同的数
7、据来源、数据源的专业性和独立性 在统一的地理框架下建立跨系统、跨部门的统一用户视图,清理、合并数据对数据质量解决方案的实施至关重要,遥感数据获取误差是获取数据的过程中受自然条件及卫星的成图成像系统影响所造成的误差 处理误差是利用地面控制点对原始数据进行几何校正、图像增强和分类等引起的误差 转换误差一般是在矢量与栅格数据转换过程中形成的 人工判读误差:解析和判读时产生,(3)空间数据处理中的误差,(4)数据组织时产生的质量问题,数据组织时的质量问题可能出在单个或多个数据集合中 与数据记录本身相关的质量问题,称为实例相关问题;与数据组织关系有关的质量问题,称为模式相关问题 数据组织中产生的质量问题
8、主要是由于缺乏合适的数据模型或满足特定应用的完整性约束而引起的,典型的实例相关问题,空缺值 拼写问题 内嵌数据 属性依赖冲突 数据重复,二、质量控制体系,1.质量管理体系,2.质量标准体系,空间数据质量标准是生产、使用和评价空间数据的依据。 目前, 世界上已建立了一些数据质量标准, 如美国FGDC的质量标准等。 空间数据质量标准的建立必须考虑数据产生的全过程。,空间数据分类标准,(1)原则: 1)遵循已有的国家标准,以利于全国范围内的数据共享。 2)遵循国务院有关部委以及军队正在使用的数据标准。 3)遵循各领域中普遍使用和认同的数据标准。 4)当各种数据标准相互矛盾时,应遵循由上而下的原则进行
9、处理。 5)制定新的数据标准时,应尽可能参考同类标准。,(2)目前我国已有的与GIS有关的关于空间数据分类的国家标准: GB2260-95 中华人民共和国行政区划代码 GB13923-92 国土基础信息数据分类与代码 GB11708-89 公路桥梁命名和编码规则 GB14804-93 1:500、1:1000、1:2000地形要素分类与代码 等等。,空间数据交换标准,(1)外部数据交换标准,特点:自动化程度不高,速度较慢等,但它可解决不同GIS之间的数据转换问题。它仍然是实现数据共享的主流方式。,(2)空间数据互操作协议,特点:比外部数据交换标准方便,但由于各种软件存储和处理空间数据的方式不同
10、,空间数据的互操作函数又不可能很庞大,因此往往不能解决所有问题。,服务器存放空间数据,采用客户机/服务器体系结构,各种GIS通过一个公共的平台在服务器存取所有数据,以避免数据的不一致性。 特点:思路较好,但现有的GIS软件各有自己的底层,要统一平台目前难以实现,(3)空间数据共享平台,在对空间数据模型有共同理解的基础上,各系统开发专门的双向转换程序, 将本系统的内部数据结构转换成统一数据库的接口。 特点:这种方式的前提,首先要求对现实世界进行统一的面向对象的数据理解, 这不易实现的 目前:外部数据交换标准仍是实现数据共享的主流方式。,(4)统一数据库接口,空间数据质量标准的要素及内容,(1)
11、数据情况说明:对地理数据的来源、内容及处理过程等做出准确、全面和详尽的说明。 (2) 位置精度:为空间实体的坐标数据及实体真实位置的接近程度, 常表现为空间三维坐标数据精度。它包括数学基础精度、平面精度、高程精度、接边精度、形状再现精度(形状保真度)、像元定位精度(图像分辨率)等。 (3) 属性精度:指空间实体的属性值与其真值相符的程度。通常取决于地理数据的类型, 且常常与位置精度有关, 包括要素分类与代码的正确性、要素属性值的准确性及其名称的正确性等。,(4) 时间精度:要素时间属性和时间关系的准确度 (5) 逻辑一致性:指地理数据关系上的可靠性,包括数据结构、数据内容(如毛面积、净面积和扣
12、除面积的关系), 以及拓扑性质上的内在一致性。 (6) 数据完整性。指地理数据在范围、内容及结构等方面满足所有要求的完整程度, 包括数据范围、空间实体类型、空间关系分类、属性特征分类(如土地利用分类编码能否涵盖所有现象)等方面的完整性。 (7) 表达形式的合理性。主要指数据抽象、数据表达与真实地理世界的吻合性, 包括空间特征、专题特征和时间特征表达的合理性等。,3.质量控制措施,质量 控制,传统的手工 方法,元数据方法,地理相 关法,将数字化数据与数据源进行比较,图形部分的检查包括目视方法、绘制到透明图上与原图叠加比较,属性部分的检查采用与原属性逐个对比或其他比较方法。,数据集的元数据中包含了
13、大量的有关数据质量的信息,通过它可以检查数据质量,了解数据质量的状况和变化。,用空间数据的地理特征要素自身的相关性来分析数据的质量。,(1)总体技术方案的控制与评价,用户需求分析及联合设计 数据源 制图综合 数据生产时间 引用标准 数学基础 要素分类编码 数据格式 技术路线与技术性实验,(2)数据源质量控制 (3)数据生产质量控制 (4)数据加工处理质量控制,(5)数据质量控制策略,数据清洗 生产组织管理 建立质量保障体系 建立“二级检查、一级验收”制度 区分数据清理的优先级 监理机构设定,三、质量评价体系,1.质量评价模式,最小质量标准模式,是规定阈值的评价模式 元数据标准模式,是真实标记模
14、式 市场标准模式,是真实标记和信息反馈结合的模式,空间数据质量评价矩阵表,2.质量评价方法,(1)直接评价法 1)用计算机程序自动检测 某些类型的错误可以用计算机软件自动发现,数据中不符合要求的数据项的百分率或平均质量等级也可由计算机软件算出。此外,还可检测文件格式是否符合规范、编码是否正确、数据是否超出范围等。 2)随机抽样检测 在确定抽样方案时,应考虑数据的空间相关性。,(2)间接评价法-(地理相关法和元数据法) 指通过外部知识或信息进行推理来确定空间数据的质量的方法。用于推理的外部知识或信息如用途、数据历史记录、数据源的质量、数据生产的方法、误差传递模型等。 (3)综合评价方法 通过对数
15、据质量的各组成部分的评价结果进行的综合分析来确定数据的总体质量的方法。,数字化的误差评价和质量控制,1)自动回归法 由于跟踪数字化不仅是一个随机序列,而且是一个时间序列,因此可用数理统计中的时间序列分析法来确定数字化的误差。 2)Band法 该方法适用于任何类型的GIS数据,关键是如何给出合理的值。,评价数字化误差的方法,3)对比法 把数字化后的数据,用绘图机绘出,与原图叠合,选择明显地物点进行量测,以确定误差。除了几何精度外,属性精度、完整性、逻辑一致性等也可用对比法进行对照检查。,Band,数字化过程中的质量控制,1)数字化预处理工作 包括对原始地图、表格等的整理、清绘。 2)数字化设备的
16、选用 根据手扶数字化仪、扫描仪等设备的分辨率和精度等有关参数的进行挑选,这些参数不应低于设计的数据精度要求。 3)数字化对点精度(准确性) 数字化时数据采集点与原始点的重合程度,一般要求对点误差小于0.1mm。,4)数字化限差 包括:采点密度(0.2mm)、接边误差(0.02mm)、接合距离(0.02mm)、悬挂距离(0.007mm)等。 5)数据的精度检查 输出图与原始图之间的点位误差,一般要求对直线地物和独立地物,误差小于0.2mm,对曲线地物和水系,误差小于0.3mm,对边界模糊的要素应小于0.5mm。,四、空间数据共享中的质量控制,1.空间数据共享的法制建设问题,2.基于元数据的空间数
17、据共享质量控制,Metadata 可译成元数据, 是描述数据的数据 在地理空间数据中, 元数据说明数据的内容、质量、状况和其他有关特征的背景信息。 它主要反映数据集自身的特征规律, 以便于用户对数据集的准确、高效与充分的开发与利用 不同领域的数据库, 其元数据的内容会有很大差异。,用来组织和管理空间信息,并挖掘空间信息资源。 帮助数据使用者查询所需空间信息。 组织和维护一个机构对的投资。 用来建立空间信息的数据目录和数据交换中心。 提供数据转换方面的信息。,元数据作用,空间元数据的分类,1)高层元数据(数据集系列Metadata),描述整个数据集的元数据,包括数据集区域采样原则,数据库的有效期
18、,数据的时间跨度、分辨率以及方法等。是用户用于概括性查询数据集的主要内容。 2)中层元数据(数据集Metadata),既可以作为数据集系列Metadata的组成部分,也可以作为后面数据集属性以及要素等内容的父Metadata数据集系列。全面反映数据集的内容 。 3)底层元数据(要素、属性的类型和实例Metadata),包括最近更新日期,位置纲量,存在问题标识(如数据的丢失原因),数据处理过程等。是元数据体系中详细描述现实世界的重要部分。,空间元数据的内容,对空间元数据所要描述的一般内容进行层次化和范式化,指定出可供参考与遵循的空间元数据标准的内容框架。,第一层是目录层,主要用于对数据集信息进行
19、宏观描述,适合在数字地球的国家级空间信息交换中心或区域以及全球范围内管理和查询空间信息时使用。 第二层是空间元数据标准的主体,由八个基本内容部分和四个引用部分组成。,元数据的获取,数据收集后,根据需要产生的,包括数据处理过程描述、数据的利用情况、数据质量评估、数据集大小、数据存放路径等 。,数据收集前,得到的是根据要建设的数据库的内容而设计的元数据,包括数据类型、数据覆盖范围、使用仪器说明、数据变量表示、数据收集方法、数据时间、数据潜在利用等。,1)三阶段:,数据收集中,随数据的形成同步产生的元数据,例如在测量海洋要素数据时,测点的水平和垂直位置、深度、温度等是同时得到的。,2)获取方法,键盘
20、输入,关联法,测量法,计算法,推理法,现有的空间元数据标准,ArcGIS- ArcCatalog -metadata,空间数据质量元数据实例描述1,主 表 数据集编号: 11002000001 数据集类型:数据库 数据集专业类型:地理 数据集名称:国家基础地理信息系统全国1:25万地形数据库 数据集版本: 1.0 数据集语言:中文 有效性:授权使用 数据集摘要:全国1:25万数据库,是国家基础地理信息系统三个全国性空间数据库之一。它由地形数据库、数字高程模型(DEM)数据库、地名数据库三部分构成。地形数据库: 以矢量方式存储管理1:25万地形图上的境界、水系、交通、居民地、地貌等要素。数据库管
21、理系统采用ARC/ANF07.1版。覆盖范围:全国1:25万数据库在空间上包含816幅1:25万地形图数据,覆盖整个国土范围。国外部分沿国界外延25公里采集数据。全国816幅分布情况详见1:25万图幅接合表。数据量:1:25万地形数据库,4.5GB。数据库质量:全国1:25万数据库通过国家级验收,其数据完整性、逻辑一致性、位置精度、属性精度、接边精度、现势性均符合国家测绘局制定的有关技术规定和标准的要求,质量优良可靠。适用范围:全国1:25万数据库是国家空间数据基础设施的重要组成部分,为国民经济信息化提供数字化空间平台,为国家和省级各部门进行区域规划、灾害监测、防洪抢险、环境保护、宏观决策等提供信息服务。 数据源说明:中华人民共和国国家测绘局编制的中国1:25万地形图。共816幅图,覆盖整个国土范围。按照经纬度
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026清华大学基础医学院彭敏实验室招聘科研助理2人备考题库及完整答案详解(全优)
- 2026云南曲靖市陆良县人力资源和社会保障局招聘公益性岗位3人备考题库及完整答案详解【夺冠系列】
- 2026广东佛山顺德区梁銶琚夫人幼儿园招聘2人备考题库及完整答案详解(必刷)
- 2026广东阳江市阳春市招聘乡村公益性岗位12人备考题库(第六批)附参考答案详解【a卷】
- 2026广东汕尾市城区消防救援大队招聘政府专职消防员4人备考题库及参考答案详解【培优a卷】
- 2026山东省新动能基金管理有限公司校园招聘8人备考题库附答案详解(完整版)
- 2026上半年北京事业单位统考市纪委市监委招聘5人备考题库【真题汇编】附答案详解
- 2026海南博鳌一龄生命养护中心招聘笔试备考题库及答案解析
- 新生儿睡眠与亲子关系建立
- 2026新疆昌吉州呼图壁县总医院自主招聘编制外人员24人笔试备考题库及答案解析
- 第二章护理伦理学的理论基础课件
- 闽教版小学英语五年级下册校本作业
- 拜仁慕尼黑足球俱乐部
- 晚归检讨书阅读
- 结构化面试答题套路90结构化面试题型及答题套路
- GB/T 24218.1-2009纺织品非织造布试验方法第1部分:单位面积质量的测定
- FZ/T 43008-2012和服绸
- 大型工业园区规划方案
- 初中英语名师工作室工作总结
- 《边坡稳定性分析》课件
- 卫生健康科技计划项目申报书
评论
0/150
提交评论