GIS原理与应用-4.4 空间数据质量分析与控制_第1页
GIS原理与应用-4.4 空间数据质量分析与控制_第2页
GIS原理与应用-4.4 空间数据质量分析与控制_第3页
GIS原理与应用-4.4 空间数据质量分析与控制_第4页
GIS原理与应用-4.4 空间数据质量分析与控制_第5页
已阅读5页,还剩52页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、4.4 空间数据质量分析与控制2 空间数据的特点 空间数据质量的概念和内容 空间数据质量的影响因素分析 空间数据质量的误差分析 空间数据质量的评价 空间数据质量的控制主要内容:1. 空间数据的特点Spatially relatedCan be assigned coordinates or any spatial reference.On the surface of the earth.Involves location and organization.ScaleCan be from general to specific.Simple to complex.A satellite ca

2、n generate one terabyte (1012 bytes) of information per day.DynamicsSpatial dynamics (variations in space).Temporal dynamics (variations in time).Coordinate systemScaleTime 1Time 2空间数据的三个侧面空间特征:表示现象的空间位置或现在所处的地理位置。空间特征又称为几何特征或定位特征,一般以坐标数据表示,例如笛卡尔坐标等。属性特征:表示实际现象或特征,例如变量、级别、数量特征和名称等等。时间特征:指现象或物体随时间的变化

3、,其变化的周期有超短期的、短期的、中期的、长期的等等。三个侧面空间特征是GIS区别于其它的软件的根本特征是由于地物或现象的空间分布所带来通常是通过特定空间参照系下的坐标直接表达基于坐标的派生数据定量的度量信息:面积、周长、质心、距离等定性的空间关系:拓扑关系、方位关系时间特征空间数据涉及时间特征的几个方面地物的生命周期(产生、消亡)地物的移动(移动点)属性的时效性相关的问题时间关系时空关系时态GIS数据模型是其关键(时空立方体模型等)专题属性特征地物所固有的,不是由于地物空间分布所带来的特征如某地的年降雨量、土地酸碱类型、人口密度、交通流量、空气污染程度等。这类特征在其它类型的信息系统中均可存

4、储和处理专题属性特征通常以数字、符号、文本和图像等形式来表示空间数据与专题数据空间数据的时态特征数据的测量尺度命名(Nominal)量定性而非定量,不能进行任何算术运算,如一个城市的名字次序(Ordinal)量 线性坐标上不按值的大小,而是按顺序排列的数,例如,事故发生危险程度的级别由大到小被标为1,2,3, 间隔(Interval)量 不参照某个固定点,而是按间隔表示相对位置的数。按间隔量测的值相互之间可以比较大小,并且它们之间的差值大小是有意义的 比率(Ratio)量比率测量尺度的测量值指那些有真零值而且测量单位的间隔是相等的数据。数据的测量尺度GIS数据测量尺度示例PointLineAr

5、eaQuantitativeOrdinalQualitative51015Each dot represents500 personsProportional symbolsLargeMediumSmallQTownAirportFlowContour304050HighwayRoadStreetRoadBoundaryRiver10020Population densityHigh impactLow impactSwampDesertForrest不同测量尺度数值可以进行的运算命名量=,!=次序量=,!=,+,-,*,/2. 空间数据质量概念和内容在GIS的几个主要因素中,数据是一个极为重

6、要的因素。在计算机软件、硬件环境选定之后,GIS中数据质量的优劣,决定着系统分析质量以及整个应用的成败。GIS提供的空间数据的分析方法被广泛用于各种领域,用于决策领域的数据,其质量要求应该是可知的或可预测的。研究空间数据质量的目的在于加强数据生产过程中的质量控制,提高数据质量(1)空间数据质量的重要性GeographicDatabaseQuery and AnalysisSpatial Data Input and ManagementOutput: DisplayHelp Prevent“Garbage in,Garbage out!”G I S(2)空间数据质量的相关概念准确性(Accur

7、acy)精度(Precision)空间分辨率(Spatial Resolution)比例尺(Scale)误差(Error)不确定性(Uncertainty)(2)空间数据质量的相关概念准确性(Accuracy)一个记录值(测量或者观察值)与它的真实值之间的接近程度;空间数据的准确性通常是根据所指的位置、拓扑或者非空间属性来分类的;可以误差(Error)来衡量空间数据的准确性;(2)空间数据质量的相关概念精度(Precision)数据精度表示数据对现象描述的详细程度数据精度和数据准确性的区别: 精度低的数据不一定准确度也低;数据精度如果超出了测量仪器的已知准确度,这样的纪录数字在效率上是冗余的;

8、例如:在设计精度为0.1mm的数字化仪上测量返回的坐标数据为(10.11mm,12.233mm),其中就含有冗余的数据;(2)空间数据质量的相关概念空间分辨率(Spatial Resolution)分辨率是两个可测量数值之间最小的可辨识的差异;空间分辨率可以看作是记录变化的最小幅度;空间分辨率示例:地图上最细线宽度对应的地理范围,遥感图像上一个像素代表的实际地理范围大小空间分辨率 数据精度空间分辨率示例Real WorldVector DataRaster Data1 pixel = 10mX10m 分辨率 = 10m10M10M1 Pixel(2)空间数据质量的相关概念比例尺(Scale)地

9、图上一个记录的距离和它所表现的“真实世界”的距离之间的一个比例;如右图中,这幅地图的比例尺=10cm:1000m=1:10000比例尺是刻画数据精度的量(如最小线宽为地图的空间分辨率);(2)空间数据质量的相关概念误差(Error)描述测量值和真实值之间的差别;在大部分情况下,误差的大小是很不准确的,因为待测量的真实值往往无法得到;研究如何给出误差大小的最佳估计以及误差传播规律,是很有用的;误差的分析包括: 位置误差(如点、线、多边形的位置误差);属性误差;位置和属性误差之间的联系;产生的误差的环节投影变换: 地图投影是将三维地球椭球面到二维场平面的拓扑变换。在不同投影形式下, 地理特征的位置

10、、面积和方向的表现会有差异。地图数字化和扫描后的矢量化处理: 数字化过程采点的位置精度、空间分辨率、属性赋值等都可能出现误差。数据格式转换: 在矢量格式和栅格格式之间的数据格式转换中, 数据所表达的空间特征的位置具有差异性。数据抽象: 在数据发生比例尺度变换时, 对数据进行的聚类、归并、合并等操作时产生的误差建立拓扑关系: 拓扑过程中伴随有数据所表达的空间特征的位置坐标的变化。与主控数据层的匹配: 一个数据库中, 常存储同一地区的多层数据面, 为保证各数据层之间空间位置的协调性, 一般建立一个主控数据层以控制其他数据层的边界和控制点。在与主控数据层匹配的过程中也会存在空间位移, 从而导致误差。

11、数据叠加操作和更新: 数据在进行叠加运算以及数据更新时, 会产生空间位置和属性值的差异。数据集成处理: 指在来源不同、类型不同的各种数据集的相互操作过程中所产生的误差。数据集成是包括数据预处理、数据集之间的相互运算、数据表达等过程在内的复杂过程, 其中位置误差、属性误差都会出现。数据的可视化表达: 数据在可视化过程中为适应视觉效果, 需对数据的空间特征位置、注记等进行调整, 由此产生数据表达上的误差。数据处理过程中误差的传递和扩散: 在数据处理的各个过程中, 误差是累积和扩散的, 前一过程的累积误差可能成为下一个阶段的误差起源, 从而导致新的误差的产生。不确定性(Uncertainty)对于空

12、间信息科学技术来说,数据的正确性与错误并存,正常与异常并存,精确与粗糙并存,质量高与质量低并存,什么时候是正确的,什么时候不正确的,这些都属于不确定性现象;GIS中数据的不确定性包括:位置的不确定性、属性的不确定性、时域的不确定性、逻辑上的不一致性以及数据的不完整性;研究不确定性可以更好的了解测量数据的性质?(2)空间数据质量的相关概念(3)空间数据质量指标及内容 数据情况说明:对地理数据的来源、内容及处理过程等做出准确、全面和详尽的说明。 位置精度:为空间实体的坐标数据及实体真实位置的接近程度, 常表现为空间三维坐标数据精度。它包括数学基础精度、平面精度、高程精度、接边精度、形状再现精度(形

13、状保真度)、像元定位精度(图像分辨率)等。 属性精度:指空间实体的属性值与其真值相符的程度。通常取决于地理数据的类型, 且常常与位置精度有关, 包括要素分类与代码的正确性、要素属性值的准确性及其名称的正确性等。 时间精度:指数据的现势性; 逻辑一致性:指地理数据关系上的可靠性,包括数据结构、数据内容(如毛面积、净面积和扣除面积的关系), 以及拓扑性质上的内在一致性。 数据完整性。指地理数据在范围、内容及结构等方面满足所有要求的完整程度, 包括数据范围、空间实体类型、空间关系分类、属性特征分类(如土地利用分类编码能否涵盖所有现象)等方面的完整性。 表达形式的合理性。主要指数据抽象、数据表达与真实

14、地理世界的吻合性, 包括空间特征、专题特征和时间特征表达的合理性等。(3) 空间数据质量指标及内容3. 空间数据质量的影响因素分析空间现象自身存在的不稳定性分布的不确定性、属性类型划分和表达多样性等;空间现象的获取和表达中的误差测量误差、地图投影、数值采样和量化等;空间数据处理中的误差投影转换、地图数字化与扫描矢量化、格式转换、数据抽象(聚类、归并等)、空间分析、可视化等;空间数据使用中的误差:生产者和使用者对数据的解释和理解不同,可通过空间数据的元数据来沟通;空间数据误差的主要来源数据处理过程误差来源数据搜集野外测量误差:仪器误差、记录误差遥感数据误差:辐射和几何纠正误差、信息提取误差地图数

15、据误差:原始数据误差、坐标转换、制图综合及印刷数据输入数字化误差:仪器误差、操作误差不同系统格式转换误差:栅格-矢量转换、三角网-等值线转换数据存储数值精度不够空间精度不够:每个格网点太大、地图最小制图单元太大数据处理分类间隔不合理多层数据叠合引起的误差传播:插值误差、多源数据综合分析误差比例尺太小引起的误差数据输出输出设备不精确引起的误差输出的媒介不稳定造成的误差数据使用对数据所包含的信息的误解对数据信息使用不当空间数据源误差地图、遥感测量(1) 地图误差地图固有误差。指用于数字化的地图本身所带有的误差, 包括控制点误差、投影误差等。 材料变形产生的误差。这类误差是由于图纸的大小受湿度和温度

16、变化的影响而产生的。温度不变的情况下, 若湿度由0%增至25%,则纸的尺寸可能改变 1.6%; 纸的膨胀率和收缩率不相同, 即使温度又恢复到原先水平, 图纸也不能恢复原有的尺寸数字化误差:数字化仪;扫描矢量化(2) 遥感数据误差遥感数据的误差来源: 观测过程:受空间分辨率、几何畸变和辐射误差等影响。处理和解译过程:由图像处理中的影像或图像校正和匹配以及遥感解译判读和分类引人的,其中包括混合像元的解译判读所带来的属性误差。(3) 测量数据的误差标准椭球体代表地球真实表面空间时, 已经引入了一定的误差因素, 由于这种误差因素无法排除, 一般也不作为误差考虑。测量方面的误差通常考虑的是系统误差、操作

17、误差和偶然误差。(a) 系统误差的发生与一个确定的系统有关 , 它受环境因素(如温度、湿度和气压等)、仪器结构与性能以及操作人员技能等方面的因素综合影响而产生。系统误差不能通过重复测量以检查或消除, 只能用数字模型模拟和估计。(b) 操作误差是操作人员在使用设备、读数或记录观测值时, 因粗心或操作不当而产生的。(c) 偶然误差是一种随机性的误差, 由一些不可预料和不可控制的因素引人。这种误差具有一定的特性, 如正负误差出现频率相同、大误差少、小误差多等。偶然误差可采用随机模型进行估计和处理。4. 空间数据质量的误差分析按流程:源误差、处理误差、使用误差; 数据类型:几何误差、属性误差、时间误差

18、和逻辑误差;误差性质:随机误差、系统误差和粗差(1)空间数据误差的类型空间数据误差分为:几何误差、属性误差、时间误差和逻辑误差;逻辑误差和几何误差为GIS特有逻辑误差:语义角度判断数据的合理性各种逻辑误差(2) 几何误差。由于地图是以二维平面坐标表示位置 , 在二维平面上的几何误差主要反映在点和线上。a. 点误差。 关于某点的点误差即为测量位置(x,y)与其真实位置 ( x0 ,y0)的差异。坐标误差定义为: x = x - x0 y = y - y0为了衡量整个数据采集区域或制图区域内的点误差, 一般采用抽样测算(x,y)。抽样点应随机分布于数据采集区内, 并具有代表性。这样抽样点越多, 所

19、测的误差分布就越接近于点误差的真实分布。b. 线误差。线在系统数据库中既可表示线性现象, 又可以通过连成的多边形表示面状现象。第一类:线在真实世界中是可以找到的, 如道路、河流、行政界线等, 这类线性特征的误差主要产生于测量和对数据的后处理 ; 第二类:现实世界中找不到的, 如按数学投影定义的经纬线、等高线、气候区划线和土壤类型界限等, 这类线性特征的线误差, 被称为解译误差。 解译误差与属性误差直接相关, 若没有属性误差, 则可以认为那些类型界线是准确的, 因而解译误差为零。各种线折线和曲线的误差(2)几何误差分析方法解析法试验法蒙特卡洛模拟法Epsilon带模型误差带模型解析法 基于统计学

20、中的误差传播定律,包括分布、方差、协方差的传播。试验法 实验场法和实地检验法;蒙特卡洛模拟法 事先假定GIS中所输入数据的误差模型,再对数据加上随机噪声来模拟其误差和不确定性的影响。Eplion模型沿着一条线或多边形边界线的两侧有定宽(Epsilon)的带所构成。假设为: 对于GIS中的每一个特定线的每一个误差可以视为一个随机变量。 在GIS中产生线的过程可以被看成是独立的过程;误差带模型以线要素上的各点的实际误差作为该点处的带宽,其带宽是不等的,因而能更好地描述线要素的点位误差分布状况: 两端点的误差是相互独立的; 两端点的误差有相同的方差和协方差。折线误差的分布曲线的误差的分布质量评价对生

21、产者和用户都十分重要多尺度(多精度):不同用户,不同比例尺对数据质量有不同要求时效性:不同数据有不同时效要求数据精度的测试结果与测试报告五、空间数据质量评价评价内容: 数据集完整性; 包括要素分层的完整性、要素内容的完整性等; 说明信息评价; 用于描述对图中各地理实体有共同影响的因素,包括原始资料的说明、数据获取的方法和日期、数据处理方法、作业人员、数据格式和各种文档资料; 地理目标数据评价: 位置精度、属性精度、数据的完整性、逻辑一致性和拓扑关系正确性。五、空间数据质量评价空间目标属性精度的评价: 属性值值域的检查; 检查目标的主码、识别码、描述码、参数值的值域是否正确; 属性值逻辑组合正确

22、性检查; 用属性组合是否存在逻辑错误,是否按照相关技术规定正确描述了目标的质量、数量及其他信息; 用符号化方法对各属性值进行详细检查:六、空间数据质量控制常见的方法有 :1. 传统的手工方法 主要是将数字化数据与数据源进行比较, 图形部分的检查包括目视方法、绘制到透明图上与原图叠加比较, 属性部分的检查采用与原属性逐个对比或其他比较方法。2. 元数据方法 元数据中包含了大量的有关数据质量的信息, 通过它可以检查数据质量, 同时元数据也记录了数据处理过程中质量的变化, 通过跟踪元数据可以了解数据质量的状况和变化。3. 地理相关法 用空间数据的地理特征要素自身的相关性来分析数据的质量。例如, 从地

23、表自然特征的空间分布着手分析, 山区河流应位于地形的最低点(最低等高线)实例:“数字国土”数据质量控制指标1 经过纠正的分幅原始扫描图数据(1)扫描图数据清晰,能够区分图内各要素。(2)扫描影像数据经过角度纠正,纠正后的图幅下方两个内图廓点的连线与水平线的角度误差不超过0.2度。矢量化后未校正的分幅图件数据图内各要素的采集无错漏现象图形定位误差(即图形控制点采集)不超过0.2mm(图面值)。各要素的采集与扫描数据相吻合,线划(点位)整体或部分偏移的距离不超过0.3mm(图面值)。经过误差校正的分幅数据与理论值相比,误差校正后的控制点(四个内图廓点)点位绝对误差不超过0.1mm(图面值)。4 经过坐标系转换并经过接边的分幅数据数据内容齐全。坐标系转换后的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论