第二讲:数据质量的基本概念.ppt_第1页
第二讲:数据质量的基本概念.ppt_第2页
第二讲:数据质量的基本概念.ppt_第3页
第二讲:数据质量的基本概念.ppt_第4页
第二讲:数据质量的基本概念.ppt_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1误差误差反映了数据与真实值或者公认的真值之间的差异,它是一种常用的衡量数据准确性的表达公式。,2数据的准确度数据的准确度被定义为结果、计算值或估计值与真实值或者公认的真值的接近程度。如果两地间的距离为110,从地图上量测的举例为98,那么地图距离的误差为2;若用GPS测量并计算两点间的距离得99.9,则GPS的测距误差为0.1,因而GPS比地图量测距离更准确。,3数据的精密度数据的精密度指数据表示的精密程度,亦即数据表示的有效位数。它表现了测量值本身的离散程度。由于精密度的实质在于它对数据准确度的影响。同时在很多情况下,它可以通过准确度而得到体现,故常把两者结合在一起称为精确度,简称精度。如对同样两点,用GPS测量可得9.903,而用工程制图尺在1:10万地形图上量算仅可得小数点后两位,即9.85。9.85比9.903精度低。但精度低的数据并不一定准确度低。,4不确定性不确定性是关于空间过程和特征不能被准确确定的程度,是自然界各种空间现象自身固有的属性。在内容上,它是以真值为中心的一个范围,这个范围越大,数据的不确定性也就越大。,当真值不可测或无法知道时,我们就无法确定误差,因而用不确定性取代误差。统计上,用多次测量的平均值来计算真值,因而标准差来反映可能的误差大小。因此可以用标准差来表示测量值不确定性。然而欲知标准差,就需要对同一现象做多次测量。所以要知道某测量值的不确定程度,需要多次测量,而称一次测量的结果为不确定的。,例如,由于潮汐的作用,海岸线是某一瞬间海水与陆地的交界。它是一个大家熟知的不能准确测量的现象,我们称测量得的海岸线长度为不确定的。其实造成数据不确定性的原因不仅限于真值的不可测或测不准,也可能是由于测量对象的概念模糊所致。如高密度住宅或常绿阔叶林,当地图或数据库中出现这类多边形时,无法知道住宅密度究竟多高,该处常绿阔叶林中到底有哪几种树,而只知道一个范围,因而这类数据是不确定的。,5相容性是指两个来源的数据在同一个应用中使用的难易程度。例如两个相邻地区的土地利用图,当要将它们拼接到一起时,两图边缘处不仅边界线可良好地衔接,而且类型也一致,称两图相容性好。反之,若图上的土地利用边界无法接边,可见两个城市的统计指标不一致也可造成数据无法比较致使数据不相容。这种不相容可以通过同一分类和统计标准来减轻。,另一类不相容性可从使用不同比例尺的地图数据看到,一般土壤图比例尺小于1:10万,而植被图则在1:15000至1:50000之间,当使用这两种数据进行生态分类时,可能出现两种情况:一是当某一土壤图的图斑大得使它代表的土壤类型在生态分类时可以被忽略;二是当土地界线与某植被图斑相交时,它实际应该与植被图斑的部分界线一致。,6一致性是指对同一现象或同类现象的表达的一致程度。如果同一条河流,在地形图上和在土壤图上形状不同,又如同一行政边界在人口图和土地利用图上不能重合,这些均表示数据的一致性差。,7完整性是指具有同一准确度和精度的数据在类型上和特定范围内是否完整的程度。完整性主要是针对空间属性数据的,且随着时代的发展而完整性不断在完善。针对不同的应用部门对完整性的内容不一样,如:交通部门和房地产部门对房子的认识就不一样,交通部门只要知道房子的位置就行了,而房地产部门对房子就要知道其大小,结构,房主,房价等。可见实体的完整性是地图最难确定的,也是最需要更新的。,8.空间分辨率,9.比例尺精度,1.3信息系统与土地信息系统,一、土地信息系统(LIS)的定义是以土地管理与资产管理为管理对象,以土地空间数据库为基础,对土地资源与资产相关数据进行采集、分类、管理、检索、操作、分析、统计、模拟和显示,并采用空间模型分析方法,适时提供多种空间和动态的土地信息并应用和传播土地信息,结合专家经验与国家的相关法律法规以及土地管理模式,为决策服务而建立起来的计算机系统。,8可得性是指获取或使用数据的容易程度。保密的数据按其等级限制使用者的多少,有些单位或个人无权使用;公开的数据则按价决定可得性。由于我国经济水平还比较低,数据的可得性已人为制约地图在我国的发展和造成地图基础设施的重复建设。,9现势性是指数据反映客观目前状况的程度。不同现象的变化频率是不同的,如地形、地质状况的变化一般来说比人类建设要缓慢,地形可能由于山崩、雪崩、滑坡、泥石流、人工挖掘及填海等原因而在局部区域改变。,10.空间尺度是指在观察或研究某一地理现象时所采用的空间尺度限定,通常指地理现象在空间上所涉及的范围,同时也包括空间的间隔、频率、分辨率。空间尺度与观测的地理现象或地理目标无关,由于多种地理现象和过程的尺度行为并非按比例线性或均匀变化,因此,研究地理实体的空间形态和过程随尺度变化的规律,是地理信息尺度变换研究的重点。,11.时间尺度是指在观察或研究某一地理现象时所采用的时间尺度限定,通常指地理现象在时间上所涉及的范围,同时也包括与时间的间隔、频率、分辨率。时间尺度主要刻画地理现象的时间长度和变化的粗略与详细程度。,12.语义尺度是指地理信息所表达的地理实体、地理现象组织层次大小及区分组织层次的分类体系在地理信息语义上的界定,体现了对于地理实体类的概括程度。语义尺度用于描绘事务过程或属性。,13.现象尺度是指地理目标、空间结构和地理现象自身存在的尺度,它是对地理现象理解的本质尺度,是空间目标和现象的“真”的尺度,是不以人们的分析和表达为转移的。,14.数据尺度是指根据用户需要对空间现象的抽象描述,数据尺度的大小与区域大小和数据使用要求有关,与介质无关。对于空间数据本身而言,尺度则表现为分辨率或精度,大尺度数据意味着空间和时间分辨率和属性精度较低。,15.分析尺度是指对地理现象和地理目标进行度量和数据采集时的尺寸大小,主要包括空间广度、空间粒度、空间精确度以及研究尺度。其中空间粒度可以看作空间数据采样的像素多少、地理目标的分辨率、空间数据的认知层次等。,16.幅度是指地理信息所表征的地理现象的广度和范围,所以也称广度或区域大小。空间幅度就是指空间的范围和面积,时间幅度指时间所持续的长度。,17.粒度也称颗粒度在物理学中指微粒或颗粒大小的平均度量,即构成物质或图案的微粒的相对尺寸。对空间尺度来就,粒度是指地理信息中最小的可辨识单元所代表的特征长度、面积或体积。对语义尺度来说,粒度是指地理信息中最小单元所表示的意义以及层次,粒度越小,所能表达的语义层次越多,分辨率越高。对时间尺度而言,粒度是指在获得地理信息时采样计量的时间精度或者单位,即单位时间采样点的数量。,18.分辨率是和图像相关的一个重要概念,它是用于度量位图图像内数据量多少,衡量图像细节表现力的一个参数。例如影像数据通常用分辨率来度量图像内数据量;数字高程模型通常用栅格数据格网的大小来衡量数据细节表现力。,(1)图像分辨率指图像中存储的信息量。这种分辨率通常表示成每英寸像素(Pixelperinch,PPI)和每英寸点(dotperinch,PDI)。包含的数据越多,图形文件的长度就越大,也能表现更丰富的细节。,(2)网屏分辨率指的是印刷图像所用的网屏的每英寸的网线数(linesperinch,LPI)来表示。(3)扫描分辨率是指在扫描一幅图像之前所设定的分辨率,它将影响所生成的图像文件的质量和使用性能。,(4)图像的位分辨率又称位深,是用来衡量每个像素储存信息的位数。这种分辨率决定可以标记为多少种色彩等级的可能性。(5)打印机的分辨率(6)显示器的分辨率(7)鼠标的分辨率是指每移动一英寸能检测出的点数,分辨率越高,质量也就越高。(8)触摸屏的分辨率是指将屏幕分割成可识别的触点数目。,19.时间分辨率是指在同一区域进行的相邻两次遥感观测的最小时间间隔。对轨道卫星,亦称覆盖周期。时间间隔大,时间分辨率低,反之时间分辨率高。时间分辨率是评价遥感系统动态监测能力和“多日摄影”系列遥感资料在多时相分析中应用能力的重要指标。,根据地球资源与环境动态信息变化的快慢,可选择适当的时间分辨率范围。按研究对象的自然历史演变和社会生产过程的周期划分为5种类型:超短期的。如台风、寒潮、海况、鱼情、城市热岛等,需以小时计;短期的。如洪水、冰凌、旱涝、森林火灾或虫害、作物长势、绿被指数等,要求有以日数计;中期的。如土地利用、作物估产、生物量统计

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论