计算机地图制图(中国矿业大学课件)3数据采集与数据库_第1页
计算机地图制图(中国矿业大学课件)3数据采集与数据库_第2页
计算机地图制图(中国矿业大学课件)3数据采集与数据库_第3页
计算机地图制图(中国矿业大学课件)3数据采集与数据库_第4页
计算机地图制图(中国矿业大学课件)3数据采集与数据库_第5页
已阅读5页,还剩193页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、计算机地图制图计算机地图制图中国矿业大学银川学院中国矿业大学银川学院第三章 地图数据采集和地图数据库4.1 4.1 概述概述4.2 4.2 空间数据的分类和编码空间数据的分类和编码4.3 4.3 地图数据的采集地图数据的采集4.4 4.4 地图数据质量和数据标准地图数据质量和数据标准4.5 4.5 地图数据库地图数据库4.1 4.1 概述概述1 1)地图数据源)地图数据源2 2)地图数据采集的任务)地图数据采集的任务3 3)研究数据质量的目的和意义)研究数据质量的目的和意义4.2 4.2 地图数据的分类和编码地图数据的分类和编码1 1)地图数据的组织)地图数据的组织2 2)地图数据的分层)地图

2、数据的分层3 3)地图数据的分类和编码)地图数据的分类和编码4.3 4.3 地图数据的采集地图数据的采集1 1)数据输入前的准备)数据输入前的准备2 2)几何数据与属性数据的采集)几何数据与属性数据的采集3 3)几何与属性数据的连接)几何与属性数据的连接4 4)地图数据的编辑和检核)地图数据的编辑和检核4.4 4.4 地图数据质量和数据标准地图数据质量和数据标准1 1)地图数据质量的内容及评价方法)地图数据质量的内容及评价方法2 2)数字化误差评价和质量控制)数字化误差评价和质量控制3 3)数据处理中的质量评价)数据处理中的质量评价4 4)地图数据标准)地图数据标准4.5 4.5 地图数据库地

3、图数据库1 1)数据库的概念)数据库的概念2 2)数据库模型)数据库模型3 3)地图数据库的设计、建立与维护)地图数据库的设计、建立与维护本章重点本章重点l地图数据的分类和编码方式地图数据的分类和编码方式l几何数据与属性数据的采集方法几何数据与属性数据的采集方法l地图数据质量的评价方法地图数据质量的评价方法l数据库模型、结构、系统组成数据库模型、结构、系统组成4.1 4.1 概述概述现实世界现实世界文字报告、文字报告、遥感图象遥感图象等等数字化仪数字化仪扫描仪扫描仪解析测图仪解析测图仪键盘等键盘等编辑、接边、分层、图形与编辑、接边、分层、图形与属性连接、加注记等属性连接、加注记等空间数据库空间

4、数据库数据源?数据源?如何采集如何采集? ?质量如何质量如何? ?4.1.1 4.1.1 地图数据源:地图数据源: 地图数据、遥感数据、文本数据、统计数据地图数据、遥感数据、文本数据、统计数据实测数据、多媒体数据、已有系统的数据实测数据、多媒体数据、已有系统的数据4.1.2 4.1.2 空间数据采集的任务空间数据采集的任务 将现有的上述类型数据转换成计算机地图将现有的上述类型数据转换成计算机地图制图技术制图技术可以处理与接收可以处理与接收的数字形式,通常要的数字形式,通常要经过经过验证、修改、编辑验证、修改、编辑等处理。等处理。4.1.3 4.1.3 研究地图数据质量的目的和意义研究地图数据质

5、量的目的和意义 数据质量是指空间数据的数据质量是指空间数据的可靠性可靠性,通常用,通常用空间数据的空间数据的误差误差来度量。来度量。误差是指数据与真值误差是指数据与真值的偏离。研究地图数据质量对于的偏离。研究地图数据质量对于保证地图产品保证地图产品的可靠性、的可靠性、减少减少地图设计地图设计盲目性盲目性具有重要意义。具有重要意义。4.24.2 地图数据的分类和编码地图数据的分类和编码4.2.1 4.2.1 地图数据的组织地图数据的组织4.2.2 4.2.2 地图数据的分层地图数据的分层图层图层(CoverageCoverage): :按某种按某种属性特征属性特征形成的一个形成的一个数据层数据层

6、。1)1)分层方法:分层方法:l专题分层专题分层:每个图层对应一个专题,包含某一:每个图层对应一个专题,包含某一类数据。如地貌层、道路层、居民地层等。类数据。如地貌层、道路层、居民地层等。l时间序列分层时间序列分层:即把不同时间或不同时期的数:即把不同时间或不同时期的数据作为一个数据层。据作为一个数据层。l地面垂直高度分层地面垂直高度分层:即:即把不同地面高度值的数把不同地面高度值的数据作为一个数据层。据作为一个数据层。 专题分层专题分层时间序列时间序列Z Z2 2)数据分层目的:)数据分层目的:便于数据便于数据管理、查询、分析管理、查询、分析等。等。1 1)划分为若干数据层后,对所有数据的管

7、理就)划分为若干数据层后,对所有数据的管理就简化为简化为对各对各数据层数据层的管理;的管理;一个一个数据层的数据层的数据数据结构结构较较单一单一,数据量,数据量小小,管理,管理简单简单;2 2)对对不同数据层不同数据层叠加可进行叠加可进行各种各种空间分析。空间分析。3 3)查询时只需查询时只需要对要对某一层某一层空间数据查询,空间数据查询,可加可加快快查询速度;查询速度;4 4)增加了图形显示的灵活性。)增加了图形显示的灵活性。4.2.3 4.2.3 地图数据的分类与编码地图数据的分类与编码点、线、面点、线、面特征码特征码、坐标、坐标信息世界信息世界 基础地理数据的分类的编码是空间基础地理数据

8、的分类的编码是空间数据库建立的重要基础。数据库建立的重要基础。1)1)属性数据编码属性数据编码 属性数据中,有一部分与几何数据的表示属性数据中,有一部分与几何数据的表示密切相关密切相关。例如道路的。例如道路的等级、类型等级、类型等等决定着决定着道道路路符号符号的形状、色彩等。通常把的形状、色彩等。通常把这部分属性数这部分属性数据据用用编码编码的形式表示并与几何数据的形式表示并与几何数据一起管理一起管理。编码:指确定编码:指确定属性数据属性数据的的代码代码的的方法方法和和过程过程。代码:一个或一组代码:一个或一组有序有序的的易于易于被计算机或人被计算机或人识识别与处理别与处理的的符号符号,是计算

9、机,是计算机鉴别和查找信息鉴别和查找信息的的主要依据和手段。(编码的直接产物就是代码,主要依据和手段。(编码的直接产物就是代码,而分类分级则是编码的基础)而分类分级则是编码的基础)2)2)分类编码的原则分类编码的原则 分类是将分类是将具有共同具有共同的属性或特征的事物或现的属性或特征的事物或现象象归并在一起归并在一起,将,将不同不同属性或特征的事物或现象属性或特征的事物或现象分开分开的过程。的过程。分类的分类的基本原则基本原则是:是:科学性、系统性、可扩性、实用性、兼容性、科学性、系统性、可扩性、实用性、兼容性、稳定性、不受比例尺限制、灵活性稳定性、不受比例尺限制、灵活性人类思维所固有的一人类

10、思维所固有的一种活动和认识事物的种活动和认识事物的一种方法。一种方法。3 3)分类码和标识码分类码和标识码4 4)分类码示例分类码示例5 5)标识码示例标识码示例C14924.3 4.3 地图数据的采集地图数据的采集4.3.1 4.3.1 输入前准备输入前准备1 1)资料准备,区域标定)资料准备,区域标定2 2)统一地理基础,确定投影、比例尺、分类)统一地理基础,确定投影、比例尺、分类分级编码。分级编码。3 3)所用软件的检查、试用菜单准备及其它辅)所用软件的检查、试用菜单准备及其它辅助工作。助工作。4 4)硬件检查。)硬件检查。5 5)精度试验,样区、单项试验。)精度试验,样区、单项试验。基

11、础原始数据、基础原始数据、数据分类项目、数据分类项目、数据标准的准确数据标准的准确性的确定。性的确定。4.3.2 4.3.2 几何图形数据的采集几何图形数据的采集1 1)手工数字化)手工数字化2 2)数字化仪数字化)数字化仪数字化3 3)扫描矢量化)扫描矢量化4 4)解析测图法)解析测图法5 5)已有数据转入)已有数据转入地地图图数数字字化化将传统的纸质或其将传统的纸质或其他材料上的地图他材料上的地图(模拟线号)转换(模拟线号)转换为计算机可识别的为计算机可识别的图形数据(数字信图形数据(数字信号)的过程,以便号)的过程,以便进一步在计算机中进一步在计算机中存贮、分析和输出。存贮、分析和输出。

12、确定数字化路线确定数字化路线地图预处理地图预处理地图数字化地图数字化1)1)手工数字化手工数字化 是指不借用任何数字化设备对地图进行数字是指不借用任何数字化设备对地图进行数字化,即化,即手工读取并录入手工读取并录入地图的地理坐标数据。地图的地理坐标数据。 按照空间数据存储格式的不同分为:按照空间数据存储格式的不同分为:手工手工矢量矢量数字化数字化手工手工栅格栅格数字化数字化手工矢量数字化:手工矢量数字化: 直接读取地理实体坐标数据并按一定格式直接读取地理实体坐标数据并按一定格式记录下来,具体步骤如下:记录下来,具体步骤如下:对地理实体编码对地理实体编码量取地理实体坐标量取地理实体坐标录入坐标数

13、据录入坐标数据手工栅格数字化:手工栅格数字化: 将图面划分为栅格单元矩阵,按地理实体将图面划分为栅格单元矩阵,按地理实体的类别对栅格单元进行编码,再依次读取每个的类别对栅格单元进行编码,再依次读取每个栅格单元代码值的数字化方法:栅格单元代码值的数字化方法:确定栅格单元大小确定栅格单元大小准备栅格网准备栅格网栅格单元编码栅格单元编码读取栅格单元值读取栅格单元值数据录入数据录入2)2)数字化仪数字化数字化仪数字化用用数数字字化化软软件件进进行行数数字字化化3)3)扫描矢量化扫描矢量化屏幕跟踪矢量化流程:屏幕跟踪矢量化流程:4.3.2 4.3.2 属性数据的采集属性数据的采集1 1)键盘,人机对话方

14、式)键盘,人机对话方式2 2)程序批量输入。)程序批量输入。a1a2001002程序程序空间空间数据库数据库0010024.3.3 4.3.3 几何与属性数据的连接几何与属性数据的连接1)1)可手工输入可手工输入2)2)由系统自动生成由系统自动生成( (如用顺序号代表标识符如用顺序号代表标识符) ) 标识码标识码属性数据属性数据几何数据几何数据4.3.4 4.3.4 地图数据的编辑和检核地图数据的编辑和检核1 1)空间)空间数据输入数据输入的误差的误差l几何数据的不完整或重复。几何数据的不完整或重复。l几何数据的位置不正确。几何数据的位置不正确。l比例尺不正确。比例尺不正确。l几何数据与属性数

15、据的连接有误。几何数据与属性数据的连接有误。l属性数据错误、不完整。属性数据错误、不完整。l键盘输入错误,漏输数据或错误分类等。键盘输入错误,漏输数据或错误分类等。 2 2)空间数据的检查)空间数据的检查l通过图形实体与其属性的通过图形实体与其属性的联合显示联合显示,发现数字,发现数字化中的遗漏、重复、不匹配等错误;化中的遗漏、重复、不匹配等错误;l在屏幕上用地图要素对应的在屏幕上用地图要素对应的符号显示符号显示数字化的数字化的结果,对照原图检查错误;结果,对照原图检查错误;l把数字化的结果绘图输出在透明材料上,然后把数字化的结果绘图输出在透明材料上,然后与原图与原图叠加叠加以发现错漏;以发现

16、错漏;l对等高线通过确定最低和最高等高线的高程及对等高线通过确定最低和最高等高线的高程及等高距,等高距,编制软件编制软件来检查高程赋值是否正确;来检查高程赋值是否正确;l对于面状要素,可在对于面状要素,可在建立拓扑关系建立拓扑关系时,根据时,根据多边形是否闭合来检查,或根据多边形与多边多边形是否闭合来检查,或根据多边形与多边形内点的匹配来检查等;形内点的匹配来检查等;l对于属性数据,通常是在屏幕上逐表、逐行对于属性数据,通常是在屏幕上逐表、逐行检查,也可检查,也可打印打印出来检查;出来检查;l对于属性数据还可编写对于属性数据还可编写检核程序检核程序,如有无字,如有无字符代替了数字,数字是否超出

17、了范围,等等;符代替了数字,数字是否超出了范围,等等;l对于图纸变形引起的误差,应使用对于图纸变形引起的误差,应使用几何纠正几何纠正来进行处理。来进行处理。目标检核目标检核 机器检核机器检核图形叠合比较图形叠合比较属性数据检核属性数据检核各种方法反复进行各种方法反复进行4.4 4.4 地图数据质量和数据标准地图数据质量和数据标准4.4.1 4.4.1 地图数据质量的内容(类型)地图数据质量的内容(类型)1 1)位置(几何)精度:位置(几何)精度:如数学基础、高程精度如数学基础、高程精度等用以描述等用以描述几何数据的误差几何数据的误差。2) 2) 属性精度:属性精度:如要素分类的正确性、属性编码

18、如要素分类的正确性、属性编码的正确性等用以反映的正确性等用以反映属性数据的质量属性数据的质量。3) 3) 逻辑一致性:逻辑一致性:如多边形闭合精度、拓扑关系如多边形闭合精度、拓扑关系正确性等;几何或属性误差会正确性等;几何或属性误差会引起引起逻辑误差逻辑误差。4) 4) 完备性完备性:如实体类型的完备性、属性数据的:如实体类型的完备性、属性数据的完备性、完备性、检验完整性检验完整性等。等。5) 5) 现势性现势性:如数据:如数据采集时间采集时间、更新时间更新时间等。等。逻辑误差逻辑误差:对数据进行质量控制或质量评价或:对数据进行质量控制或质量评价或质量保证,一般先从数据的逻辑性检查入手。质量保

19、证,一般先从数据的逻辑性检查入手。误差产生的主要原因:误差产生的主要原因:具体分析具体分析原因原因误差的具体来源:误差的具体来源:误差传播误差传播:可分为:可分为:1 1)代数(算术)关系)代数(算术)关系如差、倍数、线性关系,有一套成熟的如差、倍数、线性关系,有一套成熟的经典测量经典测量误差误差理论处理。理论处理。2 2)逻辑关系)逻辑关系a a、布尔逻辑关系:如叠置分析。、布尔逻辑关系:如叠置分析。b b、不精确推理关系:如专家系统中的不精确推、不精确推理关系:如专家系统中的不精确推理。理。正处于研究正处于研究中,需要中,需要借用信息论,模糊数借用信息论,模糊数学、人工智能、专家学、人工智

20、能、专家系统等学科系统等学科有望解决有望解决。4.4.1 4.4.1 地图数据质量评价的方法地图数据质量评价的方法1 1)直接评价法)直接评价法l用计算机程序自动检测用计算机程序自动检测:某些类型的错误可以:某些类型的错误可以用计算机软件用计算机软件自动发现自动发现,数据中不符合要求的数,数据中不符合要求的数据项的百分率或平均质量等级也可由计算机据项的百分率或平均质量等级也可由计算机软件软件算出算出。此外,还可检测文件格式是否符合规范、。此外,还可检测文件格式是否符合规范、编码是否正确、数据是否超出范围等。编码是否正确、数据是否超出范围等。l随机抽样检测随机抽样检测:在确定抽样方案时,应考虑数

21、:在确定抽样方案时,应考虑数据的空间相关性。据的空间相关性。2 2)间接评价法(地理相关法和元数据法)间接评价法(地理相关法和元数据法)l通过外部知识或信息通过外部知识或信息进行推理进行推理来确定空间数据来确定空间数据的质量的方法。用于推理的外部知识或信息如的质量的方法。用于推理的外部知识或信息如用途、数据历史记录、数据源的质量、数据生用途、数据历史记录、数据源的质量、数据生产的方法、误差传递模型等。产的方法、误差传递模型等。3 3)非定量描述法)非定量描述法l通过对数据质量的通过对数据质量的各组成部分各组成部分的评价结果进行的评价结果进行的的综合分析综合分析来确定数据的来确定数据的总体质量总

22、体质量的方法。的方法。4.4.2 4.4.2 数字化的误差评价和质量控制数字化的误差评价和质量控制1 1)评价数字化误差的方法)评价数字化误差的方法l自动回归法:由于跟踪数字化不仅是一个随机自动回归法:由于跟踪数字化不仅是一个随机序列,而且是一个时间序列,因此可用数理统序列,而且是一个时间序列,因此可用数理统计中的计中的时间序列分析法时间序列分析法来确定数字化的误差。来确定数字化的误差。lBandBand法:适用于任何类型的地理数据,法:适用于任何类型的地理数据,关键是关键是如何如何给出合理的给出合理的值。值。BandBandl对比法对比法:将数字化后的数据用绘图机绘出,将数字化后的数据用绘图

23、机绘出,与与原图叠合原图叠合,选择明显地物点进行量测,以确定误,选择明显地物点进行量测,以确定误差。除了几何精度外,属性精度、完整性、逻辑差。除了几何精度外,属性精度、完整性、逻辑一致性等也可用对比法进行对照检查。一致性等也可用对比法进行对照检查。2 2)数字化过程中的质量控制)数字化过程中的质量控制l数字化预处理数字化预处理:对原始地图、表格等的整理对原始地图、表格等的整理和清绘。和清绘。l数字化设备的选用:根据手扶数字化仪、扫数字化设备的选用:根据手扶数字化仪、扫描仪等设备的描仪等设备的分辨率分辨率和和精度精度等参数的进行挑选,等参数的进行挑选,这些参数这些参数不应低于不应低于设计的数据精

24、度要求。设计的数据精度要求。l数字化对点精度(准确性)数字化对点精度(准确性):数字化时数据数字化时数据采集点与原始点的采集点与原始点的重合重合程度,一般要求对点误程度,一般要求对点误差小于差小于0.1mm0.1mm。l数字化限差:包括采点密度(数字化限差:包括采点密度(0.2mm0.2mm)、接边)、接边误差(误差(0.02mm0.02mm)、接合距离)、接合距离(0.02mm)(0.02mm)、悬挂距、悬挂距离离(0.007mm)(0.007mm)等。等。l数据的精度检查:输出图与原始图之间的数据的精度检查:输出图与原始图之间的点点位误差位误差,一般要求对,一般要求对直线地物和独立地物直线

25、地物和独立地物,误,误差小于差小于0.2mm0.2mm,对,对曲线地物和水系曲线地物和水系,误差小于误差小于0.3mm0.3mm,对,对边界模糊边界模糊的要素应小于的要素应小于0.5mm0.5mm。4.4.3 4.4.3 数据处理中数据质量的评价数据处理中数据质量的评价1 1)数字高程模型)数字高程模型(DEM)(DEM)的精度的精度主要受主要受原始资料的精度原始资料的精度( (采样密度、测量误差、采样密度、测量误差、地形类别、控制点等地形类别、控制点等) )和和内插的精度内插的精度( (内插方法、内插方法、地形类型、原始数据的密度等地形类型、原始数据的密度等) )的影响。的影响。 受原始采样

26、点受原始采样点采样密度采样密度的影的影响与响与不同的插不同的插值方法关系不值方法关系不大大。原始等高线原始等高线DEMDEM重新生成等高线重新生成等高线原始等高线与原始等高线与重新生成等高线叠加重新生成等高线叠加内插内插自动追踪自动追踪2)2)矢量数据栅格化的误差矢量数据栅格化的误差属性误差属性误差: :在矢量数据转换为栅格数据后,栅在矢量数据转换为栅格数据后,栅格数据中的每个象元格数据中的每个象元只含一个只含一个属性数据值,它属性数据值,它是象元内是象元内多种属性多种属性的一种的一种概括概括。象元越大,属。象元越大,属性误差越大。性误差越大。几何误差几何误差: :在矢量数据转换成栅格数据后所

27、引在矢量数据转换成栅格数据后所引起的起的位置的误差位置的误差,以及由位置误差引起的,以及由位置误差引起的长度、长度、面积、拓扑匹配面积、拓扑匹配等的误差。几何误差的大小与等的误差。几何误差的大小与象元的大小象元的大小成正比。成正比。矢量数据表示矢量数据表示的多边形网用的多边形网用象元逼近时易象元逼近时易产生较严重的产生较严重的该类问题。该类问题。3 3)多边形叠置产生的误差)多边形叠置产生的误差 计算计算思路思路:单层图单层图误差误差 叠置图叠置图误差。误差。会会产生产生拓扑匹配误差拓扑匹配误差、几何误差几何误差和和属性误差属性误差。l拓扑匹配误差拓扑匹配误差:不同类型的地图、不同的图:不同类

28、型的地图、不同的图层、不同比例尺的地图叠置,同一条边界线往层、不同比例尺的地图叠置,同一条边界线往往是不同的数据,在叠置时必会出现一系列往是不同的数据,在叠置时必会出现一系列无无意义多边形意义多边形。所叠置的多边形的。所叠置的多边形的边界越精确边界越精确,越容易越容易产生无意义的多边形。这就是产生无意义的多边形。这就是拓扑匹配拓扑匹配误差误差。 多边形叠置所形成的多边形叠置所形成的多边形的数量多边形的数量与原多边形边与原多边形边界的界的复杂程度有关。复杂程度有关。-需合并需合并无意义无意义的多边形的多边形如果多边形之间如果多边形之间具有具有统计独立性统计独立性时,产生时,产生中等数中等数量量的

29、多边形;如的多边形;如果是果是高度相关高度相关的,的,则产生则产生大量无意大量无意义义的多边形。的多边形。+统计独立性统计独立性:土地利用土地利用行政区划行政区划行政区划行政区划街区线街区线高度相关:高度相关:合并无意义的多边形的方法:合并无意义的多边形的方法:a、人机交互法合并人机交互法合并到大多边形中;到大多边形中;b、根据根据无意义多边形的无意义多边形的临界值自动合并临界值自动合并到大到大多边形中;多边形中;c、拟合后新边界拟合后新边界合并。合并。l几何误差:几何误差:新边界新边界可能会可能会偏离偏离已制图的边界位已制图的边界位置(或置(或真实位置真实位置)。为了保证人们习惯上认为)。为

30、了保证人们习惯上认为重要的边界线的精度,如境界、河流、主要道重要的边界线的精度,如境界、河流、主要道路等,处理时应对这些边界上的点路等,处理时应对这些边界上的点加权加权使他们使他们能能尽可能地不被移动尽可能地不被移动。l属性误差:实际上每个进行叠置的多边形属性误差:实际上每个进行叠置的多边形本本身身的属性就是的属性就是有误差有误差的,因为属性值是分类的的,因为属性值是分类的结果结果( (如把植被分为不同的类别如把植被分为不同的类别) ),而分类就会,而分类就会产生误差。多幅图的叠置会产生误差。多幅图的叠置会使误差急剧增加使误差急剧增加,以至使叠置出的结果以至使叠置出的结果不可信不可信。4.4.

31、4 4.4.4 地图数据标准地图数据标准数据共享数据共享1 1)目前影响数据共享的因素:)目前影响数据共享的因素:体制上体制上:行业数据保密政策。:行业数据保密政策。技术上技术上:不同系统对空间数据采用的数据结构和:不同系统对空间数据采用的数据结构和数据格式不同。数据格式不同。网络化程度网络化程度:资源共享是网络主要功能之一,用:资源共享是网络主要功能之一,用户可共享网络分散在不同地点的各种软硬件。户可共享网络分散在不同地点的各种软硬件。2 2)地图数据标准:是指地图数据的名称、代码、)地图数据标准:是指地图数据的名称、代码、分类编码、数据类型、精度、单位、格式等的分类编码、数据类型、精度、单

32、位、格式等的标准形式标准形式。3 3)地图数据标准的状况:如果只针对)地图数据标准的状况:如果只针对某一某一地理地理信息系统设计空间数据标准,信息系统设计空间数据标准,并不困难并不困难;如果;如果所建立的空间数据标准所建立的空间数据标准能为大家所承认能为大家所承认,为大,为大多数系统所接受和使用,就多数系统所接受和使用,就比较复杂和困难比较复杂和困难。 3 3)地图数据分类的原则:)地图数据分类的原则:l遵循已有的国家标准,以利于全国范围内的遵循已有的国家标准,以利于全国范围内的数据共享。数据共享。l遵循国务院有关部委以及军队正在使用的数遵循国务院有关部委以及军队正在使用的数据标准。据标准。l

33、遵循各领域中普遍使用和认同的数据标准。遵循各领域中普遍使用和认同的数据标准。l当各种数据标准相互矛盾时,应遵循由上而当各种数据标准相互矛盾时,应遵循由上而下的原则进行处理。下的原则进行处理。l制定新的数据标准时应尽可能参考同类标准。制定新的数据标准时应尽可能参考同类标准。4 4)目前我国已有的一些关于地图数据分类的目前我国已有的一些关于地图数据分类的国家标准:国家标准:lGB2260-95 GB2260-95 中华人民共和国行政区划代中华人民共和国行政区划代码码lGB13923-92 GB13923-92 国土基础信息数据分类与代国土基础信息数据分类与代码码lGB11708-89 GB1170

34、8-89 公路桥梁命名和编码规则公路桥梁命名和编码规则lGB14804-93 GB14804-93 1 1:500500、1 1:10001000、1 1:20002000地形要素分类与代码地形要素分类与代码等等。等等。地图数据交换标准:地图数据交换标准:1 1)外部数据交换标准)外部数据交换标准数数据据格格式式 1 1外部数据交换格式标准外部数据交换格式标准数据转换数据转换数据转换数据转换数数据据格格式式 2 2特点:特点:自动化程度不高自动化程度不高,速度较慢速度较慢等,但它等,但它可可解决解决不同数据间转换的问题。它仍然是实现数不同数据间转换的问题。它仍然是实现数据共享的据共享的主流方式

35、主流方式。2 2)空间数据互操作协议)空间数据互操作协议数数据据格格式式1 1操纵空间数据的操纵空间数据的APIAPI直接调用直接调用 直接调用直接调用 数数据据格格式式2 2操纵操纵操纵操纵特点:比外部数据交换标准特点:比外部数据交换标准方便方便,但由于各种,但由于各种软件存储和处理空间数据的方式不同,空间数软件存储和处理空间数据的方式不同,空间数据的互操作函数又不可能很庞大,因此据的互操作函数又不可能很庞大,因此往往不往往不能能解决所有问题。解决所有问题。3 3)空间数据共享平台)空间数据共享平台采用采用客户机客户机/ /服务器体系结构服务器体系结构,通过一个,通过一个公共平公共平台台在在

36、服务器服务器存取所有数据以存取所有数据以避免避免数据的不一致性数据的不一致性。特点:思路较好,但各特点:思路较好,但各CACCAC软件有自己的底层,软件有自己的底层,统一平台统一平台目前目前难以难以实现。实现。服务器存放空间数据服务器存放空间数据C/SC/S平台平台 C/SC/S平台平台 数数据据格格式式1 1数数据据格格式式2 24 4)统一数据库接口)统一数据库接口特点:这种方式的特点:这种方式的前提前提首先要求对现实世界进行首先要求对现实世界进行统一的面向对象的数据理解,这统一的面向对象的数据理解,这不易实现不易实现的。的。目前目前:外部数据交换标准仍是实现数据共享的:外部数据交换标准仍

37、是实现数据共享的主主流方式流方式。空间数据库接口空间数据库接口 转换程序转换程序 转换程序转换程序 数数据据格格式式1 1数数据据格格式式2 24.5 4.5 地图数据库地图数据库4.5.1 4.5.1 数据管理技术的产生和发展数据管理技术的产生和发展1 1)数据管理:对数据进行分类、组织、编码、)数据管理:对数据进行分类、组织、编码、存储、检索和维护。存储、检索和维护。2 2)数据管理技术的发展过程:)数据管理技术的发展过程:l人工管理人工管理阶段(阶段(4040年代中期年代中期-50-50年代中期)年代中期)l文件系统阶段(文件系统阶段(5050年代末期年代末期-60-60年代中期)年代中

38、期)l数据库管理阶段(数据库管理阶段(6060年代末期年代末期- -现在)现在)发展动力:应用发展动力:应用需求的推动、软需求的推动、软硬件技术的发展。硬件技术的发展。人工管理:人工管理:1 1)产生的背景:)产生的背景:l应用需求应用需求 l硬件水平硬件水平l软件水平软件水平l处理方式处理方式科学计算科学计算无直接存储设备无直接存储设备无操作系统无操作系统批处理批处理2 2)特点:)特点:l管理者:应用程序,数据不保存;管理者:应用程序,数据不保存;l面向的对象:某一应用程序;面向的对象:某一应用程序;l共享程度:无共享、冗余度极大;共享程度:无共享、冗余度极大;l独立性:不独立,完全依赖于

39、程序;独立性:不独立,完全依赖于程序;l结构化:无结构;结构化:无结构;l控制能力:应用程序自己控制。控制能力:应用程序自己控制。应用程序与数据的对应关系(人工管理):应用程序与数据的对应关系(人工管理):文件系统:文件系统:1 1)产生的背景:)产生的背景:l应用需求应用需求 l硬件水平硬件水平l软件水平软件水平l处理方式处理方式科学计算、管理科学计算、管理磁盘、磁鼓磁盘、磁鼓有文件系统有文件系统联机实时处理、批处理联机实时处理、批处理2 2)特点:)特点:l管理者:文件系统,数据可以长期保存;管理者:文件系统,数据可以长期保存;l面向的对象:某一应用程序;面向的对象:某一应用程序;l共享程

40、度:共享性差,冗余度大;共享程度:共享性差,冗余度大;l独立性:独立性差,结构改变需修改程序;独立性:独立性差,结构改变需修改程序;l结构化:记录内有结构,整体无结构;结构化:记录内有结构,整体无结构;l控制能力:应用程序自己控制。控制能力:应用程序自己控制。应用程序与数据的对应关系(文件系统):应用程序与数据的对应关系(文件系统):数据库系统:数据库系统:1 1)产生的背景:)产生的背景:l应用需求应用需求 l硬件水平硬件水平l软件水平软件水平l处理方式处理方式大规模管理大规模管理大容量磁盘大容量磁盘有数据库管理系统有数据库管理系统联机实时处理、分布处联机实时处理、分布处理、批处理理、批处理

41、2 2)特点:)特点:l管理者:管理者:DBMS;l面向的对象:现实世界;面向的对象:现实世界;l共享程度:共享程度:共享性高共享性高;l独立性:高度独立性:高度物理独立性物理独立性、一定、一定逻辑独立性逻辑独立性;l结构化:结构化:整体结构化整体结构化;l控制能力:由控制能力:由DBMS统一管理和控制。统一管理和控制。应用程序与数据对应关系(数据库系统):应用程序与数据对应关系(数据库系统):数据高共享性的好处:数据高共享性的好处:l降低数据冗余度,节省存储空间;降低数据冗余度,节省存储空间;l避免数据间的不一致性;避免数据间的不一致性;数据的独立性:数据的独立性:l物理物理独立性:用户的应

42、用程序与存储在磁盘独立性:用户的应用程序与存储在磁盘上的数据库中的数据相互独立。物理存储改变上的数据库中的数据相互独立。物理存储改变后应用程序不用改变。后应用程序不用改变。l逻辑逻辑独立性:用户的应用程序与数据库的逻独立性:用户的应用程序与数据库的逻辑结构是相互独立的。逻辑结构改变了,用户辑结构是相互独立的。逻辑结构改变了,用户程序也可以不变。程序也可以不变。数据结构化:数据结构化:l整体结构的数据化是数据库主要特征之一;整体结构的数据化是数据库主要特征之一;l数据库中实现的是数据的真正结构化:数据数据库中实现的是数据的真正结构化:数据结构用结构用数据模型描述数据模型描述无需程序定义、数据可以

43、无需程序定义、数据可以变长变长、最小存取单位是、最小存取单位是数据项数据项。DBMSDBMS对数据的控制功能:对数据的控制功能:l数据安全性的保护数据安全性的保护:每个用户只能按指定的方:每个用户只能按指定的方式使用和处理指定的数据,以防止不合法的使用式使用和处理指定的数据,以防止不合法的使用造成的数据泄密和破坏。造成的数据泄密和破坏。l数据完整性的检查数据完整性的检查:将数据控制在有效范围内:将数据控制在有效范围内或保证数据之间满足一定的关系。或保证数据之间满足一定的关系。l并发控制并发控制:对多用户并发操作进行控制防止相:对多用户并发操作进行控制防止相互干扰。互干扰。l数据库恢复数据库恢复

44、:恢复到某一已知正确状态。:恢复到某一已知正确状态。文件系统阶段信息处理的传统方式:文件系统阶段信息处理的传统方式:数据库阶段信息处理方式的演变:数据库阶段信息处理方式的演变:4.5.2 4.5.2 四个基本概念四个基本概念l数据数据(DataData)l数据库数据库(DatabaseDatabase)l数据库管理系统数据库管理系统(DBMSDBMS)l数据库系统数据库系统(DBSDBS)数据数据:描述事物的符号记录,是数据库中存储的:描述事物的符号记录,是数据库中存储的基本对象;可以是文字、图形、图像、声音等形基本对象;可以是文字、图形、图像、声音等形式;与其语义是不可分的。式;与其语义是不

45、可分的。例如,学生档案中的学生记录例如,学生档案中的学生记录(李明,男,(李明,男,19721972,江苏,计算机系,江苏,计算机系,19901990)数据的解释:数据的解释:l语义:学生姓名,性别,出生年月,籍贯、语义:学生姓名,性别,出生年月,籍贯、所在系别、入学时间所在系别、入学时间l解释:李明是个大学生,解释:李明是个大学生,19721972年出生,江苏年出生,江苏人,人,19901990年考入计算机系。年考入计算机系。数据的形式数据的形式不能完全表不能完全表达其内容。达其内容。数据库:数据库:长期储存长期储存在计算机内、在计算机内、有组织有组织、可共可共享享的大量数据集合。的大量数据

46、集合。数据库管理系统(数据库管理系统(DataBase Management SystemDataBase Management System):):位于用户与操作系统之间的一层位于用户与操作系统之间的一层数据管理软件数据管理软件。主要功能:主要功能:l数据定义功能数据定义功能l数据操纵功能数据操纵功能l数据库运行、管理功能数据库运行、管理功能l数据库建立、维护功能(实用程序)数据库建立、维护功能(实用程序)数据数据定义语言定义语言、对象等。、对象等。数据数据操纵语言操纵语言如查询等。如查询等。安全性、并发使用等。安全性、并发使用等。批量装载、故障恢复等。批量装载、故障恢复等。数据库系统(数据

47、库系统(Database SystemDatabase System):在计算机系):在计算机系统中统中引入数据库引入数据库后的系统构成,不引起混淆的情后的系统构成,不引起混淆的情况下常把数据库系统简称为数据库。况下常把数据库系统简称为数据库。由数据库、由数据库、数据库管理数据库管理系统(及其系统(及其开发工具)、开发工具)、应用系统、应用系统、数据库管理数据库管理员(和用户)员(和用户)组成组成。用户用户用户用户用户用户应用系统应用系统应用开发工具应用开发工具DBMS操作系统操作系统数据库数据库数据库数据库管理员管理员数据库系统在计算机系统中的位置:数据库系统在计算机系统中的位置:4.5.3

48、 4.5.3 数据模型数据模型现实世界的模拟现实世界的模拟 在数据库中用数据模型这个工具来在数据库中用数据模型这个工具来抽象、抽象、表示和处理表示和处理现实世界中的数据和信息。数据模现实世界中的数据和信息。数据模型应满足三方面的要求:型应满足三方面的要求:l能比较能比较真实真实的的模拟模拟现实世界;现实世界;l容易容易为人所为人所理解理解;l便于便于在计算机上在计算机上实现实现。分为两个不同的层次分为两个不同的层次概念模型概念模型数据模型数据模型概念模型:信息模型,按概念模型:信息模型,按用户的观点用户的观点对数据和信对数据和信息建模。是现实世界到计算机世界的一个息建模。是现实世界到计算机世界

49、的一个中间层中间层次次和设计人员与用户之间和设计人员与用户之间交流交流的的语言语言。基本要求:基本要求:l较强的语义表达能力,能够方便直接的表达较强的语义表达能力,能够方便直接的表达应用中的各种语义知识。应用中的各种语义知识。l简单、清晰,易于用户理解。简单、清晰,易于用户理解。信息世界中的基本概念:信息世界中的基本概念:1 1)实体实体(EntityEntity):客观存在并可相互区别的):客观存在并可相互区别的事物,可以是具体的人、事、物或抽象的概念。事物,可以是具体的人、事、物或抽象的概念。2 2)属性属性(AttributeAttribute):实体所具有的某一特性。):实体所具有的某

50、一特性。3 3)码码(KeyKey):唯一标识实体的属性集。):唯一标识实体的属性集。4 4)域域(DomainDomain):属性的取值范围。):属性的取值范围。5 5)实体型实体型(Entity TypeEntity Type):用实体名及其属性):用实体名及其属性名集合来抽象和刻画同类实体。名集合来抽象和刻画同类实体。6 6)实体集实体集(Entity SetEntity Set):同型实体的集合。):同型实体的集合。7 7)联系联系(RelationshipRelationship):现实世界中事物内):现实世界中事物内部以及事物之间的联系在信息世界中反映为实体部以及事物之间的联系在信

51、息世界中反映为实体内部的联系和实体之间的联系。内部的联系和实体之间的联系。实体型间的联系:实体型间的联系:l一对一联系一对一联系(1:1)l一对多联系一对多联系(1:N)l多对多联系多对多联系(N:N)一对一联系一对一联系:实体集:实体集A A中的每一个实体,在实体中的每一个实体,在实体集集B B中中至多有一个至多有一个实体与之联系,反之实体与之联系,反之亦然亦然。记。记为为1:11:1。例如:例如:班长与班长之班长与班长之间的联系,一间的联系,一个班级只有一个班级只有一个正班长,一个正班长,一个班长只在一个班长只在一个班中任职。个班中任职。一对多联系一对多联系:实体集中:实体集中A A的每一

52、个实体在实体集的每一个实体在实体集B B中有中有N N个个实体(实体(N N0)0)与之联系;反之,对于实体与之联系;反之,对于实体集集B B中每一个实体,实体集中每一个实体,实体集A A中中至多有一个至多有一个实体与实体与之联系,称实体集之联系,称实体集A A与与B B有一对多联系记为有一对多联系记为1:N1:N。例如:例如:班级与学生之班级与学生之间的联系,一间的联系,一个班级有若干个班级有若干学生,每个学学生,每个学生只在一个班生只在一个班级中学习。级中学习。多对多联系:实体集多对多联系:实体集A A中的每一个实体在实体集中的每一个实体在实体集B B中有中有N N个实体(个实体(N0)N

53、0)与之联系;反之,对于实体与之联系;反之,对于实体集集B B中每一个实体,实体集中每一个实体,实体集A A中中也有也有M M个实体(个实体(M M 00)与之联系,称实体集与之联系,称实体集A A与与B B有一对多联系记有一对多联系记为为M:NM:N。例如:例如:课程与学生间课程与学生间的联系,一门的联系,一门课多个学生选课多个学生选修,一个学生修,一个学生可选修多门课。可选修多门课。概念模型的表示方法:概念模型的表示方法:实体实体联系方法联系方法(ER)方法:)方法:用用ER图来描述现实世界的概念模型,图来描述现实世界的概念模型,ER方方法也称法也称ER模型。模型。ER图图l实体型:用矩形

54、表示,矩形框内写明实体名。实体型:用矩形表示,矩形框内写明实体名。学生学生教师教师l属性:用椭圆表示,并用无向边将其与相应的属性:用椭圆表示,并用无向边将其与相应的实体连接起来。实体连接起来。学生学生学号学号姓名姓名性别性别年龄年龄l联系本身:用菱形表示,菱形框内写明联系名联系本身:用菱形表示,菱形框内写明联系名并用无向边分别于有关实体连接起来,同时在无并用无向边分别于有关实体连接起来,同时在无向边旁标上联系的类型(向边旁标上联系的类型(1:1、1:N、M:N)。)。l联系的属性:联系本身也是一种实体型,也可联系的属性:联系本身也是一种实体型,也可以有属性,也可用无向边与该联系连接起来。以有属

55、性,也可用无向边与该联系连接起来。1:11:NM:N111NMN实体型实体型1 1实体型实体型2 2实体型实体型1 1实体型实体型1 1实体型实体型2 2实体型实体型2 2联系名联系名联系名联系名联系名联系名1:11:NM:N111NMN班长班长班长班长班级班级课程课程学生学生学生学生班级班级- -班长班长组成组成选修选修联系的表示方法示例:联系的表示方法示例:联系属性的表示方法:联系属性的表示方法:课程课程学生学生选修选修成绩成绩4.5.3 4.5.3 数据模型数据模型现实世界的模拟现实世界的模拟 在数据库中用数据模型这个工具来在数据库中用数据模型这个工具来抽象、抽象、表示和处理表示和处理现

56、实世界中的数据和信息。数据模现实世界中的数据和信息。数据模型应满足三方面的要求:型应满足三方面的要求:l能比较能比较真实真实的的模拟模拟现实世界;现实世界;l容易容易为人所为人所理解理解;l便于便于在计算机上在计算机上实现实现。分为两个不同的层次分为两个不同的层次概念模型概念模型数据模型数据模型常用数据模型:常用数据模型:1 1)非关系模型:)非关系模型:l层次模型层次模型l网状模型网状模型2 2)关系模型关系模型3 3)面向对象模型面向对象模型层次模型层次模型满足下面两个条件满足下面两个条件的基本层次联系的的基本层次联系的集合称为层次模型:集合称为层次模型:1 1)有且只有一个)有且只有一个

57、节点,没有双亲节节点,没有双亲节点,这个节点称为点,这个节点称为根节点。根节点。2 2)根以外的其他)根以外的其他节点有且只有一个节点有且只有一个双亲节点。双亲节点。表示方法:表示方法:l实体型:用记录类型描述,每个节点表示一个实体型:用记录类型描述,每个节点表示一个记录类型。记录类型。l属性:用字段描述。每个记录类型可包含若干属性:用字段描述。每个记录类型可包含若干个字段。个字段。l联系:用结点之间的连线表示记录类型之间的联系:用结点之间的连线表示记录类型之间的联系。联系。层次模型层次模型数据结构特点:数据结构特点:l结点的结点的双亲双亲是是唯一唯一的;的;l只能只能直接处理直接处理一对多一

58、对多的实体联系;的实体联系;l每个记录类型定义一个排序字段,也称为每个记录类型定义一个排序字段,也称为码字码字段段;l任何记录值只有任何记录值只有按按其其路径查看路径查看时才能显示出全时才能显示出全部意义;部意义;l子女子女记录记录不能脱离双亲不能脱离双亲记录而存在。记录而存在。层次模型的完整性约束:层次模型的完整性约束:l无相应的双亲结点就不能插入子女结点的值;无相应的双亲结点就不能插入子女结点的值;l如删除双亲结点值,则相应的子女结点值也被如删除双亲结点值,则相应的子女结点值也被同时删除;同时删除;l更新操作时,应更新所有相应记录以保证数据更新操作时,应更新所有相应记录以保证数据的一致性。

59、的一致性。层次模型的层次模型的优点优点:l层次数据模型层次数据模型简单简单,对,对一对多一对多层次关系描述层次关系描述自自然、直观然、直观、容易理解;、容易理解;l性能优于关系模型,不低于网状模型;性能优于关系模型,不低于网状模型;l该模型提供了良好的该模型提供了良好的完整性完整性支持。支持。层次模型的层次模型的缺点缺点:l多对多多对多联系联系不自然不自然;l插入和删除插入和删除限制多限制多。基于层次模型的地图数据表示:基于层次模型的地图数据表示:网状模型网状模型满足下面两个条满足下面两个条件的基本层次联件的基本层次联系的集合称为网系的集合称为网状模型:状模型:1 1)允许一个以)允许一个以上

60、的结点无双亲;上的结点无双亲;2 2)一个结点可)一个结点可以有多于一个的以有多于一个的双亲;双亲;表示方法(与层次数据模型相同):表示方法(与层次数据模型相同):l实体型:用记录类型描述,每个节点表示一个实体型:用记录类型描述,每个节点表示一个记录类型。记录类型。l属性:用字段描述。每个记录类型可包含若干属性:用字段描述。每个记录类型可包含若干个字段。个字段。l联系:用结点之间的连线表示记录类型之间的联系:用结点之间的连线表示记录类型之间的联系。联系。网状模型网状模型数据结构特点:数据结构特点:l只能只能直接处理直接处理一对多一对多的实体联系;的实体联系;l每个记录类型定义一个排序字段,也称

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论