p08第八章 空间数据库设计_第1页
p08第八章 空间数据库设计_第2页
p08第八章 空间数据库设计_第3页
p08第八章 空间数据库设计_第4页
p08第八章 空间数据库设计_第5页
已阅读5页,还剩79页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第一节、第一节、gisgis数据库及其设计的相关概念数据库及其设计的相关概念 第二节、用户需求分析第二节、用户需求分析 第三节、概念化设计第三节、概念化设计 第四节、第四节、gisgis数据库的详细设计数据库的详细设计 第五节、实施规划第五节、实施规划 第六节、试点项目第六节、试点项目 第七节、数据库实施第七节、数据库实施 第一节、第一节、gis数据库及其设计数据库及其设计 gis数据库的概念 gis数据库的设计 一、gis数据库的概念 gis数据库:在计算机储存设备上合理存放的相互关联的空 间数据集合。 u基于文件的gis数据库 u基于关系性数据库的gis数据库 二、gis数据库设计的概念

2、制定整个数据库的使用目的和目标,制定、分析和评 价各种设计方案的并进行雏形试验; gis数据的特点导致了gis数据库设计的复杂性和特殊 性:空间性、时间性和多格式性等等; 1、对gis数据库的设计要求 1. 最小冗余度原则;数据尽可能不重复;由于数据独立于应用程序, 那么不同部门可以同时使用同一数据,而不需要分别储存,减少 了数据的冗余度。 2. 数据独立性原则:数据和应用程序的相对独立,数据的存放尽可 能地独立于使用它的应用程序,数据库和应用程序的灵活性增强; 3. 应用程序对数据资源的共享原则:数据库以最优的方式服务于一 个或多个应用程序因为数据库共享,各部门可对数据库进行共同 维护和更新

3、,所以数据库的开发费用得到分摊,而使用范围扩大; 统一管理原则:能够用一个软件统一管理这些数据。 2、数据库的设计原则 u 数据库的设计原则既要考虑数据本身的特点,也要兼顾 数据的应用目的。 u 共享式数据库中数据应该按其本身的特点进行组织,而 不是因使用的目的不同而不同;但数据库的结构应该反 映出不同用户的要求,支持各种应用程序和目的。 3、gis数据库设计过程 应用目的驱动的gis数据库设计过程 u第一步:需求分析 u第二步:原型概念化设计 u第三步:gis数据库的详细设计 u第四步:自动化方案制定 u第五步:试点项目实施 u第六步:数据库总体实施 第二节、用户需求分析 一一需求分析的目的

4、需求分析的目的 二二现状调查的方式现状调查的方式 三三需要了解的内容需要了解的内容 四四分析结果报告分析结果报告 一、gis数据库需求分析的目的 了解用户对数据库内容和行为的期望和要求; 明白即将开发的gis所支持的各种功能; 了解系统要求的数据内容和行为; 了解数据之间的关系和优先次序,便于制定数据库的 开发实施计划; 了解数据库和gis的整体要求和蓝图。 二、现状调查的方式 参观 面谈 电话采访 问卷 索取有关的资 料并加以学习 和理解 gis专题报告 面谈和电话访谈的技巧 在访谈以前将各种问题以表格、问卷或其他书面形 式写出来; 避免不必要的细节,着重了解预定的内容; 整个访谈应由gis

5、专业技术人员掌握,控制进度,保 持良好的访谈气氛; 尽可能在对方工作的地方进行,以便对方可以随时 提供必要的资料和过程; 让对方告知轻重次序,以便于在实施过程中决定执 行次序; 注意负面意见,但不要急于作答; 对于自己不熟悉的领域可以使用录音机、录相、照 相等。 三、需要了解的内容 机构的模式:机构的组织和机构的功能,按数据流的方 式表达为机构关系图 日常操作 数据情况:现有数据来源、和数据功能 专业人员的组成和功能 软件 硬件 四、分析结果报告 分析结果报告通常要包括以下几个部分: 机构运作的逻辑数据流程图; 建立gis系统所能获得的各种产品; 硬件资源表; 软件资源表; 专业人员清单; 数

6、据功能参照表; 数据来源清单; 部门功能清单; 人员培训计划; 实施的进度计划 1、机构运作的逻辑数据流程图 对于整个数据流程的每步过程,数据的输入是如何转 换成数据的输出; 各主要处理均应当以任务的形式出现; 各主要处理的步骤应简单明了地注明。 数据 逻辑 流程 图 2、建立gis系统获得的各种产品 各类gis产品通常可以包括: u地图 u报表 u文件 u应用软件包 u屏幕查询 u或是更新的数据库等。 3、硬件资源表 包括:硬件名称、操作系统、主要功能、所属部门、 运行状况等。 4、软件资源表 包括:软件名称、所属单位、操作平台、主要功能、 参与的应用、运行状况等。 5、专业人员清单 主要包

7、括:人员名称、所属部门职务、主要职责范围 、技术优势、经验层次、目前工资等。 6、数据功能参照表 i: input o: output 7、数据来源清单 8、部门功能清单 第三节、概念化设计第三节、概念化设计 数据库的概念设计是从抽象的角度来设计数据库,其内容包括: 确定数据库的内容并进行数据库的宏观地理定义:主要指对 数据库比例尺、地图投影和坐标系统的定义; 数据库数据模型确定:包括数据库的地理图元设以及数据库 属性表格及其关系的设计表达; 数据库总体设计的评定;根据数据库的应用目的和数据内容 及使用方式来评价前面三步的设计结果,进行统筹的考察; 数据库概念模型的起草;将gis数据库的概念设

8、计起草成正式 的文件,作为后面详细设计时参考。 一、数据库的宏观地理定义 宏观地理定义通常包括以下三个内容: 1. 比例尺 2. 地图投影和地理坐标系统 1、比例尺 比例尺是指地图和地表上长度的对应关系,它是地图 或数据精度和详细程度的标志; 原始图件的比例尺决定了数据库的精度; 使用何种地图比例尺取决于用户对数据精度的要求; 在一个gis数据库中往往对同一类内容需要多种比例尺 的数据 多种比例尺的数据复合运算时,往往带来一些问题, 要尽量保证所运算图层的精度一致性。 2、地图投影和地理坐标系统 对于面积较大的地区往往跨越几个投影带,设计数据库时可以 有以下几种选择 将所有数据放入一个带:选择

9、一个带作为基本带,其他带都 使用这个带的投影参数; 将各带分别存放:变形较小,但使用不便; 选择不同的地图投影:选择一种能够将整个地区放在一个投 影带中的地图投影; 选择使用地理坐标系统:适合于大范围的数据库建设,但在 具体使用时候需要转换为平面坐标系; 如果有地区标准的话,应该使用地区标准。 如果研究区的面积很重要时,可以考虑使用一种等面积的投 影进行面积计算,而数据在存储时可以使用另外一种投影。 二、数据库数据模型确定 数据模型的选择 数据库数据的组织 属性表及属性关系设计 逻辑数据图 1、数据库数据模型的选择 数据模型的选择依赖于所用软件 但开发式gis的发展使数据模型对软件的依赖开始变

10、小 2、数据库数据的组织 gis数据组织的主要任务包括: 数据分层; 数据在各层次上表达的形式及其格式; 数据属性信息的内容。 数据分层的考虑因素 基本点:图形原则专题原则 即使是同一类型的数据,有时其属性特征也不相同,所 以也应该分层存储。 比例尺的一致性,同一类型不同比例尺的数据需要分层 存储; 该层数据会有同样的使用目的和方式; 不同部门的数据通常应该放入不同的层,便于维护; 数据库中各类数据的更新可能使用各种不同的数据源, 在分层中,使用不同数据源更新的数据也应分层进行存 储,以便于更新; 数据库中需要不同级别安全处理的数据; 3、属性表与属性关系设计 设计相互关联的表格;设计相互关联

11、的表格; 对数据表进行规范化;对数据表进行规范化; 定义主关键项和外部关键项;定义主关键项和外部关键项; 使用实体关系模型来定义关系;使用实体关系模型来定义关系; 关系表的再规范化。关系表的再规范化。 1)、设计相互关联的表格 数据库由相互关联的表组成,表和表之间的关系通过关键项 (key)来维护,关键项有主关键项和外部关键项之别,主 关键项的选择必须具备以下特性: u唯一性:在每个表中,每个记录的关键项均必须是唯一 的; u不变性:从来不会被更改; u纯粹性:不含有其他方面的信息; u不重复性:不会被重复使用,即某一个值被删除后,不 会再被使用; u可获得性:需要时便可以拿来到此信息。 外关

12、键项存在于子表中,不要求具有唯一性 2)、空间数据的均衡 将数据库中各关系表进行分解,使其变成更简单、更稳定 的一套关系表的过程叫数据库的均衡化。 一、范式的概念 二、关系的规范化 三、关系规范化的必要性 四、关系分解的正确性 范式来自英文 normal form,简称nf,是在设计数据库时,根 据不同设计出现冗余和异常操作冗余和异常操作的程度,分成若干标准,称 为范式。 关系数据库中的关系必须满足最低的关系要求,不同范式满足 不同程度的要求。目前主要有六种范式:1nf、2nf、3nf等。 a、范式的概念 关系规范化:将一个低一级范式的关系模式,通过模式模式 分解分解可以转换为若干个高一级范式

13、的关系模式集合,这 种过程就叫关系的规范化。 b、 关系的规范化的概念 第一范式:第一范式:给定关系r,如果r中每个列与行的交点处的取值 (单元值)都是不可再分的基本元素,则r达到第一范式, 简称1nf。 c、第一范式(1nf) 第一范式图解(1) 第一范式图解(2) 满足第一泛式,即分量的原子性 第二范式:第二范式:如果一个关系达到第一范式,且不存在任何非 主属性对候选关键字的部分函数依赖,则称此关系达到第 二范式,简称2nf。 规范化到第二范式的方法:将有关非主属性与其完全函数 依赖的那些部分主属性分解建立新的关系。 d、第二范式(2nf) 第二范式图解(1) 主码(学号、课程名),非主属

14、性(姓名,年龄,系名,系主任,成绩) 由于存在函数依赖集学号姓名,学号年龄,学号性别,学号 系名,系名系主任,(学号,课程名) 成绩 非主属性对主码存在着部分函数依赖:(学号、课程名) 姓名, (学 号、课程名) 年龄)等 因此不符合第一泛式的要求,可以将其分解为下面两个表: p p t 第二范式图解(第二范式图解(2) 第三范式:第三范式:如果一个关系达到第二范式且不存在非主属性对候 选关键字的传递函数依赖,则称为达到第三范式,简称3nf。 优化到第三范式的办法是,将对关键字存在传递函数依赖的那 些属性与其完全函数依赖的非主属性分解出来建立新的关系, 而它们所依赖的那个非主属性作为关联属性也

15、要存在于原关系 中。 e、第三范式(3nf) 第三范式(第三范式(3nf)图解()图解(1) 主属性:学号 学号系名,系名系主任,因此存在: 学号系主任 不符合第三泛式,将此表可分解为一下两表: t 第三范式(第三范式(3nf)图解()图解(2) 3)、使用实体关系模型来帮助关系表的 规范化 首先要识别实体; 决定实体间的关系; 决定各实体的关键项; 将其汇成连通的图表。 4、逻辑数据图 三、概念化设计的书面报告 文件内容应该将所有的数据内容加以详细的概述; 对数据库的数据模型和内容加以描述,即数据模型、分 层和表格关系; 在能够使用图表的情况下尽量使用图表; 很多详细的内容可以放入附录之中,

16、以保持文本主体的 清晰; 假若时间允许,可以提供一个原型以更清楚地表示整个 设计的概念。 第四节、gis数据库的详细设计 主要包括五个方面的内容: 一数据源的选择; 二各种数据的评价; 三空间数据层的设计; 四数据字典; 五数据库存储结构和管理结构的设计。 一、数据源的选择 来源:地图;航空象片;gps接收的数据;卫星 象片;现有的各种电子数据文件;照片;各种 记录性文件等。 现有电子数据的来源(美国): 国家各机构生产和维护的数据 省级政府生产和维护的数据 各级地方政府生产和维护的数据 商业团体的数据 非赢利性机构生产的数据 二、各种数据的评价 1. 数据一般状况评价; 2. 数据空间图元的

17、评价; 3. 数据属性特征的评价 1、数据一般状况评价 数据的目前状态:包括数据是否已有电子版,是否有机构正在生产数 据电子版; 数据是否是一种标准形式:主要指该类数据是否在各政府机构或商业 团体生产的标准数据之列; 数据是否可以直接gis使用:常常某些数据需要经过一定的处理以后 才能与数据库中定义的数据相符合; 数据的原始性;有些数据是由其他更原始的数据推导、综合而来; 数据的可替代性:常常对一种所需要的数据来说,会有多种来源,有 些容易获得,有些则较难。在决定使用哪一种时,应该将各种可能来 源的数据均加以收集并仔细比较,再做定论; 数据与其他数据一致性:覆盖的地区是否一致,比例尺是否相同,

18、数 据的地理控制点是否符合数据库的要求,在整个地区是否一致,投影 是否与要求符合等; 空间地理数据的系列性; 已存在的电子版数据的评价原则 数据格式:数据格式是一个很重要的因素,如果不与数据库设计的 要求相吻合,势必要进行数据转换; 拓扑关系:gis数据要求数据的图元之间保持应有的拓扑关系; 数据分辩率:数据的分辨率是否满足要求。对于栅格数据,数据的 分辩率是指象元的大小; 数据覆盖面及一致性:该数据是否能够覆盖整个的工作地区; 数据的可获得性:包括数据存储的媒介,适用的计算机平台和是否 可以购买及免费提供; 样本数据:在数据评判过程,如果能够有机会获得该数据的样本将 会对数据的感性认识大大地

19、提高; 自动化过程实施的考虑:通常现有的数字化数据并不完全符合某一 数据库设计的要求,可能需要做不同程度的加工才能入库; 数据的元数据信息是否完全:元数据的存在与否及质量直接影响到 该数据的价值。 2、数据空间图元的评价 空间图元的表达方式; 空间图元的连续性和闭合性; 空间图元分类方法的比较和评价; 空间图元表示规则的比较; 空间数据地理控制信息的比较; 地理参考系统的一致性。 3、数据属性特征的评价 属性的存在性; 属性数据与空间位置的匹配; 属性数据的编码系统; 属性数据的现适性。 三、空间数据层的设计 1. 属性数据类型的设计 2. 编码标准的设计 3. 数据字典中各数据层的详细内容

20、1、属性数据类型的设计 各属性项的定义:含义、字段名称、类别、宽度 2、编码标准的设计 编码标准的设计应该尽量采用国家标准,如果不够的 话可以进行细化设计 3、数据字典中各数据层的详细内容 1. 标题类信息:名称、类型; 2. 数据质量; 3. 各层的有关文件、表、各表的项及各项的定义、有效 值范围等; 4. 地理参考方面要求满足的情况; 5. 其它有便于说明和理解的文字或图表等; 6. 各层空间及属性的质量控制规范; 7. 各层编号系统与其它各标准编号系统的关系; 8. 各层数据的使用与各应用类型的关系等。 四、数据字典 数据字典是整个数据库的总体和详细总结, 是当前 gis数据库的蓝图,可

21、以帮助用户理解数据库的内容 以便更好地使用数据库: 1. 数据字典的内容; 2. 数据文件的命名方法; 3. 数据字典的元数据内容。 1、数据字典的内容 数据库的总体组织结构; 数据库总体设计的框架:包括数据来源、整体命名方 法、地图投影、图幅匹配及精度,拓朴关系、质量控 制等等; 数据层的详细内容定义及结构; 数据命名的定义; 元数据内容等。 2、数据文件的命名方法 通过命名反映数据的内容、所接受的操作、被同一类 型操作所处理的先后顺序 如so01dg,表示土壤、第一次数字化 3、数据词典的元数据内容 数据集内容、质量条件及操作过程的描述 五、存储管理结构和数据库管理的设计 数据的精度考虑

22、rdbms对属性信息存储软件的选择 空间数据库的管理 1、数据的精度考虑 一个数据库的精度不会因为采用自动化的数据采集过 程而使其增高。 经数字化过的地理数据特征,其精度不会高于其原始 地图。 数据库总体精度是最低精度部分的数据的精度 2、rdbms对属性信息存储软件的选择 单独对属性信息的存储,可以使整个数据库的独立性提 高,属性数据库可以单独地进行使用、维护和管理。 可以充分利用dbms系统的各种高级功能。 属性数据库部分可以与其它gis软件的空间数据部分相 结合使用,不受开发时软件的限制。 3、空间数据库的管理 数据使用权限的设置; 数据库更新过程中的质量控制和安全性考虑; 数据库的恢复能力; 合理管理单元的设定; 数据库系统的网络考虑。 第五节、gis数据库的实施规划 一建立数据自动化处理方法; 二实施质量控制的原则标准; 三将整个实施规划与整个地理信息系统的实现相结合起来。 一、数据采集设计 1. 直接的数据采集方法; 2. 空间数据的数字化过程; 3. 属性数据的数字化 1、直接的数据采集方法 gps方法 摄影测量方法 l控制点:如果该地区没有很好的大地控制点,则必须要先将 一种控制点网络建立后再行使用。 l比例尺:摄影测量的比例尺与造价关系很大,在确定使用何 种比例尺时,应根据数据库精度的要求,既不可使用太大比

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论