地理信息系统 第三章地理空间数据模型_第1页
地理信息系统 第三章地理空间数据模型_第2页
地理信息系统 第三章地理空间数据模型_第3页
地理信息系统 第三章地理空间数据模型_第4页
地理信息系统 第三章地理空间数据模型_第5页
已阅读5页,还剩69页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

地理空间数据组织与管理第二部分

第三章地理空间数据模型概念基本特征和描述分类和分层空间数据索引空间数据模型3.1地理空间数据模型概念3.2基本特征和描述空间位置特征:对地理实体或现象的分布位置、几何特征和空间关系的定义。空间属性特征:对地理实体或现象的属性定义和说明信息。时间特征:地理实体或现象的时间尺度,随时间变化的特征。空间数据描述的内容编码——用于区别不同的实体,有时同一个实体在不同的时间具有不同的编码,如上行和下行的火车。编码通常包括分类码和识别码。分类码标识实体所属的类别,识别码对每个实体进行标识,是唯一的,用于区别不同的实体。位置——通常用坐标值的形式(或其它方式)给出实体的空间位置。类型——指明该地理实体属于哪一种实体类型,或由哪些实体类型组成。行为——指明该地理实体可以具有哪些行为和功能。属性——指明该地理实体所对应的非空间信息,如道路的宽度、路面质量、车流量、交通规则等。说明——用于说明实体数据的来源、质量等相关的信息。关系——与其它实体的关系信息。3.3分类编码和数据分层空间数据的分类、分层和空间索引是GIS空间数据组织的重要方式和内容分类是编码之依据分层是分类的结果空间索引建立了空间实体坐标系和屏幕间关系,是快速选取空间实体的基础分类和分级分类将具有共同的属性或特征的事物或现象归并在一起,而把不同属性或特征的事物或现象分开的过程。

分类是人类思维所固有的一种活动,是认识事物的一种方法。分级是对事物或现象的数量或特征进行等级的划分,主要包括确定分级数和分级界线。线分类法:(层次分类法)耕地71园地

72林地

73牧草地74居民点及公矿用地

75交通用地75水域

76未利用地

77土地利用类型7有林地

731灌木地

732疏林地733迹地

735针叶树疏林地7331阔叶树疏林地7332未成林林地734面分类法分类的基本原则科学性:选择事物或现象最稳定的属性和特征作为分类的依据。系统性:应形成一个分类体系,低级的类应能归并到高级的类中。可扩性:应能容纳新增加的事物和现象,而不致于打乱已建立的分类系统。实用性:应考虑对信息分类所依据的属性或特征的获取方式和获取能力。兼容性:应与有关的标准协调一致。确定分级数的基本原则分级数应符合数值估计精度的要求。分级数多,数值估计的精度就高。分级数应顾及可视化的效果。等级的划分在GIS中要以图形的方式表示出来,根据人对符号等级的感受,分级数应在4~7级。分级数应符合数据的分布特征。对于呈明显聚群分布的数据,应以数据的聚群数作为分级数。在满足精度的前提下,应尽可能选择较少的分级数。确定分级界线的基本原则保持数据的分布特征。使级内差异尽可能小,各级代表值之间的差异应尽可能大。在任何一个等级内都必须有数据,任何数据都必须落在某一个等级内。尽可能采用有规则变化的分级界线。分级界线应当凑整。空间数据的编码空间数据的编码是指确定属性数据的代码的方法和过程。代码是一个或一组有序的易于被计算机或人识别与处理的符号,是计算机鉴别和查找信息的主要依据和手段。编码的直接产物就是代码,而分类分级则是编码的基础。分类是一种信息结构,编码是一种数据结构。代码的功能鉴别——代码代表对象的名称,是鉴别对象的唯一标识。分类——当按对象的属性分类,并分别赋予不同的类别代码时,代码又可作为区分分类对象类别的标识。排序——当按对象产生的时间、所占的空间或其它方面的顺序关系排列,并分别赋予不同的代码时,代码又可作为区别对象排序的标识。编码的基本原则唯一性——一个代码只唯一地表示一类对象。合理性——代码结构要与分类体系相适应。可扩性——必须留有足够的备用代码,以适应扩充的需要。简单性——结构应尽量简单,长度应尽量短。适用性——代码应尽可能反映对象的特点,以助记忆。规范性——代码的结构、类型、编写格式必须统一。代码的类型代码有数字、字母、数字和字母混合三类表示形式。数字型代码用一个或若干个阿拉伯数字表示对象的代码。特点是结构简单、使用方便、易于排序,但对对象的特征描述不直观。字母型代码用一个或若干个字母表示对象的代码。特点是比同样位数的数字型代码容量大,还可提供便于识别的信息,易于记忆,但比同样位数的数字型代码占用更多的计算机空间。数字、字母混合型代码是由数字、字母、专用符组成的代码。兼有数字型和字母型的优点,结构严密,直观性好,但组成形式复杂,处理麻烦。编码方法举例行政区划代码(GB—2260—91)这是一种识别码,用6位数字代码按层次分别表示省(自治区、直辖市)、地区(市、州、盟)、县(区、市、旗)的名称。其第一、二位表示省(自治区、直辖市);第三、四位表示省直辖市(地区、州、盟),其中01~20,51~70表示省直辖市,21~50表示地区、州、盟;第五、六位表示县(市辖市、地辖市、县级市、旗),其中01~18表示市辖区或地辖市,21~80表示县、旗,81~99表示县级市。例如、郑州市的代码为410100加拿大数字地形要素分类编码系统这是一种分类码,且是一种数字字母混合型代码。采用树型结构将地形要素分为四级,其代码结构为:

×

××

×××

×××

└─

四级代码,三位数字

└───

三级代码,三位数字

└───

二级代码,两位数字

└───

一级代码,一位数字空间数据的分层和分区地理信息本身具有层次性。分层和分区是空间数据组织的高级形式,为管理和使用提供了便利分层依据地理实体性质分区依据平面范围分层按专题地貌、水系、植被、交通、居民地等按时间不同时间的数据成为不同层,便于对比、处理、表现。如每年建的住宅用不同的颜色表现按实体的几何类型一般按点、线、面、注记按实体的属性结构同种属性表为一个层按专题分层

每个图层对应一个专题,包含某一种或某一类数据。如地貌层、水系层、道路层、居民地层等。。现实世界获取水系信息地形信息道路信息植被信息等+++空间数据库存储按时间序列分层

即把不同时间或不同时期的数据分别构成各个数据层图层i图层j点文件i线文件i面文件i点文件j线文件j面文件jShape文件公路GIS的图层分区按图幅、自然区域、行政区域划分外业测量按河流、街道划分可大大减少接边的工作工作区(Workspace)图幅或数据范围,含多个工作层和逻辑层Coverage是工作层也是逻辑层,用层的方式严格将点线面分开后期的工作层可同时包含点线面地物类由相同的地物组合而成一个工作层含多个地物类工作层和逻辑层SuperMap的层——数据集在SuperMap中,层称为数据集数据集的特点表达同种地理实体具有同样的数据表具有相同的符号数据集的位置工作空间——数据源——数据集——符号GIS数据的组织管理结构GIS工程工作区1工作区2

工作区m工作层1

图幅2 图幅n图幅1 工作层2

工作层p

地物类2 地物类1

地物类q

地物1地物2地物r…….…….……. …….…….3.4空间数据索引空间索引的层次结构无缝图层工作区索引目标索引窗坐标、BSP、KDB树、R树和R+树、CELL树空间数据索引的必要性在GIS中需要根据空间位置进行查询,例如,“找出通过某个区域的所有公路”,“检索在某个区域内的所有湖泊”等等。为了处理这类空间查询,数据库需要检查每一个可能满足条件的空间要素的记录,看它是否与查询区域相交或是在查询区域内,这种空间相交运算需要先读出空间要素几何形状的边界坐标,然后再与空间区域进行空间关系运算。由于传统数据库的这种穷尽式搜索方法花费的磁盘访问时间和空间运算时间都很长,往往达到令人无法忍受的程度,故必须建立空间数据索引机制。空间索引的层次无缝图层现实世界的地区、城市均是连续的。对较小的区域可以将数据物理连接,生成物理无缝图层。对无法生成物理无缝图层的地区,可以建立逻辑无缝图层。逻辑无缝图层建立了地物的连接描述工作区索引对海量数据而言,必须建立多个工作区,将数据按工作区存放于存储器。建立索引文件在开窗操作时,系统根据窗口坐标,按索引文件迅速调入所涉及的工作区目标索引窗坐标索引机制格网型空间索引BSP索引机制KDB树R树和R+树CELL树窗坐标

索引

机制建立每个实体的最小包容矩形,记录其对角坐标。单点检索可判断是否在包容矩形内;范围检索可判断每个实体的最小包容矩形和范围的关系:内、外、相交。对所有空间实体的外接矩形最大最小坐标进行落入判别,其中空间实体B、C完全落入查询窗,从空间数据库中提取B和C的相应数据。

A 查询窗口 B

CE F D

格网型空间索引将区域用横竖线条划分大小相等和不等的格网,记录每一个格网所包含的空间实体。进行空间查询时,首先计算出查询对象所在格网,然后再在该网格中快速查询所选空间实体。一条河流、一个湖泊和一条省界,它们的关键字分别为5,11和23。河流穿过的栅格为2,34,35,67,68;湖泊覆盖的栅格为68,69,100,101;省界所通过的栅格为5,37,36,35,67,99,98,97。BSP索引机制是一种二叉树,它将空间逐级进行一分为二的划分。BSP树能很好地与空间数据库中空间对象的分布情况相适应,但对一般情况而言,BSP树深度较大,对各种操作均有不利影响。6.5空间数据模型三种传统模型层次、网络、关系面向对象模型二维矢量模型栅格数据模型三维空间模型矢量、栅格三种传统模型层次网络关系层次模型层次模型是一种树结构模型,它把数据按自然的层次关系组织起来,以反映数据之间的隶属关系。一棵树有且仅有一个无双亲结点的称为根的结点;其余结点有且仅有一个双亲结点。

层次模型描述矢量数据特点是将数据组织成一对多关系的结构。层次结构采用关键字来访问其中每一层次的每一部分。层次数据库结构特别适用于文献目录、土壤分类、部门机构等分级数据的组织ⅠⅡ123456abcdefgMMⅠⅡabcdefg1223344134355664c层次数据的特点优点:存取方便且速度快结构清晰,容易理解数据修改和数据库扩展容易实现检索关键属性十分方便缺陷:结构呆板,缺乏灵活性同一属性数据要存储多次,数据冗余大(如公共边)不适合于拓扑空间数据的组织空间对象的层次分类编码分类对象的从属和层次关系有明确的分类对象类别和严格的隶属关系高压711电线架715管线:7地下电力线与电缆72电力线71地下检修井74管线73低压712电杆713电塔714不依比例7142依比例7141网状模型基本特征:结点数据之间没有明确的从属关系,一个结点可与其它多个结点建立联系,即结点之间的联系是任意的,任何两个结点之间都能发生联系,可表示多对多的关系。用网络数据模型描述复杂关系

网络模型用连接指令或指针来确定数据间的显式连接关系,是具有多对多类型的数据组织方式。系名土木系教师数学生数研究生系名管理系教师数49学生数257研究生71学校名称工程学院系名测绘系教师数52学生数300研究生70系名教师数学生数研究生系名教师数学生数学号002312姓名杨乐年级3籍贯广东系名教师数学生数研究生系名教师数学生数教师号12姓名梁欣年龄28职称助教系名教师数学生数研究生系名教师数学生数课程号A01课程名GIS周学时4学分5系名教师数系名学号002312课程号A01网络数据模型特点优点:能明确而方便地表示数据间的复杂关系数据冗余小缺陷:网状结构的复杂,增加了用户查询和定位的困难。需要存储数据间联系的指针,使得数据量增大数据的修改不方便(指针必须修改)关系数据模型关系模型的数据结构为满足一定条件的二维表,表具有固定的列数和任意的行数,在数学上称为“关系”;二维表是同类实体的各种属性的集合,每个实体对应于表中的一行,在关系中称为元组,通常称为一条记录;表中的列表示属性,称为域,相当于通常记录中的一个数据项。若二维表中有n个域,则每一行叫做一个n元组,这样的关系称为n度(元)关系;表的行对应于对象的实例,各个表的行列交点就用来存贮简单值。满足一定条件的规范化关系的集合,就构成了关系模型。基于关系模型的数据库——关系型数据库目前的GIS中一般都是采用关系型数据库存储、管理属性数据以表为基础:行(Record,记录)列(Field,属性、数据项、字段、关键字段

)字段类型:(数值型、字符型、日期型、逻辑型…)CODELANDUSEFARDENSITYGREENHEIGHTA3-1G120.000.000.000.00A3-2C250.8025.0030.0015.00A3-3C250.8025.0030.0015.00A3-4C410.000.000.0012.00A3-5C250.8025.0030.0015.00房屋表和道路表房号性质楼层数结构建筑年代20私房7砖198629公房12砼2001编号等级路面材料宽度车道数建筑年代3021水泥12419862012沥青1662001ⅠⅡ123456abcdefgM用关系模型表示地理实体地理实体——多边形关系:M(Ⅰ,Ⅱ)多边形——边关系:Ⅰ(a,b,c,d)Ⅱ(e,f,g,c)边——结点关系:a(V1,V2)、b(V2,V3)、c(V3,V4)、d(V1,V4)、e(V1,V5)、f(V5,V6))、g(V6,V4)ⅠabcdⅡefgc

a12b23c34d14e35f56g64MⅠMⅡ关系模型的进一步发展RDBMS的现状是理论和技术都非常完善和成熟,基本上占据了全部传统应用领域和90%以上的非传统应用领域非结构化大型对象的引进

多媒体——如文本数据、图象数据、静止的视频片断、全动感的视频信息、声音波形等等,需要用关系数据库存储和管理这类非结构化数据DEC公司于1981年就引进能存贮变长字符串和二进制数据的概念,目前一些大型的RDBMS(如Oracle等)中,增加了大型对象这种数据类型。数据从等长转为变长分布式数据库70年代以来计算机网络迅速发展,在地理上分散的公司、团体和组织对于数据库更为广泛的应用,产生了分布式数据库系统分布式数据库系统是数据库和网络两者有机结合的结果。比如,全省各院校可以把招生的情况存放在各自的招生办,省招生办可以通过网络随时查询统计各校数据。对象特性的融入

为了迎接面向对象数据库在非传统应用领域对关系数据库提出的挑战,确保关系数据库在数据库领域的霸主地位,关系数据库巨头Oracle、Sybase、DB2、Informix都在积极努力,使自己的关系型产品增加一些面向对象的成分。面向对象模型面向对象的基本概念是在上世纪70年代萌发,它的基本做法是把系统工程中的某个模块和构件视为问题空间的一个或一类对象。80年代,面向对象的方法得到很快发展,在系统工程、计算机、人工智能等领域获得了广泛应用。90年代,人们在更高级的层次上和更广泛的领域内对面向对象的方法进行研究面向对象的概念基本思想基本概念对象:含有数据和操作方法的独立模块类:共享同一属性和方法集的所有对象的集合构成类。消息:对对象进行操作的请求方法:对对象的所有操作地理对象属性—数据行为—方法类实例1实例2对象1对象2请求和协作消息面向对象的特性和核心技术

面向对象方法的特性抽象性、封装性、多态性面向对象方法的核心技术分类、概括、聚集、联合现实世界抽象对象1对象n对象2面向对象数据模型的核心工具继承为面向对象方法所独有,服务于概括。在继承体系中,子类的属性和方法依赖父类的属性和方法。传播是一种作用于聚集和联合的工具,用于描述复合对象或集合对象对成员对象的依赖性并获

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论