第四章空间数据库.ppt_第1页
第四章空间数据库.ppt_第2页
第四章空间数据库.ppt_第3页
第四章空间数据库.ppt_第4页
第四章空间数据库.ppt_第5页
免费预览已结束,剩余69页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

主讲人:赵萍,合肥工业大学资源与环境工程学院Email:njuzhpQQ:526091899,第四章空间数据库,主要内容,本章重点:空间数据库概念、构造的原理、模型和方法,数据库是一个信息系统的基本且重要的组成部分,是以一定的组织方式存储在一起的相互关联的数据集合。数据库系统的构成数据库存储系统:按照一定的结构组织在一起的相关数据的集合数据库管理系统:数据库建立、使用和管理的软件系统数据库应用系统:对数据库访问和操作的应用软件,满足用户要求作用:数据存储与管理辅助用户的空间分析与决策要求:高效关键:数据模型,第一节空间数据库概述,一、空间数据库的概念,空间数据文件存储管理:空间数据以操作系统的文件形式保存在计算机中。,特点:一个GIS软件可以同时直接使用多个空间数据文件,一个空间数据文件也可同时为多个GIS软件共享;但空间数据存储在不同的文件里造成数据是面向应用的,多个文件之间彼此孤立,不能反映数据间的联系,易造成数据的冗余和不一致性等问题。,空间数据库存储管理,空间数据库主要是为GIS提供空间数据的存储和管理方法。空间数据的存储和管理通常有两种方式:,空间数据库系统也是由三部分构成,所不同的是研究对象为空间数据。,空间数据库系统的构成,空间数据库:是地理信息系统在计算机物理存储介质上存储的与应用相关的地理空间数据的总和,一般是以一系列特定结构的文件的形式组织在存储介质之上的。空间数据库管理系统:指能够对物理介质上存储的地理空间数据进行语义和逻辑上的定义,提供必需的空间数据查询和存取功能,以及能够对空间数据进行有效的维护和更新的一套软件系统。空间数据库应用系统:地理信息系统的应用软件部分,如GIS的空间分析模型和应用模型等。,空间数据库的特点:数据量特别大;不仅有地理要素的属性数据(与一般数据库中的数据性质相似),还有大量的空间数据,即描述地理要素空间分布位置的数据,并且这两种数据之间具有不可分割的联系;数据应用广泛,例如地理研究、环境保护、土地利用与规划、资源开发、生态环境、市政管理、道路建设等。,初级管理模式混合管理模式扩展式管理模式集成式管理模式,空间数据管理实现方式的发展,初级管理模式基于文件的管理方法,其空间分析功能和属性处理功能分别直接调用空间数据文件和属性数据文件进行处理。代表:ArcInfo的Coverage文件管理模式。,混合管理模式其空间分析功能调用空间数据库管理模块对空间数据文件进行处理,属性数据使用属性数据库进行管理。代表:ArcInfo、ArcView的shape文件和MapInfo的.TAB文件等管理模式,扩展式管理模式在常规数据库管理系统之上添加一层空间数据库引擎,以获得常规数据库管理系统功能之外的空间数据存储和管理能力。代表:ArcInfo的Geodatabase(SDE)。,集成式管理模式直接对常规数据库管理系统进行功能扩展,加入一定数量的空间数据存储和管理功能。代表:OracleSpatialCartridge(对象关系数据库)。,空间数据库的设计,其实质是将地理空间实体以一定的组织形式在数据库系统中加以表达的过程,也就是GIS中的空间实体建立数据模型的过程。空间数据库设计空间数据的模型化(一)设计过程和步骤,二、空间数据库的设计,(二)空间数据库设计的原则和技术方法设计原则较少的冗余量稳定和灵活的数据结构高效的访问和查询能反映空间数据间的复杂性较强的应用适应性,设计技术数据设计者使用的设计工具,其中包括各种算法、文本化方法、用户组织的图形表示法、各种转化规则、数据库定义的方法及编程技术。设计技术分为两类:数据分析技术和技术设计技术,两类技术所处理的是两类不同的问题。,(一)空间数据库的实现建立空间数据结构装入试验数据进行测试装入实际数据调试运行(二)空间数据库的运行与维护维护空间数据库的安全性和完整性测试并改善数据库性能增加新的功能修改错误,三、空间数据库的实现和维护,第二节空间数据库概念模型设计,概念模型设计阶段要产生反映GIS需求的数据库概念模型。概念模型是对错综复杂的现实世界的认识与抽象,是关于实体及实体间联系的抽象概念集。普遍采用的概念模型是:语义数据模型面向对象数据模型,语义模型的模型结构是由若干种抽象所组成,用这些抽象来描述空间实体的基本语义特征,再根据语义模型结构规则把这些抽象有机地组织起来形成模型。最常用的语义模型之一是实体联系模型(E-R模型),可以通过E-R图的图示方法进行设计。E-R模型由三部分组成:实体:实体是对客观存在的起独立作用的客体的一种抽象。在E-R图中用矩形符号表示,实体名标注于矩形符号内。联系:联系是客体间有意义的相互作用或对应关系,分为1:1、1:N、M:N三种类型。用菱形符号表示,实体和联系之间用线段连接并注明连接类型。属性:属性是对实体和联系特征的描述。用椭圆表示,椭圆中标注属性名称,属性同实体和联系之间也用线段连接。,一、语义数据模型,优点:接近人的思想,易于理解,同时,与计算机的具体实现无关,是一种很好的概念设计模型,但不能在数据库中直接实现。,采用E-R模型进行数据库概念设计的三个步骤:设计局部E-R模型:完成局部结构范围的确定,定义属性、实体和联系,以及属性的分配。设计全局E-R模型:将所有局部的E-R图综合成单一的全局的E-R图。全局E-R模型的优化:达到三个目的(实体类型个数尽可能少,实体类型所含的属性尽可能少,实体类型间联系无冗余)具体有以下优化方式:通过实体类型的合并来实现冗余属性的消除冗余联系的消除,(一)基本概念对象:是对客观世界实体的抽象描述,由数据和对数据的操作组合而成,具有封装性、继承性、多态性等。如:一个城市、一条河流具有一个唯一的标识,以表明其存在的独立性;具有一组描述特征的属性,以表明其在某一时刻的状态静态属性数据,通过域来描述,可称为私有存储单元;具有一组表示行为的操作方法,用以改变对象的状态。-作用、功能函数、方法。将方法与数据放于一对象中,以使对数据的操作只可通过该对象本身的方法来进行。即将对象的状态及其操作集成化,使之不受外界影响,具有封装性。,二、面向对象的数据模型,消息:是对象之间通信的手段,用来指示接收消息的对象的操作。分为:公有消息:可由其他对象向它发送的消息。私有消息:由它自己向自身发送的消息。类和实例:类:是对多个相似对象共同特性的描述。共享同一属性和方法集的所有对象的集合构成类。实例:是由一特定类描述的具体对象。类和实例之间是抽象和具体的关系,实例是某类的一个具体对象,类是多个实例的抽象综合。,(二)继承及类之间的层次关系继承:是一种现实世界中对象之间独特的关系,它使得某类对象可以得到另一类对象的特征和能力。如饭店子类从建筑物类继承地址、建筑日期等属性。继承性具有双重作用:一是减少代码冗余;二是通过协调性来减少相互之间的接口和界面。继承从对象类的数量上看可分为分单继承(子类仅有一个直接的父类)和多继承(允许多于一个直接父类)两种。类的层次结构:是引入类的继承关系而产生的,被继承的类称为超类(基类),继承其他类的类称为子类(派生类),(三)功能重载和多态性面向对象系统中消息传递的实现是以重载和多态为支撑概念的,也可以说,重载和多态概念是消息传递模式的自然体现。功能重载:实际上意味着特定的函数不仅以名称来区分,而且用它所带的参数来区别。多态:是指同一个消息可以根据发送消息对象的不同采用多种不同的行为方式。,(四)概括和聚集概括:概括是把一组具有相同持征和操作的对象归纳在一个更一般的超类中。聚集:聚集反映了嵌套对象的概念,嵌套对象是由一些其他对象组成的,它是用来描述更高层次对象的一种形式。即把几个不同性质类的对象组合成一个更高级的复合对象的过程。,运用面向对象的概念和方法就可以建立起GIS中空间数据库的对象数据模型。如OpenGIS协会推荐的空间对象数据模型:,(五)空间数据库对象模型,ORM即对象角色建模(ObjectRoleModeling),是运用面向对象的原理进行数据库概念建模的软件工程方法。它提供了概念性的、易于理解的模型化数据的技术。该方法使用用户和设计人员都能够理解的直观符号和自然语言事实来说明应用领域的对象。该方法还提供了一组全面的约束来表达业务规则。ORM图是用图形符号的形式表现对象角色建模的结果。它用对象类型和谓词来表达一个事实。,(六)ORM图,对象类型:表示实际对象或概念的类型,必须以大写字母开头的英文名词的形式出现,必须具有唯一的定义,且在模型范围内只能被定义一次。对象类型有两类:实体对象类型:是由实际事物组成的对象类型。在图中用实线椭圆表示。值对象类型:是由数字或字符串组成的数字类型,一般用于说明实体对象类型。在图中用虚线椭圆表示。谓词:是描述由对象类型扮演的角色的事实的一部分。每一谓词都分为若干角色,在ORM图中,表示为一个或多个角色框的序列。约束:是一种规则,用来规定数据的关系,唯一性约束用双向箭头表示,强制性约束用圆点表示。ORM图可以表达子类型的关系。,第三节空间数据库逻辑模型设计,数据库逻辑设计的任务是把数据库概念设计阶段产生的概念数据库模式变换为逻辑数据库模式,即适应于某种特定数据库管理系统所支持的逻辑模型。传统的数据模型层次模型网状模型关系模型,一、层次模型概念:层次模型是以记录类型为结点的有向树或森林,能很好地表达1:N的关系。主要特点:除根结点外,任何结点都有且只有一个“父亲”;“父”结点表示的实体与“子”结点表示的实体是一对多的关系。,层次模型反映了实体之间的层次关系,简单、直观,易于理解,并在一定程度上支持数据的重构。,层次模型用于GIS地理数据库的局限性很难描述复杂的地理实体之间的联系,描述多对多的关系时导致物理存储上的冗余;对任何对象的查询都必须从层次结构的根结点开始,低层次对象的查询效率很低,很难进行反向查询;数据独立性较差,数据更新涉及许多指针,插入和删除操作比较复杂,父结点的删除意味着其下层所有子结点均被删除;层次命令具有过程式性质,要求用户了解数据的物理结构,并在数据操纵命令中显式地给出数据的存取路径;基本不具备演绎功能和操作代数基础。,二、网状模型概念:网状模型将数据组织成有向图结构(系结构),图中的结点代表数据记录,连线描述不同结点数据间的联系。特点:可以有一个以上的结点没有“父”结点;至少有一个结点有多于一个“父”结点;结点之间可以有多种联系;可以存在回路。,网状模型反映地理世界中常见的多对多关系,支持数据重构,具有一定的数据独立和数据共享特性,且运行效率较高。,网状模型用于GIS地理数据库的局限性由于网状结构的复杂性,增加了用户查询的定位困难,要求用户熟悉数据的逻辑结构,知道自己所处的位置;网状数据操作命令具有过程式性质,存在与层次模型相同的问题;不直接支持对于层次结构的表达;基本不具备演绎功能和操作代数基础。,三、关系模型关系数据模型是把数据的逻辑结构归结为满足一定条件的二维表格,每个二维表格称为一个关系。关系模型以记录组或数据表的形式组织数据,便于利用各种地理实体与属性之间的关系进行存储和变换,不分层也无指针,是建立空间数据和属性数据之间关系的一种非常有效的数据组织方法。,(一)关系数据模型的基本概念,关系:是一个二维表,表的每行对应一个元组,表的每列对应一个域。由于域可以相同,为了加以区分,为每列起一个名字,称为属性。关键字:关系中的某一属性组,若它的值唯一地标识了一个元组,则称该属性组为候选关键字。若一个关系中有多个候选关键字,则选定一个为主关键字,该关键字的属性称为主属性,其余的为非主属性。关系模式:关系的描述。包括关系名,属性名,属性向域的映射及属性间的依赖关系等。通常记为R(A1,A2,An),R为关系名,A1,A2,An为属性名。一个关系模式确定了这个关系的二维表的框架。关系数据库:一系列关系的集合构成了一个关系的数据库。,关系数据模型的基本概念,关系完整性:指关系的正确性、相容性和有效性。它是给定的关系模型中数据及其联系的所有制约和依存规则,用以限定数据库状态及状态变化,从而保证数据的正确、相容和有效。实体完整性:设属性A是基本关系R的主关键字组成部分,则属性A不能取空值(“不知道”和“无意义”的值)。参照完整性:若基本关系R中含有与另一个基本关系S的主关键字K相对应的属性值F(此时F称为R的外部关键字),则对于R中每个元组在F上的值必须为空或等于S中某个元组的主关键值。用户定义完整性:由应用环境决定,并针对某一具体数据库的约束条件必须满足的规则。实则是反映了某一具体应用所涉及的数据必须满足的语义要求。,地图,线,多边形,点,关系模型用于GIS地理数据库的局限性,在GIS分析中,常常需要综合运用实体之间的空间关系和属性数据,要求GIS数据库能对实体的属性数据和空间数据进行综合管理。,找离火车站最近的汽车站?,空间数据库,空间计算,距离最近的汽车站,检索,检索,GIS分析,无法用递归和嵌套的方式来描述复杂关系的层次和网状结构,模拟和操作复杂地理对象的能力较弱;用关系模型描述本身具有复杂结构和涵义的地理对象时,需对地理实体进行不自然的分解,导致存储模式、查询途径及操作等方面均显得语义不甚合理;由于概念模式和存储模式的相互独立性,及实现关系之间的联系需要执行系统开销较大的联接操作,运行效率不够高。空间数据通常是变长的,而一般RDBMS只允许记录的长度设定为固定长度,此外,通用DBMS难于存储和维护空间数据的拓扑关系。一般RDBMS都难以实现对空间数据的关联、连通、包含、叠加等基本操作。,一般DBMS不能支持GIS需要的一些复杂图形功能。一般RDBMS难以支持复杂的地理信息,因为单个地理实体的表达需要多个文件、多条记录,包括大地网、特征坐标、拓扑关系、属性数据和非空间专题属性等方面信息。GIS管理的是具有高度内部联系的数据,为了保证地理数据库的完整性,需要复杂的安全维护系统,而这些完整性约束条件必须与空间数据一起存储,由地理数据库来维护系统数据的完整性。否则,一条记录的改变会导致错误、相互矛盾的数据存在,而一般RDBMS难以实现这一功能。,(二)E-R图向关系数据模型的转换一个实体类型转换成一个关系模式,实体的属性就是关系的属性,实体的关键字就是关系的关键字;一个联系类型转换成一个关系模式,参与该联系的各实体的关键字以及联系的属性转换成关系的属性。该关系的关键字有三种可能:联系类型为1:1,则每个实体的关键字均是该关系的候选关键字联系类型为1:N,则关系的关键字为N端实体的关键字联系类型为M:N,则关系的关键字为各实体的关键字的组合,第四节空间数据库的物理设计,一、空间数据库物理设计的概念从一个满足用户信息需求的、已确定的逻辑数据结构(逻辑模型)出发,研制出一个有效的、可实现的物理数据库结构。二、空间数据库物理设计的步骤结构设计:将数据库逻辑设计的模型映射为关系数据库的物理结构,包括存储记录的格式设计、存储方法设计、访问方法设计等约束设计:设计建立数据库完整性和安全性措施应用设计:包括查询设计、人机界面设计、输入/输出格式的设计、代码设计、处理加工设计等,空间数据库物理模型简化示例,第五节空间数据查询,空间数据的查询是指根据用户要求,从空间数据库中找出符合用户要求的空间数据子集,供用户进一步处理,是GIS空间数据库的主要功能之一。简单查询:根据鼠标位置查找空间实体及其属性,或根据属性记录查找对应的空间实体。复杂查询:针对空间关系的查询这对非空间属性的查询结合空间关系和非空间属性的查询,一、空间关系查询类型,空间关系查询主要是对空间实体间存在的拓扑、顺序、距离、方位等的查询。简单的点、线、面实体相互关系的查询包括:点-点查询:查询距离某个点实体一定范围内的其他点实体;线-点查询:查询距离某个线实体一定范围的点实体;面-点查询:查询某个面实体范围内的点实体;点-线查询:查询距离某个点实体一定范围内的线实体;线-线查询:查询与某个线实体相连的其他线实体;面-线查询:查询经过某个面实体的线实体;点-面查询:查询某点实体被包含在哪个面实体的内部;线-面查询:查询某线实体经过的面实体;面-面查询:查询与某面实体相邻的其他面实体。,二、属性数据查询利用SQL(结构化查询语言),可以在属性数据中方便地实现多种条件的组合查询,找出满足条件的空间实体。三、空间属性联合查询分步骤借助于单独的空间关系查询和属性查询来实现。,四、空间查询语言,空间数据库查询语言是指从空间数据库中查找出所有满足空间约束条件和属性约束条件的地理实体的算法语言。需要对SQL进行空间扩展,空间扩展的SQL可以采用SQL的基本语法形式,并在查询条件中加入空间约束条件的算子。空间扩展的SQL目前还没有统一标准,空间关系的谓词也没有规范化,通常有相邻“Adjacent”或“Touch”,包含“Contain”,穿过“Cross”,包含于“Inside”或“Within”,缓冲区“Buffer”等。Eg:SELECT*FROMCity,ProvinceWHERECity.objWITHINPronvice.objANDProvince.Name=“江苏省”,第六节空间数据库索引,空间索引的概念:它是依据空间实体的位置和形状或空间实体之间某种空间关系按一定的顺序排列的一种数据结构,其中包含空间实体的概略信息,如标识码、最小外接矩形及存储地址。空间索引的作用:作为一种辅助性的空间数据结构,空间索引介于空间操作算法和空间实体之间,它通过筛选把大量与特定空间操作无关的空间实体排除,从而提高空间操作速度和效率。常见的空间索引范围索引格网空间索引四叉树空间索引,一、范围索引,即在记录每个空间实体的坐标时,同时记录每个空间实体的最大和最小坐标。范围索引并没有建立真正的空间索引结构,只是在空间实体的数据中增加了最大和最小坐标项,主要依靠空间计算来进行判别,仍然要对整个数据库的空间实体进行检索,需花费大量的查询时间。,二、格网空间索引,即将区域划分成大小相等的网格,记录每个网格内所包含的空间实体在数据库中的地址。,三、四叉树空间索引,即将区域进行若干层次的划分,每个层次的划分是将上一层次划分得到的每个区域分成四个相等的子区域,判定空间实体包含在哪一层次的哪一个子区域中,则用子区域的编码来记录空间实体,这样就形成一个四叉树的空间划分。四叉树空间索引与格网空间索引相比,其结构灵活、效率更高。,第七节空间元数据,一、元数据及其作用元数据Metadata:“meta”是一希腊语词根,意思是“改变”,“Metadata”一词的原意是关于数据变化的描述。一般都认为元数据就是“关于数据的数据”,反映了某项数据自身的一些特征。空间元数据:是指在空间数据库中用于描述空间数据的内容、质量、表示方法、空间参考和管理方式等特征的数据,是实现地理空间信息共享的核心标准之一。,元数据的内容对数据集中各数据项、数据来源、数据所有者及数据生产历史等的说明对数据质量的描述,如数据精度、数据的逻辑一致性、数据完整性、分辨率、源数据的比例尺等对数据处理信息的说明,如量纲的转换等数据转换方法的描述对数据库的更新、集成方法等的说明,现有空间元数据的标准,空间元数据的主要作用帮助数据生产单位有效地管理和维护空间数据,建立数据文档;提供有关数据生产单位数据存储、数据分类、数据内容、数据质量、数据交换网络及数据销售等方面的信息,便于用户查询检索地理空间数据;提供通过网络对数据进行查询检索的方法或途径,以及与数据交换和传输有关的辅助信息;帮助用户了解数据,以便就数据是否能满足其需求作出正确的判断;提供有关信息,以便用户处理和转换有用的数据。帮助空间数据的使用者查询所需的空间信息,进行空间数据的共享,并进一步处理空间数据。,二、元数据实例,第八节空间数据库引擎,一、概述将GIS的空间数据存储在关系数据库中是当前主要的空间数据库解决方案,但常规的RDMBS都不直接提供GIS的空间数据类型的存储功能。如何使常规的关系数据库支持GIS空间数据类型的存储和空间操作功能?空间数据库引擎(SDE)是在GIS应用软件和关系型空间数据库之间建立的一个中间层,由它为GIS应用软件提供在关系数据库里存储、存取、查询和分析空间数据的相应功能。,二、空间数据库引擎的工作原理,(一)SDE的体系结构,(二)SDE的访问模式GIS用户的应用程序通过SDE的应用编程接口(API)向SDE服务器提出空间数据访问请求,SDE服务器依据空间对象的特点在存储空间数据的关系数据库中完成空间数据的搜索,通常采用SQL方式进行,并将搜索结果向GIS用户的应用程序返回。SDE可以提供对空间、非空间数据进行高效率操作的数据库服务。,(三)SDE支持的空间数据类型矢量数据:点、线、多边形等栅格数据(包括DEM)通常一个空间数据对象可以分别存储在三个关系表中,同一空间对象在三个表里的记录用一个共同的要素ID编码联系。要素表:存储空间对象的坐标数据索引表:存储空间对象的空间索引属性表:存储空间对象的属性数据,第九节空间时态数据库,一、概述从GIS的角度观察,时间在逻辑上可以是一条没有端点、向过去和未来无限延伸的坐标轴时间轴,在每一设定的时间分辨率的坐标点上都可以扩展其三维空间的数据。时间是现实世界的第四维,除了具有与

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论