《GIS数据建模》PPT课件.ppt_第1页
《GIS数据建模》PPT课件.ppt_第2页
《GIS数据建模》PPT课件.ppt_第3页
《GIS数据建模》PPT课件.ppt_第4页
《GIS数据建模》PPT课件.ppt_第5页
已阅读5页,还剩227页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、GIS数据建模,2020/8/21,2,引言,模型GIS主要的研究内容 GIS主要包括对地理现象和过程等客体的特征描述、关系分析和过程模拟等内容。这些内容在地理信息系统的软件工具、数据库系统和应用系统研究中往往被抽象、概括为数据结构的定义、数据模型的建立及专业应用模型的构建等主要理论与技术问题。它们共同构成地理信息系统基础研究的主要内容。,2020/8/21,3,引言,所有的GIS系统都为它所要描述的世界建立了模型: 数据建模:描述了组织数据的框架结构。 如:楼房住户-数据;房间规格和排列-数据模型 数据建模最后发展成为数据的存储方式(数据字典 中的定义) 应用建模:用户的最终需求。 业务功能

2、建模最后发展成为应用模型。 产生高效的应用模型的前提是良好的数据模型。(正如10 平米的房间无法成为会议厅一样,一个糟糕的数据模型也无法产生高质量的应用。,2020/8/21,4,数据建模主要内容,数据模型概述 概念模型 逻辑模型 地理数据模型,2020/8/21,5,建立空间数据模型的目的,是揭示空间实体的本质特性,并对其进行抽象化,使之转化为计算机能够接受和处理的数据形式。 在地理信息系统研究中,空间数据模型就是对空间实体进行描述和表达的数学手段,使之能反映客体的某些结构特性和行为功能。,1 数据模型概述,2020/8/21,6,1 数据模型概述,数据模型:是对现实世界各种事物特征的数据化

3、的描述和抽象。 对事物的数据描述通常包括静态的属性描述和动态的行为描述。 静态属性包括:数据结构和对数据的约束; 动态特性包括:对静态属性数据的操作方法。,2020/8/21,7,数据建模过程,存在于人脑之外的客观存在的事物及其相互联系。,是现实世界在人们头脑中的反映,人们用文字、图形和符号等表示它们,构成信息世界,由于计算机只能处理数据化的信息,所以对信息世界中的信息必须进行数据化,数据化后的信息称为数据,2020/8/21,8,2020/8/21,9,数据建模过程,2020/8/21,10,数据模型概述,在数据库中用数据模型这个工具来抽象、表示和处理现实世界中的数据和信息。 在数据库系统中

4、针对不同的使用对象和应用目的,采用不同的数据模型。 概念模型 逻辑模型,2020/8/21,11,现实世界的事物经过人脑的抽象加工,提取出对用户有用的信息,经过组织整理加工形成介于现实世界和计算机世界之间的中间模型; 概念数据模型可以自然地反映现实世界的事物和事物之间的联系,是面向用户的数据模型,是易于人们观察和理解的数据模型。 概念数据模型着重表示数据的语义,而不注重数据的组织结构,它是建立在逻辑数据模型之上的、更高一层的数据模型。它是对现实世界的第一层抽象,是独立于计算机系统的数据模型,不涉及信息在计算机内如何表示。,概念模型(Conceptual Data Model),2020/8/2

5、1,12,概念模型(Conceptual Data Model),CDM是系统分析员、程序设计员、维护人员、用户之间相互理解的共同语言; CDM能使数据库的设计人员在设计的初始阶段摆脱计算机系统及DBMS的具体技术问题,集中精力分析数据、数据之间的联系; 概念模型必须转换成逻辑模型,才能在DBMS中实现; 最常用的概念模型是E-R模型,2020/8/21,13,LDM是对数据及数据之间逻辑联系的描述,是用户从数据库所看到的数据模型; 按计算机的观点对数据建模。逻辑数据模型着重于描述数据的组织结构,很少考虑数据的语义和用户对数据的理解,它们最关心的是提供一致的、高效的数据存放的物理结构和信息结构

6、,提高数据存取和检索的速度。 逻辑数据模型是直接面向数据库的逻辑结构和DBMS的,它是现实世界的第二层次的抽象,这类模型涉及到计算机系统和数据库管理系统,又称为“基本数据模型”。如层次、网状和关系数据模型等。,逻辑模型(Logical Data Model),2020/8/21,14,是数据特征的抽象,从抽象的层次上描述了系统的静态特征、动态行为和约束条件。 是具体的DBMS所支持的数据模型(网状/层次 /关系/面向对象); 一般的DBMS支持一种LDM(特殊的DBMS支持多种LDM),逻辑模型(Logical Data Model),2020/8/21,15,按用户的观点来对信息建模。用于组

7、织信息世界的概念,表现从现实世界中抽象出来的事物以及它们之间的联系。这类模型强调其语义表达能力,概念简单、清晰,易于用户理解。它是现实世界到信息世界的抽象,是用户与数据库设计人员之间进行交流的语言。 如E-R模型。,2 概念数据模型,2020/8/21,16,传统的非空间数据库的建模内容及如何建模。 空间数据库或GIS的建模内容: 有关地理要素的形状和位置、与地理要素有关的属性信息及要素间的空间关系等信息。 概念模型的核心问题?,2 概念数据模型,2020/8/21,17,空间实体的抽象,实体是点、线、面、体多种要素的复杂组合。空间对象一般按地形维数进行归类划分 点:零维 线:一维 面:二维

8、体:三维 时间:通常以第四维表达,但目前GIS还很难处理时间属性。,2020/8/21,18,点实体,有位置,无宽度和长度; 抽象的点,美国佛罗里达洲地震监测站2002年9月该洲可能的500个地震位置,2020/8/21,19,线实体,有长度,但无宽度和高度 用来描述线状实体,通常在网络分析中使用较多 度量实体距离,香港城市道路网分布,2020/8/21,20,面实体,具有长和宽的目标 通常用来表示自然或人工的封闭多边形地物 一般分为连续面和不连续面,中国土地利用分布图(不连续面),2020/8/21,21,空间对象:面(续),连续变化曲面:如地形起伏,整个曲面在空间上曲率变化连续。,不连续变

9、化曲面,如土壤、森林、草原、土地利用等,属性变化发生在边界上,面的内部是同质的。,2020/8/21,22,空间对象:体,有长、宽、高的目标 通常用来表示人工或自然的三维目标,如建筑、矿体等三维目标,香港理工大学校园建筑,2020/8/21,23,现实世界的各种现象比较复杂,往往由简单实体组合而成,例如: 住宅小区 城市,复杂实体,2020/8/21,24,实体抽象的主观性,应用决定建模方式 河流 线实体? 面实体? 随着应用目的的不同,坐标系统的比例尺缩小时,部分的体、面、线实体均可能变为点实体。,2020/8/21,25,实体空间结构,线可以视为由点组成,面可由作为边界的线所包围而形成,体

10、又可以由面所包围而形成,可见四类空间实体之间存在着内在的联系,只是在构成上属于不同的层次。 随着观察这些实体的坐标系统的维数、视角及比例尺的变化,实体之间的关系和内容可能按照一定的规律相互转化。 例如,由三维坐标系统变为二维坐标系统后,比如通过地图投影,空间体可变成面,面可以部分地变成线,线可以部分地变成点,视角变化之后,也将使某些客体发生变化。坐标系统的比例尺缩小时,部分的体、面、线客体均可能变为点客体。,2020/8/21,26,空间实体描述,对空间实体的描述有5种内容: 即识别码、位置、实体特征、实体的角色、行为或功能以及实体的空间特性。,2020/8/21,27,识别码:用于区别同类而

11、又不同的实体。 位置:可用坐标描述也可用其它形式。 空间特征:也是位置信息的一种,如维数、类型及实体的组合等。 实体的行为和功能:是指在数据采集过程中不仅要重视实体的静态描述,还要收集那些动态的变化,如岛屿的侵蚀、水体污染的扩散、建筑的变形等。,续-,2020/8/21,28,实体之间的关系,所有地理现象和地理过程中的各种空间实体并非孤立存在,而是具有各种复杂的联系。这些联系可以从空间实体的空间、时间和属性三个方面加以考察。,2020/8/21,29,实体之间的关系,实体间的空间联系大体上可以分解为空间位置、空间分布、空间形态、空间关系、空间相关、空间统计、空间趋势、空间对比和空间运动等等联系

12、形式。 空间位置描述的是空间实体个体的定位信息; 空间分布是描述空间实体的群体定位信息,且通常能够从空间概率、空间结构、空间聚类、离散度和空间延展等方面予以描述; 空间形态反映空间实体的形状和结构; 空间关系是基于位置和形态的实体关系;,2020/8/21,30,实体之间的关系,空间相关是空间客体基于属性数据上的关系; 空间统计描述空间客体的数量、质量信息,又称为空间计量; 空间趋势反映客体空间分布的总体变化规律; 空间对比可以体现在数量、质最和形态三个方面; 空间运动则反映空间客体随时间的迁移或变化。 以上种种空间信息基本上反映了空间分析所能揭示的信息内涵,彼此互有区别又有联系。,2020/

13、8/21,31,空间实体的空间关系,地图、遥感影象上的空间关系是通过图形识别的,在GIS中的空间关系则必须显式的进行定义和表达。 空间关系的描述多种多样,目前尚未有具体的标准和固定的格式,但基本原理一致。不同的GIS可能采用不同的方法进行描述。,2020/8/21,32,空间对象的拓扑空间关系,拓扑元素: 点:孤立点、线的端点、面的首尾点、链的连接点 线:两结点之间的有序弧段 面:若干弧段组成的多边形 基本拓扑关系 关联:不同拓扑元素之间的关系 邻接:相同拓扑元素之间的关系 包含:面与其他元素之间的关系 点、线、面之间的拓扑关系,2020/8/21,33,2020/8/21,34,空间实体的空

14、间关系-拓扑关系,2020/8/21,35,方向关系:地理实体在空间中的相互方位和排列顺序。 描述空间实体的方向关系,对于点状空间实体只要计算两点之间的连线与某一基准方向的夹角即可,该夹角称为连线的方位角。基准方向通常有真子午线方向、磁子午线方向和坐标纵线方向三种。 计算点线、点面、线线、线面以及面面方向关系时比较麻烦。,空间实体的空间关系-方向关系,2020/8/21,36,度量空间关系主要是指空间对象之间的距离关系。 这种距离关系可以定量地描述为特定空间中的某种距离,如A实体距离B实体100m。也可以应用与距离概念相关的术语,如远近等进行定性的描述。 距离分为欧氏距离、棋盘距离等。,空间实

15、体的空间关系-度量关系,2020/8/21,37,距离量算,n 维匀质空间广义距离公式,j(xj, yj),i(xi, yi),i,j,i,j,距离计算公式,n 维非匀质空间距离计算,q=2,二维欧氏距离,q=1,曼哈顿距离,q=0.6,非欧氏距离,2020/8/21,38,实体之间的时间关系,实体之间的时间联系一般可以通过实体变化过程来反映。有些实体数据的变化周期很长,如地质地貌等数据随时间的变化。而有些空间数据则变化很快,需要及时更新,如土地利用数据等。实体时间信息的表达和处理构成了空间时态地理信息系统及其数据库的基本内容。,2020/8/21,39,实体之间的属性关系,实体间的属性联系主

16、要体现为属性多级分类体系中的从属关系、聚类关系和相关关系。 从属关系主要反映各实体之间的上下级和包含关系; 聚类关系是反映实体之间的相似程度及并行关系; 相关关系则反映不同类实体之间的某种直接或间接的并发或共生关系。 属性联系可以通过地理信息系统属性数据库的设计加以实现。,2020/8/21,40,空间对象的层次关系,分类对象的从属和层次关系 有明确的分类对象类别和严格的隶属关系,高压711,2020/8/21,41,空间概念模型,如何模拟:? 地图模型 遥感模型 E-R模型,2020/8/21,42,空间对象的地图模型,点:位置:(x,y) 属性:符号,线:位置: (x1,y1),(x2,y

17、2),(xn,yn) 属性:符号形状、颜色、尺寸,面:位置:(x1,y1),(x2,y2),(xi,yi),(xn,yn) 属性:符号变化 等值线,2020/8/21,43,空间对象的遥感影像模型,遥感传感器平台,传感器,2020/8/21,44,基本概念 1976年,P.S.Chen提出-模型(Entity-Relationship Model),用-图来描述概念模型。 观点:世界是由一组称作实体的基本对象和这些对象之间的联系构成的。,实体联系方法(E-R方法),2020/8/21,45,实体、属性和联系,实体(Entity) 一个实体可以是一个具体的事物,也可以是一个抽象的事物。 实体集

18、个体实体 属性 描述实体或联系的特性。属性有属性名、属性类型、属性定义域和属性值之分。,2020/8/21,46,实体、属性和联系,联系 实体之间有联系,联系反映实体间的相互关系。这种联系必然要在信息世界中进行描述。 联系集:实体间相同类型的联系也构成联系集。 联系本身也可以有描述属性。,2020/8/21,47,确定所有实体集合 用矩形方框表示实体集合,方框内标明实体集合名称; 选择实体集应包含的属性 用椭圆框表示属性,通过无向边连接到实体集。只有一个属性的实体集可用属性代替,附加到它参加的联系上; 确定实体集之间的联系 用菱形框表示,框内标明联系的名称,通过无向边连接到参加联系的每个实体集

19、合; 确定实体集的关键字 用下划线在属性上标明关键字的属性集合; 确定联系的类型 在用无向边连接联系到实体集时,在边上注明1或 n(多)来指明联系的类型。,设计E-R模型步骤,2020/8/21,48,示例,解放路,珞喻路,空间实体及其联系的ER表达,2020/8/21,49,ECR(entity-categroy-relationship-model)模型,在ER模型的基础上,如果加入实体的分类的话,则得到ECR模型,ECR模型,2020/8/21,50,E-R模型特点,有丰富的语义表达能力,能充分反映现实世界中实体和实体之间的联系,能满足用户对数据对象的处理要求。 易于交流和理解,因为它不

20、依赖于计算机系统和具体的DBMS,所以它是DBA、系统开发人员和用户之间的桥梁。,2020/8/21,51,E-R模型说明,易于修改和扩充。 易于向各种结构化数据模型转换。 实体、属性和联系这三个概念是有明确区分的,但对于某个具体的数据对象,究竟算它是实体,还是属性或联系,是相对的,这取决于应用背景和用户的观点。,2020/8/21,52,ER模型缺点,侧重于空间目标自身的描述,难于描述空间目标之间的一些重要的空间关系(如相交、穿越等)。 难于描述空间实体之间的从属、组合关系。 主要用来表达某一时刻的空间实体及其相互关系,没有考虑空间实体的时空变化,本质上是非时态的。,2020/8/21,53

21、,3 逻辑模型,从计算机实现的观点来对数据建模。是信息世界中的概念和联系在计算机世界中的表示方法。一般有严格的形式化定义,以便于在计算机上实现。 从抽象的层次上描述和模拟了系统的静态特征、动态行为和约束条件 如层次模型、网状模型、关系模型。,2020/8/21,54,数据模型的三要素,数据结构 数据操作 约束条件,2020/8/21,55,数据结构,数据结构:描述系统的静态特性,即组成数据库的对象类型。包括: 数据本身:类型、内容、性质。如网状模型中的数据项、记录,关系模型中的域、属性,关系等。 数据之间的联系:例如网状模型中的系型(Set Type) 在数据库系统中一般按数据结构的类型来命名

22、数据模型。,2020/8/21,56,数据操作,描述系统的动态特性,即对数据库中对象的实例允许执行的操作的集合,包括操作方法及操作规则。一般有检索、更新(插入、删除、修改)操作。 数据模型要定义操作含义、操作符号、操作规则,以及实现操作的语言。,2020/8/21,57,数据约束条件,数据的约束条件是完整性规则的集合,规定数据库状态及状态变化所应满足的条件,以保证数据的正确、有效、相容。 约束条件的主要目的是使数据库与它所描述的现实系统相符合。 设计时:使数据模型正确、真实、有效地反映现实 运行时:保证数据库中的数据值真实地体现现实世界的状态,2020/8/21,58,数据模型类型,层次模型

23、网状模型 关系模型 面向对象模型,2020/8/21,59,层次数据模型,层次数据模型的概念 层次数据模型数据的组织 层次数据库数据的存储 层次数据模型的特点,2020/8/21,60,层次数据模型的概念,层次数据库管理系统的典型代表产品是IBM公司的IMS(Information Management System),是世界上第一个DBMS产品。 层次数据模型是用有向树结构表示各类实体及实体间联系的数据模型。 树的每个结点表示一个记录类型,描述某类实体。 每个记录类型包含若干数据项表示实体的属性。 记录类型之间的联系用结点之间的连线(有向边)表示。 上一层记录类型和下一层记录类型的联系是1:

24、N联系。,2020/8/21,61,层次数据模型的概念,在数据库中定义满足下面两个条件的基本层次联系的集合为层次模型: 有且只有一个结点没有双亲结点,这个结点称为根结点 根以外的其他结点有且只有一个双亲结点。 层次数据模型的建模规则: 树的结点表示实体记录类型; 父结点和子结点必须是不同的实体类型; 结点之间的联系必须是一对多的联系。,2020/8/21,62,层次数据模型数据的组织,由于层次数据模型用树型结构表示实体和实体之间的联系。因此,层次数据模型便于处理一对多的实体联系,即记录类型之间的1:N联系。 层次数据模型处理记录类型之间多对多的联系,或者一个记录类型有多个双亲的情况比较麻烦,必

25、须转化为多个一对多的联系。 以矢量多边形数据的组织为例,2020/8/21,63,层次数据模型数据的组织,2020/8/21,64,层次数据库数据的存储,层次数据库不仅要存储数据本身,还要存储数据间的层次联系。常用的实现方法: 邻接法: 按照层次树前序遍历的顺序把所有记录值依次邻接存放。 链接法: 用指针来反映数据记录间的层次关系,每一个记录设立两类指针,分别指向最左边的子女和右边的兄弟。 无论采用哪种存储方法,层次数据模型数据库中查询子女结点必须通过双亲结点遍历。,2020/8/21,65,层次模型的操作和完整性约束,主要有查询和插入、删除和更新 特点 完整性约束 插入时,不能插入无双亲的子

26、女结点 删除时,删除双亲结点,也即删除了子女结点 更新所有相应记录,保证数据一致性,2020/8/21,66,层次数据模型的特点,优点: 模型简单,使用方便。 对实体间联系固定,且预先定义好的应用系统,性能较好。 提供了良好的完整性支持 对一对多层次关系描述有优势。 缺点: 数据查询和更新操作复杂,导致应用程序编写困难,难以反向查询。 难以实现系统扩充,因为数据的更新涉及许多指针。 层次命令具有过程式性质,要求用户了解数据的物理存储,并在数据操纵时显式地给出存储路径 模拟多对多关系是导致物理存储上的冗余 数据独立性差 基本上只能表示一对多关系。,2020/8/21,67,网状数据模型的概念 网

27、状数据模型数据的组织 网状数据库数据的存储 网状数据模型的特点,网状数据模型,2020/8/21,68,网状数据模型的概念,最典型的网状数据模型是美国 CODASYL (Conference On Data System Language )的数据库任务组DBTG (Data BaseTask Group)提供的网状数据模型标准化报告, 称为DBTG报告。 1977年CODASYL的DBTG 报告制定了网状数据库系统的基本术语、概念和接口的标准。,2020/8/21,69,网状数据模型的概念,有向图结构的表示 图中的每个结点表示一个实体记录类型,每个记录类型包含若干数据项表示实体的属性。 结点

28、之间的连线(有向边)表示不同记录类型之间的联系,由于任意两个不同的记录类型之间都可能有连线,甚至两个不同的记录类型之间可能有多条连线,所以必须为每条连线取一个单独的名字。 这一联系也必须是一对多的联系;即上一层记录类型和下一层记录类型的联系是1:N联系。,2020/8/21,70,网状数据模型的概念,在数据库中定义满足下面两个条件的基本层次联系的集合为网状数据模型: 允许一个以上的结点没有双亲结点; 至少有一个结点可以有多于一个的双亲结点。 网状数据模型的建模规则: 有向图的结点表示实体记录类型; 父结点和子结点必须是不同的实体类型; 父结点和子结点之间的联系必须是一对多的二元联系,每个联系要

29、有一个唯一的联系名。,2020/8/21,71,网状数据模型数据的组织,层次模型中子女结点和双亲结点的联系是唯一的,而在网状模型中这种联系可以不唯一。因此,在网状模型中要为每个联系命名,并要指出与该联系有关的双亲记录和子女记录。 在网状数据模型中,虽然每个结点可以有多个父结点,但是每个双亲记录和子女记录之间的联系只能是1:N的联系,因此,在网状数据模型中,对于M:N的联系,必须人为地增加记录类型, 把M:N的联系分解为多个1:N的二元联系。,2020/8/21,72,2020/8/21,73,网状数据库数据的存储,网状数据模型数据库存储数据的关键在于实现记录之间的联系,常用链接法,包括单向链接

30、、双向链接、环状链接等。,2020/8/21,74,网状模型的操作和完整性约束,主要有查询和插入、删除和更新 特点 完整性约束 插入时,允许插入没确定双亲结点值的子女结点值 删除时,允许只删除双亲结点值 更新时,只需要更新指定记录,2020/8/21,75,网状数据模型,优点: 可以描述多对多关系,具有良好的性能 数据存储效率高 一定程度上支持数据的重构,具有一定的共享特性,运行效率高 可以代替任何层次系统 缺点: 结构复杂,增加了用户查询的困难 数据独立性差 数据定义语言非常复杂 不直接支持对层次结构的表达,2020/8/21,76,关系数据模型,关系数据模型的基本概念 关系数据模型的数据组

31、织 关系数据模型的特点,2020/8/21,77,关系数据模型的基本概念,关系数据模型: 是由若干关系组成的集合,每个关系从结构上看实际上是一张二维表格,即把某类型的记录集合写成一张二维表,表中的每行表示一个实体对象,表的每列对应一个实体属性。这样的一张表称为一个关系。,2020/8/21,78,关系数据模型的数据组织,关系数据模型中,实体类型用关系表表示;实体类型之间的1:1和1:N的联系可以用关系表表示,也可以用属性来表示;实体类型之间的M:N的联系必须用关系表表示。 在关系数据模型中,通过外部关键字可以直接表达实体之间一对多和多对多的联系,不需要任何转换或中间环节。,2020/8/21,

32、79,关系数据模型的数据组织,2020/8/21,80,关系模型的存储结构,关系模型中,实体和实体间的联系都是用表来表示的。在数据库的物理组织中,表是以文件形式存在的,通常一个表对应一个文件,2020/8/21,81,关系模型的操作和完整性约束,主要有查询和插入、删除和修改 特点:集合操作;非过程化 完整性约束(对关系的约束) 实体完整性 参照完整性 用户定义完整性,2020/8/21,82,关系数据模型的优点,(1) 关系模型结构简单 实体和实体之间的联系都用关系表表示。 (2) 直接处理多对多的关系 通过关键字直接建立一个表中的元组与多个表中的元组之间的联系。 (3) 关系模型是面向记录集

33、合的 一次可处理一个元组的集合, 即对一个关系表的操作可产生一张新的二维关系表。 (4) 关系模型有坚实的理论基础 其理论基础是集合论与关系代数,一个关系是数学意义上的一个集合(无序、无重值)。,2020/8/21,83,(1)以记录为基础的结构不能很好地面向用户和应用。 传统数据模型基本结构是记录,而人类对现实世界的认识往往以某个事物或概念为单位,与记录不一定相对应。记录的组成往往从计算机实现的角度加以考虑,而不一定反映人们对现实世界的认识,不利于建立数据的概念模型。,传统数据模型的缺点,2020/8/21,84,(2)不能以自然的方式表示实体之间的联系。 层次和网状数据模型虽然提供了显式的

34、联系描述手段,但这些联系形式不是实间联系的自然表示,而是联系的物理实现的描述。这样就把本来应该对用户隐藏的物理实现的细节,当作数据模型的组成部分呈现在用户面前,既不自然又不便于用户理解和使用,而且也有损于数据的物理独立性。 关系数据模型虽然避免了这个缺点,实体间的联系也可以用关系来表示,但关系数据模型很难从数据模型看出实体间的联系。一个实体与哪些实体有联系,必须检查每个关系才可能知道。现实世界中的实体联系被掩盖在记录、属性之中。总之,三种传统数据模型都难以自然地表示实体间的联系,这是它们的一个主要弱点。,传统数据模型的缺点,2020/8/21,85,(3)语义贫乏。 三种传统数据模型都或多或少

35、含有一些语义,例如关系数据模型的主关键字,层次数据模型中的主从关系,网状数据模型中的系都提供了一定的语义信息。但是就总体而言,它们能够表达的语义是贫乏的。记录各个属性间的关系及其作用不够明确,这就要求用户通过文字来描述这些记录的语义,但这些文字描述又不是数据库的一部分。 此外,它们对实体间联系的语义描述,也缺少必要的手段。交互关系、从属关系、性质、组成等都是代表语义不同的联系,却用同样的记录结构表示,并且缺少描述这些联系的相应结构在语义上无法区分这些联系。,传统数据模型的缺点,2020/8/21,86,(4)数据类型太少难以满足应用需要。 传统数据模型原来都是面向事物处理的。它们一般只提供最常

36、用的一些简单数据类型,例如整数、实数、字符串等,而且不允许用户自己定义新的数据类型。但在有些应用中,希望属性值不直接给出,而是由公式、规则或过程推导而得。有时不但要知道数据的当前值,还要知道不同时间的数值。这些功能在传统数据模型中都不支持。,传统数据模型的缺点,2020/8/21,87,面向对象数据模型(Object Oriented Data Model),面向对象的基本概念 面向对象的数据模型,2020/8/21,88,基本思想和基本概念,面向对象的方法就是以接近人类通常思维方式的思想,将客观世界的一切实体模型化为对象。每一种对象都有各自的内部状态和运动规律,不同对象之间的相互联系和相互作

37、用就构成了各种不同的系统。 对象含有数据和操作方法的独立模块,可以认为是数据和行为的统一体。如一个城市、一棵树均可作为地理对象。 类共享同一属性和方法集的所有对象的集合构成类。从一组对象中抽象出公共的方法和属性,并将它们保存在一类中,是面向对象的核心内容。如河流均具有共性,如名称、长度、流域面积等,以及相同的操作方法,如查询、计算长度、求流域面积等,因而可抽象为河流类。被抽象的对象,称为实例,如长江、黄河等。 消息对对象进行操作的请求,是连接对象与外部世界的唯一通道。 方法对对象的所有操作,如对对象的数据进行操作的函数、指令、例程等。,2020/8/21,89,面向对象的特性,面向对象方法具有

38、抽象性、封装性、多态性等特性。 抽象是对现实世界的简明表示。形成对象的关键是抽象,对象是抽象思维的结果。任何一个对象都是通过抽象和概括而形成的。 封装是指将方法与数据放于一对象中,以使对数据的操作只可通过该对象本身的方法来进行。即一对象不能直接作用于另一对象的数据,对象间的通信只能通过消息来进行。对象是一个封装好的独立模块。封装是一种信息隐蔽技术,封装的目的在于将对象的使用者和对象的设计者分开,用户只能见到对象封装界面上的信息,对象内部对用户是隐蔽的。 多态是指同一消息被不同对象接收时,可解释为不同的含义。因此,可以发送更一般的消息,把实现的细节都留给接收消息的对象。即相同的操作可作用于多种类

39、型的对象,并能获得不同的结果。,2020/8/21,90,面向对象数据模型的核心技术,1、分类 类是具有相同属性结构和操作方法的对象的集合,属于同一类的对象具有相同的属性结构和操作方法。分类是把一组具有相同属性结构和操作方法的对象归纳或映射为一个公共类的过程。对象和类的关系是“实例”(instance-of)的关系。 在面向对象的数据库中,只需对每个类定义一组操作,供该类中的每个对象使用,而类中每一个对象的属性值要分别存储,因为每个对象的属性值是不完全相同的。例如,在面向对象的地理数据模型中,城镇建筑可分为行政区、商业区、住宅区、文化区等若干个类。以住宅区类而论,每栋住宅作为对象都有门牌号、地

40、址、电话号码等相同的属性结构,但具体的门牌号、地址、电话号码等是各不相同的。当然,对它们的操作方法如查询等都是相同的。,2020/8/21,91,面向对象数据模型的核心技术,2、概括 概括是把几个类中某些具有部分公共特征的属性和操作方法抽象出来,形成一个更高层次、更具一般性的超类的过程。子类和超类用来表示概括的特征,表明它们之间的关系是“即是”(isa)关系,子类是超类的一个特例。 作为构成超类的子类还可以进一步分类,一个类可能是超类的子类,同时也可能是几个子类的超类。所以,概括可能有任意多层次。例如,建筑物是住宅的超类,住宅是建筑物的子类,但如果把住宅的概括延伸到城市住宅和农村住宅,则住宅又

41、是城市住宅和农村住宅的超类。 概括技术的采用避免了说明和存储上的大量冗余,因为住宅地址、门牌号、电话号码等是“住宅”类的实例(属性),同时也是它的超类“建筑物”的实例(属性)。当然,这需要一种能自动地从超类的属性和操作中获取子类对象的属性和操作的机制。,2020/8/21,92,面向对象数据模型的核心技术,3、聚集 聚集是将几个不同类的对象组合成一个更高级的复合对象的过程。术语“复合对象”用来描述更高层次的对象,“部分”或“成分”是复合对象的组成部分,“成分”与“复合对象”的关系是“部分”(partsof)的关系,反之“复合对象”与“成分”的关系是“组成”的关系。例如,医院由医护人员、病人、门

42、诊部、住院部、道路等聚集而成。 每个不同属性的对象是复合对象的一个部分,它们有自己的属性数据和操作方法,这些是不能为复合对象所公用的,但复合对象可以从它们那里派生得到一些信息。复合对象有自己的属性值和操作,它只从具有不同属性的对象中提取部分属性值,且一般不继承子类对象的操作。这就是说,复合对象的操作与其成分的操作是不兼容的。,2020/8/21,93,面向对象数据模型的核心技术,4、联合 联合是将同一类对象中的几个具有部分相同属性值的对象组合起来,形成一个更高水平的集合对象的过程。术语“集合对象”描述由联合而构成的更高水平的对象,有联合关系的对象称为成员,“成员”与“集合对象”的关系是“成员”

43、(memberof)的关系。 在联合中,强调的是整个集合对象的特征,而忽略成员对象的具体细节。集合对象通过其成员对象产生集合数据结构,集合对象的操作由其成员对象的操作组成。 联合与概括在概念上不同。概括是对类进行抽象概括;而联合是对属于同一类的对象进行抽象联合。联合有点类似于聚集,所以在许多文献中将联合的概念附在聚集的概念中,都使用传播工具提取对象的属性值。,2020/8/21,94,面向对象的几何抽象类型,GIS中的各种地物,在几何性质方面不外乎表现为四种类型,即点状地物、线状处物、面状地物以及由它们混合组成的复杂地物,因而这四种类型可以作为GIS中各种地物类型的超类。,2020/8/21,

44、95,面向对象的属性抽象类型,GIS中的地物可根据国家分类标准或实际情况划分类型。如一个大学GIS的对象可分为建筑物、道路、绿化、管线等几大类,地物类型的每一大类又可以进一步分类,如建筑物可再分成教学楼、科研实验楼、行政办公楼、教工住宅、学生宿舍、后勤服务建筑、体育楼等子类,管线可再分为给水管道、污水管道、电信管道、供热管道、供气管道等,另一方面,几种具有相同属性和操作的类型可综合成一个超类。,2020/8/21,96,吉奥之星 中的空间对象模型,2020/8/21,97,空间数据库管理系统的实现方式,传统数据库管理系统的局限性 (1)传统数据库系统管理的是不连续的、相关性较小的数字和字符;而

45、地理信息数据是连续的,并且具有很强的空间相关性。 (2)传统数据库系统管理的实体类型较少,并且实体类型之间通常只有简单、固定的空间关系;而地理空间数据的实体类型繁多,实体类型之间存在着复杂的空间关系,并且还能产生新的关系(如拓扑关系)。 (3)传统数据库系统存贮的数据通常为等长记录的数据;而地理空间数据通常由于不同空间目标的坐标串长度不定,具有变长记录,并且数据项也可能很大,很复杂。 (4)传统数据库系统只操纵和查询文字和数字信息;而空间数据库中需要有大量的空间数据操作和查询,如相邻、连通、包含、叠加等。,2020/8/21,98,空间数据库管理系统的实现方式,文件与关系数据库混合管理系统 全

46、关系数据库管理系统 对象关系数据库管理系统 面向对象空间数据库管理系统?,2020/8/21,99,文件 关系数据库混合管理方案,属性数据建立在RDBMS上,数据存储和检索比较可靠、有效; 几何数据采用图形文件管理,功能较弱,特别是在数据的安全性、一致性、完整性、并发控制方面,比商用数据库要逊色得多。 空间数据分开存储,数据的完整性有可能遭到破坏。 GIS软件:Arc/Info,MGE,SICARD、GENEMAP等。,早 期,GIS用户界面,图形处理,DBMS,图形 文件库,属性 数据库,高级语言,ODBC协议,数据库开发,数据库开发,2020/8/21,100,全关系式数据库管理方案,属性

47、数据、几何数据同时采用关系式数据库进行管理 空间数据和属性数据不必进行烦琐的连接,数据存取较快 属间接存取,效率比DBMS的直接存取慢,特别是涉及空间查询、对象嵌套等复杂的空间操作 GIS软件:System9,Small World、Geovision等,2020/8/21,101,空间数据库引擎,空间数据引擎概述 常规的关系数据库系统不直接支持对空间数据类型存储功能,也不提供对GIS空间数据类型的操作。 空间数据引擎(SDE)是使常规的关系数据库支持GIS空间数据类型存储和操作的一个间接的技术方法。它在GIS应用软件和关系型数据库之间建立了一个中间层,由SDE为GIS 应用软件提供在关系数据

48、库里存储、查询和分析空间数据的相应功能。,2020/8/21,102,空间数据库引擎,空间数据引擎的工作原理 SDE的体系结构 SDE的访问方式 SDE支持的空间数据类型,2020/8/21,103,对象关系数据库管理方案,在标准的关系数据库上增加空间数据管理层,即利用该层将地理结构查询语言(GeoSQL)转化成标准的SQL查询,借助索引数据的辅助关系实施空间索引操作。 解决了空间数据变长记录的存储问题,由数据库软件商开发,效率较高 用户不能根据GIS要求进行空间对象的再定义,因而不能将设计的拓扑结构进行存储 GIS软件:TIGER,Geo+、Geo Tropics等,2020/8/21,10

49、4,面向对象数据库系统的实现方式,面向对象的数据模型从概念上将人们对GIS的理解提高到了一个新的高度。 一方面,它巧妙地容纳了GIS中拓扑数据结构的思想,能有效地表达空间数据的拓扑关系。另一方面,面向对象数据模型在表达和处理属性数据时,又具有许多独特的优越性。 目前,采用面向对象数据模型,建立面向对象数据库系统,主要有三种实现方式: 扩充面向对象程序设计语言(OOPL),在OOPL中增加DBMS的特性 扩充RDBMS,在RDBMS中增加面向对象的特性 建立全新的支持面向对象数据模型的OODBMS,2020/8/21,105,空间数据索引,空间数据索引概念 索引是数据库的一种数据快速查找的机制,

50、通常由关键字和存储地址组成。 空间索引就是依据空间实体的位置和形状或空间实体之间的某种空间关系按一定的顺序排列的一种数据结构其中包括空间实体的概略信息,如表示码、最小外接矩形以及存储地址。 空间数据索引的性能优劣直接影响数据库和GIS的性能。,2020/8/21,106,空间数据索引,空间数据索引的方法 范围索引 即在记录每个空间实体坐标时,同时记录每个实体的最大最小坐标。 没有建立真正的索引结构,主要依靠空间计算来进行判别。,2020/8/21,107,空间数据索引,空间数据索引的方法 格网空间索引 将区域分成大小相等的网格,记录每个网格内所包含的空间实体在数据库中的地址。每个网格可以按顺序

51、进行编码,建立顺序码和实体的对应关系。,A,B,2020/8/21,108,空间数据索引,空间数据索引的方法 四叉树空间索引 四叉树空间索引是将区域进行若干个层次的划分,每个层次划分得到的每个区域分成四个相等的子区域,判断空间实体包含在哪一个层次的哪一个子区域内,则用该区域的编码来记录空间实体,这样就形成了一个四叉树的空间划分。 为了便于按次序记录各个子区域,可以将每一个子区域按mortona码编码,建立起morton码和空间实体的对应关系。,2020/8/21,109,空间数据索引,四叉树索引,2020/8/21,110,4 地理数据建模,空间对象的模拟 矢量模型 栅格模型 TIN 地理数据

52、建模 Shapefile数据模型 Coverage数据模型 Geodatabase数据模型,2020/8/21,111,模拟离散要素,矢量数据反映的是点、线、多边形要素,常应用于具有确定的形状或边界的不连续对象。 要素具有精确的形状和位置、属性和元数据以及有意义的行为。,2020/8/21,112,模拟离散要素,点用来表示那些没有面积或长度的地理要素,或者那些太小、在给定的地图尺寸上不能清楚表示出来的要素。 线要素用来表示那些具有一定长度但没有面积的对象,或者是那些在给定的地图尺寸上其形状非常窄的要素。 多边形要素用来表达区域如州、郡、人口普查地域、销售领域、土壤单位、土地块、土地利用区等。,

53、2020/8/21,113,模拟离散要素,要素分别扮演三种不同的角色:简单要素、网络要素或拓扑要素。 简单要素 网络要素 具有公共边的拓扑关系,2020/8/21,114,模拟离散要素,2020/8/21,115,模拟离散要素,点用一对坐标来记录;线用一系列有序的x,y 坐标来记录;多边形则用一系列定义环绕某区域的各线段的x,y 坐标来记录。,2020/8/21,116,矢量数据结构编码的基本内容,2020/8/21,117,点实体,2020/8/21,118,线实体,面实体,多边形矢量编码,不但要表示位置和属性,更重要的是能表达区域的拓扑特征,如形状、邻域和层次结构等,以便使这些基本的空间单

54、元可以作为专题图的资料进行显示和操作,由于要表达的信息十分丰富,基于多边形的运算多而复杂,因此多边形矢量编码比点和线实体的矢量编码要复杂得多,也更为重要。,2020/8/21,119,矢量数据结构,简单数据结构(也称面条数据结构) 拓扑数据结构,2020/8/21,120,只记录空间对象的位置坐标和属性信息,不记录拓扑关系。 特征 无拓扑关系,主要用于显示、输出及一般查询 公共边重复存储,存在数据冗余,难以保证数据独立性和一致性 多边形分解和合并不易进行,邻域处理较复杂; 处理嵌套多边形比较麻烦,简单的矢量数据结构面条结构,2020/8/21,121,简单的矢量数据结构面条结构,10:x1,y

55、1 x2,y2 x3,y3 x4,y4 x5,y5 x6,y6 x7,y7 x8,y8 x9,y9 x10,y10 x11,y11。 20:x1,y1 x12,y12 x13,y13 x14,y14 x15,y15 x16,y16 x17,y17 x18,y18 x19,y19 x20,y20 x21,y21 x22,y22 x23,y23 x8,y8 x9,y9 x10,y10 x11,y11 30:x33,y33 x34,y34 x35,y35 x36,y36 x37,y37 x38,y38 x39,y39 x40,y40 40:x19,y19 x20,y20 x21,y21 x28,y2

56、8 x29,y29 x30,y30 x31,y31 x32,y32 50:x21,y21 x22,y22 x23,y23 x8,y8 x7,y7 x6,y6 x24,y24 x25,y25 x26,y26 x27,y27 x28,y28。,2020/8/21,122,简单的矢量数据结构面条结构,这种数据结构具有编码容易、数字化操作简单和数据编排直观等优点。但这种方法也有以下明显缺点: 相邻多边形的公共边界要数字化两遍,造成数据冗余存储,可能导致输出的公共边界出现间隙或重叠; 缺少多边形的邻域信息和图形的拓扑关系; 岛只作为一个单个图形,没有建立与外界多边形的联系。,2020/8/21,123,

57、拓扑数据结构,主要特点: 点是相互独立的,点连成线,线构成面 拓扑数据结构最重要的技术特征和贡献是具有拓扑编辑功能,包括多边形连接编辑和结点连接编辑。 在空间分析和应用中都具有非常重要的意义。 拓扑数据结构 索引法 双重独立编码 链状双重独立式,2020/8/21,124,该法采用树状索引以减少数据冗余并间接增加邻域信息, 方法是对所有边界点进行数字化,将坐标对以顺序方式 存储,由点索引与边界线号相联系,以线索引与各多边 形相联系,形成树状索引结构。,索引法:,2020/8/21,125,树状索引编码消除了相邻多边形边界的数据冗余和不一致的 问题,在简化过于复杂的边界线或合并相邻多边形时可不必

58、 改造索引表,邻域信息和岛状信息可以通过对多边形文件的 线索引处理得到,但是比较繁琐。,2020/8/21,126,双重独立式DIME(Dual lndependent Map Encoding),这种数据结构除了通过线文件生成面文件外,还需要点文件,2020/8/21,127,链状双重独立式,链状双重独立式数据结构是DIME数据结构的一种改进。在DIME中,一条边只能用直线两端点的序号及相邻的面域来表示,而在链状数据结构中,将若干直线段合为一个弧段(或链段),每个弧段可以有许多中间点。 在链状双重独立数据结构中,主要有四个文件:多边形文件、弧段文件、弧段坐标文件、结点文件。,2020/8/2

59、1,128,弧段文件 弧段号起始点终结点左多边形右多边形 a51OA b85EA c168EB d195OE e1519OD f1516DB g115OB h81AB i1619DE j3131BC 弧段坐标文件 弧段号点 号 a5,4,3,2,1 b8,7,6,5 c16,17,8 d19,18,5 e15,23,22,21,20,19 f15,16, g1,10,11,12,13,14,15 h8,9,1 i16,19 j31,30,29,28,27,26,25,24,31,链状双重独立式,多边形文件 多边形号弧段号周长 面积 中心点坐标 Ah,b,a Bg,f,c,h,-j Cj De,i,f Ee,i,d,b,2020/8/21,129,矢量数据结构的属性数据表达,属性特征类型 类别特征:是什么 说明信息:同类目标的不同特征 属性特征表达 类别特征:类型编码 说明信息:属性数据结构和表格 属性表的内容取决于用户 图形数据和属性数据的连接通过目标识别符

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论