




已阅读5页,还剩227页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
GIS数据建模,2020/5/11,2,引言,模型GIS主要的研究内容GIS主要包括对地理现象和过程等客体的特征描述、关系分析和过程模拟等内容。这些内容在地理信息系统的软件工具、数据库系统和应用系统研究中往往被抽象、概括为数据结构的定义、数据模型的建立及专业应用模型的构建等主要理论与技术问题。它们共同构成地理信息系统基础研究的主要内容。,2020/5/11,3,引言,所有的GIS系统都为它所要描述的世界建立了模型:数据建模:描述了组织数据的框架结构。如:楼房住户-数据;房间规格和排列-数据模型数据建模最后发展成为数据的存储方式(数据字典中的定义)应用建模:用户的最终需求。业务功能建模最后发展成为应用模型。产生高效的应用模型的前提是良好的数据模型。(正如10平米的房间无法成为会议厅一样,一个糟糕的数据模型也无法产生高质量的应用。,2020/5/11,4,数据建模主要内容,数据模型概述概念模型逻辑模型地理数据模型,2020/5/11,5,建立空间数据模型的目的,是揭示空间实体的本质特性,并对其进行抽象化,使之转化为计算机能够接受和处理的数据形式。在地理信息系统研究中,空间数据模型就是对空间实体进行描述和表达的数学手段,使之能反映客体的某些结构特性和行为功能。,1数据模型概述,2020/5/11,6,1数据模型概述,数据模型:是对现实世界各种事物特征的数据化的描述和抽象。对事物的数据描述通常包括静态的属性描述和动态的行为描述。静态属性包括:数据结构和对数据的约束;动态特性包括:对静态属性数据的操作方法。,2020/5/11,7,数据建模过程,存在于人脑之外的客观存在的事物及其相互联系。,是现实世界在人们头脑中的反映,人们用文字、图形和符号等表示它们,构成信息世界,由于计算机只能处理数据化的信息,所以对信息世界中的信息必须进行数据化,数据化后的信息称为数据,2020/5/11,8,2020/5/11,9,数据建模过程,2020/5/11,10,数据模型概述,在数据库中用数据模型这个工具来抽象、表示和处理现实世界中的数据和信息。在数据库系统中针对不同的使用对象和应用目的,采用不同的数据模型。概念模型逻辑模型,2020/5/11,11,现实世界的事物经过人脑的抽象加工,提取出对用户有用的信息,经过组织整理加工形成介于现实世界和计算机世界之间的中间模型;概念数据模型可以自然地反映现实世界的事物和事物之间的联系,是面向用户的数据模型,是易于人们观察和理解的数据模型。概念数据模型着重表示数据的语义,而不注重数据的组织结构,它是建立在逻辑数据模型之上的、更高一层的数据模型。它是对现实世界的第一层抽象,是独立于计算机系统的数据模型,不涉及信息在计算机内如何表示。,概念模型(ConceptualDataModel),2020/5/11,12,概念模型(ConceptualDataModel),CDM是系统分析员、程序设计员、维护人员、用户之间相互理解的共同语言;CDM能使数据库的设计人员在设计的初始阶段摆脱计算机系统及DBMS的具体技术问题,集中精力分析数据、数据之间的联系;概念模型必须转换成逻辑模型,才能在DBMS中实现;最常用的概念模型是E-R模型,2020/5/11,13,LDM是对数据及数据之间逻辑联系的描述,是用户从数据库所看到的数据模型;按计算机的观点对数据建模。逻辑数据模型着重于描述数据的组织结构,很少考虑数据的语义和用户对数据的理解,它们最关心的是提供一致的、高效的数据存放的物理结构和信息结构,提高数据存取和检索的速度。逻辑数据模型是直接面向数据库的逻辑结构和DBMS的,它是现实世界的第二层次的抽象,这类模型涉及到计算机系统和数据库管理系统,又称为“基本数据模型”。如层次、网状和关系数据模型等。,逻辑模型(LogicalDataModel),2020/5/11,14,是数据特征的抽象,从抽象的层次上描述了系统的静态特征、动态行为和约束条件。是具体的DBMS所支持的数据模型(网状/层次/关系/面向对象);一般的DBMS支持一种LDM(特殊的DBMS支持多种LDM),逻辑模型(LogicalDataModel),2020/5/11,15,按用户的观点来对信息建模。用于组织信息世界的概念,表现从现实世界中抽象出来的事物以及它们之间的联系。这类模型强调其语义表达能力,概念简单、清晰,易于用户理解。它是现实世界到信息世界的抽象,是用户与数据库设计人员之间进行交流的语言。如E-R模型。,2概念数据模型,2020/5/11,16,传统的非空间数据库的建模内容及如何建模。空间数据库或GIS的建模内容:有关地理要素的形状和位置、与地理要素有关的属性信息及要素间的空间关系等信息。概念模型的核心问题?,2概念数据模型,2020/5/11,17,空间实体的抽象,实体是点、线、面、体多种要素的复杂组合。空间对象一般按地形维数进行归类划分点:零维线:一维面:二维体:三维时间:通常以第四维表达,但目前GIS还很难处理时间属性。,2020/5/11,18,点实体,有位置,无宽度和长度;抽象的点,美国佛罗里达洲地震监测站2002年9月该洲可能的500个地震位置,2020/5/11,19,线实体,有长度,但无宽度和高度用来描述线状实体,通常在网络分析中使用较多度量实体距离,香港城市道路网分布,2020/5/11,20,面实体,具有长和宽的目标通常用来表示自然或人工的封闭多边形地物一般分为连续面和不连续面,中国土地利用分布图(不连续面),2020/5/11,21,空间对象:面(续),连续变化曲面:如地形起伏,整个曲面在空间上曲率变化连续。,不连续变化曲面,如土壤、森林、草原、土地利用等,属性变化发生在边界上,面的内部是同质的。,2020/5/11,22,空间对象:体,有长、宽、高的目标通常用来表示人工或自然的三维目标,如建筑、矿体等三维目标,香港理工大学校园建筑,2020/5/11,23,现实世界的各种现象比较复杂,往往由简单实体组合而成,例如:住宅小区城市,复杂实体,2020/5/11,24,实体抽象的主观性,应用决定建模方式河流线实体?面实体?随着应用目的的不同,坐标系统的比例尺缩小时,部分的体、面、线实体均可能变为点实体。,2020/5/11,25,实体空间结构,线可以视为由点组成,面可由作为边界的线所包围而形成,体又可以由面所包围而形成,可见四类空间实体之间存在着内在的联系,只是在构成上属于不同的层次。随着观察这些实体的坐标系统的维数、视角及比例尺的变化,实体之间的关系和内容可能按照一定的规律相互转化。例如,由三维坐标系统变为二维坐标系统后,比如通过地图投影,空间体可变成面,面可以部分地变成线,线可以部分地变成点,视角变化之后,也将使某些客体发生变化。坐标系统的比例尺缩小时,部分的体、面、线客体均可能变为点客体。,2020/5/11,26,空间实体描述,对空间实体的描述有5种内容:即识别码、位置、实体特征、实体的角色、行为或功能以及实体的空间特性。,2020/5/11,27,识别码:用于区别同类而又不同的实体。位置:可用坐标描述也可用其它形式。空间特征:也是位置信息的一种,如维数、类型及实体的组合等。实体的行为和功能:是指在数据采集过程中不仅要重视实体的静态描述,还要收集那些动态的变化,如岛屿的侵蚀、水体污染的扩散、建筑的变形等。,续-,2020/5/11,28,实体之间的关系,所有地理现象和地理过程中的各种空间实体并非孤立存在,而是具有各种复杂的联系。这些联系可以从空间实体的空间、时间和属性三个方面加以考察。,2020/5/11,29,实体之间的关系,实体间的空间联系大体上可以分解为空间位置、空间分布、空间形态、空间关系、空间相关、空间统计、空间趋势、空间对比和空间运动等等联系形式。空间位置描述的是空间实体个体的定位信息;空间分布是描述空间实体的群体定位信息,且通常能够从空间概率、空间结构、空间聚类、离散度和空间延展等方面予以描述;空间形态反映空间实体的形状和结构;空间关系是基于位置和形态的实体关系;,2020/5/11,30,实体之间的关系,空间相关是空间客体基于属性数据上的关系;空间统计描述空间客体的数量、质量信息,又称为空间计量;空间趋势反映客体空间分布的总体变化规律;空间对比可以体现在数量、质最和形态三个方面;空间运动则反映空间客体随时间的迁移或变化。以上种种空间信息基本上反映了空间分析所能揭示的信息内涵,彼此互有区别又有联系。,2020/5/11,31,空间实体的空间关系,地图、遥感影象上的空间关系是通过图形识别的,在GIS中的空间关系则必须显式的进行定义和表达。空间关系的描述多种多样,目前尚未有具体的标准和固定的格式,但基本原理一致。不同的GIS可能采用不同的方法进行描述。,2020/5/11,32,空间对象的拓扑空间关系,拓扑元素:点:孤立点、线的端点、面的首尾点、链的连接点线:两结点之间的有序弧段面:若干弧段组成的多边形基本拓扑关系关联:不同拓扑元素之间的关系邻接:相同拓扑元素之间的关系包含:面与其他元素之间的关系点、线、面之间的拓扑关系,2020/5/11,33,2020/5/11,34,空间实体的空间关系-拓扑关系,2020/5/11,35,方向关系:地理实体在空间中的相互方位和排列顺序。描述空间实体的方向关系,对于点状空间实体只要计算两点之间的连线与某一基准方向的夹角即可,该夹角称为连线的方位角。基准方向通常有真子午线方向、磁子午线方向和坐标纵线方向三种。计算点线、点面、线线、线面以及面面方向关系时比较麻烦。,空间实体的空间关系-方向关系,2020/5/11,36,度量空间关系主要是指空间对象之间的距离关系。这种距离关系可以定量地描述为特定空间中的某种距离,如A实体距离B实体100m。也可以应用与距离概念相关的术语,如远近等进行定性的描述。距离分为欧氏距离、棋盘距离等。,空间实体的空间关系-度量关系,2020/5/11,37,距离量算,n维匀质空间广义距离公式,j(xj,yj),i(xi,yi),i,j,i,j,距离计算公式,n维非匀质空间距离计算,q=2,二维欧氏距离,q=1,曼哈顿距离,q=0.6,非欧氏距离,2020/5/11,38,实体之间的时间关系,实体之间的时间联系一般可以通过实体变化过程来反映。有些实体数据的变化周期很长,如地质地貌等数据随时间的变化。而有些空间数据则变化很快,需要及时更新,如土地利用数据等。实体时间信息的表达和处理构成了空间时态地理信息系统及其数据库的基本内容。,2020/5/11,39,实体之间的属性关系,实体间的属性联系主要体现为属性多级分类体系中的从属关系、聚类关系和相关关系。从属关系主要反映各实体之间的上下级和包含关系;聚类关系是反映实体之间的相似程度及并行关系;相关关系则反映不同类实体之间的某种直接或间接的并发或共生关系。属性联系可以通过地理信息系统属性数据库的设计加以实现。,2020/5/11,40,空间对象的层次关系,分类对象的从属和层次关系有明确的分类对象类别和严格的隶属关系,高压711,2020/5/11,41,空间概念模型,如何模拟:?地图模型遥感模型E-R模型,2020/5/11,42,空间对象的地图模型,点:位置:(x,y)属性:符号,线:位置:(x1,y1),(x2,y2),(xn,yn)属性:符号形状、颜色、尺寸,面:位置:(x1,y1),(x2,y2),(xi,yi),(xn,yn)属性:符号变化等值线,2020/5/11,43,空间对象的遥感影像模型,遥感传感器平台,传感器,2020/5/11,44,基本概念1976年,P.S.Chen提出-模型(Entity-RelationshipModel),用-图来描述概念模型。观点:世界是由一组称作实体的基本对象和这些对象之间的联系构成的。,实体联系方法(E-R方法),2020/5/11,45,实体、属性和联系,实体(Entity)一个实体可以是一个具体的事物,也可以是一个抽象的事物。实体集个体实体属性描述实体或联系的特性。属性有属性名、属性类型、属性定义域和属性值之分。,2020/5/11,46,实体、属性和联系,联系实体之间有联系,联系反映实体间的相互关系。这种联系必然要在信息世界中进行描述。联系集:实体间相同类型的联系也构成联系集。联系本身也可以有描述属性。,2020/5/11,47,确定所有实体集合用矩形方框表示实体集合,方框内标明实体集合名称;选择实体集应包含的属性用椭圆框表示属性,通过无向边连接到实体集。只有一个属性的实体集可用属性代替,附加到它参加的联系上;确定实体集之间的联系用菱形框表示,框内标明联系的名称,通过无向边连接到参加联系的每个实体集合;确定实体集的关键字用下划线在属性上标明关键字的属性集合;确定联系的类型在用无向边连接联系到实体集时,在边上注明1或n(多)来指明联系的类型。,设计E-R模型步骤,2020/5/11,48,示例,解放路,珞喻路,空间实体及其联系的ER表达,2020/5/11,49,ECR(entity-categroy-relationship-model)模型,在ER模型的基础上,如果加入实体的分类的话,则得到ECR模型,ECR模型,2020/5/11,50,E-R模型特点,有丰富的语义表达能力,能充分反映现实世界中实体和实体之间的联系,能满足用户对数据对象的处理要求。易于交流和理解,因为它不依赖于计算机系统和具体的DBMS,所以它是DBA、系统开发人员和用户之间的桥梁。,2020/5/11,51,E-R模型说明,易于修改和扩充。易于向各种结构化数据模型转换。实体、属性和联系这三个概念是有明确区分的,但对于某个具体的数据对象,究竟算它是实体,还是属性或联系,是相对的,这取决于应用背景和用户的观点。,2020/5/11,52,ER模型缺点,侧重于空间目标自身的描述,难于描述空间目标之间的一些重要的空间关系(如相交、穿越等)。难于描述空间实体之间的从属、组合关系。主要用来表达某一时刻的空间实体及其相互关系,没有考虑空间实体的时空变化,本质上是非时态的。,2020/5/11,53,3逻辑模型,从计算机实现的观点来对数据建模。是信息世界中的概念和联系在计算机世界中的表示方法。一般有严格的形式化定义,以便于在计算机上实现。从抽象的层次上描述和模拟了系统的静态特征、动态行为和约束条件如层次模型、网状模型、关系模型。,2020/5/11,54,数据模型的三要素,数据结构数据操作约束条件,2020/5/11,55,数据结构,数据结构:描述系统的静态特性,即组成数据库的对象类型。包括:数据本身:类型、内容、性质。如网状模型中的数据项、记录,关系模型中的域、属性,关系等。数据之间的联系:例如网状模型中的系型(SetType)在数据库系统中一般按数据结构的类型来命名数据模型。,2020/5/11,56,数据操作,描述系统的动态特性,即对数据库中对象的实例允许执行的操作的集合,包括操作方法及操作规则。一般有检索、更新(插入、删除、修改)操作。数据模型要定义操作含义、操作符号、操作规则,以及实现操作的语言。,2020/5/11,57,数据约束条件,数据的约束条件是完整性规则的集合,规定数据库状态及状态变化所应满足的条件,以保证数据的正确、有效、相容。约束条件的主要目的是使数据库与它所描述的现实系统相符合。设计时:使数据模型正确、真实、有效地反映现实运行时:保证数据库中的数据值真实地体现现实世界的状态,2020/5/11,58,数据模型类型,层次模型网状模型关系模型面向对象模型,2020/5/11,59,层次数据模型,层次数据模型的概念层次数据模型数据的组织层次数据库数据的存储层次数据模型的特点,2020/5/11,60,层次数据模型的概念,层次数据库管理系统的典型代表产品是IBM公司的IMS(InformationManagementSystem),是世界上第一个DBMS产品。层次数据模型是用有向树结构表示各类实体及实体间联系的数据模型。树的每个结点表示一个记录类型,描述某类实体。每个记录类型包含若干数据项表示实体的属性。记录类型之间的联系用结点之间的连线(有向边)表示。上一层记录类型和下一层记录类型的联系是1:N联系。,2020/5/11,61,层次数据模型的概念,在数据库中定义满足下面两个条件的基本层次联系的集合为层次模型:有且只有一个结点没有双亲结点,这个结点称为根结点根以外的其他结点有且只有一个双亲结点。层次数据模型的建模规则:树的结点表示实体记录类型;父结点和子结点必须是不同的实体类型;结点之间的联系必须是一对多的联系。,2020/5/11,62,层次数据模型数据的组织,由于层次数据模型用树型结构表示实体和实体之间的联系。因此,层次数据模型便于处理一对多的实体联系,即记录类型之间的1:N联系。层次数据模型处理记录类型之间多对多的联系,或者一个记录类型有多个双亲的情况比较麻烦,必须转化为多个一对多的联系。以矢量多边形数据的组织为例,2020/5/11,63,层次数据模型数据的组织,2020/5/11,64,层次数据库数据的存储,层次数据库不仅要存储数据本身,还要存储数据间的层次联系。常用的实现方法:邻接法:按照层次树前序遍历的顺序把所有记录值依次邻接存放。链接法:用指针来反映数据记录间的层次关系,每一个记录设立两类指针,分别指向最左边的子女和右边的兄弟。无论采用哪种存储方法,层次数据模型数据库中查询子女结点必须通过双亲结点遍历。,2020/5/11,65,层次模型的操作和完整性约束,主要有查询和插入、删除和更新特点完整性约束插入时,不能插入无双亲的子女结点删除时,删除双亲结点,也即删除了子女结点更新所有相应记录,保证数据一致性,2020/5/11,66,层次数据模型的特点,优点:模型简单,使用方便。对实体间联系固定,且预先定义好的应用系统,性能较好。提供了良好的完整性支持对一对多层次关系描述有优势。缺点:数据查询和更新操作复杂,导致应用程序编写困难,难以反向查询。难以实现系统扩充,因为数据的更新涉及许多指针。层次命令具有过程式性质,要求用户了解数据的物理存储,并在数据操纵时显式地给出存储路径模拟多对多关系是导致物理存储上的冗余数据独立性差基本上只能表示一对多关系。,2020/5/11,67,网状数据模型的概念网状数据模型数据的组织网状数据库数据的存储网状数据模型的特点,网状数据模型,2020/5/11,68,网状数据模型的概念,最典型的网状数据模型是美国CODASYL(ConferenceOnDataSystemLanguage)的数据库任务组DBTG(DataBaseTaskGroup)提供的网状数据模型标准化报告,称为DBTG报告。1977年CODASYL的DBTG报告制定了网状数据库系统的基本术语、概念和接口的标准。,2020/5/11,69,网状数据模型的概念,有向图结构的表示图中的每个结点表示一个实体记录类型,每个记录类型包含若干数据项表示实体的属性。结点之间的连线(有向边)表示不同记录类型之间的联系,由于任意两个不同的记录类型之间都可能有连线,甚至两个不同的记录类型之间可能有多条连线,所以必须为每条连线取一个单独的名字。这一联系也必须是一对多的联系;即上一层记录类型和下一层记录类型的联系是1:N联系。,2020/5/11,70,网状数据模型的概念,在数据库中定义满足下面两个条件的基本层次联系的集合为网状数据模型:允许一个以上的结点没有双亲结点;至少有一个结点可以有多于一个的双亲结点。网状数据模型的建模规则:有向图的结点表示实体记录类型;父结点和子结点必须是不同的实体类型;父结点和子结点之间的联系必须是一对多的二元联系,每个联系要有一个唯一的联系名。,2020/5/11,71,网状数据模型数据的组织,层次模型中子女结点和双亲结点的联系是唯一的,而在网状模型中这种联系可以不唯一。因此,在网状模型中要为每个联系命名,并要指出与该联系有关的双亲记录和子女记录。在网状数据模型中,虽然每个结点可以有多个父结点,但是每个双亲记录和子女记录之间的联系只能是1:N的联系,因此,在网状数据模型中,对于M:N的联系,必须人为地增加记录类型,把M:N的联系分解为多个1:N的二元联系。,2020/5/11,72,2020/5/11,73,网状数据库数据的存储,网状数据模型数据库存储数据的关键在于实现记录之间的联系,常用链接法,包括单向链接、双向链接、环状链接等。,2020/5/11,74,网状模型的操作和完整性约束,主要有查询和插入、删除和更新特点完整性约束插入时,允许插入没确定双亲结点值的子女结点值删除时,允许只删除双亲结点值更新时,只需要更新指定记录,2020/5/11,75,网状数据模型,优点:可以描述多对多关系,具有良好的性能数据存储效率高一定程度上支持数据的重构,具有一定的共享特性,运行效率高可以代替任何层次系统缺点:结构复杂,增加了用户查询的困难数据独立性差数据定义语言非常复杂不直接支持对层次结构的表达,2020/5/11,76,关系数据模型,关系数据模型的基本概念关系数据模型的数据组织关系数据模型的特点,2020/5/11,77,关系数据模型的基本概念,关系数据模型:是由若干关系组成的集合,每个关系从结构上看实际上是一张二维表格,即把某类型的记录集合写成一张二维表,表中的每行表示一个实体对象,表的每列对应一个实体属性。这样的一张表称为一个关系。,2020/5/11,78,关系数据模型的数据组织,关系数据模型中,实体类型用关系表表示;实体类型之间的1:1和1:N的联系可以用关系表表示,也可以用属性来表示;实体类型之间的M:N的联系必须用关系表表示。在关系数据模型中,通过外部关键字可以直接表达实体之间一对多和多对多的联系,不需要任何转换或中间环节。,2020/5/11,79,关系数据模型的数据组织,2020/5/11,80,关系模型的存储结构,关系模型中,实体和实体间的联系都是用表来表示的。在数据库的物理组织中,表是以文件形式存在的,通常一个表对应一个文件,2020/5/11,81,关系模型的操作和完整性约束,主要有查询和插入、删除和修改特点:集合操作;非过程化完整性约束(对关系的约束)实体完整性参照完整性用户定义完整性,2020/5/11,82,关系数据模型的优点,(1)关系模型结构简单实体和实体之间的联系都用关系表表示。(2)直接处理多对多的关系通过关键字直接建立一个表中的元组与多个表中的元组之间的联系。(3)关系模型是面向记录集合的一次可处理一个元组的集合,即对一个关系表的操作可产生一张新的二维关系表。(4)关系模型有坚实的理论基础其理论基础是集合论与关系代数,一个关系是数学意义上的一个集合(无序、无重值)。,2020/5/11,83,(1)以记录为基础的结构不能很好地面向用户和应用。传统数据模型基本结构是记录,而人类对现实世界的认识往往以某个事物或概念为单位,与记录不一定相对应。记录的组成往往从计算机实现的角度加以考虑,而不一定反映人们对现实世界的认识,不利于建立数据的概念模型。,传统数据模型的缺点,2020/5/11,84,(2)不能以自然的方式表示实体之间的联系。层次和网状数据模型虽然提供了显式的联系描述手段,但这些联系形式不是实间联系的自然表示,而是联系的物理实现的描述。这样就把本来应该对用户隐藏的物理实现的细节,当作数据模型的组成部分呈现在用户面前,既不自然又不便于用户理解和使用,而且也有损于数据的物理独立性。关系数据模型虽然避免了这个缺点,实体间的联系也可以用关系来表示,但关系数据模型很难从数据模型看出实体间的联系。一个实体与哪些实体有联系,必须检查每个关系才可能知道。现实世界中的实体联系被掩盖在记录、属性之中。总之,三种传统数据模型都难以自然地表示实体间的联系,这是它们的一个主要弱点。,传统数据模型的缺点,2020/5/11,85,(3)语义贫乏。三种传统数据模型都或多或少含有一些语义,例如关系数据模型的主关键字,层次数据模型中的主从关系,网状数据模型中的系都提供了一定的语义信息。但是就总体而言,它们能够表达的语义是贫乏的。记录各个属性间的关系及其作用不够明确,这就要求用户通过文字来描述这些记录的语义,但这些文字描述又不是数据库的一部分。此外,它们对实体间联系的语义描述,也缺少必要的手段。交互关系、从属关系、性质、组成等都是代表语义不同的联系,却用同样的记录结构表示,并且缺少描述这些联系的相应结构在语义上无法区分这些联系。,传统数据模型的缺点,2020/5/11,86,(4)数据类型太少难以满足应用需要。传统数据模型原来都是面向事物处理的。它们一般只提供最常用的一些简单数据类型,例如整数、实数、字符串等,而且不允许用户自己定义新的数据类型。但在有些应用中,希望属性值不直接给出,而是由公式、规则或过程推导而得。有时不但要知道数据的当前值,还要知道不同时间的数值。这些功能在传统数据模型中都不支持。,传统数据模型的缺点,2020/5/11,87,面向对象数据模型(ObjectOrientedDataModel),面向对象的基本概念面向对象的数据模型,2020/5/11,88,基本思想和基本概念,面向对象的方法就是以接近人类通常思维方式的思想,将客观世界的一切实体模型化为对象。每一种对象都有各自的内部状态和运动规律,不同对象之间的相互联系和相互作用就构成了各种不同的系统。对象含有数据和操作方法的独立模块,可以认为是数据和行为的统一体。如一个城市、一棵树均可作为地理对象。类共享同一属性和方法集的所有对象的集合构成类。从一组对象中抽象出公共的方法和属性,并将它们保存在一类中,是面向对象的核心内容。如河流均具有共性,如名称、长度、流域面积等,以及相同的操作方法,如查询、计算长度、求流域面积等,因而可抽象为河流类。被抽象的对象,称为实例,如长江、黄河等。消息对对象进行操作的请求,是连接对象与外部世界的唯一通道。方法对对象的所有操作,如对对象的数据进行操作的函数、指令、例程等。,2020/5/11,89,面向对象的特性,面向对象方法具有抽象性、封装性、多态性等特性。抽象是对现实世界的简明表示。形成对象的关键是抽象,对象是抽象思维的结果。任何一个对象都是通过抽象和概括而形成的。封装是指将方法与数据放于一对象中,以使对数据的操作只可通过该对象本身的方法来进行。即一对象不能直接作用于另一对象的数据,对象间的通信只能通过消息来进行。对象是一个封装好的独立模块。封装是一种信息隐蔽技术,封装的目的在于将对象的使用者和对象的设计者分开,用户只能见到对象封装界面上的信息,对象内部对用户是隐蔽的。多态是指同一消息被不同对象接收时,可解释为不同的含义。因此,可以发送更一般的消息,把实现的细节都留给接收消息的对象。即相同的操作可作用于多种类型的对象,并能获得不同的结果。,2020/5/11,90,面向对象数据模型的核心技术,1、分类类是具有相同属性结构和操作方法的对象的集合,属于同一类的对象具有相同的属性结构和操作方法。分类是把一组具有相同属性结构和操作方法的对象归纳或映射为一个公共类的过程。对象和类的关系是“实例”(instance-of)的关系。在面向对象的数据库中,只需对每个类定义一组操作,供该类中的每个对象使用,而类中每一个对象的属性值要分别存储,因为每个对象的属性值是不完全相同的。例如,在面向对象的地理数据模型中,城镇建筑可分为行政区、商业区、住宅区、文化区等若干个类。以住宅区类而论,每栋住宅作为对象都有门牌号、地址、电话号码等相同的属性结构,但具体的门牌号、地址、电话号码等是各不相同的。当然,对它们的操作方法如查询等都是相同的。,2020/5/11,91,面向对象数据模型的核心技术,2、概括概括是把几个类中某些具有部分公共特征的属性和操作方法抽象出来,形成一个更高层次、更具一般性的超类的过程。子类和超类用来表示概括的特征,表明它们之间的关系是“即是”(isa)关系,子类是超类的一个特例。作为构成超类的子类还可以进一步分类,一个类可能是超类的子类,同时也可能是几个子类的超类。所以,概括可能有任意多层次。例如,建筑物是住宅的超类,住宅是建筑物的子类,但如果把住宅的概括延伸到城市住宅和农村住宅,则住宅又是城市住宅和农村住宅的超类。概括技术的采用避免了说明和存储上的大量冗余,因为住宅地址、门牌号、电话号码等是“住宅”类的实例(属性),同时也是它的超类“建筑物”的实例(属性)。当然,这需要一种能自动地从超类的属性和操作中获取子类对象的属性和操作的机制。,2020/5/11,92,面向对象数据模型的核心技术,3、聚集聚集是将几个不同类的对象组合成一个更高级的复合对象的过程。术语“复合对象”用来描述更高层次的对象,“部分”或“成分”是复合对象的组成部分,“成分”与“复合对象”的关系是“部分”(partsof)的关系,反之“复合对象”与“成分”的关系是“组成”的关系。例如,医院由医护人员、病人、门诊部、住院部、道路等聚集而成。每个不同属性的对象是复合对象的一个部分,它们有自己的属性数据和操作方法,这些是不能为复合对象所公用的,但复合对象可以从它们那里派生得到一些信息。复合对象有自己的属性值和操作,它只从具有不同属性的对象中提取部分属性值,且一般不继承子类对象的操作。这就是说,复合对象的操作与其成分的操作是不兼容的。,2020/5/11,93,面向对象数据模型的核心技术,4、联合联合是将同一类对象中的几个具有部分相同属性值的对象组合起来,形成一个更高水平的集合对象的过程。术语“集合对象”描述由联合而构成的更高水平的对象,有联合关系的对象称为成员,“成员”与“集合对象”的关系是“成员”(memberof)的关系。在联合中,强调的是整个集合对象的特征,而忽略成员对象的具体细节。集合对象通过其成员对象产生集合数据结构,集合对象的操作由其成员对象的操作组成。联合与概括在概念上不同。概括是对类进行抽象概括;而联合是对属于同一类的对象进行抽象联合。联合有点类似于聚集,所以在许多文献中将联合的概念附在聚集的概念中,都使用传播工具提取对象的属性值。,2020/5/11,94,面向对象的几何抽象类型,GIS中的各种地物,在几何性质方面不外乎表现为四种类型,即点状地物、线状处物、面状地物以及由它们混合组成的复杂地物,因而这四种类型可以作为GIS中各种地物类型的超类。,2020/5/11,95,面向对象的属性抽象类型,GIS中的地物可根据国家分类标准或实际情况划分类型。如一个大学GIS的对象可分为建筑物、道路、绿化、管线等几大类,地物类型的每一大类又可以进一步分类,如建筑物可再分成教学楼、科研实验楼、行政办公楼、教工住宅、学生宿舍、后勤服务建筑、体育楼等子类,管线可再分为给水管道、污水管道、电信管道、供热管道、供气管道等,另一方面,几种具有相同属性和操作的类型可综合成一个超类。,2020/5/11,96,吉奥之星中的空间对象模型,2020/5/11,97,空间数据库管理系统的实现方式,传统数据库管理系统的局限性(1)传统数据库系统管理的是不连续的、相关性较小的数字和字符;而地理信息数据是连续的,并且具有很强的空间相关性。(2)传统数据库系统管理的实体类型较少,并且实体类型之间通常只有简单、固定的空间关系;而地理空间数据的实体类型繁多,实体类型之间存在着复杂的空间关系,并且还能产生新的关系(如拓扑关系)。(3)传统数据库系统存贮的数据通常为等长记录的数据;而地理空间数据通常由于不同空间目标的坐标串长度不定,具有变长记录,并且数据项也可能很大,很复杂。(4)传统数据库系统只操纵和查询文字和数字信息;而空间数据库中需要有大量的空间数据操作和查询,如相邻、连通、包含、叠加等。,2020/5/11,98,空间数据库管理系统的实现方式,文件与关系数据库混合管理系统全关系数据库管理系统对象关系数据库管理系统面向对象空间数据库管理系统?,2020/5/11,99,文件关系数据库混合管理方案,属性数据建立在RDBMS上,数据存储和检索比较可靠、有效;几何数据采用图形文件管理,功能较弱,特别是在数据的安全性、一致性、完整性、并发控制方面,比商用数据库要逊色得多。空间数据分开存储,数据的完整性有可能遭到破坏。GIS软件:Arc/Info,MGE,SICARD、GENEMAP等。,早期,GIS用户界面,图形处理,DBMS,图形文件库,属性数据库,高级语言,ODBC协议,数据库开发,数据库开发,2020/5/11,100,全关系式数据库管理方案,属性数据、几何数据同时采用关系式数据库进行管理空间数据和属性数据不必进行烦琐的连接,数据存取较快属间接存取,效率比DBMS的直接存取慢,特别是涉及空间查询、对象嵌套等复杂的空间操作GIS软件:System9,SmallWorld、Geovision等,2020/5/11,101,空间数据库引擎,空间数据引擎概述常规的关系数据库系统不直接支持对空间数据类型存储功能,也不提供对GIS空间数据类型的操作。空间数据引擎(SDE)是使常规的关系数据库支持GIS空间数据类型存储和操作的一个间接的技术方法。它在GIS应用软件和关系型数据库之间建立了一个中间层,由SDE为GIS应用软件提供在关系数据库里存储、查询和分析空间数据的相应功能。,2020/5/11,102,空间数据库引擎,空间数据引擎的工作原理SDE的体系结构SDE的访问方式SDE支持的空间数据类型,2020/5/11,103,对象关系数据库管理方案,在标准的关系数据库上增加空间数据管理层,即利用该层将地理结构查询语言(GeoSQL)转化成标准的SQL查询,借助索引数据的辅助关系实施空间索引操作。解决了空间数据变长记录的存储问题,由数据库软件商开发,效率较高用户不能根据GIS要求进行空间对象的再定义,因而不能将设计的拓扑结构进行存储GIS软件:TIGER,Geo+、GeoTropics等,2020/5/11,104,面向对象数据库系统的实现方式,面向对象的数据模型从概念上将人们对GIS的理解提高到了一个新的高度。一方面,它巧妙地容纳了GIS中拓扑数据结构的思想,能有效地表达空间数据的拓扑关系。另一方面,面向对象数据模型在表达和处理属性数据时,又具有许多独特的优越性。目前,采用面向对象数据模型,建立面向对象数据库系统,主要有三种实现方式:扩充面向对象程序设计语言(OOPL),在OOPL中增加DBMS的特性扩充RDBMS,在RDBMS中增加面向对象的特性建立全新的支持面向对象数据模型的OODBMS,2020/5/11,105,空间数据索引,空间数据索引概念索引是数据库的一种数据快速查找的机制,通常由关键字和存储地址组成。空间索引就是依据空间实体的位置和形状或空间实体之间的某种空间关系按一定的顺序排列的一种数据结构其中包括空间实体的概略信息,如表示码、最小外接矩形以及存储地址。空间数据索引的性能优劣直接影响数据库和GIS的性能。,2020/5/11,106,空间数据索引,空间数据索引的方法范围索引即在记录每个空间实体坐标时,同时记录每个实体的最大最小坐标。没有建立真正的索引结构,主要依靠空间计算来进行判别。,2020/5/11,107,空间数据索引,空间数据索引的方法格网空间索引将区域分成大小相等的网格,记录每个网格内所包含的空间实体在数据库中的地址。每个网格可以按顺序进行编码,建立顺序码和实体的对应关系。,A,B,2020/5/11,108,空间数据索引,空间数据索引的方法四叉树空间索引四叉树空间索引是将区域进行若干个层次的划分,每个层次划分得到的每个区域分成四个相等的子区域,判断空间实体包含在哪一个层次的哪一个子区域内,则用该区域的编码来记录空间实体,这样就形成了一个四叉树的空间划分。为了便于按次序记录各个子区域,可以将每一个子区域按mortona码编码,建立起morton码和空间实体的对应关系。,2020/5/11,109,空间数据索引,四叉树索引,2020/5/11,110,4地理数据建模,空间对象的模拟矢量模型栅格模型TIN地理数据建模Shapefile数据模型Coverage数据模型Geodatabase数据模型,2020/5/11,111,模拟离散要素,矢量数据反映的是点、线、多边形要素,常应用于具有确定的形状或边界的不连续对象。要素具有精确的形状和位置、属性和元数据以及有意义的行为。,2020/5/11,112,模拟离散要素,点用来表示那些没有面积或长度的地理要素,或者那些太小、在给定的地图尺寸上不能清楚表示出来的要素。线要素用来表示那些具有一定长度但没有面积的对象,或者是那些在给定的地图尺寸上其形状非常窄的要素。多边形要素用来表达区域如州、郡、人口普查地域、销售领域、土壤单位、土地块、土地利用区等。,2020/5/11,113,模拟离散要素,要素分别扮演三种不同的角色:简单要素、网络要素或拓扑要素。简单要素网络要素具有公共边的拓扑关系,2020/5/11,114,模拟离散要素,2020/5/11,115,模拟离散要素,点用一对坐标来记录;线用一系列有序的x,y坐标来记录;多边形则用一系列定义环绕某区域的各线段的x,y坐标来记录。,2020/5/11,116,矢量数据结构编码的基本内容,2020/5/11,117,点实体,2020/5/11,118,线实体,面实体,多边形矢量编码,不但要表示位置和属性,更重要的是能表达区域的拓扑特征,如形状、邻域和层次结构等,以便使这些基本的空间单元可以作为专题图的资料进行显示和操作,由于要表达的信息十分丰富,基于多边形的运算多而复杂,因此多边形矢量编码比点和线实体的矢量编码要复杂得多,也更为重要。,2020/5/11,119,矢量数据结构,简单数据结构(也称面条数据结构)拓扑数据结构,2020/5/11,120,只记录空间对象的位置坐标和属性信息,不记录拓扑关系。特征无拓扑关系,主要用于显示、输出及一般查询公共边重复存储,存在数据冗余,难以保证数据独立性和一致性多边形分解和合并不易进行,邻域处理较复杂;处理嵌套多边形比较麻烦,简单的矢量数据结构面条结构,2020/5/11,121,简单的矢量数据结构面条结构,10:x1,y1x2,y2x3,y3x4,y4x5,y5x6,y6x7,y7x8,y8x9,y9x10,y10 x11,y11。20:x1,y1x12,y12x13,y13x14,y14x15,y15x16,y16x17,y17x18,y18x19,y19x20,y20 x21,y21x22,y22x23,y23x8,y8x9,y9x10,y10 x11,y1130:x33,y33x34,y34x35,y35x36,y36x37,y37x38,y38x39,y39x40,y4040:x19,y19x20,y20 x21,y21x28,y28x29,y29x30,y30 x31,y31x32,y3250:x21,y21x22,y22x23,y23x8,y8x7,y7x6,y6x24,y24x25,y25x26,y26x27,y27x28,y28。,2020/5/11,122,简单的矢量数据结构面条结构,这种数据结构具有编码容易、数字化操作简单和数据编排直观等优点。但这种方法也有以下明显缺点:相邻多边形的公共边界要数字化两遍,造成数据冗余存储,可能导致输出的公共边界出现间隙或重叠;缺少多边形的邻域信息和图形的拓扑关系;岛只作为一个单个图形,没有建立与外界多边形的联系。,2020/5/11,123,拓扑数据结构,主要特点:点是相互独立的,点连成线,线构成面拓扑数据结构最重要的技术特征和贡献是具有拓扑编辑功能,包括多边形连接编辑和结点连接编辑。在空间分析和应用中都具有非常重要的意义。拓扑数据结构索引法双重独立编码链状双重独立式,2020/5/11,124,该法采用树状索引以减少数据冗余并间接增加邻域信息,方法是对所有边界点进行数字化,将坐标对以顺序方式存储,由点索引与边界线号相联系,以线索引与各多边形相联系,形成树状索引结构。,索引法:,2020/5/11,125,树状索引编码消除了相邻多边形边界的数据冗余和不一致的问题,在简化过于复杂的边界线或合并相邻多边形时可不必改造索引表,邻域信息和岛状信息可以通过对多边形文件的线索引处理得到,但是比较繁琐。,2020/5/11,126,双重独立式DIME(DuallndependentMapEncoding),这种数据结构除了通过线文件生成面文件外,还需要点文件,2020/5/11,127,链状双重独立式,链状双重独立式数据结构是DIME数据结构的一种改进。在DIME中,一条边只能用直线两端点的序号及相邻的面域来表示,而在链状数据结构中,将若干直线段合为一个弧段(或链段),每个弧段可以有许多中间点。在链状双重独立数据结构中,主要有四个文件:多边形文件、弧段文件、弧段坐标文件、结点文件。,2020/5/11,128,弧段文件弧段号起始点终结点左多边形右多边形a51OAb85EAc168EBd195OEe1519ODf1516DBg115OBh81ABi1619DEj3131BC弧段坐标文件弧段号点号a5,4,3,2,1b8,7,6,5c16,17,8d19,18,5e15,23,22,21,20,19f15,16,g1,10,11,12,13,14,15h8,9,1i16,19j31,30,29,28,27,26,25,24,31,链状双重独立式,多边形文件多边形号弧段号周长面积中心点坐标Ah,b,aBg,f,c,h,-jCjDe,i,fEe,i,d,b,2020/5/11,129,矢量数据结构的属性数据表达,属性特征类型类别特征:是什么说明信息:同类目标的不同特征属性特征表达类别特征:类型编码说明信息:属性数据结构和表格属性表的内容取决于用户图形数据和属性数据的连接通过目标识别符或内部记录号实现。,2020/5/11,130,矢量数据结构的表达,空间对象,地物类型特征与制图属性,2020/5/11,131,矢量数据结构的特点,用离散的点描述空间对象与特征,定位明显,属性隐含用拓扑关系描述空间对象之间的关系面向目标操作,精度高,数据冗余度小与遥感等图象数据难以结合输出图形质量号,精度高,2020/5/11,132,栅格数据表现连续的数据。栅格中的每一个像元(或像素)是一个测量单元。栅格数据集的一个优点就是以连续数据的形式存贮和操作,这些数据可以是高程、水量表、污染物浓度或环境噪声的级别。栅格数据集最常见的来源是卫星影像或航空相片。栅格数据集也可以是一个要素(如建筑物)的照片。,模拟影像或采样数据,2020/5/11,133,栅格数据结构,栅格结构是指将地球表面划分为大小均匀紧密相邻的网格阵列,每个网格作为一个象元或象素由行、列定义,并包含一个代码表示该象素的属性类型或量值,或仅仅包括指向其属性记录的指针。因此,栅格结构是以规则的阵列来表示空间地物或现象分布的数据组织,组织中的每个数据表示地物或现象
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 老旧厂区项目实施进度与质量控制方案
- 海康监控考试试题及答案
- 技术转让合同认定条件与合同范本
- 学生通知书评语大全
- 加工型种薯购销合同
- 新能源汽车齿轴零件生产线项目环境影响报告书
- 双方协议离婚后独生子女抚养权及监护责任转移合同
- 离婚协议书:知识产权分割及商业秘密保护
- 商品混凝土供应与施工衔接技术方案
- 离婚补充协议孩子抚养费支付与子女医疗费用保障合同
- 2025年江西省中考语文试卷真题(含标准答案及解析)
- 工程石材吊装方案(3篇)
- 混凝土销售管理制度
- 2024年全国职业院校(中职组)技能大赛(植物嫁接)赛项考试题库
- 《江姐》教案-中职语文高一(高教版2023基础上册)
- 公司中小型会议策划方案
- T/CCT 017-2024中低温煤焦油
- 《中国传统文化》课件:佛教思想及其人生模式
- 医师多点执业协议书
- DB65∕T 3952-2016 反恐怖防范设置规范 学校
- 城市路灯照明节能改造技术方案及案例分析报告
评论
0/150
提交评论