武汉大学空间数据库复习资料整理.docx_第1页
武汉大学空间数据库复习资料整理.docx_第2页
武汉大学空间数据库复习资料整理.docx_第3页
武汉大学空间数据库复习资料整理.docx_第4页
武汉大学空间数据库复习资料整理.docx_第5页
免费预览已结束,剩余2页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

空间数据库原理第一章 数据库1、空间数据库:提供结构用于存储和分析空间数据空间数据由多维空间的对象组成在标准数据库中存储空间数据需要大量的空间,从一个标准数据库中检索查询空间数据需要很多时间并且很累赘,通常导致很多错误。2、DBMS: (数据的操作系统)一种操纵和管理数据库的大型软件,用于建立、使用和维护数据库。SDBMS:增加了处理空间数据功能的DBMS。在它的数据模型中提供空间数据类型和查询语言至少在执行时支持提供空间数据类型:空间索引;空间链接有效的算法。在地理信息系统中为什么要研究专门的空间数据库系统?1.空间数据库能提供结构存储和空间数据分析2.空间数据库包含多面空间的对象3.在标准数据库中存储空间数据会需要过多的空间4.标准数据库的查询反馈和空间数据分析会消耗过多时减并且留下大量错误空间5.空间数据库能提供更多有效率的存储和空间数据分析3、哈希(Hash)函数:一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。质数除余法(直接取余法):f(x):=x mod maxM ;maxM一般是不太接近2t的一个质数。乘法取整法:f(x):=trunc(x/maxX)*maxlongit) mod maxM,主要用于实数。平方取中法:f(x):=(x*x div 1000 ) mod 1000000);平方后取中间的,每位包含信息比较多。第二章 数据库基本原理1、数据模型Data Model:关于数据基础或对象以及他们之间的关系的抽象描述被表示在一个数据库中。3、概念数据模型:也称语义模型,关于实体和实体间联系的抽象概念集,用统一的语言描述、综合、集成的用户视图。2、数据字典:是指对数据库的内容包括数据项和属性码定义,是元数据的重要组成部分。(是指对数据的数据项、数据结构、数据流、数据存储、处理逻辑、外部实体等进行定义和描述,其目的是对数据流程图中的各个元素做出详细的说明。)Metadata:是描述数据的数据,主要是描述数据属性的信息,用来支持如指示存储位置、历史数据、资源查找、文件记录等功能。3、数据库设计和实现:需求分析概念数据建模逻辑建模(参考DBMS和基础数据模型)物理建模或者实现(参考物理存储和电脑环境)。需求调查:根据数据库设计的主题对用户的需求进行调查,了解用户特点和要求,取得设计者与用户对需求的一致看法。需求分析:指的是在创建一个新的或改变一个现存的系统或产品时,确定新系统的目的、范围、定义和功能时所要做的所有工作。4、E-R图:描述对象类型之间的关系,是表示概念模型的一种方式。第三章 基本空间概念1、凸多边形:把一个多边形任意一边向两方无限延长成为一条直线,如果多边形的其他各边均在此直线的同旁,那么这个多边形就叫做凸多边形。2、点集拓扑:一个基于相邻关系定义拓扑学空间的方法。3、大圆距离:大圆距离指的是从球面的一点A出发到达球面上另一点B,所经过的最短路径(圆弧)的长度。曼哈顿距离:两个点上在标准坐标系上的绝对轴距之总和。4、欧式空间(欧几里德空间):空间的坐标模型。作用:能将空间属性转化为以实数为元组的属性;坐标系包括一个确定的原点和在原点交叉的一对正交轴线。拓扑几何空间:关注的属性在拓扑转换能下保持不变直观上看,拓扑转换表现为橡皮条转换能协调由一系列不同固定点和相交在原点的正交线组成的框架,使其在拓扑转换时仍然能保持各对象的邻接关系。5、G图:被定义为有限非空点集和不同节点的无序对(边缘)的总和。第四章 空间数据模型1、模型Model:(字典解释)一组计划(蓝图)是对一个系统的微型解释,用于分析感兴趣的属性(特定解释)一个模型是对现实世界中实体或现象的艺术构造,使其简化和抽象,但是保留了事物的一些固有特征和构造。数据模型Data Model:一个属性集的指定结构或模式 数据的文本描述 促进一些性质的初始分析。2、建模应用域:域建模:管理领域,网络概念模型:实体/物体,属性,关系 逻辑模型:在数据库或者数据库管理系统中实例化物理模型:实际执行。领域模型:可以被看作是一个系统的概念模型,用于以可视化的形式描述系统中的各个实体及其之间的关系。空间数据模型三个层次:概念数据模型:也称语义模型,关于实体和实体间联系的抽象概念集,用统一的语言描述、综合、集成的用户视图逻辑数据模型:表达概念模型中数据实体(或记录)及其间的关系物理数据模型:描述数据在计算机中的物理组织、存储路径和数据库结构。3、场模型:也称作域模型,是把地理空间中的现象作为连续的变量或体来看待。适合用来描述具有一定空间内连续分布特点的对象,根据应用的不同场可以表现为二维或三维场。表达与存贮:表现形式:经常用一系列等值线组成,等值线就是地面上所有具有相同属性值的点的有序集合。方法:用栅格数据结构实现,栅格模型(例如遥感影像)、DEM(数字高程模型)、TIN(不规则三角网)模型、空间插值模型和等高线模型。4、对象模型:也称要素模型,将研究的整个地理空间看成一个空域,地理现象和空间实体作为独立的对象分布在该域中。适用于具有明确边界的地理现象建模。表达与存贮:针对不同地物要素表现形式:点对象:有特定位置,维数为0的物体线对象:维数为1的空间组分,有一系列坐标表示多边形对象/面状实体:由一封闭曲线加内点来表示。方法:用矢量数据结构实现。5、场Fields:用于收集或显示属性域的空间结构。物体Objects:离散独立的实体,每个都与属性地理相关。6、镶嵌模型:将平面分解为互不相交的多边形,可以是规则的多边形也可以是不规则的多边形。7、Isotropic field各向同性场:沿不同方向属性相同。Anisotropic field各向异性场:沿不同方向属性不同。8、Spatial auto-correlation空间自动相关:空间场的聚类分析。9、数字高程模型DEM:模拟地形测量的高程(数字地面模型DTM:同样模拟其他地面要素)。这个空间结构直接显示了嵌入欧几里德2或3维空间的一部分地球表面。10、数据库设计:数据库应用建模三步法:概念数据类型,关系和约束条件(ER model)关系模型的逻辑映射和查询语言(Relational Algebra)物理文件结构,索引。11、E-R图:ER模型的表示,描述对象类型之间的关系。第五章 地理数据空间表示和算法1、Spaghetti面条数据模型:仅记录空间对象的位置坐标和属性信息,不记录拓扑关系。存储方式:独立存储:空间对象位置直接跟随空间对象点位字典:点坐标独立存储,线、面由点号组成。例:2、Topological拓扑数据模型:最广泛使用的矢量数据模型借用了拓扑学的原理来描述空间事物通过拓扑关系,识别地图中的空间数据关系不仅记录空间对象的空间位置和几何特性,还记录空间关系。表达对象:主要点、线、面之间的关联拓扑关系。例:3、DIME:是一种把几何量度信息(直角坐标)和拓扑逻辑信息结合起来的系统,用于表示区域实体的一个单独的非覆盖集。其基本元素是连接两个结点的一条线段,称为段。段通过她的两个结点及两侧区域来标识。例:POLYVRT:是DIME的扩充,在这个模式里链作为基本元素取代了段。链扮演了一个重要的拓扑角色,同时形成了几何学与区域实体的接口。POLYVRT首先引进了地图数据结构,用于继续形成各种各样内部数据结构的支柱,这些结构我们今天仍然用于表示段或链。4、TIN:一种表示数字高程模型的方法,根据区域有限个点集将区域划分为相连的三角面网络,区域中任意点落在三角面的顶点、边上或三角形内。如果点不在顶点上,该点的高程值通常通过线性插值的方法得到。例:数据组织:存储每个点的高程,还要存储其平面坐标、节点链接的拓扑关系,三角形及邻接三角形等关系。应用:三维显示技术、三维分析、三角网内插、等高线追踪、内插等高线。5、栅格链式编码:从某一点开始用沿八个基本方向前进的单位矢量李链来表示对象(线状地物或多边形的边界)。行(游)程编码:按行的顺序连续且属性值相同的若干栅格。块式编码:将游程扩大到二维情况,把多边形范围划分为若干具有同一属性的正方形,然后对各个正方形进行编码。6、空间索引:是指根据空间要素的地理位置、形状或空间对象之间的某种空间关系,按一定的顺序排列的一种数据结构,一般包括空间要素指标,外包络矩形以及指向空间要素的指针。7、R树:是一种高度平衡的树,由中间节点和叶节点组成,实际数据对象的最小外接矩形存储在叶节点中,中间节点通过聚集其低层节点的外接矩形形成,包含所有这些外接矩形。优点:R树是一种动态索引结构,即:它的查询可与插入或删除同时进行,而且不需要定期的对树结构进行重新组织。R 树的搜索算法是一个递归的过程。设搜索的区域为 S,则搜索区域 S 内的空间对象的过程如下: (1)子树的搜索:从 R 树的根结点 T 开始,如果 T 不是叶子结点,那么依次判断该结点中各单元的 I 与区域 S 的空间位置关系,如果 I 与搜索区域 S 相交,则该单元所指向的结点为待搜索的根结点,重复进行上面的操作。如果 T 是叶子结点则转至第二步。(2)叶子结点的搜索:如果 T 是叶子结点,依次判断其中的空间对象与搜索区域 S 之间的空间位置关系,如果空间位置对象落在搜索区域 S 以内,则表明其满足搜索条件。8、Quad-Tree四叉树:是一种每个节点最多有四个子树的数据结构。四叉树索引的基本思想是将地理空间递归划分为不同层次的树结构。它将已知范围的空间等分成四个相等的子空间,如此递归下去,直至树的层次达到一定深度或者满足某种要求后停止分割。四叉树的结构比较简单,并且当空间数据对象分布比较均匀时,具有比较高的空间数据插入和查询效率,因此四叉树是GIS中常用的空间索引之一。可以用来在数据库中放置和定位文件(称作记录或键)。9、BSP Tree二叉树:二叉树是每个结点最多有两个子树的有序树。二叉树常被用于实现二叉查找树和二叉堆。值得注意的是,二叉树不是树的特殊情形。在图论中,二叉树是一个连通的无环图,并且每一个顶点的度不大于2。有根二叉树还要满足根结点的度不大于2。有了根结点后,每个顶点定义了唯一的根结点,和最多2个子结点。然而,没有足够的信息来区分左结点和右结点。大题:1)概念设计概念设计是通过对错综复杂的现实世界的认识与抽象,最终形成空间数据库系统及其应用系统所需的模型。具体是对需求分析阶段所收集的信息和数据进行分析、整理,确定地理实体、属性及它们之间的联系,将各用户的局部视图合并成一个总的全局视图,形成独立于计算机的反映用户观点的概念模式。概念模式与具体的DBMS无关,结构稳定,能较好地反映用户的信息需求。表示概念模型最有力的工具是E-R模型,即实体-联系模型,包括实体、联系和属性三个基本成分。用它来描述现实地理世界,不必考虑信息的存储结构、存取路径及存取效率等与计算机有关的问题,比一般的数据模型更接近于现实地理世界,具有直观、自然、语义较丰富等特点,在地理数据库设计中得到了广泛应用。2)逻辑设计在概念设计的基础上,按照不同的转换规则将概念模型转换为具体DBMS支持的数据模型的过程,即导出具体DBMS可处理的地理数据库的逻辑结构(或外模式),包括确定数据项、记录及记录间的联系、安全性、完整性和一致性约束等。导出的逻辑结构是否与概念模式一致,能否满足用户要求,还要对其功能和性能进行评价,并予以优化。从ER模型向关系模型转换的主要过程为:确定各实体的主关键字;确定并写出实体内部属性之间的数据关系表达式,即某一数据项决定另外的数据项;把经过消冗处理的数据关系表达式中的实体作为相应的主关键字根据、形成新的关系。完成转换后,进行分析、评价和优化。3)物理设计物理设计是指有效地将空间数据库的逻辑结构在物理存储器上实现,确定数据在介质上的物理存储结构,其结果是导出地理数据库的存储模式(内模式)。主要内容包括确定记录存储格式,选择文件存储结构,决定存取路径,分配存储空

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论