一种基于虚基态的时空数据模型的扩展.doc_第1页
一种基于虚基态的时空数据模型的扩展.doc_第2页
一种基于虚基态的时空数据模型的扩展.doc_第3页
一种基于虚基态的时空数据模型的扩展.doc_第4页
一种基于虚基态的时空数据模型的扩展.doc_第5页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

精品论文一种基于虚基态的时空数据模型的扩展刘敬敏 11 大连理工大学 电子信息与工程学院,辽宁大连(116024)e-mail:摘要:针对基于传统的基态修正模型的时态地理信息系统历史数据的存储和检索效率较低 的问题,并结合现有的五种基于基态修正模型的改进模型,本文提出以两级对象变化基数分 别确定实基态距和虚基态距的方法,对传统的基态修正模型进行改进,并针对改进后的基态 修正模型分析了时空数据的检索流程,实现了多种方案的时空数据检索。关键词:时态 gis;时空数据;基态修正;面向对象;时空数据模型;时空数据库;基态距 中图分类号:tp3111引言时间是地理信息的基本成分之一,在时态gis中如何处理时间的问题已经不可回避地摆 到了gis工作者面前,时态gis正成为gis研究和应用的重要领域之一。时态gis的关键问题 是建立合适的时间与空间联合的数据模型时空数据模型,更有效地存储、组织、管理和完 善地理对象的属性、空间和时间语义,以便更准确地重现历史、跟踪变化、预测未来1。目 前比较流行的时空数据模型有连续快照模型、时空复合模型、第一范式(1nf)模型、非第一 范式(n1nf)模型2、基态修正模型等,但它们在实现时间序列数据的管理上,均存在需依赖 大量冗余数据才能进行快速历史查询,或者顾及数据冗余,却造成历史回溯性能低下等不足。 传统的基态修正模型虽能提高时态分辨率,并能减少数据冗余量,但在历史动态变化频繁的 情况下,就凸显出其历史回顾效率低下的缺点3。为了克服这一缺点,在进行基态修正模型 理论的研究中,多数学者都在其基本理论的框架上根据实际的应用进行进一步的改进和扩展4-8。其中基态距优化被证明是一个提高历史数据存储和检索效率的有效的方法之一8-10。2空间对象的时态特征分析在研究时空数据库时,提出了两个时间概念,事件时间(event time)和系统时间(system time),事件时间是指空间对象在现实时间中发生变化的时间,系统时间是指数据库中用来 跟踪记录变化的时间13,一般只考虑事件时间13,14。有 3 种方法来表达空间对象在数据库 中的变化15,16:当一个或者若干个对象在一次事件中发生变化时,对这些对象所涉及的关系 表重建一个新的版本;对变化的对象给定一个新的版本;仅仅对对象变化所涉及的属性字段 增加一个新的值。目前大多数学者都是针对某一种方法进行改进,少数学者将两种方法进行 结合7。这种方法存在的问题如下:方法 1 冗余度太大,版本太多;方法 2 在对象变化次数 较少时效果很好,但当对象变化累积到一定数量时,存在冗余度大和检索时间长的问题;方 法 3 在目前条件下,商业化的关系数据库软件处理起来很不方便。在空间对象发生变化的过程中,包括了现有对象的消亡和新对象的产生,以及空间对象 的合并、分割、变形属性信息的变化、拓扑关系的变化等多种情况。对象的消亡和对象的产生都是时态数据库记录的范畴。对象的空间形状变化与属性变化也是对象的消亡与产生的过 程:当一个对象的空间形状或属性信息发生改变时,改变前的对象(旧对象)存入历史库,改变后的对象(新对象)作为现势数据存入当前数据版本,并在时态数据库中标记旧对象的消亡时间和新对象的产生时间。因此,看似复杂的空间对象的变化实际上产生的时态信息只 有两种:旧对象的消亡时间和新对象的产生时间。旧对象的消亡并不是将对象从数据库中物 理删除,而只是改变对象的时态信息,将对象变为历史记录存储于数据库中。因此可以将空-6-间对象看似复杂的时态变化归纳为两种:旧对象的消亡和新对象的产生。变化过程如表 1所示。表 1 空间对象一次事件时间中发生变化产生的时态信息tab.1 time information in a translation of event-time发生变化类型导致的结果产生的时态信息对象的删除空间对象的消亡1 空间对象的消亡时间空间图形的变形1 旧对象的消亡时间和 1 新对象的产生时间 属性信息的变化1 旧对象的消亡时间和 1 新对象的产生时间对象的修改拓扑关系的变化1 旧对象的消亡时间和 1 新对象的产生时间 空间图形的分割1 旧对象的消亡时间和 2 新对象的产生时间 空间图形的合并2 旧对象的消亡时间和 1 新对象的产生时间新对象产生空间对象的产生(含图形、属 性和拓扑关系,属性可为空)1 新对象的产生时间3传统的基态修正模型及其改进模型对于基于基态修正模型的存储方式,国内外的学者以及进行了大量的研究,在减少数据 冗余和提高数据检索效率方面取得了很多进展。3.1 传统的基态修正模型图 1(a)为传统的基态修正模型,该模型是对序列快照模型的改进,为避免序列快照模型 对未发生变化部分特征的重复进行记录,存储某一时刻的状态作为基态(记为 s0 ),以快照 方式存储,然后按照一定的时间间隔,记录其他时刻的数据状态相对于基态的变化量(记为11si )。这样就可以用 si = s0 + si 表达空间的变化过程。基态修正模型中对每个对象只需存储一次,每次变化,只有很小的数据量需要记录,同时,只有在事件发生或事件发生 变化时才存入系统,时态分辨率刻度值与事件发生的时刻完全对应。基态修正模型不存储每 个对象不同时间段的所有信息,只记录一个数据基态和相对于基态的变化值,提高了时态分 辨率,较好的解决了数据冗余问题。但是又给时空对象的索引、时空关系表达和分析带来了 困难。其不足之处概括为:对历史数据的检索时间长和时空对象的空间关系处理不好。3.2 基态修正模型的改进模型数据冗余与时空操作效率是时空数据模型中的一对矛盾,如何在两者之间取得平衡是许 多学者一直致力解决的问题,以此为切入点,国内外许多学者对基态修正模型作了一系列的 改进。langran11、张祖勋、曹志月、张宝钢、余志文、李勇等人提出了如图 1 所示的几种 基态修正模型。t0t1(a)tt0t1现状tt(b)现状tt0t1(c)现状t0t1t(d)现状tt0t1t0t1现状现状(e)(f)图 1 几种基态修正模型的改进模型fig.1 improved models of base state with amendments图 1(b)是 langran12提出的基态修正方式,只记录了一个数据基态和相对于基态的变化 值,因而对历史数据进行检索时的效率很低。图 1(c)是张祖勋9等改进后的基态修正方式,他们将时间段分成两部分,部分解决了检 索时历史数据过多的问题,当时间段进一步延长时,未能从根本上解决历史数据的检索效率 问题。图 1(d)采用动态多级索引方法10,通过动态创建差文件和基态的方法,缓解了历史数据 的检索效率问题,但是使用差文件数作为基态距不利于差文件的更新和索引的建立,基态距 是等距的,基态的分布位置也并不是最优的基态位置。图 1(e)是余志文7等根据变粒度基态距因子理论提出的修正方式,改进主要在于基态的 动态建立和基态的距离随着时间的逼近越来越短。目前仍存在两个关键性的问题:对于事件 时间分布不均匀的情况下,基态距与时间的相关性会减弱;基态的动态更新问题。作者引入 等比系数来解决基态距因子间及基态距因子和总差文件数之间的相关性问题,这是一种比较 新的思路,但是等比系数的确定比较困难。由于等比系数为小于 1 的数,基态距会随着变化 次数的增加,基态距会急剧减小,当系统运行到一定时间的时候,基态距会很小,意味着不 断的建立基态,这是数据库的容量所不允许的,最终会导致系统的崩溃。图 1(f)是李勇8以对象变化临界指数来优化基态距的修正方式,改进主要在于基态的动 态建立和基态建立的条件考虑到前一个基态的数据量的大小:两个相邻基态之间的基态距不 是等距的,也不是随时间的迫近而递减的,而是根据对象发生变化的次数是否达到或超过一 个临界值 m 来确定的,其中 m 0 。这种方式可实现基态的动态更新,但是由于 m 是一 个大于 0 的数,没有上限,数据结果发散, m 取值范围太大,确定也比较困难。而且随着 时间的推移,基态距会越来越大,不利用现状数据较近的数据的回溯。虽然提出了不同的基 态段的 m 值不同,但是随着数据量的无限增加,m 值取得最小的时候都很难实现基态距优 化。导致离现状越近的数据检索越慢,这样不符合习惯。3.3 基于虚基态的基态修正模型本文引入两个概念:实基态和虚基态。实基态就是对象变化集聚到一定的量的时候所需 要产生的新的数据版本。虚基态是指对象变化集聚到一定量的时候所需要产生的一个变化量的集合。根据对上述几种基态修正模型的改进模型进行分析,可以发现,影响数据检索效率的因 素有基态的位置、基态的个数和基态的数据量8,基态的位置设在使用频率较高的时段,则 检索效率就高;基态建立的越多,检索的就越快;基态的数据量越大,加载基态数据的时间 长。同时基态的数据量也决定着基态的建立,另一个影响基态建立的因素是基态之间对象变 化的次数。相邻基态之间对象的变化次数多,则产生的历史数据量大。由于基态的数据量我 们无法进行人为的控制,基态的位置设在什么地方最优,是随机的,跟时间相关度也不大, 故也是不确定的,所以可以提高数据检索效率的主要方法就是改变相邻基态间对象的变化次 数,即优化基态距。而影响历史数据产生大小的主要因素是基态的多少和变化量的大小,而 且主要是基态的多少,基态越多,数据冗余就越多,变化量越大,存储空间占用就越大。优 化基态距正是在两者之间取得一个平衡,使得在满足检索效率的情况下,存储空间尽量小。 因此,本文提出以两级对象变化基数来优化实基态距和虚基态距的修正方式:两个相邻基态 之间的基态距不是等距的,也不是随时间的迫近而递减的,而是根据对象发生变化的次数是 否达到或超过一个临界值来确定的,相邻两个基态之间有一个或若干个虚基态,虚基态的建 立也是根据对象变化的次数是否超过一个临界值来确定,这个临界值要比基态建立的临界值 小。虚基态和实基态均存放在一个历史库中,并用一个属性字段进行区分。改进后的基态修正时空数据模型如图 2 所示。tt0t1虚基态实基态图2 基于虚基态的基态修正模型fig.2 improved model based on virtual base state一次事件时间对象发生变化的情况只有两种:旧对象的消亡和(或)新对象的产生。由 于需要保存历史数据,旧对象的消亡并不是将对象从数据库中物理删除,而只是改变对象的 时态信息,该对象仍存储于数据库中。当对象发生变化后,相邻的两个基态的空间对象数的 变化情况如下所述:设第 n 1 个基态的空间对象数为 qn1 ,假设 qn 为待建立的基态所含的空间对象数,qm 为这两个相邻基态之间最大的空间对象数,这三者的关系根据对象操作的不同而不同,当一 次事件时间中:(1)只有增加操作时,qm = qn qn 1 ;(2)只有删除操作时,q = q q ;m n 1 n(3)删除的命令多于增加和修改的命令时,q q q ;mn 1n(4)删除的命令少于增加和修改的命令时,q= q q ;mnn 1(5)删除的命令等于增加和修改的命令时,q q= q 。mn 1n从上面分析可以得知,只有qm qn 1时才需要建立基态,第(2)种情况是不需要建立基态的。设 m 和v 为实基态临界值和虚基态临界值,且0 v m 1 ,建立基态过程如下:(1)当v (qm qn 1 ) / qm m时,建立一个虚基态;(2)当(qm - qn-1 )/qm m 时,建立一个实基态;例如,v = 0.4, m = 0.6 ,qn-1 = 150 ,则根据上述公式计算可得:在一次事件中, qm 250 时,建立一个虚基态,qm 375 时,建立一个实基态。使用这种方法,可以在保证检索效率的情况下,通过建立一些数据量比较小的虚基态, 从而减小实基态的建立,减少了数据冗余,比较好的解决了存储空间和检索效率的矛盾。4改进基态修正模型的检索实现时空数据检索的主要工具是时空数据查询语言(stsql),作为时空数据库的应用接口, stsql语言继承了标准语言的全部功能,在语言的用户表示上与标准sql保持统一,提供了数 据模型、数据表示和数据操作的可重用性17。时空数据的检索包含两个方面的条件:时间条件和空间条件。空间条件主要是基于空间 关系的查询,由于对象关系型gis一般是通过开发自己的空间数据引擎(sde)来实现对空间 关系的查询,因而在这里我们不考虑空间关系的检索,而主要关注时态问题(时间条件)。 时态数据的检索主要有两种方式:一种是基于时间点的检索,另一种是基于时间段的检 索(即查询两个事件时间之间的数据)。时间点检索方式的实现较为简单,当用户输入检索j的时间( t j )时,首先判断距离所要查找事件发生的时间最近的基态( qn )和虚基态( qm ), 然后在基态 qn 的基础上加上 qm 和相应差文件,就可以得到用户所要的结果,基于时间段的 查询也就是查询两个时间的快照并进行对比( ti 和 t ),如图3所示。tqqt0t1titjnm现状图3 基于虚基态的基态修正模型的检索实现fig.3 realization of search in improved model based on virtual base state5总结(1)在分析了现有的几种基于基态修正模型的改进的模型的基础上,提出的以两级对象 变化基数分别确定实基态距和虚基态距的方法,解决了由于事件时间分布不均匀而引起的基 态距与时间相关性减弱的问题,实现了基态的动态更新,合理地优化了历史数据的存储和检 索效率问题,并具备较强的实用性和灵活性。针对改进的基态修正模型进行时空数据查询分 析,实现了基于时间点和时间段的不同方式的数据检索,提高了历史数据的检索效率。(2)改进的基态修正模型在一定程度上减小了数据冗余并提高了数据检索效率,特别是 在相邻的两个基态间对于一个对象的多次修改或相关联的几个对象同时变化时,虚基态更能 体现出压缩数据的优势,但是在无关联的一些离散对象变化时,虚基态的建立对于减小数据 冗余和提高检索效率的优势并不明显,这将是下一步研究的方向。(3)改进的基态修正模型只考虑通过优化基态距来解决历史数据存储和检索效率的问 题,也可以考虑通过压缩差文件数据量的大小实现减小冗余数据和提高检索效率的目的。参考文献1 王华敏, 陈继祥, 于雷易. 基于基态修正模型的地籍时空数据库设计与实现j. 测绘信息与工程,2003,28(3):9-112 陈军,陈尚超,唐治锋等.用非第一范式关系表达 gis 时态属性数据j.武汉测绘科技大学学报, 1995,20(1).3 张丰,刘仁义,刘南.基于动态多级基态的修正模型的 tgis 研究j.中国图象图形学报, 2004,11(9) 4 刘仁义,刘南,苏国中.时空数据库基态修正模型的扩展j.浙江大学学报(理学版), 2000,27(2).5 刘仁义 , 刘南 . 基态修 正时 空数据 模型 的扩展 及在 土地产 权产 籍系统 中的 实现 j. 测 绘学报 ,2001,30(2):169-1726 程昌秀 , 等 . 对 象关系型 gis 中改 进基 态修正时 空 数据模型 的 实现 j. 中国 图象图形 学 报 ,2003,8(a)(6):697-702.7 余志文,等.基态修正时空数据模型的进一步扩展j 中山大学学报,2003,42(1).8 李勇,等.基于基态距优化的改进基态修正时空数据模型研究j.测绘科学,2007,32(1). 9 张祖勋,黄明智.时态 gis 数据结构的研讨j.测绘通报,1996, (1):19-22.10 曹志月,刘岳.一种面向对象的时空数据模型j.测绘学报,2002, 31(1):87-92.11 齐庆超, 等. 一种多基态修正时空数据模型改进的方法j. 测绘科学,2008,33(4):178-180.12 langrang,chrismanr.aframeworkfortemporalgeographicinformation.cartographica,1988,25(3):1-14.13 龚健雅. gis 中面向对象时空数据模型j.测绘学报,1997,26(4):289-298.14 chen j,le y f. describing land subdivision process with extended space-time composite modela. in: proceedings of liesmars, 1995c, wuhan,1995.15 arian g. a temporally oriented datamodelj. acm transactions database system,1986,(11).16 gadia s k. a homogeneous relational model and query languages for temporal databasej. acm transactions database systems, 1998,(13):418-448.17 任家东,高伟,任东英.时空数据库中时空查询语言的设计与实现j

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论