(计算机软件与理论专业论文)时空数据模型的建模研究与应用.pdf_第1页
(计算机软件与理论专业论文)时空数据模型的建模研究与应用.pdf_第2页
(计算机软件与理论专业论文)时空数据模型的建模研究与应用.pdf_第3页
(计算机软件与理论专业论文)时空数据模型的建模研究与应用.pdf_第4页
(计算机软件与理论专业论文)时空数据模型的建模研究与应用.pdf_第5页
已阅读5页,还剩53页未读 继续免费阅读

(计算机软件与理论专业论文)时空数据模型的建模研究与应用.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

时空数据模型的建模研究与应用 摘要 随着时空信息数据的大规模增长,数据挖掘理论的不断发展,时空数据挖掘已 经成为计算机界及地理信息系统专家学者研究的热点。时空数据模型是时空数据挖 掘的核心和基础,因此时空数据模型的研究具有重要的意义。 本文介绍了时空数据模型的基本概念,详细分析了现有时空数据模型的基本思 想,讨论了各个模型的优缺点。在此基础上,针对常用数据模型在时空数据挖掘中 具有较强应用指向性,通用性不强的问题,利用面向对象建模不受关系模型范式的 限制,支持对象的嵌套和变长记录等优点,提出了一种时空特征与相互关系一体化 的时空数据模型。形式化定义了该模型的元素组成、信息范畴,详细描述了元素间 的相互关系,并给出了时空特征对象的特征操作、空间操作、时间操作及三者互操 作。深入探讨了时空数据挖掘中可发现的知识类型,挖掘方法和挖掘流程等,并对 现有的关联规则进行了扩展,以处理时空数据,使其可发现时空关联规则。 此外,基于面向对象时空数据模型,实现了城市规划土地信息系统,设计了有 关的时空对象类,实现了土地管理的基本查询功能和更新功能,并进行了数据挖掘, 验证了该模型的有效性。 关键词:时空数据模型;时空数据挖掘;面向对象 t h er e s e a r c ha n d a p p l i c a t i o n o fs p a t i a l - t e m p o r a ld a t am o d e l a b s t r a c t a st h e s p a t i a l t e m p o r a l d a t a i n a e a s i n gc o s m i c a l l ya n dd a t am i n i n g t h e o r i e s d e v e l o p i n gc o n t i n u o u s l y , s p a t i a l - t e m p o r a ld a t am i n i n gh a sb e c o m ear e s e a r c hh o t s p o to f e x p e r t sa n ds c h o l a r si nf i e l d so fc o m p u t e ra n dg e o g r a p h yi n f o r m a t i o ns y s t e m a sb e i n g t h ec o r ea n dt h eb a s eo fs p a t i a l - t e m p o r a ld a t am i n i n g , t h er e s e a r c ho fs p a t i a l - t e m p o r a l d a t am o d e lh a s v e r yi m p o r t a n tm e a n i n g t h i sp a p e ri n t r o d u c e dt h eb a s i cc o n c e p t i o no f s p a t i a l - t e m p o r a ld a t am o d e l , a n a l y z e d e x i s t i n gs p a t i a l - t e m p o r a ld a t am o d e l si nd e t a i l , a n dd i s c u s s e dp r o sa n dc o i l so fe a c ho n e t os o l v et h ep r o b l e mt h a tc o m i n o ns p a t i a l - t e m p o r a ld a t am o d e l su s u a l l yp o i n tt os p e c i f i c a p p l i c a t i o na n dc a n n o tb eu n i v e r s a l , t h i sp a p e ru t i l i z e dt h a to b j e c t - o r i e n t e dm o d e l i n gh a d l i t t l el i m i to fr e l a t i o nm o d e lp a r a d i g ma n ds u p p o r t e dt h en e s t i n ga n dv a r i a b l el e n g t h r e c o r do ft h eo b j e c t as p a t i a l - t e m p o r a ld a t am o d e lw a s p r o p o s e dw h i c hh a si n t e g r a t i v e a t t r i b u t i v ec h a r a c t e ra n ds p a t i a l - t e m p o r a lr e l a t i o n t h ee l e m e n t sf o r m ,i n f o r m a t i o n c a t e g o r ya n di n t e r r e l a t i o n sb e t w e e ne l e m e n t so ft h i sm o d e la r ef o r m a l i z e dd e f i n e d t h i s p a p e ra l s os h o w e dt h ea t t r i b u t eo p e r a t i o n , s p a t i a lo p e r a t i o n , t e m p o r a lo p e r a t i o no f s p a t i a l - t e m p o r a lo b j e c t sa n do p e r a t i o n sa m o n gt h e m b e s i d e s , b a s i n go nt h i so b j e c t - o r i e n t e ds p a t i a l 4 e m p o r a ld a t am o d e l , t h i sp a p e r r e a l i z e dai n f o r m a t i o nm a n a g e m e n ts y s t e mo fc i t yg r o u n dc o n t r i b u t i o n , d e s i g n e dr e l a t e d s p a t i a l - t e m p o r a lo b j e c t s ,a n dr e a l i z e db a s i cf u n c t i o n so fq u e r y , m o d i f i c a t i o na n dd a t a m i n i n g a tl a s tt h i sd a t am o d e li sp r o v e dt ob ee f f e c t i v e g e y w o r d s :s p a t i a l - t e m p o r a ld a t - m o d e l ;s p a t i a l - t e m p o r a l 妇t m i n i n g ; o h j e e r - o r i e n t e d 学位论文独创性声明 本人声明,所呈交的学位论文系本人在导师指导下独立完成的研究成果。文中 依法引用他人的成果,均已做出明确标注或得到许可。论文内容未包含法律意义上 已属于他人的任何形式的研究成果,也不包含本人已用于其他学位申请的论文或成 果。 本人如违反上述声明,愿意承担由此引发的一切责任和后果。 论文作者签名: 狐最 日期:们年r 月侈日 学位论文知识产权权属声明 本人在导师指导下所完成的学位论文及相关的职务作品,知识产权归属学校。 学校享有以任何方式发表、复制、公开阅览、借阅以及申请专利等权利。本人离校 后发表或使用学位论文或与该论文直接相关的学术论文或成果时,署名单位仍然为 青岛大学。 本学位论文属于: 保密口,在年解密后适用于本声明。 不保密彰 ( 请在以上方框内打“”) 论文作者签名:芳良燕 日期:。7 年厂月f 妒日 导师签名:6 p 广彳矿1 0 日期:d 7 年f 月弘日 未经许可,任何单位及任何个人不得擅自使用) 引言 1 、研究目的和意义 引言 由于时空信息数据的爆炸性增长与时空知识贫乏的矛盾日益突出,以及传统数 据挖掘研究技术的快速发展,使得时空数据挖掘这一门新兴学科应运而生。时空数 据挖掘( s p a t i a ld a t am i n i n g ) “”是指从时空数据库中抽取没有清楚表现出来的 隐含的知识和时空关系,并发现其中有用的特征和模式的理论、方法和技术。时空 数据挖掘是数据挖掘研究的前沿领域之一,其研究主要受到空间数据挖掘和时态数 据挖掘研究的影响,并以经典的数据挖掘理论为基础。近年来,借助于已有数据挖 掘的研究成果,时空数据挖掘这一学科的发展更加迅猛,同样由于时空信息独特的 复杂性,也使得时空数据挖掘的研究更加艰难,因而更加富有挑战性。 当前时空数据挖掘研究主要分为两大方向:一是从事时空数据挖掘方法和技术 的研究4 ”,偏重于对时空对象的位置坐标和时空关系的描述,而对对象的非时空 特征重视不够,如空间分布计算、空间分类、空间规则归纳等,尽管采用了遗传算 法、神经网络、决策树、粗糙集等学习方法,但非时空特征如何与位置坐标、时空 关系有机的结合,仍需进一步研究;另一方面,从事时空数据挖掘技术的应用者“”, 偏重于对时空对象的非时空特征的描述,时空关系和空间坐标没有纳入计算模型, 实际上仅是对特征数据的挖掘。 时空数据模型”是研究时空数据挖掘的基础,它刻画了现实世界中时空实体 及其相互之间的关系,为时空数据的组织和时空数据挖掘的设计提供了基本的方法, 因此时空数据模型的研究对设计时空数据库和进行时空数据挖掘起着举足轻重的作 用。时空数据模型是在时间、空问和特征语义方面完整地模拟客观地理世界的数据 模型,是对客观现实世界的抽象和表示。时空数据模型的数据组织和处理方法与非 时空的数据库模型有很大差别,因此,非空间的时态数据库模型和非时间的空间数 据库模型的研究成果并不完全适合于时空数据模型。 目前国际上已有l a n g r a n 、c h r i s m a n “”“”1 等人提出了一系列时空数据模型,这 些模型在表达时空数据时各有优劣。常用的时空数据模型主要有基于栅格的时空数 据模型、基于矢量的时空数据模型、基于时间的时空数据模型以及面向对象的时空 数据模型等。 这些时空数据模型的提出对时空数据的存储和处理提供了较为有效的手段,但 由于时空数据挖掘的处理对象是时空实体网络,结构极其复杂,该类时空数据模型 中存在大量数据的冗余存储,时空特征对象语义表达不完整,模型通用性不强,因 此迫切需要建立一种时空特征与时空关系一体化的时空特征对象概念模型,对时空 1 青岛大学硕士学位论文 特征对象的信息范畴及相互关系进行完整定义和形式化描述,并探讨把时空对象纳 入数据挖掘计算的方法,以期最终建立能用于复杂时空对象建模和进行时空数据挖 掘的模型。 目前,尽管时空数据挖掘的相关理论基础尚跟不上应用发展,但是基于数据挖 掘研究成果日渐完善,以及数字地球和数字城市的建设需要,时空数据挖掘已得到 广泛应用。如s k i c a t ( s k yi m a g ec a t a l o g i n ga n da n a l y s i st 0 0 1 ) ”1 已经发现了1 6 个新的极其遥远的类星体;p o s s ( p a l o m a ro b s e r v a t o r ys k ys u r v e y ) ”系统将天空 图像中的星体对象分类准确性从7 5 提高到9 4 ;m a g e l a ns t u d y 0 1 系统通过分析启明 星表面的大约3 万幅高分辨率雷达图像来识别了火山;c o n q u e s t 系统4 1 基于内容的空 间和时问查询,发现了大气层中臭氧洞形成的样本知识等。其它领域如遥感信息处 理、精细农业等的相关研究工作也都聚集到时空数据挖掘的范围内。相信在未来几 年,随着时空数据挖掘技术的不断发展,其应用领域将不断拓展,必将带来的巨大 经济效益和良好的社会效益。 2 、国内外研究动态分析 时空数据模型的研究历程可概括为2 0 世纪7 0 年代的酝酿起始阶段,8 0 年代的 开拓阶段和9 0 年代后的大发展阶段。前两个阶段的研究重点主要表现为以空间为 主的g i s 功能研究和以时态信息处理为主的时态数据库研究,时空结合方面设计的 很少。2 0 世纪9 0 年代初期,出现了专门用于处理时空数据的模型和原型系统。 2 1 国外研究动态分析 目前主要的时空数据模型设计方法有以下几种:一是在栅格、矢量空间模型基 础上扩展时间维,二是在时间模型基础上扩展空间维,三是面向对象方法。 基于栅格的时空数据模型如序列快照模型( s e q u e n ts n a ps h o t s , a r m s t r o n g ,1 9 8 8 ) “”。该模型是较早的、经典的时空数据模型之之一,它用一系列 经过空间配准的栅格图像来表示真实世界在某个时刻的状态,只关注对象某一时刻 在数据库中的快照,不能存储时间变化,且存在不变空间状态数据的大量冗余存储。 基于矢量的时空数据模型主要有基态修正模型( b a s es t a t ew i t ha m e n d m e n t s , l a n g r a n 。1 9 9 2 ) “”和时空复合体模型( s p a c e - t i m ec o m p o s i t e ,l a n g r a n a n d c h r i s m a n ,1 9 8 8 ) “”两种。基态修正模型记录个初始状态作为基态,后继状态通过 基态与两状态的变化差值叠加获得随着修正次数的增加,重构计算的复杂性也越 来越大。时空复合体模型将对象没有变化的部分和发生变化的部分分离,通过将其 复合,生成不同的状态,该模型易于时空分析,但分割了空间对象的完整性,复合 处理增加了计算量。 2 引言 基于时间的时空数据模型可分为基于事件和基于时间语义两种。基于事件的时 空数据模型1 把地学现象发生变化的时刻称为事件,将时刻序列称为事件列表。该 模型具有较高的空间和时间查询效率,但是会将对象的变化信息分解成多个片段, 因此需要建立索引机制把这些片段组合并还原成整体。y u a n 提出了基于语义、时间、 空间的时间语义模型“”,用来模拟野火的时空变化,将时问作为独立的一维,能够 支持时态拓扑关系的表达,但其实现上非常复杂,目前还处于研究阶段。 面向对象的时空数据模型“”打破了关系模型范式的限制,支持对象的嵌套和变 长记录,以更自然的方式对复杂的时空信息模型化,成为支撑空间复杂对象建模的 有效手段,因此受到很多学者专家的关注。w o r b o y sm n ”、a g n a rr e n o l e n “”、r a z aa “” 都曾经利用面向对象的思想进行时空数据模型的研究,但这些数据模型大都基于较 低层次,专注于数据模型的物理实现,而忽视了对地理空间的正确抽象,没有将相 互之问的关联关系纳入考虑范围。 2 2 国内研究动态分析 在国内,目前仅武汉测绘科技大学测绘遥感信息工程国家重点实验室、四川联 合大学计算机系设立了时态、时空数据库的研究方向和自己的研究小组。 国内学者的主要研究成果有:龚健雅( 1 9 9 7 ) 针对分布式空间数据模型进行 过研究。舒红“1 ( 1 9 9 8 ) 根据事件序列的时问观与数量尺度的时间观发展了两种时 态数据模型:事件驱动的时态数据模型与时间标记的时态数据模型,并首先关注面 向对象技术在时空数据建模中的运用,提出时态对象代数的概念,将时空数据建模 放在三个不同层次上:复杂结构对象的基本事态特征建模,通用时空对象建模和应 用领域时空数据建模。何新贵、唐常杰( 1 9 9 9 ) ,曹志月。1 ( 2 0 0 2 ) 等提出了一 种变时间粒度分段存储模型,将时态对象的历史分为古代、近代、现代三个时代和 两个过渡区间,对不同时代的数据进行分介质,变粒度的存储,能够提高存储效率 和改善查询速度,但是需要构建专门的系统实现时代转移算法和压缩采样算法进行 数据提炼,实现难度很大。余江峰”( 2 0 0 5 ) 提出了一种对象进化数据模型,试图 从对象间信息、物质和能量的交流过程这三个方面来寻找一个规范化模式来描述时 空相互作用过程及其中的因果联系。 由此可见,时空数据建模在我国发展还处于刚起步阶段,还有大量研究工作需 要努力完成。目前的数据模型的缺陷主要表现在以下方面:无法描述复杂的结构化 信息;无法描述对象的抽象继承;无法描述对象的行为和约束信息;无法描述对象 的封装。这样就对建模技术提出了新的要求,尤其是时空数据库的开发特别需要改 善建模技术,以更好的描绘地理特征的空间和时态特性。 针对当前数据模型中存在的缺陷,迫切需要建立起一种时空特征和相互关系一 3 青岛大学硕士学位论文 体化的时空数据模型。由于时空实体的复杂性,面向对象的思想是一个可行的方向。 面向对象模型具有描述现实世界的结构、行为、继承和封装等特征,它支持对象类 型、对象、对象演变和对象间联系的建模。该建模方法具有图形表示;模型直观易 于理解:对象类型的结构、行为和联系可并存于同一模型里:允许对对象操作集中 建模;易于快速产生原形等特点。因此总结一套兼顾时空特征及相互关系的时空数 据逻辑建模指导原则,发展规范化的面向对象时空数据模型是必要且可行的。 3 、创新点和主要工作 根据当前时空数据建模应用领域的要求,通过对现有时空数据模型研究现状的 详细分析,结合己有的时态关系、空问关系、时态数据模型、空间数据模型和时空 数据模型等方面的研究成果,笔者重点从概念层及系统实现上对时空数据建模进行 研究工作。具体创新如下: 1 ) 针对当前时空数据模型中数据存储冗余,时空对象表达不完整,以及模型 通用性低的问题,基于面向对象的思想,提出了一种时空特征和相互关系一体化的 时空数据模型。 2 ) 形式化定义并详细描述了时空数据模型的元素组成、信息范畴及元素间的 相互关系。 3 ) 分析了有关的时空特征对象操作,包括特征操作、空间操作、时间操作及 三者互操作。 4 ) 对现有的关联规则进行了扩展,以处理时空数据,使其可以发现时空关联规 则。 5 ) 以城市土地建设规划为背景实现了一个面向对象的土地信息时空数据模型, 实现了系统基本功能,并进行了时空关联规则挖掘,验证了该模型的有效性。 4 、论文结构 引言:时空数据挖掘是数据挖掘研究的前沿领域之一,时空数据模型是研究时 空数据挖掘的核心和基础,因此时空数据模型的研究有着重要的意义。目前已提出 了一系列时空数据模型。这些模型在表达时空数据时各有优劣,但都为时空数据模 型的最终建立与完善做出了有益的贡献。本文工作的创新之处即采用面向对象概念 提出了一种时空特征和相互关系一体化的时空数据模型。 第一章:介绍了时空数据模型的有关概念,详细分析了时空立方体、连续快照 模型、基态修正模型、时空复合模型等已有时空数据模型的基本思想及其优缺点。 指出面向对象的时空数据模型以更自然的方式对复杂的时空信息模型化,成为支撑 4 引言 空间复杂对象建模的有效手段。 第二章:针对当前时空数据模型数据冗余存储,时空特征表达不完整,以及时 空数据模型通用性不强的问题,本文从面向对象的基本概念出发,提出了一种时空 特征和相互关系体化的时空数据模型,形式化定义了该模型组成要素的信息范畴, 详细分析了要素自】的相互关系,并讨论了有关的时空数据操作。 第三章:深入探讨了时空数据挖掘技术,包括时空数据挖掘可发现的知识类型, 挖掘方法和挖掘流程,对现有的关联规则进行了扩展,以处理时空数据,使其可以 发现时空关联规则。 第四章:以城市土地规划建设为背景,实现了一个面向对象的土地信息系统。 对土地规划建设相关对象类的时空表达和土地相关建设功能的实现进行了研究,设 计了有关的对象类,实现了基本的土地查询和管理操作,进行了时空关联规则挖掘, 验证了该数据模型的有效性。 结论:对本文所做的工作进行了总结,阐述时空数据模型进一步研究存在的问 题。并展望未来的发展方向。 5 青岛大学硕士学位论文 第一章时空数据模型概述 1 1 时空数据模型概念 时空数据模型。”是面向一定的应用目的,根据对客观世界的认识。以数字数 据的形式建立的对客观世界的模拟系统。对客观世界的模拟要尽可能接近其本来面 目,但客观世界纷繁复杂,千变万化无法也没有必要对其进行完全真实的模拟。 可从应用的角度出发,对客观世界及相关事物进行一定范围及深度的模拟,力求满 足用户的需要,同时应考虑到数据模型是对客观世界数字化形式的模拟,必须注意 模型在计算机上的有效实现。 数据模型是对现实世界的数据进行客观抽象和形式的描述,是数据库技术的重 要组成内容。时空数据的最大特点就是数据类型多、数据结构复杂和数据量大。时 空数据有着复杂的来源和种类,如栅格数据、矢量数据,又如遥感数据、野外实测 数据、数字化数据等,数据类型从单一的格式化数据扩展为多介质非格式化的多种 类型。空间数据的拓扑结构复杂。关系有序不定长,以及由于时间维的加入,时间 不断变化造成的历史数据积累形成海量数据。时空数据的这些特性大大丰富了数据 库的内容使时空数据库具有了动态性和全面性。 由于时空数据的特性以及对时空数据管理的特殊要求,在设计时空数据模型时 应考虑以下问题。 1 、模型具有可扩展性,能够完整地表达时空语义。对现实世界中大部分现象及 事物都可以根据这个模型在空间、时间、特征上完整有效地表达。 2 、能够表达空间关系、时间关系及时空特征关系。 3 、能够统一、协调地管理各对象历史及现状,减少数据冗余,维护数据一致性, 提高存取效率。 4 、定义时空完整性约束。 5 、模型可以有效地支持时空数据挖掘。 1 2 时空数据模型分析 为了能够表示时空过程,近年来,作为时空数据挖掘研究和应用的一个领域。 时空数据模型已经得到了g i s 界和计算机界学者专家的广泛关注。目| j 国际上已有 l a n g r a n 、c h r i s m a n 等人提出了一系列时空数据模型。这些模型在表达时空数据时 各有优劣,但都为时空数据模型的最终建立与完善做出了有益的贡献。主要有以下 四种模型:基于栅格的时空数据模型,基予矢量的时空数据模型,基于时间的时空 6 第一章时空数据模型概述 数据模型以及基于对象的时空数据模型。 1 2 1 基于栅格的时空数据模型 栅格型时空模型是建立在栅格数据基础上的,典型的模型如序列快照模型“和 离散格网单元列表模型“2 1 等。 1 、序列快照模型 快照模型是将一系列时间片段的快照保存起来,以此来反映地理现象的时空演 化过程,根据需要对指定时间片段进行播放( 如图1 1 所示) 。这种模型的优点:一是 可以直接在当前的地理信息系统软件中实现;二是当前的数据库总是处于有效状态。 但是,由于快照将未发生变化的所有特征进行存储,会产生大量的数据冗余,当应 用模型变化频繁,且数据量较大时,系统效率急剧下降。 x 圈未利用地 圈建设用地 1 1 为时捌i - 1 , 2 3 该模型主要存在以下缺陷: 1 ) 对于变化来说的隐式结构,要得到2 个时刻状态的不同( 即变化) ,必须对2 个快照进行彻底的比较。 2 ) 不表达单一的时空对象,较难处理时空对象间的时空关系。 3 ) 数据冗余大。 因此序列快照模型只是一种概念上的模型,不具备实用的开发价值。 2 、离散格网单元列表模型 该模型将格网单元及其变化以变长列表形式存储,每个列表的一个元素对应该 位置上的一次时空变化。若想获得某时刻状态,只需提取相应时刻各个格网单元列 表的元素。离散格网单元列表模型在一定程度上避免了快照模型的数据冗余问题, 节省了存储空间,但其缺点仍与快照模型相似,没有显著改进。如图1 2 所示。 7 青岛大学硕士学位论文 t 1 时刻的变化 e j1 r 2 时刻的变化 圈稻时刻的变化 图1 2 离散格网单元列表模型 1 2 2 基于矢量的时空数据模型 矢量型时空数据库模型是建立在矢量数据模型的基础上的。代表性的模型有基 态修正模型“”和时空复合体模型两种“”。 1 、基态修正模型 为解决快照模型将每张未发生变化部分的特征重复进行记录的缺点,基态修正 模型按事先设定的时间间隔进行采样,它只存储某个时间数据状态( 基态) 和相对于 基态的变化量。该模型是基于起始时刻地图的不断修正,任何后续时刻对象的变化 都以增量的形式存储,也叫矢量修正“”。该模型保证了地学对象的完整性,可以直 接检索对象的变化历史,但变化信息是基于图层的,时间是以图层属性形式存在, 不支持对象时态拓扑关系的运算。如图i 3 所示。 t 1他1 3 豳团 口乡村圈乡村变为城市l _乡村e 翻乡村变为城市 圈1 3 基杏修正模型 与序列快照模型相比:基态修正模型节约了存储空问,查询变化比较方便。但 对予事件的整体、历史过程的查询变得十分繁琐。该模型的缺点是较难处理给定时 刻时空对象问的空间关系,且对很远的过去状态进行检索时,几乎对整个历史状况 8 第一章时空数据模型概述 进行阅读操作,效率很低。 2 、时空复合体模型 该模型是c h r i s m a n “”于1 9 8 3 年针对矢量数据提出的,l a n g r a n 和c h r i s m a n 于1 9 8 8 年对它进行了详细描述。 时空复合体模型将空间分隔成具有相同时空过程的最大的公共时空单元,每个 时空对象的变化都将在整个空间内产生一个新的对象。对象把在整个空间内的变化 部分作为它的空间对象,变化部分的历史作为它的时态属性。时空单元的时空过程 可用关系表来表达,若时空单元分裂时,用新增的元组来反映新增的空间单元。这 种设计保留了沿时间的空间拓扑关系,所有更新的特征都被加入到当前的数据集中, 新的特征之间的交互和新的拓扑关系也随之生成。时空复合模型的数据库中,对标 识符的修改较复杂,涉及关系链层次很多,必须对标识符逐一进行回退修改。 该模型的起点是一个基图,它表达了最初的实体状况。每次数据库的更新将产 生一个覆盖层。一旦该层经过错误检查得到认可,该层通过叠加操作合并系统,新 的结点和弧段形成的新多边形在属性历史上将与它的邻接多边形不同。每个实体的 属性历史用一个有序的记录列表来表达。记录包括一个属性集和反映该属性集有效 期的时闻。该模型将空间变化和属性变化都映射为空间的变化,导致新实体的产生, 是序列快照模型和基态修正模型的折衷模型。其最大的缺点在于多边形碎片化和对 关系数据库的过分依赖( 如图1 4 所示) 。 5 1 0 1 9 8 0 ( r o ) 4 1 1 9 8 4 ( t 1 ) 5 1 5 1 9 8 8 ( t 2 ) 图1 4 时空复合体模型 1 2 3 基于时间的时空数据模型 基于时间的时空数据模型是在时间角度上来考虑空间对象,主要有时空立方体 模型和基于事件的模型两种,分别介绍如下。 1 、时空立方体模型 h a g e rs t r a n d 最早提出了时空立方体模型“”这个三维立方体是由空间二维的 几何位置和一个时间维组成的三维立方体( 如图1 5 所示) ,它描述了二维空间沿着 时间维演变的过程。任意给定一个时间点,就可从三维的立方体中获取相应的截面, 即现实世界的平面几何状态。任何一个空间实体的演变历史都是时空立方体中一个 9 。 青岛大学硕士学位论文 实体。该模型形象直观地运用了时间维的几何特性,表现了空间实体是一个时空体的 概念,对地理变化的描述简单明了,易于接受。模型具体实现的困难在于三维立方体 的表达以及随着数据量的增加,对立方体的操作会交得越来越复杂,以至于最终变得 无法处理。 图1 5 时空立方体模型 】, 2 、基于事件的时空模型 许多研究人员都在研究时空数据模型中的事件,例如p e u q u e t 和d u a n 在1 9 9 5 年提出了基于事件的时空数据模型( e t s t d m ) h 4 t 如图1 6 所示。 图1 6 基于事件的时空数据模型 在e t s t d m 中,事件代表状态的变化,通过事件序列和时间轴来表达一些过程 的时空变化。c l a r a m u n t 和t h e r i a u l t 认为事件是过程的集合,过程通过对象版本 来描述事件和实体变化。a l l e n 提出了一种“因果模型”啪1 ,也把事件作为目标状 态的改变。一般地,在基于事件的时空模型中,时空对象状态变化是由相应的地理 事件所触发的,通过引入事件表,将相互关联的属性或空间变化记录在同一个事件 1 0 第章时空数据模型概述 的各个组件内,显式、有序地给出时间的表示方法,可以建立对象状态与地理事件 问的拓扑关系,为高层次的时态操作提供了基础。基于事件的时空模型非常适合诸 如“在某一时闻段某一地理区域中发生了什么事件”这类问题的查询,同时具有很 好的数据内部一致性和较小数据冗余度。 基于事件的时空数据模型( e s t d m ) 缺点在于: 1 ) 在组件内的数组中,栅格数据采用游程编码的压缩方法,压缩效率不商,而 这对栅格数据的存储来说是至关重要和致命的。 2 ) 当发生变化的属性种类较多时,每个时间都会带有多个组件,不便于存储和 管理。 3 ) 虽然模型中指出每一时间只存储新变化的属性值及其相应的栅格,但没有指 出任意2 个时间段内如何知道或找到有哪些栅格属性值发生了变化的方法。 4 ) 要获得“现在图”必须经过多次图形叠加才可得到,而对当前状态的查询又 是比较频繁的,所以效率较低。 因此,这种模型也是语义和概念上的模型,离实际使用还有一定的距离。 1 2 4 基于对象的时空数据模型 该模型是以面向对象的基本思想组织地理时空数据。其中,对象是独立封装的 具有惟一标识的概念实体。每个地理时空对象中封装了对象的时态特性、空间特性、 属性特性和相关的行为操作及与其他对象的关系。w o r b o y 。于1 9 9 2 年提出了基于3 维时空特征的对象时空模型。其基本思想是,空间对象( 只考虑平面维) ,加上其时间 维信息,即构成了一个完整的3 维时空对象( 如图1 7 所示) 。面向对象的时空模型, 数据结构简单,充分利用面向对象软件技术,有利于时空数据模型的扩展与时态操作, 但目前纯面向对象的模型系统比较少,该模型仍有许多理论问题未得到解决,如没有 充分考虑到地理现象的时空特性和内在联系,缺少对地理实体或现象的显式定义和 基础关系描述等。 青岛大学硕士学位论文 1 3 面向对象思想及方法嘲 当前基于关系模型的时空数据模型大多是通过大量元组来牵强地表示复杂的 空问、时间信息,对一些无法表示的语义属性只能在外部描述。而在面向对象模型 中,提供了广泛化、特例化、聚合和关联等机制,易于支持各种形式时空数据,其 中可以使用矢量数据或栅格数据,也可以是不同数据类型的集成,数据结构和方法 的封装便于数据对象不同表示阃的转换。在处理时空不确定性方面,面向对象技术 也体现了其优越性。 面向对象模型具有描述现实世界的结构、行为、继承和封装等特征。它支持对 象类型,对象演变和对象间联系的建模。该建模方法具有图形表示模型直观,易于 理解,对象类型的结构行为和联系可并存于同一模型里,允许对对象操作集中建模, 易于快速产生原形等特点,把地理信息的时空特征与对象模型融到一起产生语义丰 富的时空扩展对象模型。 构成面向对象模型的基本元素,有类c l a s s ,对象o b j e c t s ,类与类之间的关系 等。对象对应于现实世界中独立的和分离的实体,类是对象的抽象描述,对象是类 的实例。类包括属性的描述和行为的描述两个方面,属性描述类的基本特征,行为 描述类具有的功能。 类图是用类和它们之间的关系描述系统的一种图示。类用长方形表示,长方形 分成上中下三个区域,类名出现在长方形内的上部,属性按顺序写在中间区域,下 面的区域标识类的操作方法。类图由类和它们之间的关系组成。类与类之间通常有 关联、概括,依赖和聚集等四种关系。 关联用于描述类与类之间的连接。由于对象是类的实例,因此类与类的关联也 就是其对象之间的关联,普通关联的图示是连接两个类之间的直线。由于关联是双 向的,可以在关联的一个方向上为关联取一个名字,而在另一个方向上取另一个名 字,紧挨着直线书写。 类图中还可以表示关联中的数量关系基数。表示数量关系时,用基数说明数量 或数量范围,对象之间可以有1 :1 、1 :n 、m :1 、m :n 等联系。概括是指一般与具体的 关系,包括子类与父类之间的继承关系,父类与子类的概括关系,图示为一带三角 形的直线三角形,紧挨着父类。 聚集是一种整体与部分的关系,可以表示对象与对象之间,也可以表示类与类 之间的一种关系。聚集的图示方式是在表示聚集关系的直线末端加一个小菱形,菱 形紧挨着具有整体性质的类。 第一章时空数据模型概述 1 4 小结 通过上述对现有模型的分析,总结现有模型存在以下缺点:由于现有模型都 是将空间、时间和属性单独处理,它们的结构和传统的数据不一致,因此传统的数 据挖掘方法不能适用于时空数据的处理上,造成模型通用性不强的问题。由于现 有的模型都是将关系作为隐含的信息表达在模型中,丽相互关系恰恰是时空数据处 理的目标。因此需要大量的计算,造成挖掘效率低下的问题。面向对象模型将时 空实体作为对象来建模,尽管较有效的表达了复杂的时空数据,但它仅考虑时空个 体。没有考虑个体阃的联系,因此仍具有一定的局限性。 本文针对现有模型存在的问题,借鉴面向对象的思想提出了一种基于对象的时 空数据模型,在下一章将详细介绍此模型,包括其信息要素组成、各要素间相互关 系和数据操作等问题。 青岛大学硕士学位论文 第二章基于对象的时空数据模型 2 1 时空数据模型 时空数据模型。“。是研究时空数据挖掘的核心和基础,它刻画了现实世界中时 空实体各组成要素的信息范畴及其相互之间的关系,是对客观现实世界的抽象和表 示。针对当前时空数据模型数据冗余存储。时空特征语义表达不完整,以及模型通 用性不强的问题,本文建立了一种时空特征对象与时空关系一体化的时空对象概念 模型,并对时空特征对象组成要素的信息范畴及其相互关系进行了形式化定义和详 细描述。 时空特征对象指存在于一定时间与空问的事物与现象。时空数据模型是对时空 特征对象的抽象和建模,我们将其定义为:s t a o = ( 。,。,= 。,r ,6 ) ,其中, z 。:空间对象的集合,空间对象( s p a t i a lo b j e c t ,简写为s o ) 是时空特征对 象中空间信息的抽象: z 。:时间对象的集合,时间对象( t e m p o r a lo b j e c t ,简写为t o ) 是时空特征对 象中时间信息的抽象; :特征对象的集合,特征对象( a t t r i b u t eo b j e c t 。简写为a o ) 描述了时空 特征对象的大小、数量等非时空特征; r :对象问相互关系的集合,表示对象和对象闻的相互关系;一般地,对于对象 间关系可以表示为:r = u r 。u 瞄,其中: r 。表示空间对象和空间对象之自j 的关系集合: 阱表示时问对象和时间对象之间的关系集合; r 。表示时间对象、空间对象和特征对象三者之间的关系集合,其中,s ,t ,a 可以取空值,但不能同时为空。若a 为空,则r 。表示空间对象和时间对象之间的关系 集合:若s 为空,则r 表示特征对象和时间对象之问的关系集合;若t 为空,则r 。表 示空间对象和特征对象之间的关系集合。 6 :对象到关系r 的映射,具体可划分为:6 s s 。h ,6 。,其中: 6 s s 表示是由。向r 。的映射,即对于给定的s o ,s o :z 。可以找到一个r e ,使得r = 6 ( s o l ,s 0 2 ) : 6 表示是由z 。z 。向r 。的映射,即对于给定的t o t ,t o 。z m ,可以找到一个r e r 竹,使得r = b ( t o i 。t 0 2 ) ; h 表示是由z 。z 。向r 。的映射,即对于给定的s o z s 0 ,t o m ,a o z ”, 可以找到一个r e r 。,使得r = 5 ( s o ,t o ,a o ) 。其中,s o ,t o ,a o 可以取空值,但 不能同时为空。 1 4 第二章基于对象的时空数据模型 根据实际应用,时空数据模型中。z 。可以为空集。若z ”为空,贝o s t a o 成为空 问数据模型;同样,如果z 。为空,那么s t a o 为一个时态数据模型;若。和。均取空值, 则该对象为传统数据挖掘问题中的数据模型。 2 1 1 空间对象 空问对象是时空特征对象中空间信息的抽象,空间信息主要包括: l 、位置 空间实体存在的位置,即确定在什么地方存在某物或发生了某事。 2 、形状 按照几何特点,空间实体的形状可以分为点、线、面、混合型等类型,通常可 采用矢量模型或栅格模型来表示。矢量模型。1 是以物体边界为基础定义和描述几何 形体,采用空间坐标的方法来表示空间数据。栅格模型”“是将空间分隔成有规则的 网格,在各个网格上给出相应的属性值来表示空间实体的一种数据组织形式。在栅 格数据中,点是一个像元,线由彼此连接的像元构成,像元的位置由所在行、列号 确定。矢量数据模型和栅格数据模型各有优缺点:矢量模型数据精度高,更新方便。 数据信息量大,存储空间小,但数据结构复杂,图形叠加困难;栅格模型结构简单, 空间叠加分析方便,但定量数据不够精确,输出图形质量不高。矢量与栅格都可以 用来描述空间实体的点、线、面三种基本类型。在实际应用中,根据应用目的,选 用合适的数据表达方式。 空问对象可抽象为空间对象类,是时空特征对象中空间对象豹抽象描述。空间 对象类包括点类、线类、面类和复杂对象类四个子类。 2 1 2 时间对象 空间和时间是客观事物存在的方式,两者相互联系不能分割。仅仅利用空问信 息和特征信息并不足以准确描述出某一种事物或现象的变化。而且要分析空间信息 的时序变化,阐明事物现象发展的过程和规律,时间信息更是一个不可缺少的属性。 若把时间看作是第四维信息渊,可对地理现象作如下划分: 超短期的:如地震、森林火灾等; 短期的:如江河洪水、作物长势等: , 中期的:如土地利用、作物估产等: 长期的:如水土流失、城市化等; 超长期的:如火山爆发、地壳形变等。 地理信息的这种动态变化特征,一方面要求信息及时获取并定期更新,另一方 面要重视自然历史过程的积累和对未来的预测和预报,以免使用过时的信息导致决 青岛大学硕士学位论文 策的失误,或者缺乏可靠的动态数据而不能对变化中的地理事件或现象做出合乎逻 辑的预测预报和科学论证。 1 、时间的结构o ” 1 ) 线性结构 认为时间是一条没有端点,向过去和将来无限延伸的线轴,除了与空间一样具 有通用性、连续性和可测量性外,还具有运动的不可逆性( 或称单向性) 和全序性。 2 ) 循环结构 反映了时间的周期性、稳定性,与时间的线性结构不可分割,相辅相成,形成 了现实世界在继承中的发展。 3 ) 分支结构 分为单向分支结构和双向分支结构,分别反映了具有不同的历史时间结构和未 来时间结构的多个目标现象的时间结构,其中各分支具有两两正交性。 2 、时间的表示方法 1 ) 时间点( i n s t a n t ) ,指时间轴上的某点,它与该点的时间值对应。根据实际 需要时问,点可以由年,月、日、时、分、秒等时间元素构成,其类型可定义为日 期( d a t e ) 、时间( t i m e ) 和日期时间( d a t e t i m e ) 等基本类型。 2 ) 时间区间( i n t e r v a l ) ,设时间点t 8 与t e ,满足t s 1 0 ,且p ( a ,量) = o 当且仅当a = p : p ( a ,9 ) = p ( b ,) ; p ( a ,v ) + p ( b ,y ) p ( q ,b ) ; 刚称p 是0 上的一个度量,p ( q ,e ) 就是在此度量下对象a 与昂之间的距离。 从现实角度看,距离是度量的一种。距离函数可以导出对应空间上的一个拓扑 结构,因此每个度量空间也是一个拓扑空间。在实际应用中,度量关系是一个很重 要的角色,例如最短距离查询、最优路径选择等等。 通常距离函数1 是基于点之间的距离度量而定义的,如d ( 号,只) ,p 1 和p 2 表示点 对象,d n - n 可以代表欧氏距离或者曼哈顿距离。给定对象0 。0 2 定义它们的最大、最小 距离为公式2 一( 1 ) 、2 - ( 2 ) 所示: d 。( d l ,d 2 ) ;m a x e 鳓丑鹕d ( 丑,只) 公式2 - ( 1 ) d 自( d 1 ,0 2 ) 一n i i n 日6 蚂以。0 2d ( 丑,e ) 公式2 ( 2 ) 其中,a 表示对象的边界。这里,点对象的边界就是该点本身,线对象的边界 就是该线本身,面对象的边界就是围成该面的边。称满足公式2 - ( 3 ) 的函数d 。为最 大函数,满足公式2 一( 4 ) 的函数d - 。为最小距离函数。实际上,最小距离函数d - 。就 是通常所用的距离函数d ,即d :也。距离关系用一个数学操作符号和一个确定的 常量比较两个对象的距离。如果d i s t 是一个距离函数,p 是一个算术谓词如 t ,- ,c 是一个常数,如果d 缸t 柚韶( q ,0 1 ) p c 成立,那么在两个空间对象之间就有 距离关系0 1d i s t a n c e0 2 成立。 3 ) 拓扑关系 为了直观地理解拓扑空间1 在一块橡胶片上面两个相接的多边形,然后进行拉 伸或扭曲( 但不能切割或折叠) 来改变橡胶片的形状,这时两个多边形的邻接性维 持不变。相接( m e e t ) 是拓扑属性的一个例子,研究保持拓扑属性不变

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论