(计算机应用技术专业论文)基于timedb的tdbms研究与应用.pdf_第1页
(计算机应用技术专业论文)基于timedb的tdbms研究与应用.pdf_第2页
(计算机应用技术专业论文)基于timedb的tdbms研究与应用.pdf_第3页
(计算机应用技术专业论文)基于timedb的tdbms研究与应用.pdf_第4页
(计算机应用技术专业论文)基于timedb的tdbms研究与应用.pdf_第5页
已阅读5页,还剩74页未读 继续免费阅读

(计算机应用技术专业论文)基于timedb的tdbms研究与应用.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 时态数据库将时间作为数据的属性纳入系统的管理范畴,存储和管理多 个时间状态的数据。经过二十多年的发展,时态数据库理论研究取得了丰富 的成果,而时态数据库实现技术尚处于起步阶段,目前国内外还没有一个真 正意义上的时态数据库管理系统。作为商业d b m s 的前端构件,t i m e d b 基 本实现了时态数据管理功能,是比较成功的时态数据库管理原型系统。基于 以上考虑,本文通过分析t i m e d b 的实现方法,研究时态数据库管理系统的 实现技术。 本文首先分析时间在计算机系统的表示方法,确定时问表达模型,接着 结合数据库技术,描述和分析时态数据模型以及时态数据操作。然后以 t i m e d b 为基础,通过以下三个步骤,深入分析和研究时态数据库管理系统 的实现技术。首先分析t i m e d b 支持的时态查询语言a t s o l 2 的扩展方法和 原理,同时结合实例说明a t s q l 2 的使用方法;接着深入分析t j m e d b 的源 代码逻辑结构,深层次地分析t d d l 、t d m l 、t d q l 的转换方法和原理; 最后应用t i m e d b 的a p i ,成功开发了“车队管理系统”,验证t i m e d b 的先 进性及其在时态数据管理上的不足。 通过分析和研究a t s q l 2 以及t i m e d b 的构造方法和原理,本文展示了 目前行之有效的时态数据库管理系统实现技术,同时讨论了t i m e d b 在时态 数据管理功能上的不足,为以后成功开发时态数据库管理系统提供了基础, 积累了技术和经验。 关键词时态数据库;时态数据库管理系统;a t s q l 2 ;t i m e d b 变三些查耋三兰堡圭:堡篁三 a b s t r a c t t c m p o r a l d a t a b a s e ss t o r ea 1 1 dm a i l a g ed i 船r e mt i m e s t a t ed a t a ,t a k i n gt i m ea s o n eo ft h ed a t aa 删b u t e sm a n a g e db ys y s t e m s w i m i nm ep a s t 晰e i l t y ) 吧a r s , r e s e a r c h e so ft e m p o m ld a t a b a s e t h e o r y h a v e a c q u i r e dg r e a ta c h i e v e m e n t s ; h o w e v e r ,i m p l e m e n 协t i o nt e c h n o l o g i e so ft e m p o r a ld a t a _ b a s es t a yi nt h ep r i m a r y p h a s e b yn o w t h e r ei sn oc o m p l e t et e l p o r a ld a 衄b a s em a n a g e m e n ts y s t e my e t a sa 丘o n t e n do fc o 咖e r c i a ld b m s ,t i m e d b ,w h i c hi sas u c c e s s f u lp r o t o t y p eo f t c m p o r a ld a t a b a s em a n a g e m e n ts y s t e m ,b a s i c a l l yr c a l i z e st h em 觚a g e m e n t so f t e m p o m ld a 协b a s i n go na b o v ec o n s i d e r a t i o n ,t h em e s i sf o c u s e so n l er e s e a r c h o fi m p l e m e n t a t i o nt e c h n o l o g i e so ft e m p o r a ld a 曲b a s em a n a g e m e n ts y s t e m ,b y m e a n so f a n a l y z i n gt i m e d b si m p l e m e n t a t i o nm e t h o d s a 船rd e s c r i p t i o n so ft i m e r 印r e s e m a t i o n s a n dt i m em o d c l s ,m et h e s i s a n a l y z e st e m p o r a l d a t am o d e l sa n d t e m p o r a ld a t ao p e r a t i o n s t h e n w j t hr e f c r e r l c e s o ft i m e d b ,i m p l e m e n t a t i o nt e c l l n o l o g i e sa r ea n a l y z e dd e e p l yb y 血r e es t e p sa s f o l l o w i n g f i r s n y 血ee x t e n s i o nm e t h o d sa n dp r i n c i p l e so fa t s q l 2 ,w h i c hi s a t e m p o m lq u e r yl a i l g u a g e ,a r ed i s c u s s e d i nt h em e a n t i m e ,l eu s eo fa t s q l 2 i s d e m o n s t r a t e dw i le x a m p l e s s e c o n d l y ,m et h e s i sa n a l y z e st h e1 0 9 i co ft h es o u r c e c o d e so ft i m e d bt or e s e 盯c ht h ec o n s t n i c t i v em e t h o d sa 1 1 dp r i n c i p l e so ft e m p o m l d a 协b a s em n a g e m e m s y s t e m i ts h o w sh o w t i m e d bc a i l 订a n s l a t et h et d d l 、 t d m la i l dt d q li n t os t a n d a r ds q ls t a t e m e n t s f i n a l l y ,ap r o t o t y p e ,阮a f c 抬 据口m 跏f e 牌,i ss u c c e s s 如l l yd e v e l o p e du s i n gt h et i m e d b sa p i s i tt e s t i f i e s 也e a d v a n c e m e ma 1 1 dd i s a d v a n t a g e so f t i m e d b t h r o u 曲a n a l y s i sa n dr e s e a r c h e so f c o n s t r u c t i v em e m o d sa i l dp r i n c i p l e so f a t s q l 2a n dt i i i l c d b ,m et h e s i ss h o w s af e a s i b l es o l u t i o no fm e i m p l e m e m a t i o n o f t e i n p o m ld a t a b a s em a m g 咖e n ts y s t e m b e s i d e s ,i t d i s c u s s e st h ed i s a d v a l l t a g e s o ft j m e d b a 1 1m e s ep r o v i d eb a s i sf o rf u t u r ci m p l e m e n t a t i o no ft e m p o m l d a t a b a s e m a l l a g e m e m ,a c c u m u l a t i n g 1 e t c c l l n o l o g i e s a i l d e x p e r i e n c e o f c o m p o n e n td e v e l o p m e n t k e y w o r d sr m p o r a ld a t a b a s e s ;7 i b i n p o r a l d a t a b a s e m a n a g e m e n ts y s t e m ; a t s q l 2 ;t i m e d b v 第一章绪论 1 1 研究背景和意义 第一章绪论 时间是自然界无所不在的客观属性,时间( 时态) 信息及其与其他信息 的联系在我们生活中起着极大的作用。随着数据库和信息技术的深入和发展, 信息系统面临着许多新的应用和新的需求,对时态信息处理的需求越来越迫 切【”。 传统数据库只反映了一个对象在某一时刻的状态( 快照) ,不联系其过去 和未来吼传统的数据库管理系统( d a t a b a s em a n a g e m e n ts y s t e m ,d b m s ) 虽 然也定义了时间数据类型,但它没有对时间作专门的处理,而只作为一般属 性值进行存储和管理。传统数据库管理系统提供的一些修改操作( d m l ) 实 现了数据库状态之间的变迁,随着时间的改变,新的状态覆盖旧的状态,数 据修改语句一旦提交,旧的状态在数据库管理系统中消失。然而现实中很多 新的应用都需要保留和处理“过去”、“现在”甚至“未来”的数据。例如,财经 系统数据库必须保留股票市场的历史数据;保险系统数据库必须指明保险条 款的有效时间;酒店预定系统数据库必须保留房间预定的情况:医疗信息管 理系统数据库设计病人的病历;决策支持系统设计未来情况的一些信息【3 。 数据库管理系统存放多个时间状态的数据并不困难,通过数据冗余的手 段,完全可以实现,只是要求更多的磁盘空间而已。然而困难的是如何实现 多个时间状态的数据的管理功能,例如提供一种能够查询多个时间状态的数 据的查询语言( 也可以说是具有时态语义的查询语言,t e 忸p o r a lq u e r y l a g u a g e ) ;如何维护时态数据库状态的一致性( 维护数据库一致性的主要手 段是约束机制) 。研究表明,将时间引入传统数据库会引起以下几个主要问题: ( 1 )描述操作需要8 倍多的代码; 广东工业大学工学硕士学位论文 ( 2 )描述约束将是以前3 0 倍长; ( 3 )查询描述困难; ( 4 )查询优化困难; ( 5 )可视化数据; 因此,正如传统的数据库管理系统管理数据库一样,同样需要时态数据 库管理系统( t e m p o r a l da _ c a b a s em a n a g e m e n t s y s t e m ,t d b m s ) 管理时态数据 库,让t d b m s 管理时态数据,提高系统性能以及程序员的生产能力。 经过二十多年的发展,时态数据库理论研究取得丰富的成果,然而时态 数据库实现技术尚处于初步阶段,目前国内外还没有个真正意义上的 t d b m s 。作为商业d b m s 的前端构件,t i m e d b 基本实现了时态数据管理功 能,是比较成功的时态数据库管理原型系统。基于以上考虑,本文通过分析 t i m e d b 源代码的逻辑结构,研究行之有效的t d b m s 扩展方法和原理,为 以后成功开发t d b m s 提供基础,积累技术和经验。 1 2 国内外研究现状 时态信息的需求与技术实际上一直伴随着数据库技术的发展而产生和发 展。关于时态数据库的起源与发展,国际时态数据库权威学者,r h s e l ,a , c l i 勖r d ,j ,g a d i a ,j a j o d i a ,s ,s e g e v ,a 和r t s n o d g m s s 等在1 9 9 3 年共同主编 的“t c m p o r a ld a t a b a s e s :m e o 吼d e s i 印,a n di m p l e m e n t a t i o n ”收集了此前时态数 据库几乎所有的重要成果。我国学者唐常杰教授对时态数据库技术前2 0 年的 发展做了系统回顾。但是,到2 1 世纪的今天,时态信息处理的研究与应用出 现了许多新的进展。我们通过多年的研究,参阅了大量文献,特别是国内外 最新研究动态和应用成果,将时态信息技术的起源与发展分为三个时期:开 创期( 1 9 8 2 年以前) 、发展期( 1 9 8 3 年至1 9 9 3 年) 、思索与应用期( 1 9 9 4 年 以来) 【”。 第一章绪论 1 2 1 开创期 时态特性是信息的客观存在,早在7 0 年代就有人关注到时态信息的应 用。例如,1 9 7 0 年g 、7 n e d e r h o l d 和j f f r i e s 在研制的医疗系统在处理时态 信息方面作了较早的尝试;1 9 7 7 年k a l l i lk e t a l 在a n i f i c i a l i n t e l l i g e n c e 上发 表的“m e c h a i l i z i n gt e m p o m lk n o w l e d g e ”反应了早期关于时态信息的基础性研 究工作。到7 0 年代末,8 0 年代初,数据库技术的日渐成熟和大容量高速存 储设备的发展为时态据库技术的产生与应用创造了条件。加州大学洛杉矶分 校j b e l l _ z v i 和纽约大学的j c l i 舫r d 在1 9 8 2 年的博士论文是时态数据库技 术开创期的两个标志性成果。 j b e n z v i 在1 9 7 9 年一1 9 8 2 年问对时态数据库技术进行了系统的研究,在 1 9 8 2 年完成的博士论文“t h et i m er e l a t i o n a lm o d e l ”。其主要贡献包括:提出 了时态数据库模型,以时间区间作字段值,提出了n 1 n f ( 非1 n f ) 的t d b , 突破了数据库字段值只能是一个数或串的局限,引入了后来被称为双时态 ( b i t e m p o r a l ) 的概念。即用有效时间( v a l i dt i m e ) 表示被管理对象在库中生命 周期,用事务时间( 仃a 1 1 s a c t i o nt i m e ) 表示数据库本身的历史,引入了时态索引 结构。这些概念和思想一直沿用至今。标志着时态数据库的形成。 同样是在1 9 8 2 年,纽约大学的j c l i 肋r d 完成了其博士论文al o g i c a l f h m ew o r kf o rt h e t e m p o r a l s e m a n t i c sa n dn a t u r a ll a n g u a g eq u e r y j n go f h i s t o r i c a ld a t a b 船e ”,并发表了一系列论文。他的主要贡献是对历史数据库的 做了开创性工作,提出了h r d m ( h i s 0 0 r i c a lr e l a t i o n a l d a t a m o d e l ) 模型。他 研究了在关系、元组、字段值上加时态信息的技术细节,引入了历史关系模 型,历史关系代数,将传统关系数据库当作历史数据库的一种特例,即当把区 间缩小为一点( n o w n o w ) 时的历史数据库。此后的2 0 多年来,j c l i 助r d 博士一直活跃在时态数据库前沿。 可以说时态数据库是在1 9 8 2 年正式形成。 广东工业大学工学硕士学位论文 1 2 2 发展期 1 9 8 2 年以后,) b 的研究开始走向繁荣时期。此后的十年中,计算机学 术界对时态数据库给予了极大的关注,发表了数以千计的论文( 例如以e i c 伽叩e n d e x w 曲检索,8 2 9 4 年间包含t e m p o m l d a t a b a s e 和锄p o r a l i n f 0 h n a t i o n 的论文有2 0 0 0 多篇) ;学术界提出了数以百计的时态数据库模型和时态信息 处理方法。此阶段,国际上一些重要大学和研究机构涌现出一大批研究学者, 形成了一批专门的时态数据库研究集体。最主要的研究集体集中在美国纽约 大学、依阿华州立大学、加州大学伯克利分校、南加利福尼亚大学、亚利桑 那大学、h p 公司和b e l l 公司的专业实验室等。 这个时期标志性成果是a t h s e l ,j c l i 筋r d ,s g a d i a ,s j a j o d i a ,a s e g e v 和r 一s n o d g r a s s 在1 9 9 3 年共同编辑出版的“t c m p o r a ld a t a b a s e s :t h e o 啦 d e s i g n ,a n di m p l e m e n t a t i on 该书被称为“世界第一本关于时态数据库专著”。 该书对此前国际时态数据库技术的研究给出了全面的总结。书中列出二+ 年 来t d b5 0 0 余篇文献,文献作者遍及美国、欧洲、中国、日本、印度、瑞士、 土耳其等。收录了国际时态数据库方面重要学者的研究成果和时态数据库模 型。书中列出这1 3 种最有影响的时态数据模型,除了前面提到j b e nz v i 和 j c 1 i 硒r d 的模型外,其他1 1 种如下: t e m p s q l ,s h a r s h i k g a d i a & s l l n i l ,s n a ir ,1 9 8 5 i x r m ( i n t e r v a l e x t e n d e dr e l a t i o n a lm o d e l ) ,n i k o sa l o r e n t z o s ,1 9 8 7 m 及t s q l ( t e m p m l e x t c 璐i o n st om er e l a t i o n a lm o d e l ) s b n a v a m e ,1 9 8 7 h s q l ( h i s t o r i c a lq u e r yl a n g u a g e ) ,n l s a r d a1 9 8 7 t q u e l ,r s n o d 伊a s s ,1 9 8 5 t r c ( t e m p o r a l r e l a t i o n a lc a l c u l u s ) ,a b d u l l a ht a n s e l ,1 9 9 2 t e e r ,( t e 加p o r a lq u e r yl a n g u a g ef o re n h a n c e de n t i t yr e l a t i o n s b i p m o d e l ) ,r e l m a s r i ,1 9 8 5 4 第一章绪论 t d m ( t e m p o r a l d a t am o d e lb a s e do nt i m es e q u e u c e ) ,幻i es e g e v a r i es h o s h a m 1 9 8 8 o o d a p l e x ( o b j e c t0 r i e n t e d a p l c x ) ,u d a y a l ,1 9 8 9 o b j e c th i s t o r y s g i n s b u 唱,t h a k a ,c jt f m 舀1 9 8 3 。 t e m p o r a ld e d u c t i v ed a 诅b a s e s ,m a r i a n n eb a n d i n e t 等,1 9 8 9 。 这段时期重要特征是时态数据库理论研究和时态数据模型探讨,因而模 型多,但原型系统少,实际应用少。 1 2 3 思索期与应用期 经过8 0 年代末的“百花齐放”,9 3 年a t h s e l ,j c l i 肋r d 等人的“t e m p o r a l d a t a b a s e s :m e o 瞄d e s i g n ,a n di m p l e m e n t a t i o n 可以说是划上了一个“分号”。此 后,学术界的观点和认识逐步趋向“统一”,从早期的基于关系代数,到后来 的c a l c u l u s - b a s e d ,d a 诅l o g - b a s e d ,o o 等,现在基本上采用扩充s q l 模型,时 态模型没有新的突破。1 9 9 4 年后人们开始进入“思索”阶段,如何将时态数据 模型“标准化”和“产品化”是这个时期重要特征。 在“标准化”方面代表性成果是r s n o d g r a s s 等人1 9 9 4 年提出的双时态数 据模型t s q l 2 ,t s q l 2 是对s q l - 9 2 语言标准的时态扩充,并提出将t s q l 2 的相关结构集成到s o l 3 标准。1 9 9 6 年己将增加有效时间( v a l i dt i m e ) 和事 务时间( 订a n s a c t i o nt i m e ) 的s q l 门b m p o r a l 方案分别于5 月和1 0 月提交到i s o 和a n s i 委员会。但是,时态数据模型标准化的道路还需要探索。美国c m s t i a n s j e n s e n ,c l i 肋r d ,j ,s n o d g r a s s ,r t 等2 0 0 0 年合作的t e m p o r a ld a t a b a s e m a n 醒e m e n r 是这阶段重要文献。 在“产品化”方面代表性成果是瑞士t i m e c o n s u l t 公司1 9 9 8 年推出的 t i m e d b2 0 ,目前已发布b e t a4 。t i m e d b 是一个双时态关系数据库系统,支 持平台j a v a ,j d b c 。它基于s q l 查询语言,支持时态查询语言a t s q l 2 。 a t s q l 2 基本模型源于rs n o d g r a s s 的t s q l 2 语言结合丹麦a a l b o r g 大学的 广东工业大学工学硕士学位论文 m i c h a c lb o e h l e n 提出的c h r o n o l o g 模型和瑞士a n d r e a ss t e i n e r 的b i t e m p o m l c l l r o n o s q l 模型。t i m e d b 作为商业数据库o r a c l e 系统的前端运行。a t s q l 2 的语句( 包括查询、更新和断言等) 被编译成标准的s o l 一9 2 语旬在后台执 行。这种方法确保了在不同的平台和不同的数据库管理系统的兼容性。但是 目前t i m e d b 还在完善之中,仍在没有能够真正“产品化”。 这个时期另一个重要特征是“时态信息的应用”。8 0 年代中后期,由于计 算机相关技术的迅速发展,特别是网络与多媒体技术等技术的发展。应用领 域的许多新需求得以能够实现,时态信息的应用就是一个重要方面。主要应 用领域包括:地理信息系统、农业信息系统,电信信息系统,电子商务,电 子商务,智能决策支持系统,数据仓库与数据挖掘等,特别是时空 ( s p 砒i o t e m p o r a l ) 信息技术和多媒体信息技术的时态应用。但是,由于时态 数据库理论与模型还不够成熟,时态信息产品还没有形成,这时期的应用大 多都是只借助时态数据库的一些概念,时态信息的管理与操作的实现还是采 用传统的数据库技术与相关应用领域的技术( g i s ,m u l t i m e d i a 等) 相结合来 完成的。 1 3 t d b m s 实现方案 t d b m s 有其存在和开发的必要性,目前学者和研究人员提出了多种开 发t d b m s 的方案。根据对时态支持的程度和开发难度,t d b m s 实现方案 一般分为以下四种f 舢。 1 3 1 使用d a t e 数据类型支持时态操作 大多d b m s 都提供d a r e 数据类型,让用户自己定义如生产日期这样的 时间点,也可以通过定义起始时间和结束时间来标明时间区间:对于其他特 殊的时间定义,都要通过程序声明。其他所有的时态操作和时态约束都要求 第一章绪论 程序员在程序中作相应的处理。 由于程序员不能从d b m s 中得到太多的帮助,因此程序员需要大量时间 和精力处理时态数据。对于处理相同的时态业务逻辑,不同的应用程序往往 采用不同的方法,明显这不是我们追求的方向。 1 3 2 实现时间抽象类型 该方法首先假设支持抽象数据类型( a b s 诅c td a t a 聊e ,a d t ) ,而关系 d b m s 是不能实现这种方法的。面向对象的d b m s 不单要支持数据结构的定 义,而且要扩展系统的功能实现数据存储。我们可以实现一个时间a d t ,例 如定义了时间区间集合以及一套操作( 如并、差、交操作) ,在程序里通过这 些a d t 支持时态数据处理。 然而,该方法有其自身局限性,例如将旧代码不能直接移植到新系统。 而且由于应用a d t 只是针对一部分数据,但实际上时态数据并没有限制在某 些数据上,所以有必要对数据模型和管理系统建立时态支持。 1 3 3 分层扩展非时态d b m s 商业d b m s 相当一个黑盒,只有d b m s 提供商才能改变其内部结构。 因此,不改变商业d b m s 的内部结构,而在它之上添加“时态数据管理层”, 把时态查询语言转换为非时态查询语言,实现时态数据的管理功能。 该方法只需要少量的工作便可以基本实现时态数据支持,移植旧代码只 需要少量的编码便可实现。然而一旦商业d b m s 结构改变,它也要做相应的 改变,同时某些性能受到一定程度上的限制,例如时态约束表达能力有限。 总的来说,该方法是目前实现t d b m s 的最佳方法。 1 3 4 完全建立t d b m s 针对时态数据的特殊性,改变整个d b m s 的体系结构等。但由于开发完 全的t d b m s 需要大量人力物力,而且目前时态数据库理论、技术还不够成 熟,d b m s 提供商绝不会贸然改变现有d b m s ,因此现阶段看来该方法不可 行。 1 4 主要工作及论文组织 本课题来源于国家基金项目“时态信息模型及其构件研究”。文章以 t i m e d b 为基础,深入分析其源代码逻辑结构,研究“时态数据管理层”如 何把a t s q l 2 语句转换为标准s q l 语句,为以后成功开发t d b m s 提供了基 础并积累了技术和经验。本文研究的内容主要包括: 1 时间模型、时态运算、时戳添加方法: 2 时态操作、时态数据模型; 3 时态查询语言a t s q l 2 扩展方法和原理; 4 t i m e d b 的设计思想、源代码逻辑结构以及实现方法和原理; 本文第二章讨论了计算机系统表示时间的方法和模型;结合数据库技术, 分析时戳的添加方式;描述时态关系运算以及主要的时态数据模型 第三章讨论了时态查询语言a t s q l 2 的设计思想:分析它的构造方法和 原理;结合实例,说明a t s q l 2 的使用方法。 第四章通过分析t i m e d b 的源代码,研究其转换a t s q l 2 的实现方法和 原理,展示了分层结构的t d b m s 的设计思路。 最后总结本文工作,讨论t i m e d b 的不足以及开发t d b m s 的考虑因素。 第二章时态数据库技术 2 1 时间模型 2 1 1 时间表示 第二章时态数据库技术 时间作为事物的一种基本属性,无时不在,无处不在的,在时间轴上是 连续存在。在计算机系统里如何描述基本的时间单位呢? 一般说来有以下三 种基本形式【5 】: 1 基于点( p o i n t b a s e d ) 的时问基于点的时间又称为时间点( t i m ei n s t a n t ) , 它把时间看成是一个个孤立点。现实的生活中用年、月、日、小时、分、 秒、毫秒等不同单位描述时间就是时间点的体现。当时问点的粒度 ( g m u l 撕t y ) 足够小时,即可以准确描述现实世界事件发生的时间。在 计算机系统中引入了时间量子( c 1 1 r o n o n ) 这一概念,它被定义为时态系 统所支持的最小的、不可分割的时间间隔。可以看到,只要时间量子的 精度足够高,时间点可以准确描述事物发生或延续的时间。 2 基于区间( i n t e r v a l b a s e d ) 的时间基于区间的时间的基本单位为时间跨 度( t i m es p a l l ) 或时间区间( t i m ei n t e r v a l ) 。时间跨度通过时间长度表示持 续的一段时问。例如“l y e a r2m o n m s ”在计算机系统里表示为一个整数。 时间区间通过时间段的起始点和终止点表示持续的一段时间。一般用 和“ 分别表示左右闭区间,“( ”和“) ”分别表示左右开区间。令p i ,p j 分别 表示两个时间点,当p i = p j ,时间区间便可理解为延续时间为0 的一段时 间,即时间轴上的某个时间点。 3 时态元素( t e r n p o r a ie l e m e n t ) 时问区间上的集合操作有交n 、并u 、 减一,这些集合操作符关于i n t e a l 类型是不封闭。也就是说o p ( i n t e r v a l l , 广东工业大学工学硕士学位论文 i n t e a 1 2 ) 产生的并不一定是i m e r v a l ,有可能是i n t e r v a l 类型值的一个集 合。例如假定t i l = 【1 9 8 0 1 9 9 0 ) 、t 1 2 = 【1 9 9 2 一1 9 9 4 ) 、t 1 3 = 【1 9 7 5 1 9 9 6 ) , 那么t 1 1u t l 2 = “1 9 8 0 一1 9 9 0 ) ,【1 9 9 2 一1 9 9 4 ) ;t 1 1 一t 1 3 = ) ; t 1 3 一t 1 2 = 1 9 7 5 1 9 9 2 ) , 1 9 9 4 1 9 9 6 ) 。这些时间区间的有穷 并集称为时态元素 6 】。例如 1 9 8 0 - 1 9 9 0 ) , 1 9 9 2 - 1 9 9 4 ) ) 就是一个时态 元素。采用时态元素的优点是使之在理论上具有更好的代数结构一使之 具有封闭性。 2 1 2 时间模型 从计算机科学的角度看,如何量化时间和确定某个时间点或者时间段, 这关系到如何确定时间模型。因为如果按照现实世界的本来面目来记录时间, 则数据量过于庞大,而且人们往往并不需要获取现实世界所有时间的状态。 解决这一问题的方法是对时间建模,这样使得它不仅能应用到数据模型中, 而且能满足在不同应用场合的要求。 基于对时间轴结构的选择,可以对时间模型作如下几种划分 5 】。 1 连续模型连续模型把时间看作同构于实数,每一个实数对应于一个时 间点。因此,在时间轴的两个时间点之间,可以存在其它的时间点。这 种模型能够最精确的为时间建模,但是由于现代计算机基于数字逻辑的 工作方式,所以不可能无失真的记录时间。在许多实时控制场合,例如 工业控制领域,需要记录大量随时间不断变化的数据。在这种情况下, 往往采取采样的方式记录数据变化,对相邻时间点之间的数据采取插值 的方法得到。 2 步进模型步进模型把数据的状态看成是时间的函数。当时间点上的数 据状态发生变化时才记录状态变化,否则保持不变。在这种模型下,时 间序列上任一点上数据的值对应于上一次数据改变时保持的状态,如果 要查询当前数据的取值,需要回溯。 第二章时态数据库技术 3 离散模型离散模型把时间和整数映射起来,在相邻的两个时间点之间 不存在另一个时间点。任一时间点有前驱和后继时间点。在实际应用中, 该模型适用于记录那些在关键时间点上才有意义的数据。 4 恒定模型顾名思义,有些数据是不随时间变化的,例如:籍贯、出生 地等。这些数据是它本身固有的属性,但在另一种情况下往往会有时态属 性。例如:住址、身份、工作单位等。在建模时通常没有充分考虑值随 时间变化的情况,发生变化时,则用最新值进行替换。 2 2 时戳添加方法 时戳( t i m e s t 锄d ) 简单来说就是给数据“贴上”时间标签,让系统和用户 根据它对处理时态数据。如何给数据“贴上”时戳,以构成不同时间维的时态 数据模型,必须考虑三个问题:一、是选择时间区间、时间点还是时态元素 来给数据“贴上”时戳? 二、在数据哪里“贴上”时戳,是在元组还是在属性列 上记录时戳? 三、时间的表示方法与时间粒度的关系如何? 将时戳添加到数据库中的方式有六种【7 : 1 _ 元组瞬时标记( i n s t a n t s t a m p i n go f t u p l e s ) :每个元组含有一个时间值分 量,时间值指明该元组为当前元组的开始时间。 2 元组时区标记( h t e n ,a 1 s t a m p i n go f t u p l e s ) :每个元组含有两个时间值, 这两个时间值分别指明元组为当前元组的开始和结束时间。 3 元组时态元素标记( t e m p o r a l e l e m e n t _ s t a l p i n go ft u p l e s ) :每个元组含 有一个时态元素,时态元素指明该元组为真的时间。 4 属性瞬时标记( i n s t a n t - s t a m p i n go f a t 岫b u t e s ) :元组的每个属性含附加一 个时间值,时间值指明该属性为真的开始时间。 5 属陛时区标记( i n t e n r a l s t a m p i n go f a 嘣b u t e s ) :元组的每个属性附加两个 时间值,这两个时间值分别指明属性为真的开始和结束时问。 6 属性时态元素标记( t e m p o r a l e l e m e n t s t a m p i n go fa t 啊b u t e s ) :元组的每 广东工业大学工学硕士学位论文 个属性附加一个时态元素,时态元素指明该属性为真的时间。 2 3 时态关系 时态关系简单来说就是时间之间的运算,它一般分为三大类,分别是时 态区间之间、时态区间与时问点之间、时间点之间的时态关系。 1 时态区间之间的时态关系a l l e n 在1 9 8 3 年发表的m a i n t a i n i n gk n o w l e d g e a b o u tt c m p o r a lh l t e m l s 论文8 1 中指出1 3 种时态区间的关系,为时态关 系研究做出了开创性工作。这1 3 种关系分别是:“b e f o r e ”,“a f c e r ”, “d 确n g ,“c o n t a i n s ,“o v e d a p s ”,o v e r l a p p e d b y ”,“m e e t s ”, h e t - b y ”,“s t a n s ,“s t a n e d - b y ”,“血i s h e s ”,“f i n i s h e d _ b y ”,以及 “e q u a l s ”。 2 时态区间与时间点之间的时态关系在2 1 1 中已经指出,时间点可以看 作延续时间为0 的时间区间。a 1 l e n 提出的1 3 种时态关系是基于时间区 间的,在此基础上,我们可以给出关于时态区间与时间点的5 种关系 9 】: “b e f o r e ”、“a 骶r ,、“m e e t s ”( 或者s t a n s ) 、“m e t b y ,( 或f i n i s h e s ) 、 “d u r i n g ”。 3 时间点之间的时态关系时间点与点之间的时态关系相对而言比较简单, 一共有3 种关系:b e f o r c ”、“a 盘e r 、“e q u a l s ”。 2 4 三种时间 构造时态数据模型,系统需要自动添加某些时戳类型的属性列来构造时 态模型,这些属性列对用户来说是透明不可见的。在实际的应用环中,用户 也可能定义时戳类型的属性列。这两种不同性质的属性列在时态d b m s 中处 理的过程是完全不同的:系统自动添加的属性列具有时态意义( 他们是构成 了时态模型的基础) 时态关系运算解释要对这些属性列;而用户定义的时戳 第二章时态数据库技术 类型属性列本质上等同于一般的属性列,只是它的数据类型是时戳类型而已。 根据不同用途和处理方法,通常把时间区分为以下三种类型。 1 用户定义时间( u s e r - d e f i n e d t i m e )用户自定义时间指用户根据自己的 需要或理解定义的时间,其数据的含义不需要d b m s 的解释。例如 b m d a y 本来不是一种标准数据类型,但是假如用户根据自己的需要定义 了一种数据类型为b i n h d a y ,那么该属性的值( 如“1 9 7 5 年5 月6 日”) 被 称为用户自定义时间。 2 有效时间( v a l i dt i m e ) 一个事实( 事件) 的有效时间是指在建模的现实世 界中它为真( 存在) 的时间。有效时间值可以指过去、现在和未来,它的含 义依赖于具体应用,取值是否有效视具体应用场合而定,即涉及到数据 约束问题。 3 事务时间( t r a n s a c t i o nt i m e )事务时间用来记录实体对应的元组( 记 录) 在数据库的改变历史,对应于现有事务或现有数据库状态变迁的历 史。事务时间的值由系统时钟给出,用户不能修改,并且它不能晚于现 在时间,因为它反映着数据库实际操作的时间,不能指未来,而有效时 间可以指未来。 2 5 时态数据库分类 按照s s r i p a d a 和r s n o d g r a s s 的意见,时态数据库一般分为三类l o 】: 1 历史数据库( h i s t o r i c a ld a t a b a s e )历史数据库只支持有效时间,对象的 历史由d b m s 内部机制处理。它记录现实世界在有效时间点的事件,或 者现实世界的状态变化,对事物的描述比较符合直观理解。 2 事务数据库( r o l l b a c k d a t a b a s e )事务数据库又称为回滚数据库,只支 持事务时间,对象删改历史由d b m s 内部机制处理。它记录数据库自身 变化,沿着事务时间轴记录数据,按照事务时间排序,保留了所有状态 演变中过去的状态】。 广东工业大学工学硕士学位论文 3 双时态数据库( b i t e l n p o r a l d a t a b a s e ) 双时态数据库同时支持有效时间 和事务时间。它既能处理管理对象的历史,又能管理数据库本身被删改 的历史。 2 6 时态数据模型 时态数据库理论研究已经走过了近三十个年头,取得了丰硕的成果。时 态数据库模型很多,各有千秋。下面是几个“代表性”的时态数据模型的基本 情况川。可以看出这些模型在概念和机制上有许多共同的特点。 2 6 1 t e m p s q l 基本结构:s q l 的扩充 支持时间类型:有效时问 提供操作:关系表达式,时态表达式,布尔表达式。 典型查询: s e l e c ts e l c c t l i s t w h i l e w h i l e e x p r e s s i o n f r o m 厅o m l i s t w h e r ew h e r c c o n d i t i o n g r o u pb y 目o u p b y l i s t h a v i n gh a v i n g c o n d i t i o n d u r i n gd u m g e x p r e s s 作者:s h a s h ik g a d i aa n ds n a i r 美国衣阿华州立大学计算机科学系 最初发表时间1 9 8 5 2 6 2 t 砌讧& t s q l 基本结构:t r m 的一种实现。 支持时间类型:有效时间。 操作:传统s q l 表达式,时态表达式,特别表达式:t j o i n ,t n j o i n , c o m p r e s s : 1 4 篁三兰坠奎墼堡星苎查 典型查询: s e l e c ts e l e c t l i s t ( t i m e s t a r t ,t 【m e e n d ,i n t e r ) w h e nw h e n e x p r e s s i o n ( b e f o r e ,a f t e r ,d u f u n ge q u i 、,a l e n t , a d j a c e n t ,o v e r l a p ,f o l l 0 w s ,p r e c e d e s ) f m m 丘o m l i

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论