




已阅读5页,还剩50页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
山东大学硕士学位论文 摘要 时间是自然界无所不在的客观属性,所有信息都具有相应的时态属性。时态 数据库将时间作为数据的属性纳入系统的管理范畴,存储和管理多个时间状态的 数据。时态数据库中存储的数据都具有时态信息,当我们把经典关系数据库中的 函数依赖( f u n c t i o n a ld e p e n d e n c y ) 引入到时态数据库中时,同样需要给函数依赖 增加时态信息,来说明函数依赖成立的时间,例如:“任一雇员在同一月内只能 有一种工资”、“任一雇员在同一年内只能在同一部门工作一,相对于经典函数依 赖,我们分别记这两个时间区段内的函数依赖为:l m e 一。月,s a l ,n a m e - * 。年 d e p t , 并称它们为时态函数依赖( t e m p o r a lf u n c t i o n a ld e p e n d e n c y ) 。显然时态函数依赖 能更有效的建模现实世界的对象,并且能有效的解决数据库的冗余问题和实现数 据的约束。 经过二十多年的发展,时态数据库理论研究取得了丰富的成果,而时态数据 库实现技术尚处于起步阶段,目前国内外还没有一个真正意义上的时态数据库管 理系统。作为商业d b m s 的前端构件,t i m e d b 基本实现了时态数据管理功能, 是比较成功的时态数据库管理原型系统。但是目前提出的t d b m s 都没有提供对 时态函数依赖的支持,时态函数依赖的定义、解释和检查都要由用户程序实现。 如何在t d b m s 中对关系数据库中的函数依赖进行扩展,增加时态信息使其扩展 为时态函数依赖,在对t d b m s 进行数据插入和修改时进行函数依赖检查,对不 满足时态函数依赖的插入和修改事务进行回滚,并且允许用户自定义时态函数依 赖,是时态数据库应用研究领域的一个重要课题。本文提出了一种基于时态函数 依赖处理模块对t i m e d b 进行扩展的实现方案,在时态数据库中实现时态函数依 赖的支持,并支持用户自定义时态函数依赖。 本文首先介绍了时态数据库出现的历史背景、起源与发展以及研究与应用现 状,说明了时态数据库中的一些基本概念,其次讲述了时态数据模型和时态数据 的表示方案,然后讨论了基于t i m e d b 扩展的时态数据库系统设计,最后提出了 时态函数依赖及其公理推导系统,并且在此基础上实现了时态函数依赖处理模 块。 山东大学硕士学位论文 本文提出的时态函数依赖处理模块作为现有时态数据库t i m e d b 的一个扩展 功能模块,在前端构件t i m e d b 之上,用于支持t d b m s 的时态函数依赖处理的特 性。当用户对t d b m s 进行插入和修改操作时,时态函数依赖处理模块将对插入和 修改的数据进行检查,当满足依赖时才交由t i m e d b 执行,若不满足则直接对用 户进行提示,并且支持用户自定义时态函数依赖,对时态函数依赖的解释和处理 都是对用户透明的,从而实现了t d b m s 对时态函数依赖的支持。 关键字:时态数据库:tim e d b , 时态函数依赖;时态函数依赖处理模块 i i t l i 东大学硕士学位论文 a b s t r a c t t i m ei st h ea l l p e r v a s i v en a t u i eo fo b je c t i v ea t t r i b u t e ,a l li n f o r m a t i o nh a st h e c o r r e s p o n d i n gt e m p o r a lp r o p e r t i e s t i m ea st h ed a t aa t t r i b u t eo ft e m p o r a ld a t a b a s e d a t ah a sb e e ni n c o r p o r a t e di n t ot h ep r o p e r t i e so ft h es y s t e m sm a n a g e m e n ta r e a , f o r s t o r a g ea n dm a n a g e m e m o fm u l t i p l e - t i m ed a t a t h et e m p o r a ld a t as t o r e di nt e m p o r a l d a t a b a s eh a v et e m p o r a li n f o r m a t i o n ,w h e nw eb r i n gf u n c t i o n a ld e p e n d e n c yi nt h e c l a s s i c a lr e l a t i o n a ld a t a b a s ei n t ot h et e m p o r a ld a t a b a s e ,t h ef u n c t i o nd e p e n d e n c ya l s o n e e d st oi n c r e a s e ds t a t ei n f o r m a t i o nt oi l l u s t r a t et h ee s t a b l i s h m e n to ft h et i m e o f f u n c t i o n a ld e p e n d e n c y ,s u c ha s :”a n ye m p l o y e ei nt h es a m em o n t ho n l yh a so n e w a g e ”,”a n ye m p l o y e ei nt h es a m ey e a ro n l yw o r ki nt h es a m ed e p a r t m e n t , c o m p a r e d t oc l a s s i cf u n c t i o n a ld e p e n d e n c y ,w er e c o r d :n 锄e 一 s a l ,n a m e - d e p t ,a n d s a y i n gt h e ya r et e m p o r a lf u n c t i o n a ld e p e n d e n c y c l e a r l y ,t e m p o r a l f u n c t i o n a ld e p e n d e n c yi fm o r ee f f e c t i v e l ym o d e ii n gr e a l - w o r l do b j e c t s , a n dc a l le f f e c t i v e l ys o l v et h ep r o b l e mo fr e d u n d a n td a t a si nd a t a b a s ea n d d a t ac o n s t r a i n t s a f t e rm o r et h a n2 0y e a r so fd e v e l o p m e n t , t h et e m p o r a ld a t a b a s et h e o r e t i c a l s t u d yh a sb e e nm a d ef r u i f f ma c h i e v e m e n t s ,a n dt e m p o r a ld a t a b a s et e c h n o l o g yt o a c h i e v es t i l la tt h ef l e d g l i n gs t a g e ,a th o m ea n da b r o a dd on o th a v ear e a ls e n s eo ft h e t e m p o r a ld a t a b a s em a n a g e m e n ts y s t e m a sa c o m m e r c i a ld b m sf r o n t - e n d c o m p o n e n t s ,t i m e d bb a s i c a l l ya c h i e v e dt h et e m p o r a ld a t am a n a g e m e n tf u n c t i o n s ,i t i sas u c c e s s f u ld a t a b a s em a n a g e m e n ts y s t e mp r o t o t y p e b a s e do nt h ea b o v e c o n s i d e r a t i o n s ,t h i sp a p e ra n a l y s e st h et i m e d bm e t h o d ,t h es t u d ys t a t e si nt h e d a t a b a s ea tt h et e m p o r a lf u n c t i o nd e p e n d e n to nt h ea c h i e v e m e n t b u ta tp r e s e n tt h e t d b m sd i dn o tp r o v i d et e m p o r a lf u n c t i o n a ld e p e n d e n c ys u p p o r ta r tt h es t a t ef u n c t i o n d e p e n d e n to nt h ed e f i n i t i o n ,i n t e r p r e t a t i o na n di n s p e c t i o np r o c e d u r e sb yt h eu s e rt o a c h i e v e h o wt d b m se x p a n d sf u n c t i o n a ld e p e n d e n c yi nt h er e l a t i o n a ld a t a b a s e , i n c r e a s i n gt e m p o r a li n f o r m a t i o n ,w h e ni n s e r t i n ga n dm o d i f y i n gd a t ai nt h et d b m s f u n c t i o n a ld e p e n d e n c yc h e c k st h ed a t aa n dr o l l b a c kt h et r a n s a c t i o nw h i c hd o n t i l l 山东大学硕士学位论文 s a t i s f yt h ed e p e n d e n c y ,a n da l l o w su s e r - d e f i n e df u n c t i o n a ld e p e n d e n c y ,a l la b o u ti s 锄 i m p o r t a n tr e s e a r c ht o p i ci nt h ef i e l do ft e m p o r a ld a t a b a s ea p p l i c a t i o n t h i sp a p e r p r e s e n t sa ne x p a n s i o no ft i m e d bb a s e do nt e m p o r a ld e p e n d e c yp r o c e s s i n g m o d u l e ,i m p l e m e n t st h es u p p o r to ft e m p o r a lf u n c t i o n a ld e p e n d e n c yi nt h et e m p o r a l d a t a b a s e ,a n ds u p p o r t su s e r - d e f i n e dt e m p o r a lf u n c t i o n a ld e p e n d e n c y i nt h i sp a p e r ,w ep r e s e n t st h eh i s t o r i c a lb a c k g r o u n d , o r i g i na n d d e v e l o p m e n to f t h et e m p o r a ld a t a b a s e ,a sw e l la st h es t a t u sq u oo fr e s e a r c ha n d a p p l i c a t i o n , i l l u m i n a t es o m eb a s i cc o n c e p t si nt h et e m p o r a ld a t a b a s e ,f o l l o w e ds t a t e st h e e x p r e s s i o ns c h e m eo ft h et e m p o r a ld a t am o d e la n dt e m p o r a ld a t a , a n dt h e ns y s t e m d e s i g no fd i s c u s s e dt h et e m p o r a ld a t a b a s eb a s e do nt i m e d be x t e n s i o n ,a tl a s t c o n c l u d e st e m p o r a lf u n c t i o n a ld e p e n d e n c ya n dd e r i v a t i o n ju s t i c es y s t e m , a n dt h i so n t h eb a s i so ft h et e m p o r a lf u n c t i o n a ld e p e n d e n c yp r o c e s s i n gm o d u l e t h i sp a p e rp r e s e n t st h et e m p o r a lf u n c t i o n a ld e p e n d e n c y p r o c e s s i n gm o d u l ea s a ne x t e n s i o no ft h ee x i s t i n gf u n c t i o n a lm o d u l e s ,c o m p o n e n t st i m e d bo nt h ef r o n te n d , u s e dt os u p p o r tt h et d b m s r e l yo nt h es t a t ef u n c t i o nw h e nh a n d l i n gc h a r a c t e r i s t i c s w h e nu s e r st oi n s e r ta n dm o d i f yt d b m so p e r a t i o n ,t e m p o r a lf u n c t i o nw i l lr e l yo n p r o c e s s i n gm o d u l ei n s e r t i o na n dm o d i f i c a t i o no fd a t ai n s p e c t i o n ,o n l yt or e l yo nw h e n t om e e tt i m e d bi m p l e m e n t a t i o n ,n o tm e e td i r e c t l yo nt h eu s e r t i p s ,a n ds u p p o r tu s e r s s i n c et h ed e f i n i t i o no fs t a t e - d e p e n d e n tf u n c t i o no ft h et e m p o r a lf u n c t i o nd e p e n d e n to n t h ei n t e r p r e t a t i o na n d p r o c e s s i n gi st r a n s p a r e n tt ou s e r s k e y w o r d :t e m p o r aid a t a b a s e :tim e d b :t e m p o r aif u n o tjo n ai d e p e n d e n c y ; t e m p e r a id u n o tio n ai d e p e n d e n c yp r o c e s s in gm o d ule 原创性声明和关于学位论文使用授权的说明 原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独 立进行研究所取得的成果。除文中已经注明引用的内容外,本论文不 包含任何其他个人或集体已经发表或撰写过的科研成果。对本文的研 究作出重要贡献的个人和集体,均己在文中以明确方式标明。本声明 的法律责任由本人承担。 论文作者签名:塑造日期:型丝篚生目妇 关于学位论文使用授权的声明 本人完全了解山东大学有关保留、使用学位论文的规定,同意学 校保留或向国家有关部门或机构送交论文的复印件和电子版,允许论 文被查阅和借阅;本人授权山东大学可以将本学位论文的全部或部分 内容编入有关数据库进行检索,可以采用影印、缩印或其他复制手段 保存论文和汇编本学位论文。 ( 保密论文在解密后应遵守此规定) 论文作者签名:墨遂导师签e l 期:翻幽 山东大学硕士学位论文 暑詈皇皇! 詈詈= 詈! 詈喜! 皇! 詈詈皇! 皇! 皇鼍m ii 。mm ! 鼍詈詈詈! 暑皇鼍皇 第一章前言 1 1 时态数据库出现的历史背景 时间是自然界无所不在的客观属性,所有信息都具有相应的时态属性。随着 数据库与信息技术的深入发展,信息系统面临着许多新的应用和新的需求,对时 态信息处理的需求越来越迫切。时态信息处理已成为许多新一代数据库与信息系 统的关键技术,特别是在电子政务、电子商务、数据仓库、数据挖掘、决策支持 系统等信息系统中扮演着日益重要的角色。 数据库技术及其应用系统最早出现于6 0 年代,由其应用对象决定,它们大 多基于层次数据模型或网状数据模型;7 0 年代,e e c o d d 提出数据库的关系模 型,并对关系数据理论做出了创造性的贡献,从而使数据库从技术上升到理论。 关系数据库理论和技术在7 0 至8 0 年代得到长足的发展和广泛而有效的应用。但 层次数据库、网状数据库和关系数据库,不论其模型和技术上有何差别,却主要 是面向和支持商业和事务处理应用领域的数据管理。随着数据库应用层面的拓 宽,传统的数据库技术越来越不能满足日益丰富的应用的需要。各种数据库新技 术应运而生。 e e c o d d 提出的关系数据库由于模型简单、易于掌握,并且具有坚实的数学 基础,在过去的二十多年中获得了极大的成功。但是,关系数据模型没有表达出 数据的时间维的特征。在关系数据库中,并没有对数据随时间的变化给予特别关 注,而是像对待普通数据一样处理。而在许多关心数据的过去、现在或将来的值 的应用中,这样是不够的。事实上,大多数应用都在一定程度上需要时态数据。 时态数据反映了事物发展的过程,有助于揭示事物发展的本质规律。例如,在科 学实验中,同一试验常常需要进行多次,产生多个版本的实验结果,每个实验结 果通常会涉及精确的时间序列,与试验结果相关的时间信息往往是不可忽视的。 如,在商业营销中,也常常需要保存数据及其相关时间信息,以便辅助企业决策 者做出更有效、更准确的营销部署。而传统的数据库技术在这一点上做得不尽人 意,在处理上并没有将数据的时间维同数据的其他属性区别对待,也不支持数据 的多版本维护,不利于维护数据的历史信息。在这些传统的数据库产品中,对数 山东大学硕士学位论文 据对象的值进行更新时,新值将取代旧值,时间信息也随之丢失。即使是某些广 泛应用的关系数据库产品,例如o r a c l es q ls e r v e r 等,也仅仅提供了一些时间 数据类型,没有提供专门的时间方面的操作,不能满足某些应用对历史信息的维 护需要。 日益广泛的数据库应用要求了管理被处理事件的历史性信息,和系统中元事 件的时态信息,例如查删改事务的时刻,时态信息据反映了事物发生发展的过程, 有助于( 揭示事物发展的本质规律和这些数据有助于提高数据库系统的可靠性和 效率。 6 0 年代末,人们开始认识到时态信息的重要性,并展开了研究。g w i e d e r h o l d 和j e f r i e s 在1 9 7 0 年研制的医疗系统在处理时态信息方面作了较早的尝试,k a h n k e t a l 于1 9 7 7 年在( ( a r t i f i c i a li n t e l l i g e n c e ) ) 上发表的( ( m e c h a n i z i n gt e m p o r a l k n o w l e d g e ) ) 反应了早期关于时态信息的基础性研究工作。 1 2 时态数据库的起源与发展 关于时态数据库的起源与发展,国际时态数据库权威学者a t a n s e l 、j c l i f f o r d 等在1 9 9 3 年共同主编的( ( t e m p o r a ld a t a b a s e s :t h e o r y , d e s i g n ,a n di m p l e m e n t a t i o n ) ) 收集了此前时态数据库几乎所有的重要成果,我国学者唐常杰1 9 9 9 年在时态 数据库的沿革、特色与代表人物一时态数据库2 0 年回顾之一等文献中也对时 态数据库前2 0 年的发展做了系统回顾 3 】。时态信息技术的起源和发展分为3 个 时期: l 、开创期( 1 9 8 2 年以前) : g w i e d e r h o l d 和j e f r i e s 在1 9 7 0 年研制的医疗系统在处理时态信息方面作 了较早的尝试,k a h nk e t a l 于1 9 7 7 年在 a r t i f i c i a li n t e l l i g e n c e ) ) 上发表的 ( ( m e c h a n i z i n gt e m p o r a lk n o w l e d g e ) ) 反应了早期关于时态信息的基础性研究工 作。加州大学洛杉矶分校j b e nz v i 和纽约大学的j c l i f f o r d 在1 9 8 2 年的博士论 文是时态数据库技术开创期的两个标志性成果。 j b e nz v i 于1 9 7 9 - - 1 9 8 2 年对时态数据库作了开创性研究,在1 9 8 2 年完成 了博士论文t h et i m er e l a t i o n a lm o d e l ) ) ,总结了他的一系列工作。j b e nz v i 的 贡献突出在下列几点:( 1 ) 他提出了时态数据库模型,引入了时间间隔( t i m e 2 【l f 东大学硕士学位论文 p e r i o d ) ,后来被学术界改称为时间区间。( 2 ) 在1 9 7 9 - - 1 9 8 2 这个关系规范型研究 的热点时期,j b e nz v i 突破思想禁区,提出并研究了非1 n f 的t d b 。( 3 ) 以时 间区间作字段值,刷新了人们认为数据库字段值只能是一个数或串的观念。( 4 ) 引入了后来被称为双时态的概念,即用有效时间表示被管理对象在库中生命周 期,用事务时间表示数据库本身的历史。( 5 ) 引入了时态索引结构。这些概念和 思想一直沿用至今,标志着时态数据库的形成。尽管1 9 8 2 年以后,j b e nz v i 在 t d b 领域消声匿迹了,他对t d b 的贡献功不可没。 同样是在1 9 8 2 年,纽约大学的j c l i f f o r d 完成了他的博士论文al c i 西c a l f r a m ew o r kf o r t h et e m p o r a ls e m a n t i c sa n dn a t u r a ll a n g u a g eq u e r y i n go f h i s t o r i c a ld a t a b a s e ) ) ,他的主要贡献是对历史数据库做了开创性的工作,提出了 h rm ( h i s t o r i c a lr e l a n t i o n a ld a t a m o d e l ) 模型。他研究了在关系、元组、字段 值上加上时态信息的技术细节,引入了历史关系模型、历史关系代数,将传统关 系数据库当作历史数据库的一种特例,即当把区间缩小为一点 n o w , n o w 时的历 史数据库。 美国南加利福尼亚大学的s g i n s b u r g 教授原是形式语言,特别是上下文无 关文法研究的先驱者。他于1 9 8 3 年提出对象历史模型( o b j e c th i s t o r y ) ,该模型以 可计算对象如银行帐目、支票帐户的历史性数据为研究背景,其特色在于:( 1 ) 深刻地分析了基于可计算元组的对象历史的特殊要求和特殊规律,提出了基于记 录、事件驱动的代数结构模型。( 2 ) 研究内容( 包括提出的问题,分析建模和成果 表现) 与其他t d b 模型完全不交叉,强调了历史+ 现状一未来的机制。( 3 ) 揭示了 一系列出人意料的结果,包括关于对象历史中的若干判定性问题等难度很大的结 果。( 4 ) l h - 题提出、分析和模型都接近金融系统的各种应用。 2 、发展期( 1 9 8 3 1 9 9 3 年) : 1 9 8 2 年以后,t d b 的研究开始走向繁荣时期。这个时期标志性成果是 a t a n s e l 、j c l i f r o r d 、a s e g e v 和k t s n o d g r a s s 等在1 9 9 3 年共同编辑出版的 ( ( t e m p o r a ld a t a b a s e s :t h e o r y ,d e s i g n ,a n di m p l e m e n t a t i o n ) ) ,该书被称为“世界 第一本关于时态数据库专著”。该书对此前国际时态数据库技术的研究给出了全 面的总结。收录了国际时态数据库方面重要学者的研究成果和时态数据库模型, 列出了1 3 种最有影响的时态数据库模型。这段时期的重要特征时时态数据库理 山东大学硕士学位论文 论的研究和时态数据模型的探讨,因而模型多,但原型系统少,实际应用少。 3 、应用期( 1 9 9 3 年至今) : 1 9 9 4 年后,时态模型没有新的突破,人们开始进入“思索”阶段,如何将 时态数据模型“标准化”和“产品化”是这个时期重要特征。在“标准化一方面, 代表性成果是k t s n o d g r a s s 等人在1 9 9 4 年提出的双时态数据库模型t s q l 2 , t s q l 2 是对s q l - 9 2 语言标准的时态进行扩充,并提出将t s q l 2 的相关结构集 成到s q l 3 标准。在“产品化方面的代表性成果是瑞士t i m e c o n s u l t 公司于1 9 9 8 年推出的t i m e d b 2 0 ,它是一个双时态关系数据库,支持平台j a v a 、j d b c ,基 于s q l 查询语言,支持时态查询语言a t s q l 2 。 这个时期的另一个重要特征是“时态信息的应用”。但是,由于时态数据库 理论与模型还不够成熟,时态信息产品还没有形成,所以这时期的应用大多都是 只借助时态数据库的一些概念,时态信息的管理与操作的实现还是采用传统的数 据库技术与相关应用领域的技术相结合来完成的。 1 3 研究与应用现状 目前,时态信息技术仍处于研究和发展阶段,人们从不同的观点,提出了时 态数据库模型。另外,由于实际应用的需求,时态信息处理的应用领域越来越宽, 在应用中也提出了许多方法和技术。 在现有的时态数据库模型中,对时间数据的描述组要是依照j b e nz v i 于 1 9 7 9 1 9 8 2 年提出的时间点时间区间模型、有效时间和食物时间,以及双时态等 概念;时态数据盐酸主要是基于j e a u e n 于1 9 8 4 年提出的1 3 种区间演算。主要 不足是:时态数据运算体系不完备,时态关系演算还没有系统和有力的数学理论 支持。 时态数据模型多,一些标准在逐步提出申请。由于时态数据模型还不够成熟, 所以还没有形成较完整的国际标准。时态数据模型一般都是传统关系数据库的扩 展,并将传统关系数据库作为特例。其主要方法是在t d b 中增加一些运算,扩 展一些操作。由于种种原因,数据库厂商难以下决心选用t d b 技术用于产品。 目前,在现在所有的主流数据库厂商的产品中,没有一个产品能够称得上是实现 了完整意义上的时态数库模型,能够以时态数据模型所表示的方式存储和组织数 4 山东大学硕士学位论文 据的数据库产品几乎没有。有少量产品虽然也自称是时态数据库产品,但其实也 是以一种基于关系数据库存贮的方式解决的,时间的含义和解释都是由用户应用 程序实现,而不是由时态数据库管理系统自身所理解。 1 4 本论文的研究工作 在时态数据库的应用中,由于存储的是时间区段内某些对象的情况,所以在 其中还存在着一些时间区段内的函数依赖,这些函数依赖在其时间区间内是有效 的,而在其它时间是无效的,称它们为时态函数依赖。例如:“任一雇员在同一 月内只能有一种工资、“任一雇员在同一年内只能在同一部门工作”,相对于经 典函数依赖,我们分别记这两个时间区段内的函数依赖为:n a m e - * 。月,s a l ,n a m e 一。年,d e p t 。时态函数依赖皿e 一。月,s a l 意味着对于一个月内的任意两个时刻m 和n ,在时态关系中存在元组t 1 和t 2 ,其中t 1 在时刻m 有效,t 2 在时刻n 有 效,只要t l n a m e = t 2 n a m e ,则t l s a l = t 2 s a l 。显然时态函数依赖能更有 效的建模现实世界的对象,并且能有效的解决数据库的冗余问题和实现数据的约 束。因此,在时态数据库中引入时态函数依赖是非常有必要的。 时态数据库实现技术尚处于起步阶段,目前国内外还没有一个真正意义上的 时态数据库管理系统。作为商业d b m s 的前端构件,t i m e d b 基本实现了时态数据 管理功能,是比较成功的时态数据库管理原型系统。但是目前提出的t d b m s 都没 有提供对时态函数依赖的支持,时态函数依赖的定义、解释和检查都要由用户程 序实现。时态数据库如何支持时态函数依赖,在用户插入和修改数据时进行时态 函数依赖检查,回滚不满足时态函数依赖的事务,使这些操作对用户都是透明的, 支持用户自定义函数时态依赖,成为时态数据库研究的一个重要领域。 针对以上研究现状,本论文对时态数据库的一些核心概念进行深入研究,对 已经提出的时态数据模型和时态数据库实现方案进行分析,介绍了时态函数依赖 的公理系统以及目前现有的一个比较成熟的时态数据库产品t i m e d b ,并采用分 层扩展关系数据库的思想,设计出一个基于时态函数依赖处理模块对t i m e d b 进 行扩展,实现时态数据库对时态函数依赖的支持的设计方案。 山东大学硕士学位论文 第二章时态数据库的基本概念 简单来讲,时态数据库就是记录随时间变化的信息的数据库,它在传统的数 据库基础上扩充了时间维。 r i c h a r ds n o d g r a s s 定义时态数据库是“除了支持用户定义时间,还支持一些 其他的时间方面概念的数据库。s h a m k a n tn a v a t h e 和r a f ta h m c d 给出了更精确 的定义:“时态数据库是两个关系集r s 和础的并集,其中心是所有静态关系的 集合,斑是所有随时间变化的关系的集合, 时态数据在计算机系统中一般保存在数据库中,这种记录时态数据反映时态 信息的数据库就是时态数据库( t e m p o r a ld a t a b a s e ) 。另外,从对事务时间和有效 时间的支持的角度来说,通常将支持事务时间和有效时间的数据库称为时态数据 库。下面介绍有效时间、事务时间等时态数据库中的基本概念。 2 1 三种基本时间 2 1 1 用户自定义时间( u s e r - d e f in e dt i m e ) 1 用户自定义时间是指用户根据自己的需要或理解定义的时间。这种时间的属 性值一般是时间点,用户本身会解释他所给出的时间信息,数据库系统不需要解 释该数据的含义,只需将此时间域等同于其他一般的属性域来理解,对它的操作 和对普通的字符串操作几乎没有什么差别。和传统数据库系统一样,时态数据库 系统不对用户自定义时间进行任何特殊的处理,不需要专门的语言支持。用户自 定义时间值是完全应用依赖的,由用户和系统以常规方式存取。例如b i r t h d a y 本 来不是一种标准数据类型,但是假如用户根据自己的需要定义了一种数据类型为 b i r t h d a y , 那那么该属性的值( 如“1 9 7 5 年5 月6 日“) 被称为用户自定义时间。 2 1 2 有效时间( v a li dt i m o ) 1 】 有效时间是指一个对象在现实世界中发生并保持的那段时间,或者该对象在 现实世界中为真的时间。有效时间既可以反应过去和现在的时间,还可以反应将 来的时间。有效时间可以是单一的时间点,单一的时间区间,或者是时间点的集 6 山东大学硕士学位论文 合,时间区间的有限集合,或者是整个时间域。也就是说,元组的属性可以在任 意的时间点,任意的时间区间里取值为真。和用户定义的时间不同,当查询语句 被检测到有时态语义的时候,有效时间是由数据库系统解释的。而且有效时间可 以被更新,有效时间的提供和更新也是由用户来完成的。 有效时间主要有如下两个特点: 1 ) 有效时间值的含义依赖于具体应用,取值是否有效视具体应用场合而定, 即涉及到数据约束问题: 2 ) 有效时间可以指过去、现在和未来。 2 1 3 事务时间( t r a n s a o t i o nt i m e ) 1 】 事务时间是指一个数据库对象进行操作的时间,是一个事实存储在数据库中 的时间,它记录着对数据库修改或更新的各种操作历史,对应于现有事务或现有 数据库状态变迁的历史。事务时间对应于现有事务或现有数据库的状态变迁的历 史。它是应用独立的,用户不可以修改事务时间。数据库中的数据录入数据库的 时间,修改和删除的时间是由系统时钟决定的,而修改后的数据也是不能够改变 的。处理事务时间的方法是存储所有数据库的状态,即每处理一个事务就存储一 个数据库状态。修改只能对最后一个状态进行,但是可以查询任意一个状态。 时态数据库在处理时间信息问题上,最重要的概念是有效时间和事务时间对 这两种时间属性的支持构成了时态数据库里面最为重要的特征。 2 2 四种数据库 按表示时态信息的方式和能力对数据库进行分类,可以将数据库分成基本的 四个类型 1 】。它们是快照数据库( s n a p s h o td a t a b a s e ) ,回滚数据库( r o l l b a c k d a t a b a s e ) ,历史数据库( h i s t o r i c a ld 出山a s e ) 和双时态数据库( b i t e m p o r a ld a t a b a s e ) 。 2 2 1 快照数据库 快照数据库以在特定的时刻的瞬间快照来建立模型,来考虑现实世界,尽管 现实世界是变化的,快照数据库只是反应了某一个瞬间的情况,但快照数据库确 实可以解决很多实际问题,它是我们用的时间最长的一种数据库技术,我们传统 山东大学硕士学位论文 的数据库都是这种数据库。 快照数据库由一些元组组成,每个元组就是一个静态的关系,但是此元组并 不反应其状态的变迁历史。数据库的状态变迁由事务实现,一旦事务提交,其状 态变迁就立即生效,原来的数据库状态也就完全被丢失和遗忘,相应的,现实世 界的状态也一样被丢失和遗忘。快照数据库只能进行当前数据库状态的查询和更 改及删除工作,它不能够进行与时间相关的任何工作,不能进行含有时间因素的 推理,不能进行以往历史数据的查询;而且,它更改的历史数据全部丢失,等等。 所有这些都反映了快照数据库的天生弊病,这是由快照数据库的建库机理决定 的。 2 2 2 回滚数据库 回滚数据库支持事务时间,它按事务时间进行编址,它保存了所有状态演变 中过去的状态。这种数据库由回滚关系组成。 一个回滚关系是一个三维结构,可当作是一个按时间编址的瞬象的序列。这 个三维结构是这样的:x 轴是属性轴,y 轴是元组轴,z 轴是时间轴,表示事务时 间。当在z 轴上作垂直切割,每一个时间点都对应于一个二维的快照数据库,当 然我们所取的时间的点一定是数据库中的事务时间点,也就是在那一点有数据库 的建立、修改、和删除及数据库的定期重写( 里面可能没有数据及有效时间的变 更) 工作。 回滚数据库保持了数据变迁的历史,每个事务都产生一个新的静态关系附着 在时间轴的前面,即使是数据库毫无变迁。这样就会产生很多的冗余。 回滚数据库的不足之处是较为显然的:首先它记录的是数据库活动的历史, 而不是现实世界变化的历史,现实世界中元组的属性已经随着时间变化了,但是 因为数据库的事务时间没有改变,那么此时,元组的时变属性的改变在数据库中 根本没有得到体现出来。其次,过去元组的错误决不可以更正,而只能查看,当 我们发现元组有错误的时候,如果此事务已经提交的话,我们就无能为力了,我 们所能做的工作只能是等待下次系统的事务时间进行新的改动,但是,改动的只 是提交前的数据库,以前的状态绝不能再改变。最后,回滚数据库的冗余太多。 在前一个事务时间内提交的数据,即使在下一个事务时间没有数据的改变或者改 山东大学硕士学位论文 变甚小也是需要进行所有的数据的重新输入及储存,这种冗余是较大的,特别是 在时变较小的情况下。 2 2 3 历史数据库 历史数据库与回滚数据库类似,不过它支持有效时间,不支持回滚时间。 历史数据库记录的是数据库中的一个个元组的有效时间段的状态,而不是象 回滚数据库记录的一个个“历史的”快照状态。历史数据库也是一个三维结构, 只不过用有效时间维代替事务时间维。 历史数据库建模现实世界在有效时间点的事件或现实世界状态变化的经历。 历史数据库允许任意修改( 包括以前的状态) ,因此,以前元组的错误可以修改, 而回滚数据库则不允许这样做,但是,历史数据库修改后以前的状态不再保留。 历史数据库和前两种数据库的比较:历史数据库可以象快照数据库一样任意修改 以前的状态,历史数据库也象快照数据库一样使得被修改的状态不再保留。这使 得历史数据库不可以象回滚数据库一样进行以前的某一个状态的查询,历史数据 库所查询的状态只是当前的状态。历史数据库还有一项是最为独特的,历史数据 库能够进行有关未来问题的推理,这是快照数据库和回滚数据库所决不可以的。 历史数据库记录的是现实世界的真实变化情况,它是以元组的有效时间来表达 的,对它的操作需要有更为高级的语言的支持,而不是象快照数据库和回滚数据 库的较为简单的语言。 历史数据库从某种程度上应该是可以称为时态数据库的,而前两种数据库系 统在时态上面的支持简直是太有限了,快照数据库就不用说了,就回滚数据库, 也难以称得上是纯粹的时态数据库,充其量,回滚数据库只能是用快照的办法进 行时态问题的处理,只是稍加了一些形式上的改进而已。 回滚数据库和历史数据库的结合,对两种时态属性的支持将产生真正的时态 数据库,它应该是支持事务时间和有效时间的,这就是我们下面要说的数据库一 双时态数据库。 2 2 4 双时态数据库 回滚数据库和历史数据库各具优点,通过设计一种数据库,使它即支持事务 9 山东大学硕士学位论文 时间又支持有效时间,这就是双时态数据库。双时态数据库由时态关系组成。一 个时态关系是一个四维结构。其中两维是属性和元组,另外两维是事务时间和有 效时间,一个时态关系可以看成是一个历史关系的序列。对时态关系的一个回滚 操作则是选取了一个特定的历史关系,可对该历史关系进行查询。而每一个事务 则引起一个新的历史关系的建立。 双时态数据库集成了前三种类型数据库的功能特性,储存了数据库和现实世 界两者发展的历史。时态关系的种实现方法就是组合回滚数据库和历史数据库 成为新的数据库。 下面,我们利用图2 1 进行说明。 性 图2 1 双时态数据库的四维结构 只要在事务维中任意截取事务时间点就可以找到相应的元组的有效时间段, 不同的事务时间点对应不同的有效时间段( 一般是这样的,当然也有有效时间段 是一样的不同事务时间点,如事务时间点t 。和t 。的有效时间段是一样的) 。我们 可以看出,在事务时间轴上,取不同的时间点,就产生不同的历史数据库,我们 可以对上图中的对应于四个事务时间点t ,t 。,t 。,t 4 的历史数据库进行查询操 作:当然上图中所示的只是一个元组的四个历史数据库中的有效时间片断组合, 对于其他元组的情况可以类似的进行推理,而后,这些元组组合到一起即是形成 了四个不同的历史数据库。所以,这四个历史数据库也可以当成是快照历史数据 库,说是快照,是因为这四个数据库分别是四个事务时间的快照;说是历史数据 库,是因为,每个数据库里面是历史数据库属性的,在里面记载的是现实元组的 1 0 山东大学硕士学位论文 真实变化的时间,而非数据库状态变化的时间,我们可以在这四个数据库里面进 行增加、修改、删除及查询的工作。 回滚数据库对以前的元组是不可以进行改动的,只能
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 花圃养护及管理制度
- 茶企业设备管理制度
- 药品室安全管理制度
- 大学生就业与创业教育-第十四单元抓住机遇-离成功更近一步
- 财务会计与长期股权投资管理知识分析
- 财经基本技能(第3版)教学指南+课后习题答案
- 财务基础会计学知识(一)
- 2025年春季学期国家开放大学《毛泽东思想和中国特色社会主义理论体系概论》终考任务二:大作业试卷1参考作答
- 幼儿小班我爱中国教案设计意图
- 大班各领域目标解读与教学实践研究
- 九师联盟2024-2025学年高二下学期6月摸底联考语文试题(含答案)
- 非遗文化掐丝珐琅景泰蓝
- 2025年甘肃电投集团公司招聘笔试参考题库含答案解析
- 国家开放大学《Web开发基础》形考任务实验1-5参考答案
- 中外美术评析与欣赏智慧树知到期末考试答案章节答案2024年湖南大学
- 部编版四年级语文下册期末调研测试卷(江苏南京江宁区2021春真卷)
- 外国美术史PPT现实主义
- 固体火箭发动机制造工艺
- 手术室医院感染风险评估与采取措施
- 浮选柱对有色金属矿泥的浮选
- 脉冲震荡检测原理及意义
评论
0/150
提交评论