【数据库系统课件】移动数据库技术_第1页
【数据库系统课件】移动数据库技术_第2页
【数据库系统课件】移动数据库技术_第3页
【数据库系统课件】移动数据库技术_第4页
【数据库系统课件】移动数据库技术_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、移动数据库技术在近20年的研究历史中,传统的分布计算与分布式数据库的研究都是基于有线网络和固定主机的,它们都采用了一些默认的隐含假设,例如固定网络连接、对等通信代价、主机结点固定不变等等。但是,进入90年代以来,随着移动通信技术的迅速发展和投入使用,加上移动计算机的大量普及,使得许多计算结点已经可以在自由移动的过程中与网络建立连接,使上述这些假设条件不再成立。于是,“移动计算”和“移动数据库”的概念应运而生,并且正在成为一个新兴的热点研究领域。一、移动通信技术的发展移动通信与联网技术的进步是移动计算环境得以产生和发展的基础。近年来,移动通信与联网技术已得到迅速的发展,并得到了广泛的应用。目前已

2、经或正在投入使用的移动通信与联网技术主要有以下几种:(1) 模拟蜂窝通信系统(2) 数字蜂窝通信系统(3) 无线局域网(LAN)(4) 红外技术(5) 卫星网络二、移动计算和移动数据库进入90年代以来,越来越多的用户开始拥有各种便携的计算设备,小一点的如掌上型的个人数字助理(PDA)或个人通信器(Personal Communicator),大一些的如装备较大内存和较强处理能力的笔记本电脑等,我们把它们统称为移动计算机(Mobile Computer)。据有关资料介绍,1993年美国商用PC机销售量的约40%都是移动计算机。而且,随着半导体技术的飞速发展,移动计算机的处理能力、存储容量等性能指

3、标正以每18个月翻一番的速度提高(摩尔定律),其中高档的移动计算机足可与同类台式机相媲美。如今移动计算机已经有能力管理在不久前还曾被看作是“超大规模”的数据库,支持一些复杂的数据管理任务。目前我们正在进入以网络计算为中心的时代,人们迫切需求能在任何时候、任何地点访问任何所需数据,而正在迅速发展并逐渐成熟的移动通信技术与移动计算机的结合为之提供了手段。可以预见,未来的绝大部分移动计算机都将配备以无线网络为主的移动联网设备,以支持移动用户访问网络中数据的需要。这将是一种更加灵活、复杂的分布计算环境,从们称之为移动计算(Mobile Computing)。在传统的分布计算系统中,各个计算结点之间都是

4、假定通过固定网络连接,并保持网络的持续连接性,而移动计算系统改变了这种假设条件。移动计算系统是由固定结点和移动结点构成的分布计算系统,它将使用户不再需要停留在固定位置不变,而是可以携带着移动计算机自由移动,并在移动的同时通过移动通信网络保持与固定结点或其他移动结点的连接。这种移动性将创造一类全新的应用,使得人们能够更加方便地访问各种信息。与基于固定网络的传统分布计算环境相比,移动计算环境具有以下一些主要特点:1) 移动性。2) 频繁断接性。3) 网络条件多样性。4) 网络通信的非对称性。5) 移动计算机的电源能力。6) 可靠性。7) 规模。许多移动应用环境,如公共交通信息系统,都要求系统同时支

5、持大量的移动用户并发访问,这就要求移动计算系统必须具有比传统客户/服务器及分布式系统高得多的可伸缩性。研究表明,由于移动计算环境的上述特点,使得传统的分布式数据库技术不能支持或是不能有效支持移动计算环境。因此,研究移动数据库技术,即支持移动计算环境的分布式数据库技术,已成为目前分布式数据库研究的一个新的方向。三、移动数据库的典型应用与传统的分布式计算环境相比,由于移动计算环境是一种更加灵活的计算环境,因此它可以支持更多类型的分布式应用。下面我们通过列举几种已经或是将要出现的典型移动数据库应用,这些应用都是传统分布式数据库技术所难以支持或有效支持的,从而说明研究移动数据库技术的必要性及其应用前景

6、。(1) 实例1:公共信息发布在未来的信息社会中,可以预见将会出现大量的移动用户。在移动计算环境中,这些移动用户需要访问各种各样的公共信息,例如股票、天气、交通等。以ATIS系统(Advanced Traffic Information System,先进交通信息系统)为例,在未来的信息系统中,ATIS系统将为配置有移动计算机的各种车辆提供城市交通信息。在交通高峰时段,一个大城市的ATIS系统将同时为超过100000个移动客户服务。对于这种同时服务大规模用户的应用,传统的客户/服务器数据库技术显然难以适用。(2) 实例2:移动推销员应用目前许多推销员使用笔记本电脑管理有关客户和订单的数据。当一

7、个推销员来到某个客户的地方促销时,他就需要查询这些数据,从而能够投客户之所好,完成推销任务。虽然使用传统的分布式数据库可以达到这个目的,但是它要求推销员将查询发给位于固定网络中的数据库服务器,因为有关数据是存放在那里的。因此,如果笔记本电脑不能联网的话,推销员将无法得到数据。而在移动数据库环境中,上述查询既可以在联网时发给远端的服务器,也可以在网络情况不佳甚至断接时直接从本地缓存中得到查询结果。这与分布式数据库技术的不同在于:移动计算机在联机或断接时,其查询或事务的处理方式是不同的;其次,尽管移动计算机上的移动缓存类似于分布式数据库的数据复制,但提出了诸如断接等许多新的课题。与本例相关的研究课

8、题包括:1)如何确定移动计算机上的缓存数据集合及其与固定服务器上的数据库之间的一致性程度?2)对于执行时间很长的应用,有必要将数据迁移到移动计算机中。这种迁移是一种动态的数据分布过程,而不是简单的缓存。如何做到这种数据迁移而又不使系统趋于混乱?3)在无线网络带宽有限的情况情况下,怎样使移动计算机的数据缓存与服务器保持同步?(3) 实例3:未来的战场应用现代战争对信息的需求越来越强烈,“信息战”的提法已经得到越来越多的认可。在未来的战场上,只有迅速有效地获取各种战场信息,才有可能获得战争的胜利。每个战士将配备有可以接收并处理数据的先进电子设备(移动计算机),其中部分人员(如分队长官)的电子设备还

9、可以向上级计算机设备发送数据(以保密的形式)。在这样的战场应用环境中,作战部队的战场信息服务器将负责把各种战场数据发送给下属部队的每一个士兵;而客户机(士兵或各种战斗车辆)与服务器的联系则必须受到严格的限制,以避免将自己的位置暴露给敌人,因此单向信息发送(数据广播)将成为战场信息的主要发布手段。另外,由于战场环境的千变万化,各个战斗分队之间的联系随时可能中断,这就要求每个战斗分队拥有自己的数据服务器(工作组服务器),在工作组服务器与上级服务器之间以及这些工作组服务器之间将采用弱一致性的复制协议,这就允许工作组服务器在联系中断时继续为本分队提供信息服务,并在联系恢复之后通过与其他服务器交换、协调

10、各种数据,重新恢复所有服务器上战场信息数据的一致性。例如,目前美军已提出并正在实施一项战场获知与数据发布(Battlefield Awareness and Data Dissemination,简称BADD)研究计划,它致力于建立一个指挥系统,该系统将允许指挥官建立自己的信息系统,向各战斗部门发布实时、准确、一致的战场信息,并提供对全球数据资源的访问和传输能力。BADD计划中的一个重要组成部分是美军的全球广播服务(Global Broadcast Service,简称GBS)系统,它负责将大容量的情报、天气以及其他信息发布给遍布全球的低代价接收终端,同时允许用户请求特定的信息。(4) 实例4

11、:位置相关查询位置相关查询是移动计算应用中最常提及的例子。想象一个美国家庭在作跨州旅行,未来的位置相关数据库将存有各种有关旅店、餐馆等的信息,并提供其他一些有用的本地化服务(如医生、医院等)。有了这些数据,人们可以通过位置相关查询来回答如下问题:附近最近的且拥有游泳池的旅店在哪里?去最近的医院怎么走?与基于集中和分布式数据库的查询不同的是,上述查询的答案是和位置相关的。同样一个问题在不同时候得到的回答可能是不同的,例如“最近的商店在哪里?”,因为它取决于用户所处的位置。本例涉及的研究课题有:1)移动查询语言,特别是SQL语言的扩展;2)移动数据库的设计,特别是如何自动维护将数据集合映射到不同位

12、置的元数据;3)有效的黄页管理,使得各种数据及其相关位置能够被动态地登记或删除。(5) 实例5:移动办公系统以一家美国汽车保险公司为例,对于每个索赔要求,都有一名保险检查员负责检查汽车受损情况,并预估所需修理费用。为了作出正确的评估,检查员需要获取各种信息,如造成汽车受损的事故记录、该汽车的索赔金额以及汽车的大概价值等。我们先来看看这个评估事务在现在是如何处理的,然后再看看它在2005年的移动世界里是如何完成的。在1995年,检查员接到评估任务之后,首先必须搜集有关保险人、汽车、事故报告等数据,这些数据有的可以通过电话查询,有的必须询问当事人,还有的则通过Internet获取。然后,检查员驾车

13、到汽车存放地做现场检查,并记录汽车受损情况。最后,检查员返回办公室,将所有获得的数据输入电脑,开始执行评估事务,并将评估结果报告给他的上级。这里,在获得各种所需数据的时候,大部分工作都是脱机完成的。现在我们来预测一下在2005年利用移动事务完成评估的过程。首先,大部分收集所需数据的工作都是联机完成的。当检查员接到一天内所要评估的多个任务之后,他先选择第一个要做的评估任务,并立即启动该任务的评估事务。从逻辑上说,这个评估事务所完成的功能与1995年的例子是相同的,不过收集数据的工作将由该事务自己完成:它创建一些子事务来自动获取所有数据。在这些子事务运行时,检查员可以随时通过它的移动计算机查看事务

14、的进展情况和有关数据。请注意这些处理过程都是在检查员开车前往汽车存放地的途中进行的,这期间他可能关闭移动计算机以节省电源。当他到达汽车存放地时,所有数据已经收集完毕。检查员一边检查汽车,一边将受损情况输入到他的移动计算机中,同时该移动计算机自动更新固定网络中的相关数据,并根据所得数据完成评估事务。于是,当检查员离开时,评估报告已经完成了,他可以在前往下一个索赔汽车存放地的途中启动新的评估事务。可见,移动计算机使索赔的处理过程加快了许多,检查员的工作效率得到大大提高。此外,我们可以看出一些要解决的技术问题:一是长事务问题;二是用户希望即使在移动计算机断接时,事务也能继续执行,因此移动计算环境中的

15、断接情况不能看作是系统的故障,而应该特别处理。四、移动数据管理与分布数据管理的关系一般认为,移动数据库是分布式数据库的推广,分布式数据库是移动数据库的一种特殊形式。因此,传统的分布式数据库的许多研究成果可以直接应用在移动数据库中。尽管两者之间在许多方面是相同的,但是它们之间仍存在着不少关键的差别。例如,一个主要的判别是:分布式数据库的目标是位置透明性,而移动数据库的目标是位置不透明,上面的实例3(位置相关查询)说明了这一点。另一个主要判别是不同的代价/性能观,这使得分布式数据库中许多问题的最佳解决方案在移动计算环境中反而是不可接受的。表2-1列举了移动数据库的关键技术与传统分布式数据库之间的一

16、些主要差别。表2-1移动数据库技术与传统分布式数据库技术的主要差别列举数据管理技术移动数据库与分布式数据库的差别应用程序可能是位置相关的需要适应可变的系统环境事务处理能够描述移动性的新模型事务的过区切换(在不同服务器覆盖范围之间的移动)故障恢复频繁的网络分割移动计算机的断接不认为是系统的故障移动性可能要求更多的日志记录在过区切换(handoff)时从短暂断接中恢复的技术数据复制不同程序的一致性约束(弱一致性或可变一致性)频繁的断接使移动计算机的缓存刷新必须采用新技术查询处理位置相关不同的代价因素(如网络带宽、花费、电源消耗等)查询结果可能返回到不同的位置(客户机的移动性)需要可适应性技术(网络

17、条件的变化)特殊查询方式:数据广播(网络的非对称性)名字解析移动性和断接性要求采用新型的全局命名策略(如移动计算机的地址、可移动服务器上数据库的命名等)因此,人们必须对已有的传统分布式数据库技术加以改进,或者研究新的技术,从而更好地支持用户在移动计算环境中对数据库的访问。五、移动数据库的研究目标与意义移动数据库系统的目的就是有效地支持移动计算环境中的各种数据应用,满足人们能够在任意地点、任意时时刻访问任意数据的需求。J.Gray提出,一个理想的移动数据库系统应当实现以下四个目标:1) 可用性与可伸缩性(scalability):在避免系统不稳定性的同时,提供高可用性和可伸缩性;2) 移动性(m

18、obility):允许移动计算机在和网络断接的情况下访问或更新数据库;3) 可串性(serializability):支持满足可串性的并发事务执行;4) 收敛性(convergence):使系统总能收敛于一致状态,从而避免出现混乱。总之,移动计算环境的出现,使人们看到了能够随时随地访问任意所需信息的希望。但是,移动计算以及它所具有的独特特点,对传统的分布式数据库技术提出了新的要求和挑战。因此,移动数据库技术的研究与实现,对未来移动环境中的许多重要应用,诸如战场移动指挥、移动办公系统、公共信息发布等,都将具有重要的意义和巨大的衫价值,其应用前景广阔。六、移动数据库的关键技术移动计算环境中的数据管

19、理问题是一个新兴的研究项目,因此尚不成熟。所以只能介绍移动数据库的主要关键技术及其最新的研究成果。1、复制与缓存技术数据复制(Data Replication)的主要目的是提高分布式数据库系统的可用性、可靠性以及访问性能。传统的复制技术主要考虑在服务器之间的复制,并且假设服务器之间是经常保持联接的;此外,传统的复制策略都是静态的,即由系统管理员统一安排好复制布局后就固定不变了,如果系统中用户访问范型发生较大变化而要求改变这种布局时,必须要管理员重新配置分布系统。因此,传统复制技术在移动计算环境中不能有效工作。同样,缓存(Cache)技术也在传统的分布式数据库中得到广泛应用,它通过客户机上缓存部

20、分数据,达到减少访问数据服务器的目的,从而提高了性能。但是,传统的缓存技术要求客户机保持与服务器的联接,这样才能维护缓存的一致性。因此,对于经常需要断接操作的移动客户机来说,传统的缓存技术也是不能适用的。目前,针对移动计算的特点,人们已开始对复制和缓存技术展开了研究。其中具有代表性的研究成果有J.Gray的两级复制机制、Coda系统支持客户机断接操作的缓存技术、缓存失效报告广播技术等。1、 两级复制机制两级复制机制是J.Gray详细分析了现有数据复制技术在移动计算环境中应用时的问题,并针对移动客户机频繁断接的特点而提出的。两级复制机制以主拷贝更新复制协议为基础。它假设移动数据库系统由两类结点构

21、成:一类是基结点,它们联接在固定网络中,每个基结点都维护数据库的一个复制(即第一级复制),并且是大部分数据对象的主结点;另一类是移动结点,它们有时通过无线网络与基结点联接,有时处于断接状态,它们也存有数据库的复制(即第二级复制),可以在断接时提交暂态事务(tentative transaction)。一个移动结点也可以是部分数据对象的主结点。两级复制机制的主要特点是:1) 移动结点可以做暂态数据库更新;2) 基事务的执行服从单拷贝可串性,因此基结点的状态是可串化执行的结果;3) 只有在对应的基事务完成时,一个事务的结果才会成为永久的;4) 所有相联结点的复制都将收敛于基结点系统的状态。2、 C

22、oda系统的断接操作Coda系统是由美国卡耐基-梅隆大学(CMU)研制的一种支持移动计算的分布式文件系统。在Coda系统中,断接操作(disconnected operation)是一个主要研究课题,其目的是支持移动客户机在与服务器断开网络连接(即断接)时,能够继续使用Coda文件系统。与两级复制机制不同,Coda只在客户上缓存部分对象(目录、文件),而不是整个文件系统的复制。因此,如何确定移动客户需要缓存哪些对象,以及如何保持缓存对象与服务器的同步,都是Coda致力解决的问题。在用户看来,Coda是一个集中的、位置透明的共享文件系统。Coda的名字空间以文件卷(即一个目录子树)为粒度映象到不

23、同的文件服务器上。每个Coda客户机上都有一个缓存管理器Venus负责获得并缓存这些卷的映象信息。Coda使用两种不同而又互补的机制来获得高度的可用性。第一种机制是服务器复制,允许文件卷在多个服务器上拥有读写复制。一个卷的复制结点集合称为它的卷存储组(Volume Storage Group,简称VSG),一个客户机当前可访问的VSG的子集称为AVSG(Accessible VSG)。为了提高性能,客户机可以缓存部分对象,缓存管理器Venus使用一种回叫(callback)机制来保证每个打开的文件内容都是AVSG中最新的。所谓回叫机制,就是当客户机的某个缓存对象已被服务器更新时,由服务器通知客

24、户机该缓存对象已不再有效。另一种机制就是断接操作,它允许客户机在断接时,即AVSG为空集时,可以继续访问Coda文件系统。此时,Venus通过本地缓存来完成用户的请求,并在客户机重新联机时将用户的更新结果回送给服务器。其中Venus是支持断接操作的核心部件,它具有三个工作状态,即收集(hoarding)、仿真(emulation)、和重集成(reintegration)。一般情况下(客户机断接时),Venus处于收集状态,依靠服务器的复制工作,并随时准备进入断接状态;当客户机断接时,Venus进入仿真状态,直到客户机停止断接并重新联机为止;最后,在客户机重新联机时,Venus进入重集成状态,将

25、缓存内容与AVSG重新同步,随后又进入收集状态。经过一段时间的使用表明,Coda系统基本达到了预期目标,能够比较好地支持断接操作,Venus的仿真成功率和重集成成功率都较高,因而已具有一定的实用性。3、 缓存失效报告广播技术移动客户机与服务器之间的无线网络带宽有限,而缓存技术可以有效地减少通信量,从而避免网络的拥塞。在传统的客户/服务器系统中,有两种方法来维护客户缓存的有效性:1) 服务器发送缓存失效信息给客户机。2) 客户机通过查询服务器来验证其缓存的有效性。在移动计算环境中,若采用第一种方法,由于移动客户机经常断接,断接期间客户机将无法接到缓存失效信息,因此在重新联机时必须将整个缓存作废,

26、使缓存失去了其应有的作用;若采用第二种方法,又会严重浪费有限的无线网络带宽。因此,这两种方法都不适合于维护移动客户机的缓存。D.Barbara和T.Imielinkski等人提出了一种新的缓存失效报告技术,称为缓存失效报告广播技术;服务器定期或异步地广播缓存失效报告,使移动客户机的缓存保持同步。缓存失效报告可以有多种组织形式。一种是缓存报告由最近秒内被更新的数据对象的最新时间戳构成。移动客户机联机时,保持接听这些报告,并更新缓存的状态。对于缓存中的每一个对象,如果失效报告中该对象的时间戳比缓存中对应的时间戳要新,则从缓存中清除该对象(已失效);如果失效报告中没有该对象的时间戳,则将缓存中该对象

27、的时间戳更新为此次失效报告的时间戳。另一种是缓存失效报告只包括上次广播以来被更新数据对象的标识符(ID)。与前一种相同,移动客户机在联机时通过接听失效报告广播来管理缓存,清除已失效的缓存对象。由于移动客户机断接频率的不同,如有的客户机经常处于断接状态,而有的客户机大部分时间保持联机,只是偶尔断接,因而上述两种方式各有其适用范围。对于经常联机的客户机,适合采用后一种方式,因为其失效报告较少,可以节约宝贵的网络带宽;而对于经常断接的客户机,如果用后一种方式,则重新联机时客户机的缓存都必须全部作废,这时采用前一种方式就比较合适,通过设定合适的值,可以允许客户机在重新联机时,从新的失效报告中获在其断接

28、期间被更新的对象,进而清除缓存中已失效的对象,其他缓存对象则继续有效。2、数据广播由于移动客户机经常处于断接状态,而且与服务器通信(特别是移动客户机向服务器发送信息的上行信道)的网络带宽也很有限,因此要实现大规模移动用户随时随地访问数据的目标是一个真正的挑战。在这种移动计算环境下,要用传统技术实现数据密集型应用是很困难的。另一方面,在一个无线单元内,从服务器到移动客户机的下行通信带宽一般要远大于从移动客户机到服务器的上行通信带宽,而且移动客户机从服务器接受数据的开销也远小于发送开销,因此在大部分场合,即使是处于断接状态的移动客户机也可以选择接收从服务器发送的下行广播信息。于是,可以利用这种网络

29、的非对称性,由数据库服务器把大多数用户频繁访问的数据(即热点数据)组织起来,以周期性的广播形式提供给移动客户机访问。这种数据发布方式称为数据广播技术。数据广播技术有着很好的应用前景,例如公共信息的发布(股市、交通)、军事应用(如美军GBS系统)等。数据广播的一个主要研究课题是:如何组织数据广播信道中的数据,使之适合于移动计算机访问?这称为数据广播的调度问题。目前,人们对数据广播技术的研究刚刚起步,主要研究各种数据广播的调度算法。一般地,对数据广播调度的研究可以根据不同的角度分类为:1) 按被广播数据库的覆盖范围可分为:全集、子集。2) 按广播内容的实时性可分为:静态的、动态的。3) 按是否广播

30、索引可分为:带索引广播、无索引广播。4) 按广播数据流的组织形式可分为:平坦调度、偏斜调度、多盘调度。5) 按客户机的查询方式可分为:主动的、被动的。衡量这些数据广播调度算法好坏的参数主要有两个,即访问时间(access time)和调谐时间(tuning time)。访问时间是指从移动客户机提出数据访问请求开始,到客户机从数据广播中得到结果为止所需的时间。访问时间决定了移动用户查询的响应时间。调谐时间是指定在完成一个访问请求期间,移动客户机保持接听广播的总时间。调谐时间决定了移动客户机的电源消耗,因为在不接听广播的时间里,移动客户机可以转入休眠模式,此时消耗的电源相对于激活状态可以忽略不计。

31、因为大部分移动客户机都是依靠有限的电池供电的,因此减小移动客户机的调谐时间也成为广播中的一个重要课题。因此,数据广播的调度方法可以分为访问时间优化和调谐时间优化两种。对访问时间优化中可以分为两类,一类是多盘广播调度,另一类是基于代价的客户缓存管理。数据广播的研究可以分为服务器方和客户机方两个问题。服务器方主要考虑如何组织广播的数据,即数据广播的调度;客户机方则主要考虑如何利用缓存技术进一步减小查询广播数据的响应时间。服务器必须根据所有移动客户机的需要来组织广播程序。一种最简单的调度方法是:将所有接听数据广播的客户机所需要的数据对象简单地并在一起,由服务器周期地广播,每个周期里任意对象都出现一次

32、且只有一次。这种调度称作平坦调度。在一个平坦数据广播中,每一个数据对象的平均访问时间都是相同的(即广播周期的一半),而不管该对象对于客户机的重要程度如何。而多盘广播调度则将客户机访问概率较高的对象(称为热点对象)和访问概率较低的对象(称为冷门对象)分开,其中热点对象的访问时间小于平坦调度,而冷门对象的访问时间大于平坦调度。虽然多盘数据广播理论具有无限的可伸缩性,但它是以某一种对象访问概率分布为基础优化的。对于某个单独的客户机来说,它访问数据对象的概率分布很可能与服务器考虑的分布有一定的偏差,因而会影响到访问多盘数据广播的性能。因此,多盘数据广播中客户机应当采用基于代价的缓存管理策略,即需要考虑

33、缓存不命中时,从数据广播中获得一个对象的代价(在传统的缓存技术中不必考虑这个代价,因为从服务器中获取所有不命中对象的代价都是相同的)。当缓存已满时,传统的缓存策略选择缓存中具有最低访问概率的对象进行替换;而一种简单的基于代价的缓存策略则将对象的广播频率也考虑进来:比较缓存中所有对象的访问概率P与广播频率X之比,选择P/X值最小的对象替换。后一种缓存替换算法叫做PIX算法,前一种算法叫做P算法。P算法是传统缓存技术的理论最优算法,但它却是不可实现的,因此普遍使用的是P算法的近似:LRU算法。同样地,尽管PIX算法是多盘数据广播中的最优缓存替换算法,它也是不可实现的,这是因为:1)无法准确获得或预

34、知对象的访问概率;2)每次需要进行缓存替换时,需要比较所有缓存对象的PIX值,代价过高。因此,类似于LRU算法,Acharya等设计了一种近似于PIX的实用缓存替换算法LIX算法。LIX算法是在LRU算法的基础上,通过加入对象广播频繁率因素修改而成的。虽然LIX算法只是PIX算法的一种近似实现,但却产生了很好的性能。模拟分析和实际应用结果表明,在多盘数据广播中,采用LIX算法的客户缓存性能要好于采用LRU算法;单个客户机的访问概率分布和服务器采用的概率分布相差越大,这种性能优势就越明显。因此,多盘数据广播与LIX缓存替换算法相结合,为移动计算环境中数据发布应用提供了一个很好的解决方案。由于大部

35、分客户机都是依靠能量有限的电池供电的,因此,如果客户机从数据广播中读取数据的调谐时间过大,就会大量消耗宝贵的电源,从而严重影响客户机使用时间。所以,在设计数据广播调度程序时,有必要考虑这些移动客户机的节能要求,即尽量减小调谐时间。如果在客户机与数据广播服务器之间不存在上行链路,即客户机无法从服务器联机得到数据,那么降低数据访问调谐时间的一个直接办法就是在数据广播中插入索引信息,以引导客户机访问到所需数据:通过索引,客户机可以获知所请求的数据项在广播中到来的时间,在等待该数据项到达的间隔时间里,客户机可以转入休眠模式,因此大大减少了对电源的消耗。但是,由于索引数据的加入,该广播调度的平均访问时间

36、却大大增加。因此,人们的目标是在利用索引来减小调谐时间的同时,使访问时间仍保持在一个合适的界限内,从而使移动客户机在访问数据广播时,既能节约电源消耗,又不致等待过长的时间。3、移动查询处理在移动计算环境中,位置相关信息的更新及查询是一个重要的应用。为了有效地支持这种移动查询,人们在固定网络中间设立了一些位置服务器,这些位置服务器彼此互联,并通过固定网络与若干移动基站MSS联接。移动计算机的地址信息数据库是分布在许多位置服务器上的。移动计算环境中的位置更新策略是将每个位置服务器下的MSS划分为基于互不相交的组,每个组称为一个分割。移动用户只有在从一个分割移动到下一个分割内时,才向位置服务器报告地

37、址的变动。这时,查询一个用户地址的步骤为:首先,查询其宿主服务器,找到当前所在的位置服务器;然后,从该位置服务器查出移动用户在哪个分割内;最后,从这个分割内的各个MSS中找到移动用户。除了位置更新策略,移动查询处理还涉及位置相关查询的优化及其他查询处理问题,如查询结果与提出该查询的移动用户的实际地址相关;查询结果与用户移动的方向相关;聚集度查询;实时数据的查询等。4、移动事务处理事务处理是数据库管理系统的一个基本功能,它主要用于维护数据的一致性,支持多用户的并发访问,使用户可以可靠地查询和更新数据库。一般来说,用户对数据库系统的访问都是通过事务来完成的。在传统的数据库系统中,一个事务由一系列读

38、写操作组成,从一个BEGIN操作开始,并以一个COMMIT或者ABORT操作结束;事务处理必须满足4个准则,即原子性、一致性、隔离性和永久性(简称ACID)。移动数据库系统同样要求提供事务处理能力,以满足移动应用的需求。但是,移动计算环境的特点以及一些新型移动的出现,使传统数据库系统中的事务处理技术已不能适用。根据移动计算环境的特点,移动事务处理具有以下特点:1) 移动性。这不仅指移动事务执行期间,发出事务的移动客户机是移动的,而且事务本身也在相应地移动。2) 长事务。由于无线网络通信的低带宽、高延迟,以及移动客户机的频繁断接性,都可能使移动事务成为长事务。3) 易错性。由于移动客户机不如固定

39、结点可靠,而且无线网络通信也不如固定网络稳定,因此与一般事务相比,移动事务更容易出错。4) 异构性。由于客户机的移动性,移动事务可能要访问分布的异构数据库系统。总之,移动事务是不同于传统事务的一类新事务,因此传统的ACID模型已不能很好地描述移动事务,需要为移动事务寻找更好的模型。为了维护移动事务在断接情况下的数据一致性,人们提出了以下几种解决方案:1) 可任意读/任意写的弱一致性数据复制。2) 通过延迟的收敛性控制,使复制数据最终趋于一致。3) 写操作的依赖性检查。如果采用可任意读/任意写的复制模式,由于移动客户在移动过程中可能对不同的服务器发出更新操作,而且在断接时也可能基于过时的数据完成

40、更新事务,因此更新冲突是不可避免的。对写操作进行依赖性检查可以检测出这种可能的更新冲突,使系统状态保持一致。当移动客户机从一个无线单元移动到另一无线单元内时,需要向本地的MSS登记并联接,同时断开与上一个MSS的联接;此后,移动客户机将通过本地的MSS联接到网络中,这个过程叫做过区切换(handoff)。当发生过区切换时,客户机的某个移动事务可能还没有完成,因此需要将剩余的事务操作交给本地的MSS上的协调器执行;为了继续运行这个移动事务,本地协调器需要与客户机上一次的协调器联系,取得有关事务已运行部分的信息,然后才开始执行余下的事务操作。这也是一个过区切换过程,为了和前面的过区切换相区别,将其

41、称为事务过区切换。这也是传统的事务处理所没有的。相比于非移动计算机的硬盘存储器,移动计算机的硬盘由于种种原因不再被认为是稳定存储器。此外,无线通信网络的可靠性也远不如固定网络。因此, 移动事务管理的故障恢复问题比传统的分布式环境更加难以解决。实际上,移动计算机的部分事务结果通常都被传送到固定服务器上,以获得真正的永久性。此外,在每次断接之前,将移动计算机上的数据库事务处理日志复制到一台固定计算机上也是一个很好的策略。为了提高移动事务处理的可靠性,可以在固定网络中为每个无线网络单元设立一个事务代理服务器。移动计算机每执行一个事务,都在代理服务器上执行一个孪生事务,它包括该移动事务的所有更新部分,

42、因此将产生和移动事务一样的结果。这些孪生事务可以推迟到系统空闲或网络忙的时候脱离计算机成批执行,这实际上相当于将移动计算机的事务结果周期性地备份。事务代理服务器的设立显然增加了系统的开销,但是如果移动用户需要高可靠性的移动事务处理,这种代价也是值得的。5、Agent技术移动计算环境的特点,使传统的客户/服务器模型已不能满足需要,人们需要一种更加灵活的体系结构。近年来,关于Agent的研究引起了广泛的关注。将Agent技术引入到移动计算中,特别是移动数据库系统中,将带来许多好处。Agent实际上是一个主动的程序实体,它由某个源计算机产生后,就脱离了该计算机的控制而自行执行下去。它可以在网络中漫游

43、,逐个访问各个相关的服务器,也可以和其他Agent交互协作,直到完成用户赋予它的任务。因此,Agent模型是对传统的客户/服务器模型的扩充,它在客户机和服务器之间加入了一个新的层次Agent。6、其他技术除了前面的数据管理技术之外,移动数据库系统的研究还涉及到其他一些技术。1) 省电查询优化。即根据各种候选查询规划的耗电量选择最佳执行规划。此时,除了传统的事务吞吐率之外,降低单个事务的耗电量也将成为移动数据库系统的设计原则之一。2) 安全。如何防止移动计算机的假冒?如何避免发送或接收的数据的盗用?如何防止移动用户的泛滥可能对被访问网络环境造成的偶然甚至恶意的破坏?3) 人机界面。移动计算机的小

44、型化与屏幕的可视化矛盾如何解决?七、商品化数据库的移动计算产品介绍移动计算环境的出现使分布式数据应用产生了许多变化。由于移动数据库可以支持随时随地访问各种数据,因此将会成为未来信息社会中的主要技术之一。为了适应这一变化,近年来,世界上几家著名的大型数据库软件公司纷纷作出努力,推出了各自的移动计算解决方案和产品。Oracle公司是关系数据库产品领域的巨头,当移动计算环境初现端倪时,Oracle也适时地推出了支持移动计算机访问数据库的产品Mobile Agent。Mobile Agent将传统的客户/服务器结构扩展到了移动计算环境,它通过实现一个新型的计算范型客户/Agent/服务器结构,来支持移动用户对信息的高效、安全的访问。这种客户/Agent/服务器结构是一个三层的无连接结构,移动客户机与服务器之间的通信全部交给Ag

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论