


下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、异构数据源集成系统查询优化伴随着计算机网络的不断普及和 World Wide Web 的出现, 导致若干Web异构数据源形成,异构数据源集成为这些自然分布 的异构数据源提供了完整的模式和较为一致的接口, 可以消除异 构、实现数据源的透明分布。对于系统查询而言,网络信息量的 大幅增加与网络延迟二者之间形成了强烈的反差及矛盾, 导致网 络拥挤不堪, 使得网络用户难以获得应有或理想的服务效果。 异 构源数据源集成系统中, 由于不同数据源具备着不同的查询功能 及不同效率, 使得系统往往需要进行大量的数据处理工作, 因此 必须对系统的查询功能进行优化。为使其延迟性得到系统改善, 优化过程中必须以缩减系统
2、处 理用户请求的时间为前提基础。 对于计算机网络中存在的各种不 同存储结构的数据,所有异构数据源集成系统均可以实现集成, 因此对于HTML XML文件等半结构化数据源,DBMS?可处理结 构化数据源和文本文件等非结构化数据源等都能处理 1 。异构 数据集成系统需要处理大量的数据, 且各数据之间的结构大不相 同,严重影响了查询速度, 因此必须采取优化措施改善查询效率。 本文结合实际, 谈谈利用缓存技术和预取技术对查询进行优化的 思路。1 缓存技术 通常情况下将程序中响应消息的本地存储区以及控制传输 信息存储、 删除或获取的子系统, 也即是指临时文件交换区 2 , 将其定义为缓存。 利用缓存保存可
3、以对消息进行缓存响应, 能够 降低网络的带宽消耗和将来的响应时间, 对于请求消息也同样适 用。异构数据源集成系统具有很高的数据查询能力, 能够实现对 大量HTML XML以及文本文件等进行处理,通常情况下,该类数 据文件的查询速度较慢,所所有的查询均从局部数据源进行检 索,其速度必然很慢。 异构数据源集成系统利用缓存技术提高数 据查询速度, 它有效的实现所有用户对全局视图查询结构的缓存 存放,同时对新结果不断更新, 以此来替代数据源中的旧有的结 果,从而有效提高缓存中数据的检索命中率。在缓存中,保存查 询所需的全局视图名和选择条件, 如果用户的查询与这些条件符 合,可以由缓存直接读取查询结果。
4、 如用户所需的查询结果未存 在于缓存中, 然后再将查询内容进行分解, 并将分解后的结果送 至各数据源, 以此来获取整个数据查询结果。 通常缓存中可以命 中的查询结果越多其查询速度也就越快, 这与缓存采用的替换算 法有很大关系。 在选择缓存的的替换算法时, 可以进行如下考虑:1)局部视图变化后,对缓存中旧的内容进行修改; 2)当数 据源中的数据不断更新时,比较适合采用 LRU替换算法;3)由 于不同数据源的数据具有不同的访问, 由此看来传统的LRU算法 亟待改进,根据不同数据其访问品读的不同, 将Cache块划分成 不同的区域, 同时将所有数据源均单独分配一个独立区域, 同时 该区域内容只允许请
5、求结果进行替代。通过缓存技术的应用, 有效改善了系统性能, 然而任何事物 都有其两面性, 缓存技术也一样, 当缓存中所对应的存储局部视 图出现了一定变化时, 就会产生缓存中的数据结果与局部数据源 数据结果不一致的现象,必须进行刷新。针对这一情况,根据不 同的应用需求, 异构数据源集成系统采取按需刷新和定期刷新的 方式进行数据源的刷新。 定期(根据数据源信息更新的时间确定) 对局部视图检查, 看其是否有所变化, 同时根据其变化来对缓存 内容作出相应的修改, 对于一些需要快速响应的查询处理, 可从 缓存种中直接进行数据的读取。 当然缓存内容一般会对局部视图 在两次刷新前改变的情况不能进行很好的反映
6、。 如果是一些对精 准度要求极高的查询需求, 定期的刷新显然已无法满足用户的需 求了。异构数据源集成系统则可以弥补其不足, 通过按需刷新的 方式,若出现新用户查询请求时, 首先对缓存中视图变化进行检 查,若缓存视图中未出现变化情况, 可直接提出缓存中的相应数 据结果,如果缓存中查不到所需结果,则对查询进行分解,在各 个数据源中查询更新后的数据,同时修改缓存的内容。2 预取技术缓存技术具有统一模式的机制特点, 预取技术弥补了它的这 一不足, 在提高互联网信息检索速度上受到越来越多的重视, 在 备受关注的Web检索系统中有着十分广泛的应用3。其技术理 论依据为:首先使用者在向服务器发出两次HTTP
7、请求间存在一 定的使用者空闲和思考时间,其长度一般为几秒到几分钟不等。 若想将此段时间充分利用, 即将使用的文件提前进行取回, 并将 其存放于缓存中, 以此来减少相应等待的时间。 也即是将用户即 将访问的数据,在用户的请求发出之前,先放置于缓存中,当用 户对其数据发出相应的请求信息后, 由于该数据已经提前存放于 缓存中, 便可有效减少用户等待的时间, 从而将数据访问等待的 时间降到最小 4 。这种理论应用到异构数据源集成系统也同样适用。 异构数据源集成系统中有多种多样的用户需求, 查询模式也 各不相同,且请求具有随机性。同时,也不可避免的存在这种情 况:有些用户经常进行相同的查询, 他们只希望
8、浏览结果而不想 执行查询;有些服务固定或相对固定。 针对这种用户的需求特点, 通过服务器自动提供所需信息给那些需求相对固定的用户, 我们 将其定义为服务器领取, 其本质也即是服务定制。 一般情况下异 构数据源集成系统服务器会通过手工定制的方法来实现其数据 访问,预取过程中用户不想在访问中花费太多的等待时间, 可提 前填写申请定制服务表,对其服务内容起始时间以及访问周期、 所需服务的时间等内容的详细填写。 当用户提出浏览请求时, 不 需要及时做出处理, 只需将服务器端处理好的结果及时进行显示 即可 5 。异构数据源集成系统引入预取技术提高了查询的效率, 同时 针对不同用户的不同访问模式, 借助服务器预取服务以及客户预 取服务科有效提高其使用的效率。3 不同策略的综合运用图 1 系统结构图 异构数据源集成系统整体数据由基于机群的数据分布进行 预处理,通过缓存、预取、基于用户需求等策略,能够提高系统 的应答效率。 结合缓存、 预取和基于机群的数据分布三种查询优 化策略
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- Lesson 2 Spending Habits说课稿-2025-2026学年初中英语九年级上册上海新世纪版
- 达标测试人教版八年级上册物理物态变化《升华和凝华》同步测评试卷(含答案解析)
- 建筑工程监理工作实施方案
- 难点详解人教版八年级上册物理《声现象》章节测评试卷(含答案详解版)
- 装配式户用光伏支架节点性能研究与优化
- 基于负刚度和TVMD的建筑结构的抗震性能研究
- 防水工程施工流程优化方案
- 城市污水排水管道改造方案
- 难点详解人教版八年级上册物理《声现象》难点解析练习题(含答案详解)
- 难点解析人教版八年级上册物理声现象《声音的产生与传播》专项攻克试题(详解)
- 江西三校单招试题及答案
- 首钢职务职级管理办法
- 2025国家保安员资格考试题库及答案
- 2025年黑龙江省齐齐哈尔市中考英语试卷
- 医药代表商务礼仪培训课程
- 小班科学《叭叭叭车来了》课件
- 2025至2030招投标行业产业运行态势及投资规划深度研究报告
- 光热发电技术课件
- 2025年入团考试时事热点及试题与答案
- 昌平卫校笔试题目及答案
- TSG D2002-2006燃气用聚乙烯管道焊接技术规则
评论
0/150
提交评论