(计算机应用技术专业论文)异构数据库集成技术在教学管理系统中的应用研究.pdf_第1页
(计算机应用技术专业论文)异构数据库集成技术在教学管理系统中的应用研究.pdf_第2页
(计算机应用技术专业论文)异构数据库集成技术在教学管理系统中的应用研究.pdf_第3页
(计算机应用技术专业论文)异构数据库集成技术在教学管理系统中的应用研究.pdf_第4页
(计算机应用技术专业论文)异构数据库集成技术在教学管理系统中的应用研究.pdf_第5页
已阅读5页,还剩67页未读 继续免费阅读

(计算机应用技术专业论文)异构数据库集成技术在教学管理系统中的应用研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

异构数据库集成技术在教学管理系统中的应用研究 摘要 教学管理数据库主要用于储存管理应用处理层所需的数据资料。随着信 息技术的发展,虽然地方各教育单位、不同教育机构建立的各自的应用控制 系统中也建设了各自的数据库,但由于缺乏统一协调,各数据库系统在建立 时都是从各自的需求出发,没有统一的数据库,这就使得各数据库之间无法 互连、互通,信息资源无法融合共享。论文对异构数据库集成展开研究,建 立教学管理综合数据库系统,以适应不同平台、不同部门数据库之间的数据 共享。 论文完成如下主要工作: ( 1 )提出异构数据库集成所涉及到的问题,对不同数据库之间的异构 性、实现局部数据库之间的信息共享和透明访问进行了讨论。 ( 2 )对数据库转换程序、中间件和多数据库系统三种异构数据库集成 技术作了详细研究,阐述了各种技术在异构数据库集成中的应用特点和所起 的作用。 ( 3 )在对教学管理数据库系统集成需求分析的基础上,给出了教学管 理系统数据库集成的方案:即采用中间件技术与多数据技术相结合的异构集 成,整体采用多数据库系统技术架构,各个客户机( 即全局控制层) 与各局 部数据库的联系采用数据库中间件技术。 ( 4 )论文应用c o r b a 技术设计出一个适用的中间件应用程序,运用 p o w e r b u i i d e r 实现了不同数据库之间数据转换的设计。系统通过实际运行, 表明采用上述集成技术在教学管理系统中实现异构数据库之间的数据共享是 可行的。 关键词:异构数据库集成,教学管理数据库,数据转换程序,中间件,多数据 库系统 t h er e s e a r c ho nt h ea p p l i c a t i o no fi n t e g r a t i o no fa s y n c h r o n o u s s t r u c t u r ed a t a b a s et e c h n o l o g yi ne d u c a t i o na d m i n i s t r a t i o n s y s t e m a b s t r a c t e d u c a t i o n a la d m i n i s t r a t i o nd a t a b a s ei su s e dp r i m a r i l yf o rd e p o s i t i n gt h e n e e d e dd a t ao ft h ea p p l i c a t i o nl a y e r w i t ht h ed e v e l o p m e n t o fi n f o r m a t i o n t e c h n o l o g y ,s o m ee d u c a t i o na r e a sa n ds c h o o l sh a v eb u i l dt h e i ro w nd a t a b a s e s y s t e m sf o rt h e i ro w nc o n t r o ls y s t e m so fe d u c a t i o n a la d m i n i s t r a t i o n h o w e v e r , b e c a u s et h e yh a v ei n s u f f i c i e n ta s s o r t e dw i t he a c ho t h e r ,e a c ho ft h ed a t a b a s e s y s t e mh a si t so w ns t a n d a r d ,a n dt h i s c a u s e sd i f f i c u l t i e si nt h ei n t e r l i n k a g e , i n t e r c o m m u n i c a t i o na n dt h es h a r eo fi n f o r m a t i o n t h i st h e s i sc r e a t e se d u c a t i o n a l a d m i n i s t r a t i o ns y s t e mb yr e s e a r c h i n go nt h ei n t e g r a t i o no fa s y n c h r o n o u ss t r u c t u r e d a t a b a s e t e c h n o l o g y , s ot h a t t or e a l i z et h es h a r eo fi n f o r m a t i o nb e t w e e n a s y n c h r o n o u ss t r u c t u r ed a t a b a s e t h em a i nw o r ko ft h et h e s i si sa sf o l l o w s : 1 、t h et h e s i sp u t sf o r w a r ds o m eq u e s t i o n so ft h ei n t e g r a t i o no fa s y n c h r o n o u s s t r u c t u r ed a t a b a s e ,a n da n a l y z e st h es y n t h e s i z i n gd a t a b a s es y s t e mi sc o n s i s t e do f d i f f e r e n tl o c a ld a t a b a s e s ,t or e a l i z et h es h a r eo fi n f o r m a t i o na n dt r a n s p a r e n t a c c e s s i n gb e t w e e nt h el o c a ld a t a b a s e s 2 、w i t ht h ed e t a i lr e s e a r c hw o r k si nt h et h r e em e t h o d s :da t at r a n s l a t i n g p r o c e d u r e ,m i d d l e w a r et e c h n i q u e sa n dm u l t i - d a t a b a s es y s t e m s ,w h i c hc a nb e u s e di nt h er e a l i z a t i o no fi n t e g r a t i o no fa s y n c h r o n o u s s t r u c t u r ed a t a b a s e e x p l i c a t ea l lk i n d so ft e c h n i c a lc h a r a c t e r i s t i ca n d e f f e c ti na s y n c h r o n o u ss t r u c t u r e d a t a b a s e 3 、) t h et h e s i sg i v e st h et e n t a t i v es c h e m eo fi n t e g r a t i n gt h ee d u c a t i o n a l a d m i n i s t r a t i o ns y s t e md a t a b a s e sb a s e do na n a l y z i n gf o rr e q u i r e m e n t :a d o p t i n gt h e m e t h o dt h a tc o m b i n i n gt h em i d d l e w a r et e c h n i q u ew i t h t h em u l t i - d a t a b a s e t e c h n i q u e t h ew h o l es k e l e t o nu s e sm u l t i d a t a b a s et e c h n i q u ea n dt h e c o n t a c t b e t w e e nc u s t o m e r sm a c h i n e sa n dl o c a l d a t a b a s e s a d o p t s t h em i d d l e w a r e t e c h n i q u eo fd a t a b a s e 4 ) t h et h e s i sr e a l i z e sam i d d l e w a r ea p p l i c a t i o np r o c e d u r eu s i n gt h ec o r b a t e c h n i q u ef i r s t a f t e rt h a ti tp r o c e s s e st h ed e s i g no fd a t at r a n s l a t i o ni nd i f f e r e n t d a t a b a s ew i t ht h eh e l po fu s i n gp o w e r b u i l d e r t h r o g hc o u r s i n gs y s t e r m ,i n d i c a t e a d o p ti n t e g r a t i o nt e c h n o l o g yt o r e a l i z et h es h a r eo fi n f o r m a t i o ni ne d u c a t i o n i i i a d m i n i s t r a t i o ns y s t e mi sp o s s i b l e k e yw o r d s : i n t e g r a t i o n o f a s y n c h r o n o u s s t r u c t u r e d a t a b a s e ,e d u c a t i o n a l a d m i n i s t r a t i o nd a t a b a s e ,d a t at r a n s l a t i n gp r o c e d u r e ,m i d d l e w a r e ,m u l t i d a t a b a s e s y s t e m i v 插图清单 图2 1 计算模式的进化6 图2 - 2b s 体系结构 7 图2 - 3 两段提交协议 1 4 图3 一l 加入中间层的三层结构1 9 图3 - 2o m a 参考模型2 0 图3 - 3o r b 体系结构 2 1 图3 4c0 m 组件、c0m 对象、c0 m 接口关系 25 图3 5co m 接口结构26 图3 6c o m 中对象重用模型示意图 2 9 图3 7 a 客户通过接口指针直接调用进程内组件服务器2 9 图3 7 b 客户通过代理存根利用l r p c 调用本地组件服务器3 0 图3 8 客户通过代理存根利用d c o m 网络协议调用远程组件服务器3 0 图3 9m dbs 的体系结构3 4 图3 10 查询处理过程36 图3 一1 1m dbs 模型3 8 图4 1 综合数据库的总体组成图4 2 图4 - 2 教学管理数据库集成m d b s 构架4 4 图4 3 中间件各接口模块连接示意图4 5 图5 - 1 基于c o r b a 的应用程序开发过程5 0 图5 - 2 服务器端应用程序开发过程5 2 图5 3 客户端应用系统开发过程5 4 图5 4 客户端初始化界面 55 图5 5 选择o d b c 数据源查询结果5 6 图5 - 6 选择a c c es s 数据源查询结果5 6 图5 - 7 对表s t u d e n t 进行添加操作结果”? 5 6 图5 8 数据转换模块总体结构5 8 图5 - 9 数据库间数据类型转换关系图6 0 表5 一ls y b a s es q la n y w h e r e 与其它数据库类型映射关系6 0 v 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的 研究成果。据我所知,除了文中特另t l d n 以标注和致谢的地方外,论文中不包含 其他人已经发表或撰写过的研究成果,也不包含为获得金月曼王些太堂 或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究 所做的任何贡献均己在论文中作了明确的说明并表示谢意。 学位论文作者虢忍锑净签字魄。7 年月彩日 学位论文版权使用授权书 本学位论文作者完全了解金月巴王些盔堂有关保留、使用学位论文的规 定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被 查阅和借阅。本人授权金月巴王些太堂可以将学位论文的全部或部分内容编入 有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位 论文。 ( 保密的学位论文在解密后适用本授权书) 学位论文作者签名:露锑 签字日期:d 甲年6 7 月g 日 签字日期:d 丫年月日 学位论文作者毕业后去向: 工作单位: 通讯地址: i i i 导师签名: 签字日期: 电话: 邮编: 诵 f r 寥b 致谢 本人在硕士研究生课程学习和撰写学位论文的过程中,自始至终得到了 我的导师周国祥教授的悉心指导,无论从课程学习、论文选题,还是到收集 资料、论文成稿、修改到最后定稿,都倾注了周老师大量的心血,由衷感谢 周老师在学业指导及各方面所给予我的关心以及从言传身教中学到的为人品 质和道德情操,老师广博的学识、严谨的治学态度、忘我的工作精神、诲人 不倦的教育情怀和对事业的忠诚,令我永生难忘,终身受益,并激励我勇往 直前。在这里,谨向周老师致以最衷心的感谢和崇高的敬意! 同时,我要感谢合肥工业大学的领导和老师,感谢参加评审答辩的老师, 感谢我单位的领导和同事及所有教育帮助过我的老师,他们的教诲为本文的 研究提供了理论基础,并创造了许多条件和学习机会,在我课程学习和论文 撰写期间,给予了我大力支持和帮助。 再次感谢所有帮助过我的领导和老师! v 作者:李华平 2 0 0 9 年5 月 第一章绪论 1 1 课题研究的背景和意义 随着高新技术特别是电子信息技术的迅猛发展,一场以信息技术为核心 的技术革命已经到来。数据库主要用于储存应用处理层所需的资料和数据, 它是现代信息系统的重要组成部分。根据国家制定的高校发展规划,目前越 来越多的大学趋向于整合,这也就伴随着各个学校之间的原有硬件、软件设 施的整合。其中就包括了各种已有教学管理软件的互相连接。由于历史的原 因,合并前的各个学校、系部开发的各种教学管理软件在开发时没有一个统 一的规范,使得学院合并后在信息共享的过程中,难以保持一个统一的技术 平台,各信息资源常常由不同的操作系统,不同的编程环境,不同的数据库 系统组成,当这些不同的资源需要一起运行使用时,它们之间的互连、互通、 互操作就成为了信息共享的巨大障碍,如何将这些已有的信息资源有效的整 合起来,尽量利用现有资源,减小信息共享成本,就成为了一个重要而且必 要的研究课题。 教学管理综合数据库系统作为信息平台的数据基础必须与办公信息化建 设同步。如果没有一个有效、权威的综合数据库,将会严重影响各部门获取 完备、全面、可靠的信息,制约整个教育自动化管理系统的建设。但由于发 展的原因,目前的教育信息自动化的水平与发达国家相比有较大差距,其建 设水平远不适应我国教育信息化建设的需要。因此,建立统一的信息平台, 有利于实现教育信息化管理系统统一技术体制、统一标准、统一接口要求, 确保各单位部门之间的信息系统互连,互通,互操作,同时保证各地区的教 育系统与教育信息化管理系统实现无缝连接。 教学管理数据库主要用于储存教学应用处理层所需的资料和数据,它是 教育管理自动化系统的重要组成部分。综合数据库系统作为信息平台的数据 基础必须与教育管理自动化建设同步。本课题的研究任务作为建立教学管理 数据库的重要组成部分就是在上述背景下提出和展开的,通过本课题的研究 将为实现教学管理数据库之间的无缝连接,保证各不同单位数据库系统之间 的互连,互通,互操作提供有力的技术支持,为数据库系统集成的研究积累 丰富的经验。 1 2 课题研究现状与历史 1 2 1 课题研究现状 西方国家非常重视自动化系统中的数据库建设,无论是从军事上还是民 用上,西方国家数据库系统的信息资源共享和无缝集成已经基本实现一体化。 我国目前教育系统的异构数据库系统建设比较迟缓,远不能适应教育管 理自动化系统建设的要求。这几年,虽然各地区、部门建立的各自的自动化 系统中也建设了各自的数据库,但由于缺乏统一协调,形成了下面两个问题: ( 1 )各系统没有统一的数据库。各数据库系统在建立时都是从各自需 求出发,使得各数据库之间无法互连互通,信息资源无法融合共享。 ( 2 )没有建立一个全国性的数据库系统,即使建立了一个全国统一综 合数据库,各地区数据库也无法和综合数据库互通。 因此,尽快在原有的数据库基础上集成建立教学管理综合数据库系统, 以适应信息化发展的需要是非常必要和紧迫的。 1 2 2 课题研究历史 对异构数据库集成的研究始于8 0 年代,至今己有二十多年的历史。起初 主要是走紧密耦合的道路,采用集中控制的方式。但逐渐发现这种方式代价 太高,每一次局部系统的改变都要引起对全局系统的修改和重构,并且全局 模式维护困难;于是逐渐转向了松散耦合的道路,提出了新的集成构架如联 邦式数据库等。二十多年的研究,也产生了一些实际的集成系统,如:u n i s y s 公司的m e r m a i d 系统、美国计算机公司( c o m p u t e rc o r p o r a t i o no fa m e r i c a ) 的m u l t i b a s e 系统、p a r i s 大学的s c o o p 系统等。但是这些系统大都还处于 研究阶段,功能还很不完善,并且大部分系统只能提供数据读取功能,不能 对局部数据库进行写操作。 9 0 年代初,随着各种数据库访问标准和数据库互连产品的相继涌现,以 及客户n 务器( c s ) 结构的兴起,产生了目前仍被普遍使用的两种集成方 案:客户端解决方案和服务器端解决方案。客户端方案将数据库操作的转换 工作放在客户端完成,在客户机上利用前台开发工具实现对多种数据库的连 接;典型地如:基于o d b c 的解决方案。服务器端方案在客户端为用户提供统 一的数据库访问接口,在服务器上则建立专门的互连服务器,由互连服务器 与多种异构数据库交互,由互连服务器完成转换工作,如基于公共数据库网 关的互连。 然而,这些方案仍然存在许多不足。对客户端方案,以o d b c 方案为例, 其局限性表现在: ( 1 )负载过分集中于客户端,如果有多个异构数据库需要访问,则每 个客户机上要安装多个o d b c 驱动程序。在数据库种类或客户机数量大时,系 统投资、负载、性能及管理都存在问题。 ( 2 )每种o d b c 接口只能允许客户使用标准的查询语言访问一种数据 库。这只解决了应用的移植问题,并没有提供多种异构数据库的互访,如查 询中异构数据库表的连接。 ( 3 )o d b c 支持的操作系统有限,多数u n i x 上缺少o d b c 驱动程序。 2 而对服务器端方案,其实际上是在数据库和客户间加入了一个负责转换 的中间层,从而合理分担了客户和服务器的工作,符合数据库互连产品的发 展方向。但是目前主要采用的公共数据库网关只能提供两个系统间的互操作, 在n 个异构数据库组成的复杂系统中,要实现任意两个数据库间的互操作, 就必须提供n ( n - 1 ) 2 个网关;而数据库网关价格昂贵,这在实际中是很难投 入实用的。 对上述方案研究发现:产生种种局限的一个重要原因是没有一个统一标 准来规范系统;如果能对客户和服务器间交互的数据格式以及数据库语言和 模式进行标准化,则上述的许多问题( 如数据库网关的局限) 将迎刃而解; t c p i p 在互连网上的成功已经证明了标准化是解决教学管理互连的最佳方 案。另一方面,异构数据库系统所处的环境常常是分布异构的,在这样一个 复杂的分布异构环境中,数据库间的通信必然涉及大量复杂的数据转换和协 议转换,在传统的集成方法中,这些转换是由集成系统来完成,使得集成系 统过于复杂而难以实现。如果能够有一个通用统一的通信中间件屏蔽环境异 构性,则将大大简化集成系统。 分布式对象技术的兴起为解决这一问题带来了新的曙光。分布式对象技 术始于9 0 年代初,经过十多年的不断发展完善,己经成为当今分布异构环境 下,建立应用系统集成框架和标准构件的核心技术,并在企业资源集成、分 布式系统管理、软件构件技术等方面发挥重要作用。出现了以o m g 的c o r b a 和m i c r o s o f t 的c o m d c o m c o m + 以及s u n 的e j b 为代表的应用互操作技术标 准,这在第三章讲给予介绍。 1 3 论文研究的主要内容 论文通过对异构数据库系统需求的分析研究,提出异构数据库系统集成 需要解决的问题和技术。通过对实现数据库集成的三种技术即数据转换程序、 使用中间件和多数据库系统的技术研究,提出了使用中间件和多数据库系统 是教学管理数据库集成问题的关键技术,并在此思想的指导下,通过对异构 数据库系统的需求分析给出了教学管理数据库集成的技术实现方案。在对两 种主流的中间件技术c o r b a 和c o m d c o m 进行深入研究分析的基础上,实现了 基于c o r b a 的多数据库集成的应用程序以及数据转换的设计。 1 4 论文的组织结构 本论文共分六章 第一章主要介绍论文的研究背景和意义,课题研究的现状与历史,课题 研究的主要内容及论文的组织结构。 第二章介绍了异构数据库集成涉及的问题及其理论基础和需要解决的关 3 键技术。 第三章详细论述了实现异构数据库集成的三种技术方法,并对数据转换 程序、中间件技术和多数据库系统的原理和实现细节作了详细的研究和讨论。 第四章通过对教学管理数据库需求的分析提出了教学管理数据库集成的 实施方案,并对实施过程中遇到的问题提出了解决思路。 第五章在对教学管理数据库集成的基础上首先给出了基于c o r b a 技术的 中间件应用程序实现了对异构数据库的访问,然后又进行了用p o w e r b u ii d e r 实现了不同数据库之间数据转换的设计,实现了在网络环境下使用不同数据 库间的相互转换数据。 第六章对论文所做的工作进行了总结和展望,并指出今后将要进一步完 成的工作。 4 第二章数据库集成的理论基础 2 1 数据库的发展史和异构数据库的形成 简单地说,数据库是一个特定的包含大容量信息的数据集合,这和文件 相类似。而数据库区别于一般文件的地方是它的结构,数据库包含了关于文 件结构的信息和方便数据查找的索引信息。 数据库技术从6 0 年代中期产生到现在仅有4 0 多年的历史,却经历了三 次更新换代,大致是层次型、网状型和关系型三代。层次模型是数据库系统 中最早出现的一种数据模型。层次模型采用层次式有向树结构的形式,系统 庞大复杂,不易维护。网状数据库系统采用循环链的结构形式,系统的表示 能力和存取效率都比层次型模型强。7 0 年代以前的数据库大多采用层次数据 模型和网状数据模型。层次和网状数据库中记录之间的关联依赖于指针,能 够实现数据的集中和共享,但用户观察和访问数据库中数据的抽象级别还不 高,数据独立性还不够好,数据库使用也不够方便。 关系数据库兴起于8 0 年代,它是以二维表格( 关系) 作为数据模型的数 据库。关系的每个行称为一个元组( 或记录) ,每一个列称为一个属性( 或 字段) ,所有属性名称构成的集合称为关系模式。和以前的数据模型相比, 关系数据模型有严格的关系代数和关系演算数学基础,数据结构简单。近年 来,关系模型己经成为数据库设计事实上的标准。这不仅因为关系模型自身 功能的强大,而且还由于它提供了结构化查询语言( s q l ) 的标准接口,该接 口使得可以用统一的方法来处理各种不同的数据库工具和产品。 随着面向对象技术的兴起,数据库领域又出现了对象一关系数据库系统 和完全面向对象的数据库系统。这表明数据库技术的发展又进入到一个更加 全新的阶段。数据库的设计和相互访问更加复杂。 从以上数据库发展的历史不难看出,采用不同的数据模型能设计出不同 的数据库,这些数据库由于彼此之间的数据模型各不相同,因而它们是异构 的。因此异构数据库的形成是数据库自身发展的必然结果。 2 2 异构数据库系统 随着异构数据库的出现,伴随而来的是异构数据库系统。所谓异构数据 库系统是相关的多个数据库系统的集合,它屏蔽各参与数据库( 称为局部数 据库或局部站点) 之间的异构性,实现局部数据库之间的信息共享和透明访 问。根据各局部数据库之间耦合的紧密程度,异构数据库系统可分为以下几 种: ( 1 ) 全局式多库系统( g l o b a ls c h e m am u l t i - d a t a b a s e s ) 。各局部库 间耦合较为紧密,具有单一全局策略,各局部数据库站点必须密切配合,维 5 护全局完整性。 ( 2 ) 联邦数据库系统( f e d e r a t e dd a t a b a s e s ) 。耦合较松一些。没有 单一的全局策略,每个局部数据库维护一个本地输入输出荒略。输出策略指 明了本地系统提供的全局共享数据,输入策略指明了允许输入本地系统的来 自远程节点的数据。局部输入输出策略构成了全局策略的一部分。这种系统 只集成局部系统中的部分数据,因而使得局部系统有较好的自治性。 ( 3 ) 多库语言系统( m u l t i d a t a b a s e l a n g u a g es y s t e m s ) 。这是耦 合虽松散的异构数据库系统。完全没有全局策略,只提供多库访问语言供用 户使用。全局策略完全由用户维护,用户必须知道从哪个局部库中获取数据。 该系统的局部库具有完全自治性。 耦合紧密的系统具有较好的全局同步性和较高的全局效率,在处理涉及 多个局部库的全局事务时比松耦合系统优越,但松耦合系统比紧耦合系统更 容易集成异构性较大的局部系统,并且能够保持局部系统的自治性。 2 3 三层体系结构模式 我们可以把数据库形象地看成是企业的“数据源”,它在逻辑上是分散 的,但在物理上可以集中存放,也可以分布( 分散) 存放。而网络则可以看 成是沟通用户和“数据源”的“通路”,它可以根据企业的具体情况,在客 户机和客户机之间、服务器和服务器之间、客户机和服务器之间建立快速、 可靠的访问通路。 舅旦幽堡乒宴苎壁塑韭婴 。厘。,煦 么一 一 回凰凰 ! = 1 燮二= 1 ie :t 二t 曼。t 选s e j ,兰一j兰墨蓉0 暑: 图2 - 1 计算模式的进化 ( 1 ) 集中式管理一主机终端模式 以主机为中心的计算环境,数据管理和事务处理高度集中,起始成本高, 系统维护升级只涉及主机,管理成本低,但用户端缺乏个人定制,无任何处理 功能。适用于大规模集中式应用,具有较高的效率和安全性,但存在执行效率 及容量不足问题。 晨 ( 2 ) c 1 i e n t s e r v e r 模式 它把集中管理模式转化为一种服务器与客户机负荷均衡的分布式计算模 式,解决了执行效率及容量不足的问题。该结构以p c 为主,适合部门级应用。 初级成本低,但随着应用规模扩展,网络上异种资源类型的增多,开发、管理、 维护的复杂程度加大,频繁的软硬件升级,后期成本骤升,缺乏关键事物处理 的安全性与并发处理能力。 c 1 i e n t s e r v e r 模式又分为2 种: 胖服务器瘦客户机方式:数据计算与数据处理集中在数据库服务器 端,数据库服务器端是这种系统的瓶颈,当接入的用户较多时,会发生通讯堵 塞,系统性能也急剧下降,无法适应多用户的需要。 瘦服务器胖客户机方式:数据计算与数据处理集中在客户机端,这 加大了网络负荷,影响了业务处理速度,而且客户端p c 机的多样性,使如何有 效管理控制整个系统,并不断予以更新成为一个新的“瓶颈 。 无论上述哪种方式都存在着明显的“瓶颈”,使其不能适应不断增长的多 方面需求和应用。 ( 3 )b r o w s e r s e r v e r 模式 以网络中心计算为特征的b s 结构恰到好处地取长补短,兼容并蓄,使计 算体系真正成为企业生存发展的生命力。b s 结构使数据及应用可通过不同 平台、不同网络存取,与平台无关,伸缩性大,为企业、行业提供了开放的基于 标准的综合性服务计算环境,它将处理、储存、通讯能力移入网络,集中了主 机终端和c s 的优点,管理集中,只涉及网络服务器,通过下载获得升级功 能,同时信息高度分散,通过h t t p 、j a v a 可访问连接任何u r l 资源和应用, 共享程度高,可伸缩扩展性强,具有高度开放性和灵活性,同时具备高速率和 安全性,使用户真正投资于应用而不是计算机本身。 b r o w s e r s e r v e r 模式,是从传统的c s 发展起来的计算方式。c s 是松散 耦合系统,通过消息传递机制进行对话,由客户端发出请求给服务器,服务器 进行相应处理后经传递机制送回客户端:b s 模式则把c s 模式的服务器端进 一步深化,分解成应用服务器( w e b 服务器) 和多个数据库服务器,同时简化 c s 中的客户端,将客户端的计算功能移至w e b 服务器,仅保留其表示功能,从 而成为一种由表示层( b r o w s e r ) 、功能层( w e bs e r v e r ) 与数据库服务层 ( d a t a b a s es e r v e r ) 构成的三层分布式结构,如图2 - 2 所示。 操作系统 w e bs e r v e r + ( 耍口一d a t a b a s e b r o w s e l 弋c e 吼i 回 s e r v e r i j a v a l 协 。l。j。a。v。a。a。p。p。l。e。ti 客户杌服务器 图2 - 2b s 体系结构 7 图2 2 中,客户机端只有b r o w s e r ,一般没有应用程序,借助于j a v a a p p l e t 、v b s c r i p t 、j a v a s c r i p t 、a c t i v e x 技术可以处理一些简单的客户端 处理逻辑,显示用户界面和w e bs e r v e r 端的运行结果。它向u r l 所指定的w e b 服务器提出服务申请,w e b 服务器对用户进行身份验证后,用t c p i p 协议把 所需的文件资料传送给用户,客户端只是接收文件资料,并显示在浏览器上。 服务器端由w e bs e r v e r 和d a t a b a s es e r v e r 构成,w e bs e r v e r 负责接 受远程或本地的数据查询请求,然后运行服务器脚本,借助于c g i 、a d o 、a p i 、 o d b c 、j d b c 等中间部件把数据请求发送到d a t a b a s es e r v e r 上以获取相关数 据,再把结果数据转化成h t m l 页面文档及各种脚本传回客户的b r o w s e r 。 d a t a b a s es e r v e r 负责管理数据库,处理数据更新及完成查询要求、运行 存储过程。可以是集中式的也可以是分布式的。 由图2 - 2 中可以看出,b r o w s e r 与w e bs e r v e r 之间的关系就类似于主机 终端结构中两者之间的关系,而w e bs e r v e r 与d a t a b a s es e r v e r 之间的关系 就像c 1 i e n t s e r v e r 结构中两者之间的关系。 在三层结构中,数据计算与数据处理集中在中间层,即w e bs e r v e r 这一层, 由于中间层的服务器的性能容易提升,所以在i n t r a n e t 下的三层结构可以满 足用户的需求。但这种结构对数据库服务器提出了高要求。从管理的角度来 看,程序代码的维护、数据库的备份虽然可以在服务器端执行,但这种三层结 构对网络带宽是有一定要求的,因为客户端每次要求获取的数据和反馈信息 都要通过网络与服务器联系。目前又提出了把中间层所包括的所有服务程序 严格的按逻辑细化为各个服务层,那么每一主要服务层都将视为独立的层, 这样我们所说的三层体系结构就变成为n 层体系结构。 2 4 数据库集成的分类及意义 2 4 1 数据库集成分类 从数据库集成的角度分析,被集成的数据库系统可分成同构数据库和异 构数据库两种类型,从而数据库集成也就自然的分成同构数据库集成和异构 数据库集成。 所谓同构数据库是指结构相同的数据库,这里的同构有两个级别的含义: 系统一级的同构和语义一级的同构。系统一级的同构主要表现在数据库运行 环境相同和各数据库d b m s 的也相同:运行环境相同表现在:系统体系结构相 同( 如:主机系统、p c 系统等) 和操作系统相同等,d b m s 相同如整个系统只 存在关系数据库系统或对象数据库系统或网状数据库系统等数据库结构模型 的其中一种。语义一级的同构主要表现为模式的相同。所谓模式是指用d d l 精确定义数据模型的程序,模式反映了对现实模型化后建立的数据表示引。 对应同构数据库的概念,所谓异构数据库是指结构相异的数据库。数据 8 库有多种异型结构,具体说来有以下几个方面: ( 1 )计算机体系结构的异构。各个参与的数据库可以分别运行在大型 机、小型机、工作站、p c 或嵌入式系统中。 ( 2 )基础操作系统的异构。各个数据库系统的基础操作系统可以是 u n i x 、w i n d o w sn t 、d o s 等。 ( 3 ) d b m s ( d a t a b a s em a n a g e m e n ts y s t e m 数据库管理系统) 本身的异 构。可以是同为关系型数据库系统的o r a c l e 、 s q ls e r v e r 等,也可以是不 同数据模型的数据库,如关系、层次、网状、面向对象、函数型数据库共同 组成一个异构数据库系统。 对于我们教学管理的大部分数据库系统来说,由于各部门的数据库建设 不同步,异构机、异构型数据库不可避免,基于单一数据库产品开发的系统 己经难以适应新应用的需要,许多应用不可避免地涉及多个不同数据库系统, 需要联合使用,因此在本文中所讨论的数据库集成问题都基于异构数据库的 集成。 2 4 2 异构数据库集成意义 上面说过,基于单一数据库产品开发的系统己经难以适应新应用的需要, 许多应用不可避免地涉及多个不同数据库系统,需要联合使用。具体表现在: ( 1 )应用系统本身是一群子应用的集成,这些子应用各自有其特殊要 求( 包括对硬件) ,无法用一种数据库系统满足所有子应用的需要。如:c i m s ( c o m p u t e ri n t e g r a t e dm a n u f a c t u r i n gs y s t e m s ) 系统,其中可能有c a d ( c o m p u t e ra i d e dd e s i g n ) c a m ( c o m p u t e ra i d e dm a n u f a c t u r i n g ) 子系 统需要u n i x 平台下的工程数据库支持,同时又有一些子系统运行于w i n d o w s p c 机上由一般关系数据库支持。 ( 2 )新的应用系统需要集成原有系统,而新旧系统采用的数据库产品 不同。这时,或者是由于旧系统向新系统迁移是不可能的,或者是出于保护 原有投资的目的,新的集成系统将是多数据库共存的状况。 ( 3 ) 对一个大的企业,各部门使用的操作系统和数据库系统常常不同。 即使是一个经过严密信息规划的企业,因时间推移,人事变迁,以及数据库 技术的发展和数据库市场的变化,都有可能造成各种不同数据库并存的局面。 ( 4 ) 在i n t e r n e t 这样一个动态环境中,各种数据库不断的加入或去除, 数据库中的数据也在不断变化,而现行的绝大多数应用是建立在这些分离的 数据库基础之上,因而,为了实现信息资源的共享和交流,不同数据库间相 互操作和协作不可避免。 这些情况都表明;在现代信息化进程中,不同数据库联合使用的要求是 非常迫切并会长期存在下去,并且往往还伴随着一个复杂的分布异构环境。 9 这种分布异构性表现为: 场地分布。由l a n 或w a n 支撑,存在多种网络协议。 数据分布。各种形式的数据分散在各节点,以各种形式存在。 硬件平台多样化。从台式机、工作站到大型主机等。 操作系统多样化。如w i n d o w s 、n e t w a r e 、l i n u x 、u n i x 以及v m s ( v i r t u a lm e m o r ys y s t e m ) 等。 应用平台多样化。包括来自不同开发组织的各种应用软件、中间件 和开发工具。 然而,对于用户而言,面对所有这些复杂的分布异构特性,他们希望屏 蔽掉各种层次的异构特性,他们不必知道各物理数据库系统的分布及数据库 的结构组成和操作方法,也不必自己去进行数据转换和结果汇总,只需通过 简便的全局访问方法得到一个综合结果,这就是异构数据库集成技术的主要 研究内容,也是其意义所在。 2 5 异构数据库集成的研究 2 5 1 异构数据库集成的工作任务 异构数据库集成是一个复杂的课题,根据异构数据库系统本身的特点, 一般可以通过两个方面来实现异种数据库集成:一是通过转换,二是标准化。 具体要解决以下几个问题n 8 m 1 : ( 1 )维护局部自治性 异构数据库系统和传统的分布式数据库的一个重要区别就是其每个局部 库d b m s 都具有对局部数据和处理过程完全的控制权利,也即自治性。局部库 加入集成系统、对全局系统进行修改等等这些行为都不能对局部d b m s 造成影 响。对局部d b m s 而言,全局系统只是一个本地d b m s 的用户,和其他局部数 据库用户并无区别。需要注意的是:自治性是针对局部d b m s 而言的,对整个 局部系统( 局部站点) 来说,则必须支持一定的全局相关功能,以保证集成 系统全局完整性能够维护。 保持局部库自治性是非常必要的。被集成系统一般都是预先存在的,集 成的目的是为了提供数据的共享服务,而不是要去影响和干扰局部系统原本 运行的任务。 要求局部自治性给全局系统带来了许多问题,如:如何处理全局请求及 全局优化与局部的冲突;当局部系统功能或相关信息有限,造成全局系统无 法完成某些任务时,全局系统如何处理等等。 ( 2 ) 消解异构模式 对同一数据,不同数据库系统可有不同的描述方法。因此数据模式异构, 或者通俗地说,数据表示的异构,是集成系统必须面对的问题。主要表现在 l o 以下几点: 命名冲突:相同的数据在不同的局部库中可能有不同的名称,或者相 同的名称在不同的局部库中表示了不同的数据。 o 格式相异:包括数据类型、精度、数据范围等的不同。如:一个电话 号码在一个局部库中以整数表示而在另一个库中以字符串表示。 0 结构相异:一个数据实体在不同的数据库中可能表示方式不同。如: 一个数据项在一个库中可能表示为一个值,而在另一个库中表示为几个值; 或者在一个库中表示为属性而在另一个库中表示为关系等等。 数据冲突:由于局部库的自治性,相同的数据项在不同的库中可能有 不同的值,从而造成全局查询时返回不同的结果。 对这些问题,全局系统必须能够识别并加以解决。 ( 3 ) 屏蔽系统级异构 一方面,需要屏蔽局部库d b m s 异构,通常数据库d b m s 有关系、网状、 层次等模型。如果集成系统包含有各种这些数据库,则需考虑如何实现转换, 通常的做法是将局部模型转换到统一的全局关系模型上。转换功能增加了系 统的代码量,从而影响效率,必须考虑在系统通用性和效率间的合理平衡; 另一方面,必须解决运行环境异构问题,各数据库运行环境可以存在从硬件 到网络协议到操作系统的各层次的不同,集成系统必须能屏蔽这些异构,为 客户提供透明通信,这通常会涉及大量的内部数据格式、协议等转换。 ( 4 ) 维护全局完整性 由于集成系统提供了全局视图,因此不同局部库中的数据可能彼此间有 语义上的关联性。因此,全局系统必须保证全局数据完整性、一致性,防止 修改不同步。这在某种程度上又影响了局部站点的自治性,如何在这两者间 平衡、协调,是集成系统必须要考虑的问题。 ( 5 ) 处理全局查询 全局查询通常涉及多个局部库,全局系统必须考虑如何分解和优化查询, 如何翻译全局查询为局部查询语言,如何将各局部库返回的查询结果进行组 合等问题。同时还必须考虑如何保证全局事务的a c i d 特性( a t o m i c 、 c o n s i s t e n t 、i s o l a t e d 、d u r a b l e ,即原子性、一致性、隔离性、持久性) 、 如何进行并发控

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论