(计算机应用技术专业论文)基于异构数据交换和共享技术的教学信息资源整合.pdf_第1页
(计算机应用技术专业论文)基于异构数据交换和共享技术的教学信息资源整合.pdf_第2页
(计算机应用技术专业论文)基于异构数据交换和共享技术的教学信息资源整合.pdf_第3页
(计算机应用技术专业论文)基于异构数据交换和共享技术的教学信息资源整合.pdf_第4页
(计算机应用技术专业论文)基于异构数据交换和共享技术的教学信息资源整合.pdf_第5页
已阅读5页,还剩46页未读 继续免费阅读

(计算机应用技术专业论文)基于异构数据交换和共享技术的教学信息资源整合.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 随着高等教育改革的不断深入和深化,教育体制的不断发展,我国高校的教学管 理也面l 临着新的挑战。多所高校的合并,各个学校又分多层管理,各个部门所使用的 数据库数据结构都不尽相同。针对这种情况,完全重新做一套管理系统,使用统一的 数据库是不现实的,那么就需要解决数据异构的问题以达到教学信息资源整合的目的。 本文对异构数据交换中的x m l 和移动a g e n t 的应用进行了深入的研究,将异构数 据交换和共享技术应用到了教学信息资源整合中。以x ) d l 为公共数据模型,将各种异 构数据库结构与x m l 进行交换,解决了多数据库系统中成员系统的数据异构性问题: 以移动a g e n t 为逻辑模型框架,利用其交互的特点,解决了多数据库系统中成员系统 的自治性和系统的分布性问题。 将x m l 和移动a g e n t 应用到教学管理工作中,可以很好的解决异构数据交换和数据 共享的问题,实现不同数据库之间数据信息资源的合并和共享,保护已经建立的资源、 充分利用各部门已经使用的数据库,实现不同数据库之间的数据交换和数据共享,最 终实现教学信息资源的整合。 关键词:教学资源整合异构数据交换共享技术x m l 移动a g e n t a b s t r a c t a l o n gw i t ht h ec o n t i n u o u sd e e p e n i n ga n dd e e p e no ft h er e f o r mo fh i g h e re d u c a t i o n ,t h e c o n t i n u o u sd e v e l o p m e n to ft h ee d u c a t i o n a ls y s t e m ,t h ec o l l e g et e a c h i n gm a n a g e m e n to fo u r c o u n t r yw i l la l s of a c en e wc h a l l e n g e s t h em e r g e ro fan u m b e ro fc o l l e g e sa n du n i v e r s i t i e s a n dv a r i o u ss c h o o l sa n dm u l t i l a y e rm a n a g e m e n t ,v a r i o u sd e p a r t m e n t sd a t a b a s eu s e db yt h e d a t as t r u c t u r ei sd i f f e r e n t i nv i e wo ft h i ss i t u a t i o n ac o m p l e t e l yr c d om a n a g e m e n ts y s t e m a n du s eo fau n i f i e dd a t a b a s ei su n r e a l i s t i c t h e nw en e e dt or e s o l v et h ed a t ah e t e r o g e n e o u s i s s u es oa st oa c h i e v et h ep u r p o s eo ft e a c h i n gi n f o r m a t i o nr e s o u r c e si n t e g r a t i o n i nt h i sp a p e r ih a da l li n d e p t hs t u d yo nt h ea p p l i c a t i o no fx m la n dm o b i l ea g e n tu s e i nh e t e r o g e n e o u sd a t ae x c h a n g e h e t e r o g e n e o u sd a t ae x c h a n g ea n ds h a r i n go ft e c h n o l o g y w e r eu s e di n t ot h et e a c h i n gi n f o r m a t i o nr e s o u r c e si n t e g r a t i o n t h i sp a p e rr e s e a r c h e dt h e p u b l i cd a t am o d e lb a s e do nx m lt h a ti s v a r i o u sh e t e r o g e n e o u sd a t a b a s es t r u c t u r e e x c h a n g eb a s e do nx m l t os o l v et h em u l t i - d a t a b a s e s y s t e mo f ts y s t e m a t i c d a t ai n h e t e r o g e n e o u sp r o b l e m s iu s e dm o b i l ea g e n ta st h el o g i cm o d e lf r a m e w o r k u s ei t s i n t e r a c t i v ef e a t u r e sc a ns o l v em a n ym e m b e r so ft h ed a t a b a s es y s t e ma n dt h es y s t e mo f a u t o n o m y o ft h ed i s t r i b u t i o ns y s t e mp r o b l e m s x m la n dm o b i l ea g e n th a db e e na p p l i e dt ot h et e a c h i n gm a n a g e m e n t i tc a l lb e s a t i s f a c t o r i l y r e s o l v e d h e t e r o g e n e o u s d a t ae x c h a n g ea n dd a t a s h a r i n gi s s u e s i t c a n i m p l e m e n tt h em e r g e ra n ds h a r i n go ft h ed a t ai n f o r m a t i o nr e s o u r c e sb e t w e e nd i f f e r e n t d a t a b a s e s ,p r o t e c tt h er e s o u r c e sw h i c hh a v eb e e ne s t a b l i s h e d ,m a k ef u l lu s eo ft h ed a t a b a s e w h i c hh a v eb e e nu s e db yv a r i o u sd e p a r t m e n t s ,r e a l i z ed a t ae x c h a n g ea n dd a t as h a r i n g b e t w e e nt h ed i f f e r e n td a t a b a s e sa n da c h i e v et e a c h i n gi n f o r m a t i o nr e s o u r c e si n t e g r a t i o n k e yw o r d s :t e a c h i n gr e s o u r c ei n t e g r a t i o n h e t e r o g e n e o u sd a t ae x c h a n g es h a r i n g t e c h n o l o g y x m lm o b i l ea g e n t 长春理工大学硕士学位论文原创性声明 本人郑重声明:所呈交的硕士学位论文,基于异构数据交换和共 享技术的教学信息资源整合是本人在指导教师的指导下,独立进行 研究工作所取得的成果。除文中已经注明引用的内容外,本论文不包 含任何其他个人或集体已经发表或撰写过的作品成果。对本文的研究 做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全 意识到本声明的法律结果由本人承担。 作者签名:堡, v l 灸刁l 一一年一月 日 , 长春理工大学学位论文版权使用授权书 本学位论文作者及指导教师完全了解“长春理工大学硕士、博士 学位论文版权使用规定”,同意长春理工大学保留并向国家有关部门或 机构送交学位论文的复印件和电子版,允许论文被查阅和借阅。本人 授权长春理工大学可以将本学位论文的全部或部分内容编入有关数据 库进行检索,也可采用影印,缩印或扫描等复制手段保存和汇编学位 论文。 作者签名:塞筮垂: 年一月一日 指导导师签名:翌垒垒 年一月日 1 1 本文研究的背景 第一章绪论 目前,我国的高校正处在大力发展的重大转型时期,学校规模扩大,教学工作量 日益增大,对教学工作提出了校、系二级分层管理甚至校、院、系三级分层管理的要 求。多校区的出现对教学工作系统进一步提出了分布式网络化的要求;随着扩招、合 校等因素的影响,高校在校学生人数骤增,日益膨胀的数据量和网络化管理带来的对 数据安全性和系统运行稳定性的要求越来越高;新系统对已有系统的数据需要继承, 信息在各个系统之间需要共享,学校内各个部分都在开发自己的系统,有些教学处内 部各科室也有自己的系统,很容易使信息废弃或形成信息孤岛,如何实现不同数据库 之间数据信息资源的合并和共享、如何保护已经建立的资源、充分利用各部门已经使 用的数据库,实现不同数据库之间的连接、数据交换和数据共享。对于高校的教学工 作来说,统一的框架和相应的数据共享模式是十分重要的。 如何将原有的各类己趋于成熟的数据库管理系统不加修改地纳入到一个系统中, 以便于我们在一个统一的网络环境中进行集中管理,统一使用。在复杂的环境下,如 何最大限度地透明地跨越异构网络、计算机平台,实现异构数据库之间的连接、数据 交换和数据共享,无缝地联合使用异构信息源中的大量信息。这就是我们所要解决的 数据库异构问题,也是我们必须解决的异构数据库系统的集成化与互操作难题。研究 异构数据库,努力发展其解决方案,可以提高生产率,适应将来发展的需要,充分利 用已有的投资。同时,研究异构数据库,从实用出发,有利于加深对关系数据库系统 的理解,以构造出适用而又先进的数据库系统。 在各高校教育亡作信息化建设过程中,各职能部门通常采用不同的技术和体系结 构来构建自身的信息系统,使得跨平台数据共享与访问成为困难。例如:教学工作部 门和后勤机关单位的信息系统大多是相互独立的应用系统。然而,在现实生活中,一 项工作或审批流程往往需要多个部门信息系统中的业务数据协同处理才能完成,但是 由于这些部门之间并没有一套很好的数据共享、同步更新的机制,往往会造成学校的 信息在不同的部门肓不同的版本,从而给工作以及日常工作带来诸多不便,并降低了 工作效率。 为了改变以上情况,如果号虑重新开发以上业务系统,无论实际从时间、成本、 或者是实施等方面每虑都是不叮行和不现实的。这就意味着各高校都需要一个系统来 帮助他们从彼此分敝的应用系统数据库中获取工作动态业务数据,使系统资源能够得 到最充分的利用 x l 。 1 2 国内外的研究现状与发展趋势 市场有关高校教学工作的软件产品,都是基于信息管理角度来进行设计开发,对 异构分布式数据存储、传递、同步和共享问题的解决还不彻底。近几年我国各高校的 信息化进程发展较快,但距离教学工作新的需求相比还有很大差距,很多问题还亟待 解决。例如:对教学工作提出了校、系二级分层工作甚至校、院、系三级分层工作的 要求:多校区的出现对教学工作系统进一步提出了分布式网络化的要求;如何实现不 同业务数据库间数据信息资源合并和共享、如何保护已经建立的资源、充分利用各部 门已经使用的数据库,实现不同数据库之i 日j 的连接、数据交换和数据共享的要求,以 上这些问题都是高校教学信息化所需要解决的重要问题。目前市场上还没有一种软件 产品可以对以上问题进行全面、彻底地解决。 不同数据库间的数据交换长期以来一直是困扰数据库应用开发人员的问题。每种 数据库都有自己特定的数据表示格式,为了数据的备份和转储,也都各自定义了一套 数据的加载和卸载方法。但是,当一种数掘库的数据要加载到另一种数据库中时,由 于互不相同的数据格式和数据库运行的操作系统平台而导致加裁非常困难。在x m l 出 现之前,人们解决这种问题的方法通常是自己定义一套特定的数据格式,将源数据库 中的数据先以自己想要的格式导出,然后再重新导入到目的数据库中。这种方法没有 统一的标准,而且数据格式也不规范,这样就造成了重用性差的缺点,因此也就造成 了很多像数据交换这种低级工作被不必要的重复,进而导致许多原本可以协调工作的 软件由于数据格式不统一而无法得到充分利用【。 用x m l 作为数据交换的中介,给系统的实现带来极大的灵活性。系统可以屏蔽掉 后台的多种数据源。用统一的x m l 数据呈现给用户。接收数据一方根据x m l 数据的 模式可以对数据进行任意的处理。如分解出其中需处理的数据或是以不同的样式来呈 现。通过x m l ,我们可以实现网上数据的交换、处理自动化,作为下一代i n t e m e t 应 用的基础。 这些特点使得x m l 技术广泛地应用于数据共享、系统集成,也促进了数据库系统 和x m l 的集成,许多数据库系统通过x m l 发布数据,使之更容易的参与w e b 应用。 另外,x m l 通常存储在数据库系统中,使之能够利用现有数据库的优点。显然,这都 要求建立x m l 模式和数据库模式之间有效的映射关系【2 j 。 a g e n t 是一种处在特定环境f 的实体,它能够感知其所处的环境并依据周围的环境 自主决策,自主行动。软件a g e n t 是能够竹续运行,并依据外界环境自主决策,自主 行为,而且在需要时能够与其他a g e n t 合千1 + 完成任务的软件实体。 a g e n t 越来越受到重视,研究人员把a g e n t 概念引入到软件开发的方方面面,其目 的是增强软件之间的可协作性。采用这科r ,法进行软件开发,应用程序被视为软件 a g e n t ,它们之洲可以通过a g e n t 通信语言进行信息交换i j l 。 1 3 本文研究内容 为了解决异构数据库之间数据信息的资源合并和共享,充分利用各子系统已经存 在的数据库,实现不同数据库之间的连接、数据交换和数据共享的要求,使教学信息 达到资源整合的目的,本文对以下内容进行了深入的研究: 1 ) 研究异构数据交换和共享技术中x m l 的应用。研究基于x m l 的公共数据模型, 以解决多数据库系统中成员系统的数据异构性问题。 2 ) 研究异构数据交换和共享技术中移动a g e n t 的应用。研究基于移动a g e n t 的逻辑模 型框架,以解决多数据库系统中成员系统的自治性和系统的分布性问题。 3 1 将以上技术应用到分布式高校教学信息资源整合中。 第二章异构数据交换和共享技术 2 1x m l 相关介绍 6 0 年代末,i b m 进行文本文档描述的一项研究,提出了一种格式语言s g m l ( 标 准通用标记语言) 。s g m l 是一种用标记来描述文档资料的通用语言,它包含了一系列 的文档类型定义( 简称d t d ) 。d t d 中定义了标记的含义,因而s g m l 的语法是可以 扩展的。s g m l t - 分庞大,既不易学,又不容易使用,在计算机上实现也十分困难。 随着s g m l 的应用,过于庞大的缺陷日益突显,1 9 8 9 年,w e b 的发明者欧洲核子物 理研究中心的研究人员提出了h t m l ( h y p e r t e x tm a r k u pl a n g u a g e ) 语言。h t m l 只使用 s g m l 中很小一部分的标记,为了便于在计算机上实现,h t m l 规定的标记是固定的, 即h t m l 语法是不可扩展的,它不需包含d t d 。h t m l 简单的特性使其在网络方面得 到了前所未有的应用。随着w e b 的应用越来越广泛和深入,不管h t m l 推出多少个新 版本,但始终满足不了不断增长的需求。1 9 9 8 年的w e b 标准化组织w 3 c ( w o r l dw i d e w e b ) 制订了一种精简的s g m l 版本,这就是x m l ,它去除了s g m l 中的一些非常复 杂而又用得很少的特性,使其更加精练、简洁,更易于理解和使用,从而更适合在网 络环境下使用。虽然h t m l 与x m l 都源于s g m l ,但又有所不同:h t m l 侧重于显 示数据,而x m l 侧重于描述数据 4 】【5 1 。 2 1 1 什么是x m l 简单地说,x m l 是一个描述性标记语言的元语言,它使人们可以方便地为数据 定义或扩展他们自己的描述术语以及这些术语闻的结构化关系,这就是“可扩展”的 含义也是x m l 的基础。x m l 具有如下功能特征【6 】: 1 ) x m l 是可扩展的。通过定义数据元素和属性来定制x m l 文档以满足特定的需求。 2 ) x m l 和关系数扼库关系密切。x m l 创建和管理层次数据结构,关系数据库系统 使用关系模式来天联数据实体表,以简化数据排序、查询、获取。虽然这两种数 据结构方法大不棚同,但都创建了层次结构。 3 ) x m l 跟任何背景- 己关。创建和处理x m l 文档与具体的编程语言、操作系统、计 算平台等无关。f t 何计算平台使用文本编辑器便可以开发x m l 文档。 4 ) x m l 是自我描述恂。一个x m l 文档应该是易于阅读的,这是由于定义数据元素 和层次关系的过w 是在设计行自己对数据的理解基础上进行的。 5 ) x m l 利于标准化坡据表示的阡发。不同数据库厂商开发的使用不同操作系统的数 据库系统之间转搬数据是非常复杂的过程。x m l 可以开发不同数据库系统部能理 解的独立的数据格式。 4 x m l 不只是像超文本标记语言h t m l 或是格式化的程序。这些语言定义了一套 固定的标庀,用来描述一定数目的元素。如果标记语言中没有所需的标记,用户也就 没有办法了。这时只好等待标记语言的下一个版本,希望在新版本中能够包括所需的 标记。x m l 是一种元标记语言。用户可以定义自己需要的标记。这些标记必须根据 某些通用的原理来创建,但是在标记的意义上,却具有相当的灵活性。这就必须创建 用于每项的标记。新创建的标记可在文档类型定义( d o c u m e n t t y p ed e f i n i t i o n ,简称为 d t d ) q = 加以描述。现在,只需把d t d 看作是一本词汇表和某类文档的句法。这个 d t d 可与不同用户共享。对于其它领域也有其它的d t d ,用户还可以创建自己的 d t d 7 1 。 x m l 定义了一套元句法,与特定领域有关的标记语言都必须遵守。如果一个应 用程序可以理解这一元句法,那么它也就自动地能够理解所有的由此元语言建立起来 的语言。浏览器不必事先了解多种不同的标记语言使用的每个标记。事实上,浏览器 在读入文档或是它的d t d 时才了解了给定文档使用的标记。关于如何显示这些标记 内容的详细指令是附加在文档上的样式单提供的。 有了x m l 就意味着不必等待浏览器的开发商来满足用户的需要了。用户可以创 建自己需要的标记,当需要时,告诉浏览器如何显示这些标记就可以了i 羽。 2 1 2x m l 应用于数据交换的优点 x m l 应用于数据交换有很多的优点,现总结如下f 2 j : 1 ) x m l 具有内容和形式分离,良好的可扩展性,良好的跨平台移植性和良好的自描 述性等优点。 2 ) 对结构良好的表示能力:在进行数据交换时,由于源数据和目标数据在结构上可 能存在差异,并且如果具有多个数据来源时,不同的数据源可能是由不同的数据 模式构成。即使对同种模式的数据来说,也存在数据结构和表现形式上的差异。 例如,源数据可能由多个关系型数据库构成。另外,对同一现实世界对象来说, 在不同数据库中的概念模式也不一样。这些结构上的差异也会导致数据交换中的 困难。因而,在实际交换过程中,首先必须将数据模式进行统一,将异构的数据 模式统一为一个公共的、一致的数据模式。x m l 具有灵活的数据结构的表示能力。 利用x m l 建立一个异构数据的统一模式,使得用户在进行数据交换时,只需要 将一个由x m l 描述的模式转换成目标模式即可。这样,利用x m l 作为中间模式, 就减少了不同模式之间进行转换的工作量。 3 ) 对数据的表示能力:x m l 文档从本质上来讲是一种树形结构。x m l 由嵌套的带 有标屺的元素构成,每个元素实际上为树中的一个结点。对x m l 文档中的某个 元素来说。可以存在若干属性,属性可以用来描述元素的相关信息。可以通过对 树的遍历来获取整个x m l 文档所包含的数据,也可方便的查找某一个或几个指 定节点。 对语义的表示能力:对一种数据类型,可以用属性对其进行多方面的描述。如名 称、数据类型、单位、格式等,所以x m l 可通过增加元素的属性来加强数据的 语义表示能力。 5 ) 异构应用间的数掘共享:x m l 的灵活,扩展性以及自我描述等特性,使异构应用 间的数据共享成为可能。 不同来源数据集成:x m l 能够将不同来源的结构化数据结合在起,在中间层的 服务器上,对从后端数据库和其它应用程序来的数据进行集成。 2 2a g e n t 相关介绍 a g e n t 的概念源自人工智能( a j :a r t i f i c i a li n t e l l i g e n c e ) 学科。a g e n t 思想的诞生最 早可追溯到在2 0 世纪5 0 年代j o h nm c c a r t h y 提出的“t h e a d v i c et a k e r ”系统。该系 统具有较强的目标性,系统的各实体具有独立的感知、决策和行为模块,实体间用人 类的术语进行交流。该系统具有了a g e n t 系统的初步模型。早期的a j 研究主要基于 物理符号假设的思想,它的主题是智能任务可以通过对问题的符号化内部表示进行操 作的推理过程来完成,推理过程及内部表示构成了主体的最初轮廓。随着硬件水平的 提高和计算机科学理论的进一步完善,主体的能力不断加强,能模拟人越来越多的思 维和行为。自7 0 年代后期以来,随着计算机网络、计算机通信和并行程序设计技术 的发展,分布式人工智能的研究逐渐成为一个新的研究热点。随着新的基于计算机的 信息系统、决策系统和知识系统在规模、范围和复杂程度上的增加,可以克服原有专 家系统,学习系统等的弱点,极大地提高知识系统的性能,分布式人工智能的开发与 应用越来越成为这些系统成功的关键。2 0 世纪9 0 年代以来,a g e n t 技术得到了迅速 的发展,现在已经成为信息技术领域研究的热点。随着网络技术和分布式技术的发展, 多个应用程序相互作用的模式正从单一的集成式系统向分布式系统演化【9 】。 2 2 1 什么是a g e n t 英文a g e n t 的意思是“代理”,也可翻译为“主体”或“智能主体”。由于a g e n t 技术领域的迅速发展,出现了各种各样的“a g e n t ”,a g e n t 概念的内涵和外延非常广泛, 对于这个j 口j 题答案目前还有很多争议i l 。 软件a g e n t 的研究者对a g e n t 进行了如下定义:智能软件a g e n t 是能为用户执行 特定的任务,具有一定程度的智能以允许自 执行部分任务并以一种合适的方式与环 境相互作川的软件程序【3 j 。 对于a g e n t 的特性,一般从a g e n t 的定义中可以看出它的一些基本特性f 1 1 】: 自治一n :a g e n t 对自己的动作行为和内部状态有绝对的控制权,不直接由外界的人 或者其他a g e n t 的控制。这一特性将a g e n t0 程序和对象划清了界限。它不同f 普通 程序那样外界控制e 执行,也丌;同于对象那样用内部定义的方法来由外部调刚。 反应性:a g e n t 能感知周围的环境和其它a g e n t 的动作,并能够即时进行响嘘,通 过其行为来改变环境。 社会性:a g e n t 可以通过某种a g e n t 通讯语言与其它a g e n t 进行信息交互。 主动性:a g e n t 控制自己的行为,不仅是简单的被动行为,而且具有预动行为,即 其能根据当前的环境和发生的事件等情况,决定采取什么行动。a g e n t 的这种行为是自 发的,进行以目标为导向的活动。这是a g e n t 区别于普通软件程序的基本属性。 图2 1 软件a g e n t 的主要分类 如同我们对a g e n t 的定义一样,我们现在对a g e n t 的分类也没有一个统一的标准, 各个领域的研究者都把具有某些a g e n t 属性的研究对象称为某类a g e n t 。因此,为明确 这些a g e n t 的具体含义,必须根据a g e n t 的不同功能和特性对a g e n t 进行分类。 根据a g e n t 的工作环境可将其分为软件a g e n t 、硬件a g e n t 和人工生命a g e n t ,这 是对a g e m 的最一般的分类。图2 1 是软件a g e n t 的主要分类1 1 2 j 。 本文主要研究移动a g e n t ,下面主要介绍移动a g e n t 。 2 2 2 移动a g e n t 简介 大多数的网络应用基本上是基于静态主机之间同步或异步消息传递的远程过程调 用( p r q 模式,网络上传递的主要是不能运行的消息,丽可执行的程序仍然驻留在主机 上,用户只能使用服务器上已经预先设定好的服务。整个信息处理过程是被动的,不 能根据用户的需求动念变化。所以如何及时、有效地收集、整理和分析网络上的信息, 有效利用这些资源,逐渐成为人们日益关注的问题【1 2 】。 简单地说,移动a g e n t 是一个能在异构网络中自主地宫一台主机迁移到另一台主 机,并可与其他a g e n t 或资源交互的程序,实际上它是a g e n t 技术i 分布式计算技术 的结合体。传统的r p c 客户和服务器间的交互需要连续的通信支持,而移动a g e n t 可 以迁移到服务器上,t j 之进行本地高速通信,这种本地通信不再占川网络资源。 我们丁以给出移幼a g e n t 的定义:移动a g e n t 是一独立计算机程序,它可以携带 其代码和状态,自主地在异构的阳络上,按照一定的规程移动,寻找合适的计算资源、 信息资源或软件资源利用与这峰资源同处一台主机或网络的优势处理或使j 日这些 资源,代辰用户完成特定的任务。其基本特性是自主性和移动性,l e 根本目标是减少 7 网络传输和实现异步交互【1 3 j 。 移动a g e n t 迁移的内容既包括其代码也包括其运行状态,运行状态可分为执行状 态和数据状态,执行状态主要指移动a g e n t 当前运行时状态,数掘状态主要指与移动 a g e n t 运行有关的数据堆的内容。 移动a g e n t 不同于远程执行,移动a g e n t 能够不断地从一个网络位置移动到另一 个位置,能够根据自己的选择进行移动。移动a g e n t 不同于进程迁移,一般来说进程 迁移系统不允许进程选择什么时候和迁移到哪里,而移动a g e n t 带有状态,所以可根 据应用的需要在任意时刻移动,可移动到它想去的任何地方。移动a g e n t 也不同于 a p p l e t ,a p p l e t 只能从服务器向客户单方向移动,而移动a g e n t 可以在客户和服务器之 间双向移动。 移动a g e n t 具有很多优点:移动a g e n t 技术通过将服务请求a g e n t 动态地移到服 务器端执行,使得此a g e n t 较少依赖网络传输这一中间环节而直接面对要访问的服务 器资源,从而避免了大量数据的网络传送,降低了系统对网络带宽的依赖。移动a g e n t 不需要统一的调度,由用户创建的a g e n t 可以异步地在不同节点上运行,待任务完成 后再将结果传送给用户。为了完成某项任务,用户可以创建多个a g e n t ,同时在一个或 若干个节点上运行,形成并行求解的能力【1 4 1 。 2 2 3 移动a g e n t 的技术特征 移动a g e n t 是一种特殊的a g e n t ,它除了拥有a g e n t 的基本属性之外,移动性是其 最重要的特点。移动a g e n t 的基本特征是能够在异构的网络节点间移动,并通过与服 务设施和其他a g e n t 协商获取、提供服务来完成全局目标。其主要的技术特征有以下 几点f 1 5 】: 1 ) 移动计算:移动a g e n t 可以在异构网络和分布式计算环境中自主迁移,携带信息或 寻找适当的信息资源,将交互与信息处理转移到具有很强处理能力和安全性的主机 上执行,代理用户完成信息奁询、数据交换等多种任务。 2 ) 异步计算:传统的客户朋匣务器系统一般基于同步方式,移动a g e n t 可以支持异构 计算机软件、硬件环境,用户可以自己刨建a g e n t ,异步地与其他网络节点上的 a g e n t 交互,完成任务后携带结果返回创建者。 3 ) 资源优化:传送大量的原始信息不但费时还容易阻塞网络,如果将a g e n t 移动到信 息存储的地方进行信息处理,会大大减少远程计算机网络的连接费用。同时,在网 络资源使用方面,移动a g e n t 减少了网络连接耗费的带宽,智能化路由避免资源访 问的盲目性。 4 ) 分布和并行任务求解:移动a g e n t 提供r 个独特的分布计算体系结构,为完成某 项任务,用户可以创建多个a g e n t ,将它们同时在相同或不同的节点上运行,利用 它们的并行性、移动性和信,0 ,处理能方使小系统具有处理大规模 e 确定性仃务的能 力。 5 ) 智能化路由:移动a g e n t 可以根据目标,网络通讯能力和服务器负载等因素,动态 地规划下一步操作,实现网络资源优化和负载平衡,提高问题求解速度。 总的来说,移动a g e n t 具有动态执行、移动计算、异步计算、并行计算和智能化 路由等技术特点,能够解决传统的c s 计算模式无法解决的问题。它能够在一个单一 的通用程序框架结构下,有效地、健壮地实现大规模的分布式应用。 2 3 异构数据交换技术的相关介绍 2 3 1 数据交换的概念 数据交换是指通过使用特殊的设备如磁盘、网络等媒介在不同的硬件平台、操作 系统、应用软件之间的数据移动过程。数据交换是实现数据共享的一种技术,因此通 过数据交换,实现各系统间的数据共享、互联互通、业务协同是解决目前“信息孤岛” 现象的关键途径,这也是本文研究的主要内容之一 1 6 l 。 t 2 3 2 数据交换的必要性 随着计算机技术的发展,在现代企业信息化的发展过程中积累了大量数据,而且 为了存储和管理这些数据,企业投入了大量的资金及人力,然而,由于实施数据管理 系统的阶段性、技术性,以及应用系统的不断升级等其它经济和人为因素的影响,以 至即使在一个单位或一个企业内采用的数据管理系统也大不相同,从简单的文件数据 库到复杂的网络数据库,日益积累它们构成了庞大的异构数据源。尽管这些数据管理 系统能够满足数据存储和管理要求,但是在许多情况下,为完成一项工作可能需要访 问分布在网络上不同位置的多个管理系统中的数据。同时网络的发展使单一数据源逐 渐从一个孤立节点发展成为不断与网络交换信息或进行商务交易的实体,所需要的数 据也从企业内部走向了企业间。现在面对此种情况我们比以往任何时候都需要将数据 进行发布和交换,以满足信息交流的需求。然而这必然导致越来越多的应用需要访问 分布在不同位置的各种异构数据源,因此数据交换的出现为解决此问题提供了有力的 技术支持【1 6 j 。 2 3 3 数据交换要解决的问题 在现代企业中,为了实现办公自动化,再部门根据自身的需求,基于各种技术和数 据库平台先后建立起了满足自己需要的办公自动化系统,但是各个系统之间不能有效 地实现信息共享和交互,形成了“信息孤岛”现象。针对此种情况,可以采用数据交 换平台实现数据集成,最终实现在企业内部数据的共享,达到办公真正的自动化。异 构数据源集成是数据库领域的经典问题,并随着x m l 技术的兴起再次成为了改领域研 究的一个热点。在实现异构数掘源的集成时,存在着一系列关键的技术问题,以下分 别进行概述1 1 7 】: 1 1 异构性:异构性是数据集成必须面临的首要问题,其主要表现在两个方面:系统异 构,数据源所依赖的应用系统、数据库管理系统乃至操作系统之间的不同构成了系 统异构;模式异构,数据源在存储模式上的不同。可能是结构化的,也可能是非结 构化的。需要注意的是,即便对最常用的结构化模式,它们的模式结构可能也存在 着差异。例如o r a c l e 所采用的数据类型与s q ls e r v e r 所采用的数据类型并不是完 全一致的。 2 ) 完整性:异构数掘源数据集成的目的是为应用提供统一的访问支持。为满足各种应 用处理数据的条件,集成后的数据必须保证一定的完整性,包括数据完整性和约束 完整性两个方面:数据完整性是指完整提取数据本身,一般来说,这一点较容易达 到;约束完整性,约束是指数据与数据之间的关联关系,是唯一表征数据间逻辑的 特征。保证约束的完整性是良好的数据发布和交换的前提,可以方便数据处理过程, 提高效率。 3 1 语义冲突:信息资源之间存在着语义上的区别。这些语义上的不同可能引起各种矛 盾,从简单的命名语义冲突,到复杂的结构语义冲突。语义冲突会带来数据集成结 构的冗余,干扰数据的正确处理、发布和交换。因此如何尽量减少语义冲突也是异 构数据源数据集成的一个研究热点。 钔数据冗余:数据冗余是指对于同一个客观事物在数据库中存在两个或两个以上完全 相同的描述。由于应用系统没有从总体上规划设计,几乎所有应用系统中都存在数 据的重复和信息的冗余现象,但是有时适当的保留点冗余对提高系统效率有好处, 特别是在分布式状态下,可以减少网上的传输时间。 5 、不一致性:不一致性是指多个应用系统之间由于数据的重复或冗余,在实际使用过 程中,必然造成数据信息更新的不同步,特别是在分布式状态下会造成数据的不一 致性。 6 1 数据不完整性:由于实际系统设计时存在的缺陷,以及其使用过程中人为因素所造 成的影响,可能出现有些数据属性的值丢失或不确定的情况,还可能缺少必需的数 据而造成数据不完整。 乃权限瓶颈:由于异构数据源的分布性,数据库资源可能归属不同的单位,所以如何 在访问异构数据源数据基础上原有数据库的权限不被侵犯,实现对原有数据源访问 权限的隔离和控制,就成为连接异构数据资源库必须解决的问题。 趵集成内容限定:多个异构数掘源之间的数据集成有时候并不是要将所有的数据进行 集成,那么如何定义要集成的范围,就构成了数据集成内容的限定问题。 2 3 4 数据进行交换的标准 在当今,信息技术是基于标准的,如果没有标准,那就很难进行通信。标准就是一 种工具,通过它给比特流和字节指定准确含义使通信畅通。 对任意应用系统1 n j 言,它不可避免地需要根据多个交换描述标准提供数据接口, 1 0 而且应当为潜在的交换描述标杆 :预留接口。因为随着应用系统的升级或者自动化程度 的提高,数据的一次转换流程将不局限于一个交换描述标准,在很多情况下需要涉及 两个或多个交换描述标准,而且所有通过数据界面获得的数据必须保存入数捌库以便 应用程序进行处理。若为每两个存储格式构建转换应用,是一项非常复杂的工作。 作为企业办公自动化系统之间数据交换的中间格式标准,最基本的一条就是通用 性,也就是使用该系统的企业能够识别这种中间格式,并能够转化为与本企业相适应 的数据格式,完成一次简单的数据交换,以满足自己的需求。随着x m l 技术的兴起, 以及x m l 所具有的优越性,可以把x m l 文件作为数据交换的标准,即把所有的非 x m l 格式的要用于交换的信息转换成x m l 格式,用它作为中间数据格式,需要交换 数据的企业可以通过某种媒介获取x m l 格式的信息,然后转化成自己能够识别的信 息,这样就完成了一次数据交换。有两种方式可以实现数据交换:一是数据交换对企 业来说是不可见的,完全在后台运行,企业只要给出自己所需要的数据格式,经过数 据交换系统到达企业最终的数据格式正是企业所需要的格式。另种方式就是数据交 换系统只负责将接收到的数据转换成x m l 的中间格式,然后企业在用户端安装相应的 软件能够将己经转换成的x m l 的中间格式的数据转换成自己所需要的数据格式,这样 来完成数据交换。同时有的行业只需要一个x m l 的子集就可以达到数据交换的要求, 可以对x m l 进行改造,使得它能够更好的适应特定的行业标准。 本文采用x m l 作为数据交换的中间格式。目前针对异构数据源也有把x m l 作为 中间格式的,但这种技术在安全性、稳定性以及可靠性等方面还没得到有效的研究, 因此并不妨碍我们将x m l 用于异构数据源问进行数据交换。首先我们可以通过参考国 内外的一些数据交换标准,然后对各个部门的业务模式进行归纳总结,从中抽象出基 于x m l 的数据交换模型,即定义自己的数据交换的信息格式与各个部门的一股元素规 范以及业务过程规范,然后就可以结合已经制定好的数据交换模型开发相应的数据交 换接口。对于与其它部门之间的数据交换,我们同样通过与不同的部门进行协商,然 后对自己的生成的和收到的x m l 信息进行适当变换,使其符合对方的数据交换标准, 或对方进行适当变换,使其能够解释自己的x m l 信息,当制定出相关标准时,我们就 可以对x m l 信息进行统一变换,使它符合行业标准。同时,可以采取面向对象技术以 及设计接口等,使得当以后数掘交换系统升级时对软件所做修改的范围达到最小1 1 7 l 。 2 3 5 异构数据交换的过程 本文在异构数据源间进行数据交换的过程主要包括两大步: 1 ) 各类异构数引库与x m l 的转化,即转换机制。 2 ) 利用移动a g e n t 调用机制,传递数捌实现转换过程。 不同的数据库之m 的信息交换,一直都是依靠o d b c 这类的应异j 程序。但是我们希 望能像今天通过浏览撂上网这辅,轻松的,通过浏览器的操作来完成不同的数教一:库之间 信息数捌的交换。币l 备个数据庳。之间,跨地区的数据交换,要遵j :f j 二定的行业标准, 现在这个标准可以采用x m l 。那么不同的数鼠,:库之间以l 为交换卡,j 、准结合移动a g e n t 的交换原理如图2 2 所示。 图2 2 基于x m l 和移动a g e n t 的异构数据转换过程 其中涉及的数据库的特定数据源和x m l 之间的转换问题,即我们说的转换机制由 a g e n t 来解决。a g e n t 一方面要把数据库的数据转换成x m l 文档,将其在网络上传输, 另一方面,也要能从i n t e m e t 上接收x m l 数据,并转换成数据库文件。 第三章异构数据交换和共享技术中x m l 的应用 目前,不同的系统使用的数据的结构和类型是不同的,如何让异构的数据兼容,可 以使用和访问彼此,一直是人们关注的焦点。所以,各种数据的交换和相互的转化是 不可避免的。如图3 1 所示。 3 1x m l 与异构数据 图3 1 异构数据的相互转化 x m l 和数据库提供了相似的数据查询操纵能力,只是它们实现这些功能在方法和 完整性上有些不同。x m l 和数据库技术管理数据都采用了层次结构、父子关系的概 念。x m l 能管理非常复杂、层次深的关系,丽关系数据库处理复杂关系的能力比较 差【1 8 1 。 x m l 和数据库技术都提供了查询和操纵数据的能力。数据库通过唯一的内部模 式和查询语言使得它们在执行查询和操纵数据时效率很高。x m l 通过内部或外部的 d t d 或s c h e m a 、命名空间定义、x q u e r y 查询语言等,为设计开发者设计文档提供了 巨大的灵活性,为了满足设计的灵活性,x m l 采用了开放语言和应用程序接口( a p d 来支持这种灵活性,如文档对象模型( d o m ) 等。 x m l 通过d t d 或s c h e m a 定义数据提供了简单的半结构化砚图。数据重新组织 必须对d t d 或s c h e m a 作相应的修改,而数掘库管理系统可以容易地修改数据库结构。 x m l 文档是文奉格式的简单文本,因此它与特定的平台和应川软件无关。数据 库管理系统用内部特侏的格式来俘储数据。数据库管理系统必须在 :定的计算平台和 应用软伺f 操作1 。 x m l 不受任何足档结构限制。它能表示成设计者爆望的任阿纪构。而数据库必 须满足犏定的数g , i b l 结构。虽然i 厨者存在不同点,它们处理的数据址相同的。两者分 别用自己的方法来管理和操作数据。由于x m l 体现出的巨大价值,许多数据j 乍厂商 已经将x m l 资源和j 向能集成到他们的产品中去。一个基本的功能便是提供一个x m l 翻译器,将特定的数据库格式的数据翻译成x m l 文档,这使得数据库管理系统能够 满足大量的基于w e b 的应用,当然,通过x m l 来实现的。如图3 2 所示。 图3 2x m l 做为异构数据的中间转化格式 我们将信息从源数据转换到目标数据的目的是要在目标数据中“再现”源数据中 的信息,这里的信息是指信息的内容和结构。信息的内容是构成信息的最小基本单位, 比如对象的属性、关系表中的字段,信息的结构是信息的构成形式,信息内容和信息 结构结合在一起才构成具有完整意义的信息,在信息的转移过程中,只要保证信息内 容及结构的完整转移,就能保证信息的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论