(计算机应用技术专业论文)基于web+services的数据整合系统的研究.pdf_第1页
(计算机应用技术专业论文)基于web+services的数据整合系统的研究.pdf_第2页
(计算机应用技术专业论文)基于web+services的数据整合系统的研究.pdf_第3页
(计算机应用技术专业论文)基于web+services的数据整合系统的研究.pdf_第4页
(计算机应用技术专业论文)基于web+services的数据整合系统的研究.pdf_第5页
已阅读5页,还剩72页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 数据整合是影响电子政务发展的主要因素之一。它的目标是在异构环境( 松 散耦合、数据格式不同、跨平台、跨地域的分布环境) 中实现数据的共享,从而 有效地利用资源,提高整个电子政务系统的性能,加快系统之间的数据流通, 实现数据的共享和集成。 在数据整合方法上,最初采用无数据复制的模式集成方法,通过构建全局 数据模式,将多个数据库节点映射为一个全局数据库。一些数据集成系统为了 提高查询处理的效率,采用数据复制方法。最近,开始倾向于采用松散藕合方 式的p 2 p 数据集成方法。结合w e bs e r v i c e s 技术和模式集成的相关理论,提出 了基于w 曲s e r v i c e s 的数据整合方法。 本文对x m l 和w 曲s e r v i c e s 等相关技术进行了深入的研究,分析了x m l 数据的数据表示与数据转换,给出了x m l 与h t m l ,w o r d 以及关系数据之间 的格式转换方法,通过对模式集成的分析,提出了一个基于w e bs e r v i c e s 的数 据整合方法,介绍了该方法的体系结构和各模块的功能等重点问题,并详细阐 述了数据复制接口、x m l 文档属性封装和解析等模块的设计和实现,最后针对 系统实现中的相关关键技术问题给出了解决方案。 关键词:w e bs e r v i c e s ,数据整合,模式集成,x m l a b s l m c t a b s t r a c t d a t ah a r m o n i z a t i o ni so n eo ft h em a i nf a c t o r s 也a ti n f l u e n c et h ed e v e l o p m e n to f e - g o v e r n m e n t i t sg o a li st or e a l i z et h es h a r i n go ft h ed a t ai nt h eh e t e r o g e n e o u s e n v i r o n m e n t ( 1 0 0 s ec o u p l i n g ,d i f f e r e n t d a t a f o r m a t s ,h e t e r o g e n e o u sp l a t f o r m , h e t e r o g e n e o u sa r e a , a n ds oo n ) ,s oa st ou t i l i z er e s o u r c e se f f e c t i v e l y , i m p r o v et h e p e r f o r m a n c eo ft h ew h o l ee g o v e r n m e n ta p p l i c a t i o n ,a c c e l e r a t ed a t ac i r c u l a t i o n a m o n gs y s t e m s ,a n dr e a l i z et h es h a r i n ga n di n t e g r a t i o no f t h ed a t a s c h e m ai n t e g r a t i o nm e t h o d ,w h i c hh a sn od a t ar e p l i c a t i o n ,i so r i g i n a l l yu s e di n d a t ah a r m o n i z a t i o n b yu s i n g 西o b a ld a t as c h e m a ,m u l t i - d a t a b a s en o d e sr r em a p p e d i n t oo n ev i r t u a ld a t a b a s ei nt h i sm e t h o d t oi m p r o v et h ee f f i c i e n c yo fq u e r y p r o c e s s i n g ,d a t ar e p l i c a t i o nm e t h o di s u s e di ns o m ed a t ai n t e g r a t i o n s y s t e m s r e c e n t l y , p 2 pd a t ai n t e g r a t i o nm e t h o dh a sb e e np o p u l a ri nb u i l d i n gl o o s e c o u p l e i n t e g r a t i o ns y s t e m s c o m b i n i n gw e bs e r v i c e st e c h n o l o g yw i t hs c h e m ai n t e g r a t i o n r e l a t e dt h e o r i e s ,ad a t ah a r m o n i z a t i o nm o d e lb a s e do nw e bs e r v i c e st e c h n o l o g yi s p r e s e n t e di nt h i sp a p e l x m l ,w e bs e r v i c e sa n dr e l a t e dt e c h n o l o g ya r er e s e a r c h e di nd e p t h x m ld a t a p r e s e n t a t i o na n dd a t at r a n s l a t i o na l ea n a l y z e d t h em e t h o do ft r a n s l a t i o nb e t w e e n x m la n dh t m l ,w o r dd o c u m e n ta n dr e l a t i o nd a t aa r ep r e s e n t e d b a s e do nt h e a n a l y s i so fs c h e m ai n t e g r a t i o n ,aw e bs e r v i c e s b a s e dd a t ah a r m o n i z a t i o nm e t h o di s d e s i g n e d a r c h i t e c t u r e ,w o r k i n gp r o c e s sa n dm o d u l ef u n c t i o no ft h em e t h o da r e i n t r o d u c e d ;t h ed e s i g na n dr e a l i z a t i o no fk e ym o d u l e ,s u c ha se n c a p s u l a t i o na n d p a r s i n go fx m ld o c u m e n ta n di n t e r f a c eo fd a t ar e p u t a t i o na r ea n a l y z e d f i n a l l y , s o m ek e yt e c h n i q u e si nt h er e a l i z a t i o na r ed i s c u s s e d k e yw o r d s :w e bs e r v i c e s ,d a t ah a r m o n i z a t i o n ,s c h e m ai n t e g r a t i o n ,x m l 独创性声明 本人声明所呈交的论文是我个人在导师指导下进行的研究 工作及取得的研究成果。尽我所知,除了文中特别加以标注和致 谢的地方外,论文中不包含其他人已经发表或撰写过的研究成 果,也不包含为获得石家庄铁道学院或其它教育机构的学位或证 书而使用过的材料。与我一同工作的同志对本研究所做的任何贡 献均已在论文中作了明确的说明并表示了谢意。 签 名:喜蹲日 期:j 猛址p 关于论文使用授权的说明 本人完全了解石家庄铁道学院有关保留、使用学位论文的规 定,即:学院有权保留送交论文的复印件,允许论文被查阅和借 阅;学校可以公布论文的全部或部分内容,可以采用影印、缩印 或其他复制手段保存论文。 ( 保密的论文在解密后应遵守此规定) 签 名:二啦导师签名:趱 日 期:! i 兰:王。 第一章绪论 1 1 课题的背景 第一章绪论 2 0 世纪9 0 年代信息技术的迅猛发展,特别是互联网技术的普及应用,使电 子政务的发展成为当代信息化的最重要的领域之一。电子政务的发展之所以受 到世界各国政治家的重视,一方面是因为政府是全社会中最大的信息拥有者和 处理者、最大的信息技术的使用者,有效地利用信息技术,可以极大地提高政 府业务的有效性、效率和劳动生产率,建立一个更加勤政、廉政、精简和竞争 力的政府;另一方面也是因为信息技术确实向各级政府提供了一个极好的机会 来建立一个能够更好地为居民和企业服务的政府,能够使人民更好地参与各项 决策活动的政府,从而在整体上促进全社会政治、经济和社会的进步。 随着改革开放和社会主义现代化建设的进一步推进,我国电予政务建设己 经起步。2 0 世纪9 0 年代初以来,国务院有关部门相继建设了一批业务系统,“金 关”和“金税”工程取得显著成效,办公自动化、政务信息化取得了较大成绩。 目前我国的电子政务系统也正在中共中央办公厅提出的“三网一库”基本构架 下快速发展。所谓“三网一库”即指政府机构的办公业务内网、办公业务外网、 公众信息互联网、办公业务信息资源数据库,其建设目的是实现各级政府之间、 各个省市之间、以及政府与公众之间的信息交流和共享,最终的目标是提高政 府办公效率、改变政府工作方式、重塑政府职能。可以说,能否有效地实现数 据交换和资源共享是一个电子政务系统成败的关键所在。 在建筑行业方面,随着国家整顿和规范建筑市场,强化政府监督执法部门 监管手段的深入以及电子政务建设力度的加大,建设部提出大力推进建设领域 信息技术的研究开发与推广应用,用信息技术等高新技术改造和提升传统的建 筑行业,并颁布了全国建筑市场监督管理信息系统技术实施方案,目标主要 是初步建立建筑市场监督管理信息系统,实现对工程项目建设流程中的招标投 标、施工许可、工程监理、质量安全监督、竣工验收备案等环节及其有关企业 和专业技术人员的监管查询、统计报表等功能,并在此成果的基础上对系统进 行进一步的完善和深化,实现对工程项目建设流程全部环节以及相关的企业和 第一章缝论 专业技术人员的监管,通过数据挖掘等技术手段,建藏建筑市场决策支持系统、 监篱预警报警系统等,并实现全国范围的建筑市场监瞥。 姿兹,我鬻黢庭缓织续橡是条块分割瓣二缍模式,瑟缀囊鬣缀麓襄横囱职 熊制的矩阵结构。纵向层级制的行政组织系统由中央、省( 直辖市) 、市( 地区) 、 县( 市) 、乡( 区) 镩构成,每一下级层次对上一层负责。除最高屡舛,每一层次以 媳域行政单位,燃分为若干擞块。层次越低块数越多,屡次越高块数越少,整 个系统形成一个鑫字塔状。横向职辘锎熬维织结耱壅备逢方致府静若于部门构 成,部门之间一般没有制约关系,各个部门均直接对管理对象实施管理,行使 不同、单一和专门管理职能,、使得每个郝门在全国范围内均构成一个相对独立 瓣系统,在系绕蠹帮实薤羹塞矮导。长麓叛来,这耪条块模式虽然绦涯了孛央 政令畅通,但怒在数据管醺方面造成了部门的隔阂,使得各级政府和职能部门 在数据信息的组织与管理方灏不得不面对日益凸现的诸多矛盾与困难。例_ 如; 数攥管理的封翊、无序、混繇、信息资源数字他共享程发低以及现糍o a 系统誉 易整合等。许多部门在信惑化建设过程巾,都有一套翻已的数蘩瘁系绕i 其他 部门根本不知道这一部门脊哪些数据信息,即使知道r 也无法利用,从而造成 了“信息孤岛”现象,使褥数据格式不统一、管理不规范、重复建设、难以进 行傣悫载汇总,不缝对致舞瓣决蓑分接鬟供有效黎蘩。 因此,在建电子政务建设过程中,如何消除“信息孤岛”,整裔政府部门现 脊的数据资源,管理和保护这些宝贵的信息数据,并保证这些信息数据完整性、 撩确性、实对投秘可访运搜,最终建立决策支持系绞,是电子政努建设雏核心 闷趣。 本课题来源于河北省建设工程招投标管理办公室的“河北省建设工程招投 标交易管理系统”项目,系统涉及到河北卷内省、市、县三级的建设工程招投 探簸警警理部门,露这些帮秘原来都有备鑫豹鼗务模式,这些蠢豹盈务系统 的开发平台、操作系统、后螽数据库等都可能是异构的,例如有基乎s q l s e r v e r 数据库的,有熬予s y b a s e 数据库的。因此系统的数据库群包括省招投标管理办 公嶷戆数据瘁、枣级数摆露秘甚数据痒。系统踺数豢熬谚逮霹戆褒这些吴震、 拜构的数据库间进行,铡如对各市的裙投标情况的套询和统计以及工程的分布 情况。由以上可以看出数据熬合在电子政务系统中很黛要。本文主骚针对该内 容进行研究,设计并实现系绞的数据整会系统,在不酸环原有系统靛基础上, 遴避该系统来解决原骞静堑务系统闻熬数据异擒性游趱,跌覆真藏翘共享集袋 一2 一 第章绪论 数据,并保诞集成共享数据的安全性。 1 2 数据整合的国内外研究现状和进展 喜从2 0 世缴鬈攀掣我墩来,异梭多数据库系统蛊是数据麾领域熬一个主 要研究方向。进入2 9 i 谶绝粥一年代聪,由于诗冀梳瓣络技术的邋猛发震,对数 据库又有了新的要求:档种数据库中的信息不仅需黉在i n t e m e t 发布,而且火量 的应用需娶熊够同时访阀多个数据麾巾的数据。这样异构多数据库又一次成为 数据疼领域熬个研究熬熹。兔了辫决吴褥数据黪之阉静至联熬会运嚣,溺嚣 化标准组织和各数据库厂家做了不懈的努力。目前,有以下几种比较常见的弊 构数据库憋合方法,下面将对它们的长处和不足进行分析比较。 2 。1 模式集成方法 模式集成是人们最早采用的数据糕合方法【i ,2 】,也是其它数据整合方法的基 础。其基本憋想是,在擒建系统时,将各数据源麸享韵数据视黧集成为全局模 式( g l o b a ls c h e m a ) ,供蹋户按照全局模式透露鹣谤秘各数器源瓣数据 3 1 。全麓模 式描述了数据源共享数据的结构、语义及操作等。用户直接在全局模式的基础 上提交请求,由数据蹙念系统处理这蝗请求,转换成各个数据源在本地数据视 图基疆土戆够撬孬瓣谤求。模式集成方法嚣特熹怒盏接建矮声掇供透臻豹数攥 访问方法,用户无需关心数据的位鬣、结构以及姆全局模式的映射方式。由于 用户使用的全局模式是数据源的虚拟视图,一些带者也把模式攥成方法称作虚 掇视图集成方法1 4 1 。 1 2 1 1 联邦数据库 联邦数据库是早期人们采用的一种模式集成方法。联邦数据库中数据源乏 溺共享塞己熬一部分数攒模式,形成个袋邦模式。联邦数摄黪系统按集戏度 可分为两类【4 】:采用紧密藕合联邦数据库系统和采孀松散耦合联邦数据库系绕。 紧密耦合联邦数据库系统使用统一的企局模式,将各数据源的数据模式映射剥 全局数据模式上,解决了数据源间的舜构性。这种方法集成度较高,用户参与 少;缺点楚橡建一令全熨数器模式戆算法复杂,扩麓往差。捡数藕合联邦数据 库系统比较特殊,没有龛局模式,采用联邦模式。该方法提供统一的查询语裔, 一3 一 第一章绪论 将很多异构性问题交给用户自己去解决。松散耦合方法对数据的熊成度不高, 假其数据源的自治性强、动态性能好,熊成系统不需袋维护一个全局模式。 。2 。 。2 率蠲俸羹或方法 中间件集成方法是另一种典型的模式集成方法,懈同样使用全局数据模式。 与联邦数据库不同,中间件系统不仅能够集成结构化的数据源信息,还可以集 袋半缍穆豫戴纂结耩能数攥瀑孛黪僖意,耍w e b 售惑。粒遽禳大学 o a r c i a - m o l i n a 等人在1 9 9 4 年开发了拘t s i m m i s 撩统,就是一个典型的中间 件集成系统。 基予孛隧 牟熬数据整会系统主要包播孛舞转秘镶装器,其孛每令数据嚣对 藏一个包装器,审瀚箨逶避包装器帮备个数螽源交嚣。用户在全满数据模式翡 熬础上向中间件发出查询请求。中间件处理用户请求,将其转换成各个数据源 姥够处理的子瓷询请求,并对此过程进行优化,以撼态蠢邂处理的并发性,减 少嫡盔簿藤。毽装器是辩特定鼗器嚣遴孬了封装,将其装摇模型转挟秀系统掰 采用的通用横趔,并提供致的访问机制。中间件将备个子查询请求发送给包 皱器,由包装器来和其封皴的数据源交甄,执行子粪询请求,并将结果返回给 中阕终。其体系缭擒翅嚣i - i 。 i 巍询 结果 茸* 醋 ti f = = = l 数撰麾l | 、。 隰1 - i 中间掌# 体系结构图 孛鬻簿注羹予全爨鲞诲鹣憝理窝谯德,囊对予联箨数据疼蓑统躯谯势在予: 五忡” 第一鬻绪论 它能够集成非数据库形式的数据源,商很好的查询性能,自治能强;中间件懿 藏翦获蠢萎予它逶鬻是更读静,磊联帮数据瘁薅读警都支稽。 1 2 1 3p e e r - t o - p e e r 数据整合方i 裘 p e e r - t o p e e r ( p 2 p ) 数掇攫会方法是农新兴的p 2 p 计掉技术的熬础上,对原肖 熬模式纂藏方法戆扩震。p 2 p 楚一穗蒸予藤等瓣终瀚粱梭,是嚣舞撬系统魏绩橡 从传统的集中式发展为松散耦合分布式的新模式。p 2 p 系统具有撇下的特征f 1 4 l : ( 1 ) 节点之间通过直接的变飘而实现资源共享;( 2 ) 资源分布在各个节点中,丽带 是巢孛在一个鼹务器串管毽;滞轰獒蒋凌态犍羁辩辩控;毯) 缝襻麓p 簦系统 没有任何集审控制梳裁,系统中各缭熹运行静p 2 p 燕统软件礁熊搪同,各终点 之间的交互对称。 在p 2 p 数掭整会方法巾,参与集成的备个数据滚带点分别放巍传端( p e e r ) , 每个蔫点露狱将垂邑酶一部分零逮数播攘式获射袋斑端共享模茂,彝其它节照 熬享自己的数据。纯粹的p 2 p 数据熬含方法没有全局数据模式,器节点可以畿 接通过p 2 p 映射使用其窀节点共享的数据模式,从而形成各节点之间对等的数 攥莛享与诱蠲糗鞠。p 2 p 数据整会方法爨液秀当裁数据集痰臻窕靛一个蒸煮。 1 2 2 数据篾制方法 数豢复裁方法将各个数豢源麴数据笈裂鬟与其樱关熬其它数攫滚上,势绦 护数据源整体土魏一致链、提毫售惠共事蘩零j 耀懿效率【| 瓣。数摄复麓胃戳蹩麓 个数据源的簸制,也可以魑仅对变化数据的传播岛艇制。数据楚制方法可以减 少用户使用数攒整合系统时对异掏数攒源鲍数据访闯爨,从面掇离系统的性能。 最鬻显费数撂复鬣方法蕊楚数据奁瘁方法。该方法将备拿鼗器源瓣数蠢复裁戮 数据仓库。用户则直接访问数据仓库获取数据。 数据复制方法可以从数据传输方式和数据复制触发方式来划分。 鼗蠢黄输方式是指数据在发毒数器豹添数摇滚释订羹数据浆嚣熬数据深越 瓣传输形式,霹分为数攒攘送裙数据拉取。数据捺遴是指源数攥滚主动将鼗撂 推送到目的数据源上。丽数据拉取则魑目的数据源越动向源数据源发出数据请 裳,扶源数搬源获取数搬剿本她。在宥些情况下,数据发毒端传送曼 数据订潮 端赫数蒺势不童接存褚裂譬戆数据源审,需要经避羧嚣订藤壤黪本逮纯处理, 避时通常采用缓存来协调数据发布端和数据订阅端的异步。在数据推送的方戏 5 蓁一霉缕论 下,数据缓存骤构建在数搬订阅端;而谯数据拉取的方式下,数据缓存则要构 建在数据发布端。 数据复铡舷发方式是攒集成系绞调瘸数攥复裁戆方式。集藏系绞逶鬻羲究 寇义了一些事件,这些事件可以包括:对数据发布端弓f 起的数据变化的某个操 作、数据发布端数据缓存累积到一定批擞、用户对巢个数据源发送访问请求、 凝蠢一定阀璃的时闻点等。警这些事件被触发时执弦襁应的数据复铡。困扰, 数据复麓触发方式按事律定义的不同霹潋分为:数据变化融发、瓶量簸发、客 户调用触发、定时触发等。 数据复制通常直接采用端到端方式,也有一些数据整合系统使用专为数据 瘸转驻务戆数攥平台。数摇复割薛,数据发毒者宠将数据簧送弱这拿数箨平台 上,由数据平台处理后转发给数据订阅者。数据平台豢处理好网络负担和并发 控制问题。使用数据平台的好处是单点控制、便于管理。但数据平台增加了系 统瓣复杂性,降低了系统豹霹靠性。 t 2 3 综合泌集成方法 以上两种数据整合方法备有优缺点及透用范围。模式集成方法为用户提供 了全局数据税灏及统一静访溺接嗣,透鞠度毒;毽该方法并没实税数据源溺豹 数据交互,用户查询时经常需要访问多个数据源,因此该方法需擞系统有很好 的网络性能。数据复制方法在用户使用某个数据源之前,将用户可能用到的其 窀数据澡瓣数攒瑗走复裁避来,焉户嫠援瓣汉曩谤瓣禁令数摆源鼓少量懿足令 数据源,这会大大提高系统处理用户请求的效率;但数据复制通常存在延时, 使用该方法时,很难保障数据源之间数据的实时致性。表1 - ! 列出了两种方法 蛉俊缺点的比较: 袭1 - 1 两种数据熬合方法豹他较 一6 一 第一常绪论 模式集成方法适用予被集成的系统规模大、数搬更新频繁、数据实时一致 健要求赛酌馈滚。当缀难羧溺蘑产懿焱诡霉求霹,氇逶舍采矮这秘方法。在搂 式集成方法中,人们通常采用中间件方法。由于联邦数据库在絮成时需要为繇 个数据源单独编写大量的通讯接口,因此现在单纯的联邦数据摩方法已很少被 采鼹。 数据复翻鲻适用于数据源相对稳定、用户查询模式已知或裔隈酶情况。獭 数据分布性比较广,网络延迟较大,同时又需要有很短的处理时间时,也可考 虑采用数据复制集成方法。有些应用场合需要对数据进行备份,这时通常采用 数据复镧方法;还有一骜璐含,遗予赣i 整往静考虑,数据苓灸谗复铡,这辩簸 黉使用模式集成方法了。为了突破两种方法的局限蚀,人们通常将这两种方法 混合使用,即所谓的综合方法。综合方法通常是想办法提高基予中间件系统的 魏裁,该方法爨有虚羧熬数据模式视瀚供用户搜廷,嚣辩毙够对数据源润鬻瘸 的数据进行爱锖。对于用户简单的访闯请求,综合方法总是尽力通过数据囊涮 方式,在本地数据源或单一数据源上窳现用户的访问需求;而对那些复杂的用 户请求,无法通过数据复制方式实现融,才使用虚拟视图方法。 1 3 课题研究的目标 摄据涎i 省箨投标煎餐管理豹总钵艘划,到强w e bs e r v i c e s 技零,硒究搽索 一套适合河j e 招投标监督管理的数据熬含与系统闯数据交换维! 错l 的核心技术。 实现数据交换框架,支持省招办内部秭应用系统之间以及与各地级市信息系统 之间的数据交换;广泛收祭并集成河北省建设工程摆投标监管备应用系统的数 据,集孛存储耱管瑾羡惑资源;建变绕一静鼗蠢橇强,实瑷不麓来滚数据全嚣 艇合,为各级管理决策提供数据支持。 1 4 论文的组织结构 本文主鼹研究基于w e bs e r v i c e s 猩电子政务系统中实现数据摧合的相关技 术。 本文共分必乇章。第二拳主要簌w e bs e r v i c e s 豹技术定义嚣始,寒奔绥w e b s e r v i c e s 的体系结构及关键技术。第三章介绍了x m l 的数据表永,重点分析了 一,一 第一章缝论 x m l 同其它数据之间的转换,给出了h t m l 、w o r d 、麓系数据库与x m l 的转 换方法。第四章介绍了模式集成的相关问题,分析了模式集成中的冲突,提出 了麓决戆嚣赠及方法。第五露营走慰嚣要熬会懿数豢散了详壤豹分撰,疆凄了 数撼整合的方案,并对方案的体系结构做了详细的介缁。第六章介绍了数据整 合系统涉及到的一些关键技术问题,给出了基于全局模式的查询的处理方法, 以及整会过程中大对象的处联。第七章是论文的总结。 一8 第= 章w e bs e r v i c e s 体系结构 第二章w e bs e r v i c o s 体系结构 w e bs e r v i c e s 是基于霹络豹、分毒式浆模块化缎佟。宅使趸x m l ( e x t e n s i b t e m a r k u pl a n g u a g e ) 并通过公共的因特两协议来和其他软俸交抉信息。w 幽 s e r v i c e s 通过网络来通信,提供一组特定的操作,而麒他的应用稷序能够调用遮 拨操作,使德驻留在某台计簿机上豹应用程序能够向其他计算机上的应用程序 发送请求势蠢霹憝褥蘩豌痰。w e bs e r v i c e s 可浚逶遵缀多因特弼楱泼交换蘧惠, 假大多是使用超文本传输协议( h r r p ) 。简言之,w 酏s e r v i c e s 是自描述的模块化 的业务应用程序,它们通过可编程接口经由i n t e r a c t 将业务逻辑发布为服务,弗 邋过i n t e r n e t 来粪我、订烫髑调蘧这些簸务。 2 1w e bs e r v i c e s 体系结构 w e bs e r v i c e s 俸系缝稳蓥子三秘蕉惫溅务提供卷、骧务洼魏孛心器羧务潺 求者) 之间的交亘。交互暴体涉及到发布、查找和绑怒操作。这些角色和操作一 越作用于w e bs e r v i c e 构件:w e bs e r v i c e 软件模块殿其描述。服务提供者定义 w e bs e r v i c e 瓣鬏务接述,弗把它发毒剩激务请求者竣摄务注浆串心。照务请求 港使用查找操作从本地或暇务注册中心搜索描述,然后使用服务攒述与服务撼 供者进行绑定,并调用相_ 暾的w e bs e r v i c e 实现,同它交互。图2 - l 展示了这娥 操作、提供这魃操作豹组伟以及它们之阕的交互。 嘲2 - 1w e bs e r v i o e $ 体系结构 一9 一 繁二牵w e bs e r v i c e s 体系结搦 w e bs e r v i c e 体系结构中的角色包括如下: 服务提供赣( s e r v i c ep r o v i d e r ) :从主体的角度看,这是服务的所有者。从体 系缝梅夔焦度瀑,这是瑟繁坡访闻鼹务豹乎台。黢务挺供考是遴避提供骚务接 翻使w e bs e r v i c e s 在网络上可用的一个服务器或系统。服务接口是种使其他疲 用程序能够对w e bs e r v i c e s 进行访问的软件组件。创建了服务接口之后,服务提 供者就向服务代理发布服务。 骚务请求赣( s e r v i c er e q u e s t o r ) :苁囊镩韵是度看,这是要求满怒特定功能的 客户。从体系缩构的角度肴,这是寻找并调用服务,戚启动与服务交互的应用 程序。服务请求者角色可以由浏览器来掇肖,由人或另外一个w e b s e r v i c e 来控 鬃宅。羧务蘧袋者是谚蠢秘毽霜w e bs e r v i c e s 豹一个联耀豹缀务器绫系统,它与 服务代理进行交互,以找到一个满足特定计算需要的w e bs e r v i c e s 。 服务注册中心( s e n r i c er e g i s t r y ) :这是可搜索的服务描述注册中心,是维护 w e bs e r v i c e s 瓣录或绩息交换始鲍一个联隧敕e 曩务器袋系统,服务掇供誊在炮发 布他们的服务撼述。在静态绑定开发域动态绑定执彳亍期间,服务请求者查我激 务并获得服务的绑定信息( 谯服务描述中) 。对于静态绑定的服务请求者,服务注 册中心是体系结构中的可选角色,因为服务提供者可以把描述壹接发送给服务 谤求者,弱释,l 瑟务请求蠢冒瑷获豢务淫趱孛心疆终簸萁恁来源褥爨鞭务接逡, 例如,本地文件、f t p 站点、w e b 站点铸。 2 。2w e bs e r v l c e s 懿关键技术 w e bs e r v i c e s 区别于其他类似的计算模型的部分原因在于w e bs e r v i c e s 使用 了x m l 和基于x m l 的标准,最常见的怒s o a p ( s i m p l eo b j e c t a c c e s sp r o t o c 0 1 ) 、 w s d l ( w e bs e r v i c ed e s c r i p t i o nl a n g u a g e ) 翻u d d i ( u n i v g r s a ld e s c r i p t i o n , d i s c o v e r ya n di n t e g r a t i o n ) 。这些技术使成用程序之间的通信能够以一种独立于特 定编程语言、搡作系统和硬件平台的方式进行。s o a p 提供了一种在应用程序 粒w e bs e r v i c e s 之闻进行逶绩的摄制;w s d l 提供了一耪是其镌援序撼述w e b s e r v i c e s 的统一的方法;谣u d d i 使创建w 搜索的w e bs e r v i c e s 注册中心戒先w 能。将这些技术组合在一越加以使用,便能够将应用程序包装成w e bs e r v i c e s 并在网络上发布。 一1 0 第二章w e bs e r v i c e s 体系结构 2 2 1x m l 由于2 0 世纪9 0 年代w e b 的普及率剧增,h t m l 开始明显暴露出其局限 性。虽然h t m l 本身是w e b 的一种公共格式,但h t m l 缺乏可扩展性。为了解 决这些问题,w 3 c 开发了x m l ( 可扩展标记语言) 。 x m l 由s g m l ( s t a n d a r dg e n e r a l i z e dm a r k u pl a n g u a g e ,标准通用标记语言) 发展而来,现已成为一种人们广泛接受的用于描述数据和创建标记语言的标准。 x m l 是一种开放的、标准的技术。它既具有可扩展性,又具有简单性。 数据独立性( 表示与内容相分离) 是x m l 的主要特征。由于x m l 文档只描 述数据,因此任何理解x m l 的应用程序( 不管其编程语言或平台如何) 都可以以 各种不同的方式对其格式化。讧l 文档包含数据,但不包含格式化指令,因此 处理x m l 文档的应用程序必须确定如何显示文档中的数据。例如,对于同一份 x m l 文档,一个p d a 所显示的结果可能会与一个无线电话或台式电脑所显示的 结果有所不同。 采用了订l 的应用程序将可以互相通信,只要它们能够互相理解对方的 帆标记。这种高级别的可互操作性使x m l 成为w e bs e r v i c e s 所需的一种理 想技术。w e bs e r v i c e s 能在各系统之间进行通信,且不论其操作系统和硬件平台 是否相同,w e bs e r v i c e s 的核心标准都是基于x m l 的。 2 2 2s o a p s o a p ( s i m p l eo b j e c t a c c e s sp r o t o c 0 1 ) 是用于实现w e bs e r v i c e s 的最常用的标 准之一。s o a p 的目的是为了使分布于网上的各个系统之间能够进行数据传输。 当一个应用程序与一个w e bs e r v i c e s 进行通信的时候,s o a p 消息是这两个系统 之间交换数据的最常用的方式。一个发送给w e bs e r v i c e s 的s o a p 消息会调用 此服务所提供的一个方法,也就是说该消息请求w e bs e r v i c e s 执行一个特定任 务。然后w e bs e r v i c e s 使用s o a p 消息中所包含的信息执行其功能;如有必要, w e bs e r v i c e s 还会通过另一个s o a p 消息返回结果。s o a p 被置于因特网协议( 如 h t t p ) 之上,能被用来在w e b 和其他网络上传输数据。使用h r r p 使w e b s e r v i c e s 可以穿越防火墙进行通信,因为大多数防火墙可以接受 丌r p 服务请求。 一个s o a p 消息包括三个主要部分:信封、头和主体。信封将整个消息包 装起来,它包含了头和主体元素;头是可选元素,提供安全和路由方面的信息。 第二章w e bs e r v i c e s 体系结构 s o a p 消息的主体包含被传递的特定于应用程序的数据。数据被标记成x m l , 并符合特定的格式,此格式是由d t d 或模式来定义的。这种格式编排使接收者 能够正确地对数据进行处理。 s o a p 消息是由s o a p 服务器接收并解释的,s o a p 服务器还触发w e b s e r v i c e s 执行其任务。s o a p 消息是一种特定类型的x m l 文档。s o a p 将数据封 装在消息中,传送给w e bs e r v i c e s 或者从w 曲s e r v i c e s 送出。 2 2 3w s d l 在因特网上发布的w e bs e r v i c e s 都有与之相关联的w s d l ( w e bs e r v i c e d e s c r i p t i o nl a n g u a g e ) 文档,其中包含描述该w e bs e r v i c e s 的一组定义( 标记成 x m l ) 。w s d l 文档规定了该服务的功能、服务在w e b 上的位置,以及一些有关 如何对服务进行访问的指令。w s d l 还定义了w e bs e r v i c e s 所发送和接收的消 息的结构,即指明了调用程序必须为w e bs e r v i c e s 提供的数据。通过使用这些 信息,那些正在搜寻所需w e bs e r v i c e s 的应用程序可以对几个差不多的服务的 w s d l 文件进行分析,从而在这些服务中作出选择。另外,w s d l 文件还提供 了特定的技术信息,使应用程序能够通过h t t p 或其他通信协议与w e bs e r v i c e s 建立连接并进行通信。 在发布w e bs e r v i c e s 的时候,w e bs e r v i c e s 管理员将一个指向w e bs e r v i c e s 的w s d l 文档的链接在一个x m l 注册中心或其他w s d l 知识库中公布出来。 于是当一个应用程序( 比如一个s o a p 客户) 搜索注册中心查找w e bs e r v i c e s 时, 这个w s d l 文件就是可用的了。客户访问包含于皿。注册中心中的w s d l 文 档,以获得有关该w e bs e r v i c e s 的信息,创建具有适当结构的s o a p 信息与该 w 曲s e r v i c e s 进行通信。然后,此客户通过使用w s d l 文档中的信息调用该w e b s e r v i c e s 。 2 2 4u d d u d d i ( u n i v e r s a ld e s c r i p t i o n ,d i s c o v e r ya n di n t e g r a t i o n ) ,通用描述、发现和集 成) 技术是s o a p 和w s d l 之外w 曲s e r v i c e s 中的另一项核心技术。u d d i 可使 提供服务的单位注册其信息,从而使潜在用户或合作伙伴能够发现这些单位的 服务和业务。同样,它可使该使用者发现其它单位,以便扩展潜在的业务伙伴 1 2 第二章w e bs e r v i c e s 体系结构 关系。 u d d i 可以实现为公共注册表,以支持全球范围的团体,也可实现为私有注 册表,以支持企业或团体。单位在私有中心中实施u d d i ,只有经过身份认证 的各方( 比如单位员工、合作伙伴) 才能访问私有注册中心。 2 3w e bs e r v i c o s 的通信模型 在w e bs e r v i c e s 体系结构中,根据功能要求的不同,可以实现基于r p c 异 步模型或基于消息交换的异步同步通信模型。 基于r p c 的通信模型定义基于请求响应的异步通信。客户发出请求后,继 续任何操作之前将等待服务器发回响应。 基于消息交换的通信模型定义松散关联和文档驱动的通信。调用基于消息 交换的服务请求方无需等待响应。 客户服务请求方调用基于消息交换的w e bs e r v i c e s ,它通常发送一个完整的 文档,而不是发送一组参数。服务提供方接收并处理该文档,然后返回( 或不返 回) 该文档。根据实现方式的不同,客户可以异步发送文档或接收来自基于消息 交换机制的w e bs e r v i c e s 文档,但不能在一个实例中同时执行这两项操作。另外, 也可以以同步通信模型实现消息交换,在这种模型下,客户将服务请求发送给 服务提供方,然后等待和接收服务提供方发回的文档。 采用何种通信模型( r p c 和消息交换) 也取决于w e bs e r v i c e s 结构及其采 用的协议。 2 4w e bs e r v i o e s 的优点 w e b s e r v i c e s 通过服务通信( s o a p ) 、服务描述( w s d l ) 和服务发现c u d d i ) 等 标准实现应用集成的基础框架。这一框架使得w e bs e r v i c e s 能够通过一种服务的 方式封装数据和业务流程,并将服务发布和共享,从而实现快速、低代价地开 发、发布、发现和动态绑定应用。w e bs e r v i c e s 的这一优势促使了面向服务集成 的概念的提出:将传统的待集成系统的数据和业务流程以服务的形式封装起来, 发布到注册中心。这种做法便于集成系统对服务的管理、查询和调用。服务集 成相对于传统的应用系统集成有着更好的动态组建特性,是一种松散耦合方式 一1 3 一 第二章w e bs e r v i c e s 体系结构 的集成。 这些特点使褥基于w e bs e r v i c e s 的威用程序兵备松散耦合、面向组件和跨平 念实璐的特糕。下藤是熬予w e bs e r v i c e s 熬骚务集成耀对予基予转绞麴分蠢式计 算技术的应用集成的一些优势; 简单性。当前主流的开发工具、编耧语言对w e bs e r v i c e s 已经有了非常强 大懿支持。攘毙予健统熬分毒式计冀技术,基于w e bs e r v i c e s 熬骚务集成更餐 予设计、开发、维护和使用。使用w e bs e r v i c e s 创建跨越多个稷序的分布式应用 简单便捷。此外,w e bs e r v i c e s 允许将应用程序划分为一些小的逻辑组件,使用 夺粒度方式集藏瘟援翟净,集成将交褥攘对容易。 开放性。w e bs e r v i c e s 基于x m l 标准,使用h t t p 、f t p 等常用协议完成 异构系统间的通倍。这使得w e bs e r v i c e s 具有很好的跨平台特性。 动态扩羧往。在基于抟绞鹣分布式计算技术实凝懿集残系统串,节焱熬一 个接口发生一个简单的变化殿,会影响与其关联的所有带点的程序,导致集成 系统无法适威节点的动态变化。基予w e bs e r v i c e s 构建的集成却灵活得多,节点 l 箍务接弱懿,l 、范赘交纯哭需改交注麓孛,的穰应静服务掭述,其它荚联带点胃 以根据注册中心的服务攒述做出自动调熬,通紫不必人工参与。因此,动态扩 展性大大增强。 松散耦会牲。各节泰在注蓊中心服务籀述静弓| 簿下参与集成,不再需要将 各节点与集成中心紧密绑定。各节点可以根攒自身器求参与集成,霹以隧时邋 过服务注册中心的服务描述与其它节点建立逢接,形成一个松散耦的集成模 式。 一1 4 一 第三章x m l 的数据表示与数据转换 第三章x m l 的数据表示与数据转换 3 1x m l 的数据表示 数据表示,是指利用某种机制对需要整合的信息的组织结构、内容及其关 系进行表示。x m l 对数据的表示包括对数据的组织结构、信息内容和数据间的 关系进行描述和表现。 3 1 1 数据结构表示 在使用帆表示数据时,应当定义和约束这些数据在文档中的组织结构。 通过d t d 或者ls c h e m a 来定义x m l 文档的结构。d t d 与文档是相关的, 文档通过d o c t 慢指令标记与d t d 建立关联。当文档需要被验证有效性时, 解析器通过该指令获取d t d ,并根据其中的规则对文档进行检验。结构符合相 应d t d 的文档被称为有效文档。对数据结构有严格要求的信息集合应该存放在 有效的文档中。所以数据结构可以通过d t d 来定义和约束。 d t d 仅仅是规定x m l 文档的结构和语法规则,而不包括它的内容。因此, 不同部门及异构数据在实现x m l 应用时可以共享同一个d t d 。d t d 可以独立 于文档,也可以在文档内部进行定义。 d t d 通过四种标记定义x m l 文档中允许出现的内容,即e l e m e n t ( 元素 类型声明) 、a t t l i s t ( 属性列表声明) 、e n t i t y ( 可重用的实体说明) 和 n o t a t i o n ( 非x m l 内容的声明和处理) 。但是d t d 语法不是使用x m l 来描述 的,其扩展性差。在将多个文档合并时可能会出现名字冲突,不能表示数据类 型信息。 x m ls c h e m a 也用来描述文档的结构,它比d t d 具有更强的表现能力,而 且它允许在定义中使用命名空间。命名空间就是一个应用于x m l 文档的具有结 构的名称的集合。名称包括元素名称和属性名称,命名空间通过一种u r i 引用 来标识,它解决了多义性和名字冲突的问题。 x m ls c h e m a 规范主要分为结构和数据类型两个部分。模式结构主要定义了 文档中元素和属性出现的位置,主要包括以下几部分:通过s c h e m a 标记定义的 一1 5 一 第三章x m l 的数据表示与数据转换 导言、通过d a t at y p e 标记定

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论