




已阅读5页,还剩75页未读, 继续免费阅读
(通信与信息系统专业论文)信息网络异构数据交换技术研究与实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 随着h t e m e t 和全球信息化进程的快速发展,信息共享互联互通已经日益成为 当前电子政务建设面临的重大课题。但是政府各部门之间业务系统的异构性,资 源存储的分散性使得难以做到网络信息的共享和业务协作。如何解决“信息孤岛” 问题已经成为切实推进政务信息化建设的当务之急。 本文以陕西省电子政务领域企业基础信息交换平台的建设为背景,围绕如何 通过数据交换平台实现不同部门的应用系统之间数据交换和共享这一核心问题, 认真研究了信息网络的异构数据交换技术。 本文在分析目前国内外数据交换领域已有技术和成果的基础上,设计并实现 了一种基于r d 脓m l 、适配器技术和w 曲s e r v i c e 的跨平台、可扩展、松耦合的 e x i s “镪c 数据交换平台。同时,给出了一种基于移动代理的移动电子政务系统的 数据交换模型,通过理论分析和模型仿真验证了该模型在移动数据交换系统中网 络流量,响应时间,容错性能方面的优越性。文章对该平台涉及的核心技术进行 了深入研究和讨论,包括构建一种r d 腿m l 格式的公共元数据作为异构数据集 成的基准来提供快速、方便的资源检索手段;通过适配器屏蔽不同数据源的异构 性,进行消息的翻译和转换工作;各部门和资源交换中心的交互被包装成w 曲服 务的形式,使得各部门之间真正摒弃系统之间的差异,完成无缝安全的系统对话; 针对我国的电子政务层次特点,扩展并设计了单域数据交换基础上的跨域数据交 换模型。平台测试证明了本文实现的e 【i m 镭c 数据交换平台的可行性和实用性, 这为建立企业基础信息交换提供了重要的技术支持。 关键词:数据交换,r d f m l ,适配器,w 曲s e r v i c e ,移动代理 a b s t r a c t w i t ht h e 均p i dd c v e l o p m c n to fh i t c m e t 锄di n f o 皿a t i o n i z a t i o n ,i n f o 姗a t i s h a r i i l g 卸di n t e r 姗c c t i c h 柚g c sh 够b c m ci m p o r t 卸ti s s w l i i c ht h e 呲m b g o v c 衄e n tc o n s t m c t sf a o 鼯g m d u a l l y b u th c t e g c n e “y0 f 叩e r a t i s y s t e m 锄0 n g d i 纸r c 】吡d c p a n m e n t so f 擘o v e m m 曲t 蛆dd e c c n i r a l i z a t i o fr c u “s s t o r i n gm a l 【ei t i m p o s s i b l ct op r o m i sn e 铆o r ki n f b 珊a t i s h a r i n g 粕db u 咖e 豁c o l l a b o r a t i h a wt o l v c “i l a t c do fi n f o 硼a t i ”h 弱b t 枷龉u f g e n c yf 叫g o v 咖c n tt oc a 唧 i n f b 咖a t i o nc o n s t n l c t i o ni n t oe x e c u t i 曲 t 1 l ca n i d e 辩t st h cc o n s t m c t i o n0 fe n t e f p f i s 髂b 勰i ci n f o 啪a t i 彻e x c h a n g e p l a t f o 彻醛ab a c k 伊咖n d s t u d y i l l gh c t e m g e n e 伽gd a t ac x c h 卸g ct e c h n o l o g y 0 f i n f o 衄a t i 咖n e 觚。咄w h i c hi so 蚰c c m c dw 油t h c 黜p f o b l 锄t h a th o wt oa c h i c v c d a t ae x c h a n g e 锄o n gd i f f b r e n td c p a n m e n t s a p p l i c a t i s y s t e mt h r o u g hd a t ac x c h a n g e p l a l i - o 姗a f t c r 锄a l y z i l l gt h ed a t ae x c h a n g et e c h n o l o g ya n dp r o d u c t i o nw h i c hi s 砒 h o m e 卸da b m a d ,t h ep a p c rd 船j g 船锄dj l n p l e m e n t sa s s 删a t f b n n ,e x t c n d i n 吕l o e c o u p l i n ge x i s 认b cd a t ae x c h 柚g cp l a t f o 瑚b a s c d r d 胍m la d a p t c f 卸dw 曲 s e r v i c ct c c h n o l o g y a tt h e 船m et i m c ,t 量l ep a p c rc o n s t n l c t san e wd a t a 懿c h a n g cm o d c l o fm o b i l ee - g o v e 衄e n ts y s t c mb 勰c d 伽m o b i l ea g e m ,蛐p c r i o r i t yo fm o b i l ea g c n ti s v a l i d a t e db yt h e o r y 卸a l y s i s 卸dm o d e ls i m u l a t i 衄i nn 酣o r kn o w ,s p o n t i m e , f a u l t - t o l e 瑚to fm o b i l ed a t ae x c h 柚g es y s t e m na i m a l ( e sad e e pr c s e a r c h 觚d d i s c i i s s i o no nc o f ct c c h n o l o g yi n v o l v c di nt h ep l a 怕皿,w h i c h 删u d c sc o n s t n l c t i l l ga k i l l do f 咖m m 吨l d a t ab a s e do nr d x m lf b 册a t 鸹b c n 曲m a r ko fh c t e r o g c n c 0 璐 d a t ai m e g m t i o n ,f a s ta n do o n v e i l i e n tm e t l l o d 衄r c u r c c sf c t r i e v a li s p r o v i d c d ; s l l i e l d i n gh e t e r o g e n e i t yo fd i f l b r e n td a t as o u r c c ,仃a n s l a t i i i ga n dc o n v e r t i n gd a t ab yt h c a d a p t c fs y s t e m ;h l t c r a c t i o n sb c 仰nc v e f yd c p a n m 印t 锄dr e 沁u r c 路c x c h a n g cc e n t c r a r ep a c k a g e dw 曲s e r v i c e ,w l l i c hm a l ( e sc v e r ) rd 印a n m e n tt os p u md i 断c n o f s y s t e m s 强da o c o m p l i s hs e a m l e 嚣柚ds e c i i r ed i a l o g u eb e t w e e ns y s t e m s ;a i m i n ga t a d m i n i s t r a t i v cl e v e l so f e - g o v e 舢e n t i na i i n a 懿t c n d i n g 锄d d e s i 弘i n g a a c m s s d o m a i nd a t ae x c h a n g cm o d e lb a d 彻s i n 酉e - d o m a i nd a t a 懿c h 柚g c t h e f c a s i b i l i t y 蛐dp m c t i c a b i l i t y0 ft h ea c h i c v c de x i s t a b cd a t ae x c h a n g cp l a 响mi s p r o v e db yp l a t f o 珊t e s t i n g ,w h i c hp r o v i d e si l n p o n a n tt e “c a ls u p p o nt ot l i eb u i l d i n g o ft l l ee n t e i p r i s 髂b a s i ci n f b 珊a t i e x c h 柚g e k e y w o r d s :d a t ae x c h a n g c ,r d f m la d a p t e r w e bs c r v i c c ,m o b i l ea g e m 西北工业大学 学位论文知识产权声明书 本人完全了解学校有关保护知识产权的规定,即:研究生在校攻读学位期间论文工作 的知识产权单位属于西北工业大学。学校有权保留并向国家有关部门或机构送交论文的复 印件和电子版。本人允许论文被查阅和借阅。学校可以将本学位论文的全部或部分内容编 入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。 同时本人保证,毕业后结合学位论文研究课题再撰写的文章一律注明作者单位为西北工业 大学。 保密论文待解密后适用本声明。 学位论文作者签名:二幽 州年弓卧i 曰 f 指导教师签名:显) 望b ) 年,月? f 日 西北工业大学 学位论实原创性声明 秉承学校严谨的学风和优良的科学道德,本人郑重声明:所呈交的学位论文。是本 人在导师的指导下进行研究上作所取得的成果。尽我所知,除文中已经注明引用的内容 和致谢的地方外,本论文不包含任何其他个人或集体已经公开发表或撰写过的研究成 果,不包含本人或其他已申请学位或其他用途使用过的成果。对本文的研究做出重要贡 献的个人和集体,均已在文中以明确方式表明。 本人学位论文与资料若有不实,愿意承担一切相关的法律责任。 学位论文作者签名:二曼垫塑 j 州 年弓月了日 西北工业大学硕七学位论文第一章绪论 1 1 选题背景及意义 第一章绪论 网络技术是2 1 世纪高技术中最具活力的领域,是人们生活中不可须臾离开的 一部分。它的迅猛发展和广泛普及使任何人都能打破地理界限,随意地查询、索 取、利用分布在世界各地的信息资源,有力地促进了信息服务产业的进步和创新, 比如我国正在大力推行的电子商务,电子政务,远程教育,远程医疗,虚拟企业 等等都是网络信息全球化的产物。值得注意的是所有这些信息服务都是建立在各 种资源共享和数据交换的基础之上的。但是由于各分布实体问的独立性,许多企 业、团体和个人往往是根据自身实际情况和应用需要,构建了许多支持相应应用, 相互隔离的信息管理和业务处理系统。系统实体间缺乏关联,彼此异构形成了众 多“信息孤岛”,而这些相互孤立的系统随着国民经济和社会的快速发展已无法满 足国民经济调节、市场监管、社会管理、公共服务发展的需要,主要表现在: ( 1 ) 各用户之间缺乏信息共享和互通互联的通道和平台,协同应用困难, 普遍存在信息资源开发利用和共享程度低; ( 2 ) 各业务部门在业务办理中采集的大量信息数据蕴含各方面的关系支持 信息,但是目前存在的“信息孤岛”状况对数据价值的挖掘和利用程度很低,领 导决策缺乏准确、完整、及时的信息作为准则; ( 3 ) 资源匮乏和资源重复建设并存,资源浪费现象严重; ( 4 ) 相关标准不健全,新建一个系统多一个“信息孤岛”。 这些问题直接影响了政府和行政部门的业务管理能力、监控能力和对突发事 件的快速响应能力,工作效率降低。因此,推动跨地域和职能域的信息交换和应 用已经成为摆在广大业务集成部门面前的一项重大课题。为解决这些问题,迫切 需要一种有效的方法和机制来消除这些孤岛,把这些孤岛一个一个互联起来,形 成为信息共享的“大陆”;及时获取这些有价值的数据信息同时,积极充分地利用 这些资源,降低信息化建设成本发挥更大的效益。 现实中,网络的数据交换面临以下主要困境: 异构性:信息作为一种数字化实体资源,以不同的格式和结构在网络上存储, 包括文本文件、关系数据库,对象数据库等。另外,硬件环境、软件技术、网络 西北工业大学硕士学位论文第一章绪论 协议、运行平台的异构也要求为用户提供一种透明的界面,从而达到信息共享的 目的; 动态性:数据交换要求资源发布方和订阅方能动态地加入或离开集成计算环 境,并能根据具体要求进行动态的初始化和配置管理;根据市场变化和技术发展 趋势保证应用的可重用嘲: 自治性:保持已有业务系统的独立性,在进行信息共享时不能影响已有业务系 统的正常运行; 灵活性:能够适应业务流程和数据流程的不断变化,将来能够方便、快捷地接 入新的业务系统,而无需作大的变更; 准确性:数据资源中存在大量冗余和错误,交换途径的多样性造成数据准确性 和安全性存在很大隐患,数据质量难以保证; 安全性:保证数据交换过程的合法性、可靠性和不可抵赖性; 协作性:各业务功能接口由于建设初期的独立性,彼此之间无法相互调用,难 以实现真正意义上的业务协作。 信息共享程度是评价国家信息基础建设以及国家科技、文化水平的一项重要 标准,构建一种高效、简单、实用、开放、可扩展的数据交换技术作为网络资源 交换和共享的支撑对国家信息一体化建设非常重要,意义深远。 1 2 课题来源 本课题是陕西省电子政务建设项目的一个子项目企业基础信息交换平 台。该平台是连接资源交换中心和政府各部门交换前置机的数据通道,是保证信 息可靠、安全、有效传输的主要技术实现平台。本课题在当前异构数据交换技术 及企业基础信息数据源研究基础上,提出并实现了e x i s t a b c ( e x c h 锄聆i n f o i m a t i 伽 s a f c l ya n d1 m l y a d a p t o 卜b 0 0 s t - c o l l a b o r a t i 叫) 数据交换平台,在电子政务集成应用 上迈出新的脚步。 1 3 异构数据交换技术发展现状 异构数据交换就是实现分布式网络环境下,不同位置、平台和格式的数据以 一种统一的交换标准集中展现给用户,并可以进行数据资源的抽取和利用。目前 国内外有许多支持数据交换的技术和产品,主要有: 专有转换工具:前几年用电子数据交换( e d i ) 进行商业数据交换就是根据特 2 西北工业大学硕十学位论文第一章绪论 定的数据源定制专有的转换工具实现“一对一”的数据交换。但它的局限性包括 费用昂贵,覆盖面低,系统灵活性、通用性、实时性、扩展性差。 分布式对象技术:斯坦福大学开发的基于c o r b a 的数字图书馆项目i n f o b u s 【1 9 l 提供了一种能够支持异构的、自治的、中间件互操作的基础结构。但是客户端和 服务端的耦合性,消息可读性方面制约了交换技术的发展。 基于视图集成的数据仓库技术:将数据仓库技术引入数据库系统,采用数据 仓库的方式,即采用视图集合的方式组织数据库,由e t i 和x t 珀c ,仃a 邶f o i m ,柚dl d ) 工具定期从各数据源抽取一定的数据,经过分析、转换和装载,将数据移植到数 据仓库的集成视图中,实现异构数据源的集中式管理和存储,保证数据的一致性。 如c e n d p ( 中关村智能数据平台) 【1 3 l 采用元数据管理形成的“虚拟数据库”为用 户协调分散异构的各种数据。但是数据仓库是一个信息源,属于只读数据库,一 般不轻易做修改,只能定期刷新,实时性较差;对新加入的数据源必须重新生成 一次全局模式,系统扩展性较差。 中间件技术:中间件主要是屏蔽底层操作系统和上层应用系统之间接口和协 议的差异,实现不同硬件和操作平台上的数据共享和交换的互操作。它不需要改 变原始数据的存储和管理方式,只需要为用户提供访问数据的统一数据模式以及 数据访问的通用接口。这类技术成果代表有:文献1 2 l 】提出的以b i z t a l l 【s e r v 盯为中 间件引擎实现的信息集成平台;斯坦福大学开发的t s 肼m i s l l l l 异构信息集成系统 采用w n l ) p e 删e d i a t o r ( 包装中介) 中间件模式将一种自描述的数据模型作为集成 系统的公共数据模型,这种公共数据模型就是所谓的中介模式。中间件技术的不 足就是应用系统和中间件的连接是建立在编程的基础上,应用集成人员要根据不 同的中间件产品开发不同的连接程序,比如异构数据格式的封装和打包等。另外 有些中间件的编程复杂繁重。 砒) f 、x m l 和w 曲s e r v i c e 技术的出现为网络异构数据交换的发展提供了技 术动力。各独立平台以r d 删l 为媒介,以w 曲s e r v i c e 为传输通道进行信息交 互,大大提高了数据交换能力和效率,使得跨网络协同工作环境的建设成为可能。 1 4 本文研究内容和目标 本文旨在研究当前基于l f m l 和w 曲s e i c c 及移动代理的信息网络异构 数据交换的一些关键技术,考察这些技术的实现机制,并讨论如何将这些技术在 当今信息网络异构数据交换的主要环节中加以合理利用,如何将这些技术与现有 的电子政务系统集成。 3 西北工业大学硕士学位论文第一章绪论 ( 1 ) 提出一种基于r d 胍m l 模式的公共元数据标准,弥补了用x m l 模式 建立元数据的不足,为数据的发现和识别提供一种有效的资源描述机制,有利于 更好地信息共享和访问。 ( 2 ) 针对传统d s 通信模式中存在的缺陷,提出了一种基于移动代理的数 据交换模型来提商数据交换过程的网络性能。 ( 3 ) 针对不同应用系统的连接问题,提出并设计一种适配器技术根据源目 的应用之间的数据映射关系完成异构数据源的提取和转换,利用r d 腿m l 的资 源描述能力,建立电子政务异构数据源的模式集成,提高各部门应用的互操作性。 ( 4 ) 研究如何利用w 曲s e r v i c c 和x m l 技术实现应用适配器系统和资源交 换中心的交互,交换中心和交换节点适配器各自独立实现自己的w 曲服务,并且 通过w s d l 公布自己的服务。两者通过s o a p 协议调用对方的w 曲服务,而不必 考虑平台的差异和具体w 曲服务实现语言的差异,从而完成数据的发布,订阅和 查询,实现了开放的互操作性。 ( 5 ) 根据异构数据交换的关键技术设计并实现e x i 蚍媚c 数据交换平台进行 企业基础信息数据库的信息共享和交换,并在单域交换基础上,针对我国电子政 务的多层体系结构研究设计一种跨域的数据交换体系架构。 1 5 论文章节安排 针对研究工作,论文将作如下安排: 第一章绪论提出信息网络异构数据交换的选题背景和研究意义,讨论了数 据交换技术的研究现状,制定了本文的研究内容和且标。 第二章基于r d f 乃珊l 的公共元数据建立企业基础信息元数据描述标准, 为异构数据交换提供交换模板。 第三章一种基于移动代理的数据交换模型研究基于移动代理的数据交换原 理和过程。 第四章基于适配器技术的异构数据提取研究研究分析关系型数据库到 r d 删l 模式的映射关系及转换方法和数据转换引擎( 应用适配器) 设计。 第五章基于w 曲s e r v i c c 的数据传输安全可靠的w c bs e r v i c c 技术进行数据 传输。 第六章i s l a b c 数据交换平台设计与实现实现以企业基础信息交换为背景 的数据交换平台。 第七章总结与展望总结了本文的研究工作,并做出进一步展望。 4 西北工业大学硕士学位论文第二章基于r d f m l 的公共元数据 第二章基于r d f x 札的公共元数据 2 1 公共元数据 2 1 1 概述 信息资源是实现企业、政府、商业信息化的源泉。随着i n t e m c t 技术的发展, 这些信息资源逐渐呈现分布性、动态性,多领域、半结构化或无结构化、非规范 化等特点。不同应用系统之间要进行准确的信息共享和交换,需要建立一种公共 元数据将不同的数据形式变异构为同一,化分散为集中,才能有利于集成人员对 数据的发布、订阅和查询操作。目前阻碍万维网( w w w ) 发展趋势的一个重要因 素就是它对元数据和主机间交换的数据信息语义缺乏强有力的支持。事实上,很 多w 曲站点使用内嵌于m m l ( 超文本标记语言) 中的 或 等标 记来描述该站点提供的网页内容。但是这种方法至多只能勉强满足w 曲站点的需 求,并且几乎不支持任何标记语义。这种缺乏元数据的基本结构增加了在互联网 上搜索文档内容的困难。现在很多组织都在针对不同的领域制定相应的元数据标 准:1 9 9 5 年,o c l c ( 美国在线计算机图书馆中心) 创建的都柏林核心元数据集 ( d c ) ,很好的诠释了出版界的信息资源【3 1 j ;美国标准开发机构h l 7 ( h c a l t h 工删d s “衄h c ) 研究开发了一个专门用于医疗卫生机构及医用仪器,设备数据信息交 换的标准( 捌。因此建立相关领域内资源的统一描述对数据交换至关重要。 2 1 2 元数据的概念及作用 信息社会的海量数据让人们举步维艰:用户无法知道需要何种信息,信息又 来自何处,各个数据实体缺乏一种畅通的共享渠道。如果某个文件没有与之关联 的标准描述,那么文件发送方和接收方只能以隐含的方式理解信息的内容及文件 的语义。正因为如此,数据的发送方和接收方都要明确采用某种基于某个数据模 板的结构,这个模板就是元数据。元数据是“关于数据的数据”,用来提供某种资 源有关信息的结构数据。元数据给出了关于数据对象的内容、条件、著作或其他 特征的描述1 1 4 1 ,为数字化信息资源建立一种机器可理解的框架。可以说,元数据 5 西北工业大学硕士学位论文第二章基于r d f m l 的公共元数据 的这些特性决定了数据潜在的用途,增加了数据的价值、关联度和生命周期。元 数据在实践中的作用主要表现在: 资源发现:元数据描述数据是什么( w h a t ) ,在什么位置( w h e r e ) 、如何进行 存取( h o w ) 及如何使用( h o w ,以不同的分类形式完整反映信息资源全貌,方便 用户共享。 资源检索:为用户提供多层次、多途径的有效查询方式,简化跨越地理位置边 界的信息搜索,提高命中率;帮助评价资源并作出正确判断,追踪资源在使用过 程中的变化。 资源管理:帮助集成人员有效地管理和维护大量网络化数据资源,实现一体化 组织,确保资源的长期维护性和可用性。提供包括拥有者、版权、安全级别等信 息的版权管理。 节省成本:扩大信息的使用范围和使用方式,减少不同应用系统问的信息交换 处理成本。 总之,元数据在数据交换、数据发布、数据浏览等方砸具有极其重要的作用。 特别在电子政务的信息共享互联互通中,它是建立数据交换网络的基础和地基, 实现业务协同的有效手段和方法,形成“以公众为中心”的系统集成的后盾和力 量,构成了电子政务协同工作和信息资源利用的软件环境建设基础1 2 6 i 。 2 2r d f x m l 数据交换的新标准 一个完整的元数据体系可以从横向和纵向两方面分析。横向分析包括内容元 数据、管理元数据和结构型元数据。纵向分析包括语义( 元数据表达的含义) 、结 构( 元数据元素之间的相互关系) 和语法( 元数据体系如何描述和表达) 【r n 。语 法是前两者的表现基础,只有选择合适的语法才能体现出元数据的语义和结构。 元数据的语法通常是各种标记语言,如s g m l ( s t a n d a r dg e n e r i cm a r k u pl a n g l l a 聆, 标准通用标记语言) 、h r m l 、x m l r d f 等。本节在分析x m l 和r d f 语言规范 的基础上,研究用r d f 和x m l 相结合的方式编写元数据,即r d 臃m l 模式。 2 2 1x 眦( 可扩展标记语言) 和x m l 模式 可扩展标记语言x m l 是一种具有数据描述功能、高度结构性及可验证性的置 标语言,和 玎m l 一样同属l s 0 8 8 7 9 标准s g m l 的简化子集。互联网发展初期, m m l 以简单精练的语法、极易掌握的通用性和易学性使w 曲得以普及发展以至 6 西北工业大学硕士学位论文第二章基于r d j ( m l 的公共元数据 今日辉煌。但是,随着w 曲数据的海量化和实际应用需求的发展,m m l 弊端日 益显露:数据和格式分离困难;缺乏空间立体面,处理图形、图像、音频、视频 等多媒体能力较弱;标记有限,不能用户自定义扩展。于是,x m l 诞生了,并迅 速发展成为w 3 c ( w b d dw i d ew 曲c 【m s o n i u m ,万维网联盟) 的标准。它保留了 很多s g 姗l 标准的优点,具有可扩展性、结构化、平台无关性等优势,在描述数 据内容同时能突出对结构的描述,从而体现出数据之间的关系。这种组织的数据 对于应用程序和用户都是友好的、可操作的。因此,x m l 非常适合网络环境中不 同领域内自由地交换信息。下面是一个表示地址的简单x m l 文档: ( ? x m lv c r s i o n = ”1 0 ” f r c n c h 拍。o u m r y d t y p a r i s 刮c i t y 2 6 5 2m c g a wa v c l l u c 9 0 - 4 6 7 8 8 9 0 咖s t a l c o d e ) x m l 模式是一个x m l 应用程序,用来定义元素和属性类型、元素的结构以 及x m l 文档中元素和属性相关的限制条件。x m l 模式继承了x m l 的自描述性和 可扩展性,使得x m l 模式更具有可读性和灵活性。所以一些数据交换平台以x m l 模式为元数据描述方式进行数据共享。现在给出上面描述地址元数据的x m l 模式 文档。 ( ? n lv e r s i o n = ”1 o ” a s :s c h e m 舶l 鸺:x s = ”h 吲枷嗍w 3 o 舭0 0 1 m l s c h 锄矿 t 缸g c t n a m e s p a c c = 竹h t t p :加r w w c n e c s m e x a m p l e s s c h e m a ” c x s :c o m p l c x t y p e n 锄e = ”a d d n :s s ” :】【s :e l e m e n tn a m e = ”s t r 俄d d r c s s ” t y p e = ”x s :s 嫡n g ” ,x s :m p l e x t p c l s :s c h e m a x m l 文档可以使用d o m 或s a x i 删等x m l 处理器进行解析,获取元素标记 , 西北工业大学硕十学位论文第二章基于r d 腿m l 的公共元数据 中的内容或属性值。 2 2 2r d f ( 资源描述框架) 和r d f 模式 数据交换的一个最大问题就是发现与识别:各种数据资源应该怎样去描述自 己,它们是什么,它们能作什么? r d f ( 资源描述框架) 在数据交换标准机制的 竞赛中脱颖而出,为应用程序之间交换机器可理解的网络数据交换提供了可互操 作性。 r d f 【3 l 】是由w 3 c 组织设立的基于早先的d u b l i nc c 鹏( d c ) 、p l a t f o i mf o r i n t e m c tc c m t e ms e l e c t i v i t v ( p i c s ) 的讨论组。它采用x m l 作为交换和处理元数据 的通用语法结构体系,致力于增强w w w 上对元数据的创建、交换和使用,甚至 可以通过简单地嵌套r d f 描述来生成由其他r d f 资源所组成的资源。这样,不同 的用户或团体能在这一框架下定义他们自己的元数据资源。我们可以用对象模型 的原则来辨别这些资源: ( 1 ) 资源( r e s o u d c c ) :资源对象标识实际的以网络为基础的资源,包含世界 上所有的网页及部分元素或网络应用程序。资源一般由统一资源标识符u r l 来标 识,任何事物都可具有一个u 砌。例如h n p :嘲) l ,i b m 伽伽就是一个资源; ( 2 ) 属性( p m p c n y ) :属性是用来描述资源的特定特征或关系的组合,具有 属性值这个特定的含义。属性可以是简单的文本,也可以是其他类型的资源; ( 3 ) 声明:声明即是与资源相关联的“句子”,是资源和属性的下一级延伸。 附上属性的资源组合创造了声明。声明就是描述特定资源的集合。例如: “h t l p :f w m i b m m c n ,呻o d u c t 灏n l 的发布者是j i m ”就是一个声明。它可以用三 元组的形式描述为( 发布者,“h t t p - ,i b m 伽锄p m d u c t x m i ”,“j i m ” ) 。其 中“发布者”是属性,资源用u r 卜- h t t p :帕,、v i b m c o m c n p m d u d x n l l 来描述, “j i m ”是属性值。这种模型还可以描述为 p ,s ,o ) ( 图2 1 ) ,其中p ,s o 分别 为r d f 语句的主体( s u b j e c i ) 、谓词( p r c d i c a t e ) 、客体( o b j e c t ) ,分别对应资源、 属性、属性值。 p o i l 图2 1 简单的r d f 语句三元组模型 8 西北工业大学硕士学位论文第二章基丁:r d 【m l 的公共元数据 这样,r d f 定义了一种资源属性值的三元组集合框架来描述生活中各种各样 的资源。下面是一个简单r d f 的例子: 指明被描述资源的u r i j i m 经过分析,r d f 具有如下特点1 3 2 】: ( 1 ) 易控制:现在人们面对的w 曲资源越来越多,描述元数据的格式过于复 杂会降低元数据的使用效率;x m l 的复杂结构不易控制。采用r d f 模式可以提高 资源检索和管理的效率,从而真正发挥元数据的作用; ( 2 ) 易扩展:i f 模式采取资源与词汇集分开的形式描述资源使得其很容易 扩展。通过增加词汇集的元数据或定义新的词汇集的命名空间,就能大大丰富用 户需要的资源描述; ( 3 ) 包容性:r d f 模式允许任何人定义自己的词汇集,并可以无缝的使用多 种词汇集来描述资源,以根据需要来使用,使各尽其能。比如,描述网页资源时 用d u b l i nc o f e 描述其作者属性,而在描述作者的姓名时又使用了另外一个专门描 述人的词汇集来描述。 ( 4 ) 可交换性;r d f 模式使用x m l 语法,很容易在网络上实现跨平台、跨 结构、跨协议的数据交换;定义了描述词汇集的方法,可以在不同词汇集间通过 指定元数据关系来实现含义理解层次上的数据交换。 ( 5 ) 易综合:在r d f 中资源的属性是资源,属性值可以是资源,关于资源 的陈述也可以是资源,都可以用r d f 来描述,这样就可以很容易的将多个描述综 合,以达到发现知识的目的。例如,在描述某书籍时指明其作者属性值是另一资 源,我们就可以根据描述作者的u r j 来获得作者的信息,如毕业院校等,从而知 道这本书是某一院校的毕业生写的,于是表面上看来没任何关系的两者间建立相 互联系,而这种联系往往是知识发现的前奏。 r d f 数据模型就命名属性和值而言,为描述资源间相互关系定义了一种简单 的三元组模型,但是它没有提供一种更加有效的机制来说明这些属性以及和其他 资源之间的关系,比如两个资源集合的交集、并集等等。r d f 模式的出现完善了 r d f 对资源的描述功能。它类似于面向对象编程机制,定义了许多基于x m l 的词 9 西北工业大学硕士学位论文 第二章基丁二r d f m l 的公共元数据 汇集。这些词汇集的主要作用有:抽象出各资源之间的关系,使数据上升到语义 层次,易于理解和扩展;同时支持r d f 的序列化和反序列化,为异构数据的交换 奠定了基础。下面以图2 - 2 说明r d f 模式主要成员类。 图2 2 r d f 模式的类层次 r d f 模式词汇集用 、 、 等核心类和 、 、 在元层次上解释类、资源和 属性以及它们之间的关系。r d f 模式一个特定的实例可能相当于一个类;还有一 组r d f 模式类 、 、 、 提供诸如容 器或者文字类型的数据结构;此外,r d f 模式使用 、 类 似与定义域和值域两个数学概念来定义数据类型。下例说明r d f 模式的应用。 这是表示公司所有制的类,r d f s :m m e m m f s :a a 嚣 ( r d f s :s u b a 够s o fr d f r e u r c c = 潍公司所有制t r d f t y p cr d f :r c s o l l f c c = ”挣公有制” 国棉公司是公有制单位c r d f s :o m n m e n t 1 0 西北丁业大学硕士学位论文第二章基于r d 0 m 的公共元数据 订d f p i o p c n yf d 删d = ”b r o t h c r c o m p 龃y ” 可r d f :p p e n y q 茈d e s c r i p t i 伽a b o u t = ”煤矿公司” b r o t h e 加p 卸yr d f u r o c = ”石油公司” 上述r d f 模式定义了两个类“所有制”和“公有制”。其中类“公有制”是 类“所有制”的子类,而“煤矿公司”是类“公有制”的一个实例。“石油公司” 和“煤矿公司”是兄弟公司,所以定义一个属性“b r o t h e r c 伽p a n y ”表示两者之 间的关系。 2 2 3r d fj f 口x m l 的比较 r d f 模式和x m l 模式都可以用来表示实体资源,但是两者有一定的区别,主 要表现在l j : ( 1 ) 数据模式不同:x m l 数据模式是一个文本可扩展语言,是有序的节点 带有标识的树。r d f 是一种非常简单的三元关系模式,是无序的带有标识的有向 图。x m l 是被设定为固定的、树状的文本,在描述元数据上缺乏一定的灵活性, 而r d f 模式却有足够的灵活性来描述这种主观的、分布式的、用不同形式表达的 元数据。 ( 2 ) 所使用的资源不同:x m l 中所谈到的节点是x m l 文档中的节点,尤其 是在文档结构中特定之处。在r d f 中,节点不再是节点本身了,而是任何其他可 用u r i 标识的资源。 ( 3 ) 表达的语意不同:) 洲l 模式最初的语意解释是限制在x m l 文档中的, 它是隐含的。r d f 原本就是语意解释,用于对那些不能够用树形结构来很好建模 的知识进行建模。 ( 4 ) 其他:x m l 有x m l 模式约束它的语法结构,而r d f 的语法虽然是x m l 格式,但并没有x m l 模式来约束它的结构;而r d f 模式是解释性的,即解释 r d f 中词汇的意义。 总之,r d f 和x m l 是两种定义特定元数据的模式语言,它们都有优缺点: r d f 提供丰富语义描述的同时,缺乏约束规定;订l 提供层次结构和数据类型约 束,但是只提供很少的语义支持。当元数据需要编码成数据时,) ( 1 帆语法就非常 1 1 西北t 业大学硕士学位论文第二章基于r d 肷m l 的公共元数据 有用,如果纯用x m l 语言来进行元数据建模那么在灵活性方面就会受到阻碍。因 此将r d f 和x m l 有机结合,两者互补,比如用r d f 模式定义语义,而用x m l 模式表示r d f 模式类和属性值的约束【明:通过x m l 命名空间机制,可以将所表 示的某个领域的知识与之对应的语义相联系,从而解决领域知识的语义问题。用 这样的机制实现对元数据的描述,将会使元数据的应用领域更加广泛,使用更加 灵活,扩展性更强。下节将会结合企业基础信息元数据给出用r d 腿m l 描述政 务资源元数据的具体实例。 2 3 用r d f m l 描述企业基础信息元数据 根据国信办2 0 0 5 1 0 号文件精神及全国企业基础信息共享实施要求【1 6 】确 定具体交换的信息指标及内容。表2 1 例举了企业信息部分公共元数据。 元数据元数据名称数据类型说明 r e g i s t e r i d企业注鼹号字符串型企业注册号 n a m e企业名称 字符串型企业登记的名称 d c l e g a t e n 锄c 法人代表字符串型 企业法定代表人或负责人 的姓名 l o c a l “y 地址 字符串型企业的经营注册地址 p o s t a l o d d e邮政编码 字符串型企业注册地址所在地邮政 编码 1 c l n u m b e r 联系电话字符串型企业的联系电话号码 w b r k r a n g c 经营范围字符串型 企业的经营范围或服务领 域 n o p c n y l ( i n d企业性质 整型企业性质代码 b u i l d d a t e成立日期 日期型企业成立日期 上表的r d f m l 描述为: ? x l n lv e r s i o n = ”1 o ”e n 0 0 d i n g = ”g b 2 3 1 2 ”? 企业注册号r d f s :l a b c l 捌f s :m e n t 企业注册号 捌f s :d 锄a i n f d f r e s 0 u f c c = ”静c o m p 柚y ” ,r d f p 加伴n y 企业名称r d f s :l a b c l 企业登记的名称 法人代表f d f s :l 舭l f d f s :o m n m e n t 企业法定代表人或负责人的姓名 硎c p f o p e r t yr 强i d = ”l o c a l i t y ” 地址 q d f s :c o m m e n t 企业的经营注册地址如d f s :o 咖e n t r d f p r o p e n y q d f p m p e r t y r d f i d = ”p o s t a l c o d c “ 捌f s :l a b e l 邮政编码i d f s :l a b e l 企业注册地址所在地邮政编码r d 自:锄m e n t 联系电话r d f s :l 概i 企业的联系电话号码r d f s :c o m m c m 西北丁业大学硕士学位论文第二章基于r d f m l 的公共元数据 f d f s :l a b e l 经营范围,r d f s :l a b e l 企业的经营范围或服务领域 洲f p r o p e r t y 企业性质,r d f s :l a b e l 企业性质代码,r d f s :c o m m e m 成立日期 企业成立日期 用r d 删l 描述企业信息的元数据的优势在于: ( 1 ) 当前电子政务系统不同的机构和部门根据需要建设了形式多样、内容各 异的资源库,把r d 删l 应用于企业基础信息元数据描述,通过其对资源库的 领域知识进行识别和规范描述,达成领域内关于元数据及其关系之间的共识,从 而实现资源库真正的重用和共享,解决电子政务资源库建设存在的问题。 ( 2 ) 提供元数据映射方案,集成到企业基础信息的元数据管理中,使其有机 地成为交换协议的一部分,实现电子政务公共元数据之间的语义映射、不同词汇 之间的关系定义及约束规则,从而保证电子政务平台分布式资源的语义互操作。 ( 3 ) 在i f m l 的元数据层基础上构建有关领域知识的本体层帮助提供一 种智能浏览技术,实现对查询请求的语义理解。 1 4 西北工业大学硕十学位论文 第二章基于r d f m l 的公共元数据 2 4 元数据管理 随着电子政务建设不断深入发展,各个分立的“信息孤岛”将快速走向连通 和融合,但是也应该注意网络资源的海量化给信息资源的使用者带来了很大的困 难,人们很难找到自己之所需以及所需之质量。构建企业基础信息交换平台过程 中一个典型场景:由于工作需要,税务局工作人员需要了解工商局注册企业信息, 但是他们没有和工商局打过交道,也没有工商局数据资源类型。因此需要建立一 个信息管理枢纽对元数据进行有效管理,将各种数据资源统一在集中的数据目录, 防止数据的重复建设。用户可以通过检索查找所需的信
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025-2030年鉴别仪市场前景分析及投资策略与风险管理研究报告
- 2025-2030年酒店沙发行业市场发展分析及投资前景研究报告
- 2025-2030年输配电产业市场深度分析及前景趋势与投资研究报告
- 2025-2030年视频服务器系统行业市场现状供需分析及投资评估规划分析研究报告
- 2025-2030年茶几行业市场发展分析及发展趋势前景预测报告
- 2025-2030年职业教育培训行业市场发展分析及前景趋势与投资战略研究报告
- 2025-2030年移动定位服务产业市场发展分析及发展趋势与投资研究报告
- 2025-2030年眼镜防雾清洁剂产业市场深度调研及发展趋势与投资研究报告
- 2025-2030年电解银行业市场深度调研及前景趋势与投资战略研究报告
- 2025-2030年电工钢产业市场深度调研及发展趋势与投资研究报告
- 《比亚迪品牌历史课件》课件
- 2025年4月自考00160审计学答案含评分参考
- 强基计划语文试题及答案
- 购买木地板合同协议
- 严重开放性肢体创伤早期救治专家共识解读
- 2024年佛山市顺德区公办中小学招聘教师真题
- 速卖通开店考试最权威答案
- 2025-2030中国船舶行业发展分析及发展前景与投资研究报告
- 耐药菌耐药性监测策略-全面剖析
- 北京市通州区2025年初中学业水平模拟考试(一模)英语试卷(含答案)
- 手术中大出血抢救流程
评论
0/150
提交评论