(产业经济学专业论文)本体中间件电信计费集成系统研究.pdf_第1页
(产业经济学专业论文)本体中间件电信计费集成系统研究.pdf_第2页
(产业经济学专业论文)本体中间件电信计费集成系统研究.pdf_第3页
(产业经济学专业论文)本体中间件电信计费集成系统研究.pdf_第4页
(产业经济学专业论文)本体中间件电信计费集成系统研究.pdf_第5页
已阅读5页,还剩48页未读 继续免费阅读

(产业经济学专业论文)本体中间件电信计费集成系统研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

首都经济贸易大学硕士学位论文 本体中间件电信计费集成系统研究 i 摘要 目前, 随着我国电信产业信息化的发展, 电信数据信息正以海量的方式快速积累, 系统间信息资源的集成问题日益受到广泛关注。 由于我国各地方电信企业发展情况差 距较大,各企业所采用设备又千差万别,不同的设备供应商大多建立了自己的数据信 息传输、储存系统,实行的也都是各自不同的信息标准,这就给当前的电信信息集成 工作带来巨大的困难和挑战。 过去,在我国经济水平尚不发达、市场竞争尚不激烈的情况下,各地方电信公司 各自为营,省级总公司对地方公司的监控力度相对较小,对信息的集成要求也相对较 小,加之长期以来,对电信信息内部蕴含的市场价值没有清晰的认识,用户对跨公司 的信息交互服务要求不高。电信公司在这样的环境下,自然对信息资源的集成工作缺 乏长期规划,在设备的采购、安装以及升级过程中疏于考虑。 如今,随着市场竞争日益激烈,用户对信息服务要求的不断提高,电信系统内部 的数据集成呼声日渐高涨。在这一背景下,关于如何根据电信信息资源所蕴含的相关 领域知识,实现各类电信信息资源在知识层面上的信息共享、数据集成以及在应用层 面上的互操作,避免信息孤岛的出现及信息系统重复建设情况等相关问题被广泛关 注,目前已经是电信信息系统建设过程中所面临的一项重要工作。 本文以电信计费数据集成为背景,采用 o w l d l 开发了电信计费信息集成中间件, 该中间件基于本体理念下设计并开发。其中本体管理器通过对概念、概念间关系以及 多种约束关系的表达,实现了表达电信计费领域知识的目的,进而实现了电信计费系 统在知识层面的共享、重用及推理检索等功能目标,很好地满足了用户对相关资源统 一检索的需求,进而实现了电信计费信息资源的整合与增值。 关键词:数据集成,中间件,本体管理器 首都经济贸易大学硕士学位论文 本体中间件电信计费集成系统研究 ii abstract now, with the development of information technology of chinas telecommunications industry, many kinds of telecommunications data accumulate in a rapid way. systems integration issues have become an increasing concern. because the gap of development between chinas local telecommunications business is growing, different equipment suppliers always set up their own data and information transmission, storage systems, and also introduced their own different information criteria, which gives these current telecommunications information integration lots of enormous difficulties and challenges. in the past, the level of chinas economy is not developed, the fierce market competition did not appear, the local telecommunications companies just pay attention to their own business, provincial head of the monitoring efforts to local companies is relatively small, the integration of information request was also relatively small, the inherent value of telecommunications information did not have a clear understanding and information resources within the excavation did not receive enough attention, users did not ask for information exchange services across the companies. the companies refuse to consider the future work about information integration in such an environment and the basic work on information resources was not quick enough, the lack of long- term planning deeply influence the future development of telecommunications industry. today, the market competition is becoming increasingly fierce, users demand the continuous improvement of information services, so, data integration within the system are growing. in this context, how to make telecommunications and information resources to be understood with the meaning by the system, to avoid the appearance of isolated islands of information and information systems- related issues such as duplication of construction has been widely mentioned, is already a major task in the telecommunication information system in the process. in this paper, the middleware is based on the application of ontology manager, so as to realize the telecommunications knowledge in the field of information sharing, reuse and ontology- based reasoning telecommunications information systems query, but also to fully exploit information resources to meet the user search for relevant resources in a unified demand, in order to realize the integration of telecom billing and value- added information resources. key words: data integration, middleware, ontology 首都经济贸易大学硕士学位论文 本体中间件电信计费集成系统研究 独 创 性 声 明 本人郑重声明:今所呈交的 论文 是我个人在导师指导下进行的研究工作及取得的科研成果。尽我所知, 文中除了特别加以标注和致谢的地方外,论文中不包含其他人已经发表 或撰写的内容及科研成果,也不包含为获得首都经济贸易大学或其它教 育机构的学位或证书所使用过的材料。 作者签名: 日期: 年 月 日 关于论文使用授权的说明 本人完全了解首都经济贸易大学有关保留、使用学位论文的有关规 定,即:学校有权保留送交论文的复印件,允许论文被查阅、借阅或网 络索引;学校可以公布论文的全部或部分内容,可以采取影印、缩印或 其它复制手段保存论文。 (保密的论文在解密后应遵守此规定) 作者签名: 导师签名: 日期: 年 月 日 首都经济贸易大学硕士学位论文 本体中间件电信计费集成系统研究 第 1 页 共 50 页 1 绪论 1 . 1 研究背景 随着我国近年来电信产业的高速发展,电信基础设施的大规模换代升级,电信企 业内部以及电信企业之间数据共享问题日渐受到广泛的重视。 过去,我国电信企业一直是将设备采购权下放到地方电信公司。由此造成的问题 是,在各地区经济发展水平不够均衡的情况下,各公司所采购设备的制造商不同,设 备之间数据交互能力差,公司间的数据很难实现共享。而传统上,省级总公司与各地 市县级分公司只在财务、人事方面处于监管状态,业务数据则无监管要求。因此,相 关问题并未得到各级电信公司的认真对待。 近年来,随着电信市场竞争日趋激烈,省级公司逐步加强了对地市县级子公司经 营状况的监控力度,这就对各个公司之间的信息共享水平提出了新的要求。以电信计 费系统为例,省级总公司要求对各地市县级子公司的计费数据达到 “实时监控”标 准。可是由于各个地方电信公司所使用设备的制造商不同,设备系统中对相关概念的 定义方式也大不相同。此外,各地方电信公司内部计费系统在数据储存、数据查询等 方面也存在着巨大差异,这就造成了各个公司之间无法实现信息共享的问题,给省级 总公司提出的数据集成监管目标带来了巨大的挑战。 1 . 2 研究现状 多年来,世界各国都在信息数据集成领域开展了大量工作。尤其在互联网应用方 面,x m l 的出现将信息集成的研究推向了全新的阶段。尽管大多数系统数据储存于关 系数据库中,研究人员仍然在努力将传统数据转化成为 x m l 。这项工作为数据大范围 内的集成创造了很好的条件。这些技术上的进步不仅仅实现了理论上的突破,而且促 使国内外的许多科技企业,开始向社会提供有关应用系统数据集成方面的相关产品, 尤其是在商用领域,数据集成系统己经开始应用在各种类型的企业、电子交易、电子 政务和生物科学领域。 目前,在电信产业领域内,国外主要设备制造商提供的解决方案多为整体解决方 案, 需要对设备内部构架进行改动, 因此改造成本较高, 一些地方电信企业难以承受。 国内企业则由于核心技术掌握的相对缺乏,以及知识产权方面的因素,不具备对在用 首都经济贸易大学硕士学位论文 本体中间件电信计费集成系统研究 第 2 页 共 50 页 电信设备的改造能力。因此,依靠中间件系统对电信信息系统进行数据集成的研究日 益得到业界的广泛关注。而对于各电信公司系统之间广泛存在的语义异构问题,则成 为中间件系统得以广泛应用的一个障碍。 各地方电信公司系统中自成一体的用户名称 体系制约了信息的有效集成,针对这一情况的出现,本文提出了基于本体的中间件数 据集成系统,成功地解决了系统间语义异构问题。 1 . 3 本文的主要工作 本文主要工作为三个方面: (1 )利用本体管理器在共享能力和表达能力方面的优势,设计并实现了电信计 费系统本体,通过建立电信计费领域内相关概念定义、各概念间的关联以及多种不同 类型的约束关系,对电信计费领域内相关知识进行准确全面的表达,大幅提高了电信 计费领域知识的重复使用能力和计费系统之间异构数据的交互调用能力。 (2 )充分利用本体在语义描述、表达方面的显著优势,对电信计费异构数据的 语义进行准确、全面地描述,以实现电信计费异构数据源语义层面上的数据集成,从 而有效地对电信计费信息进行数据集成, 减少各地方公司数据系统内部一直以来存在 的信息孤岛,大大提高了数据集成系统在扩展性方面的能力。 (3 )本文对基于描述逻辑的 o w l d l 的推理能力予以充分利用,并在设计与实现 了本体管理器的前提基础上,对基于本体的概念一级的推理查询予以实现,从而满足 了用户在智能查询方面的功能需要。 首都经济贸易大学硕士学位论文 本体中间件电信计费集成系统研究 第 3 页 共 50 页 2 中间件在数据集成中的应用 中间件在数据集成中的应用十分广泛。首先,由于数据异构问题的多样性,造成 集成问题的复杂化。 其次, 在诸如电信计费等系统中, 系统的基础数据改造成本过高, 这就显示出中间件在成本方面的优势。本章将首先对数据的异构情况进行分析,然后 着重介绍中间件系统在异构数据集成方面的应用。 2 . 1 数据的异构 数据异构是个含义丰富的概念, 不仅指各个数据库系统之间所储存的数据是异构 形式的,还包括那些结构不同的数据之间的异构情况,这一点可以从结构化表示的 s q l s e r v e r关系数据库数据,以及半结构化形式的文档数据中看出来。此外,在数 据所表达的语义上存在的差异则是集成过程中更大的障碍。 屏蔽各种不同异构数据间 形式的差异, 已经是数据集成工作中的一个重要任务, 而且是后续工作的基础性研究。 数据集成的目标是能够对各种异构数据进行统一的操作, 这样就能使集成后的异构数 据在保持良好的操作性基础上,实现向用户提供统一的和没有差异的界面。 目前应用于实际工作中的数据集成系统, 相当大一部分数据源中所存储的海量数 据当中,就是我们所说的异构数据,而通常人们所说的数据集成的同义概念就可以理 解为异构数据集成。 数据异构形式包括以下三类: (1 )系统层异构 系统层异构主要是指数据存储过程中,其所依赖的应用操作系统,如数据库数据 管理系统、计算机硬件平台、应用操作系统、并发控制操作系统、数据存储层访问方 式以及数据传输通信能力间的区别等。相关的具体类别细分可以包括如下几种:按照 计算机硬件的结构体系之间的不同,是指在大型机、小型机、p c等多种系统,其中 存储的数据形式便是异构数据。除了硬件因素,软件因素造成的数据异构情况同样很 多。根据所使用操作系统之间的不同,操作系统可以分为 w i n d o w s与 u n i x 等不同的 操作系统,所储存的数据就会产生异构现象。由于开发语言之间的不同,就会出现由 于 c + + , j a v a 等不同开发语言的使用而产生的数据异构情况。最后,还可能由于网络 平台之间的不同而造成的数据异构情况。 (2 )数据模式的异构 数据模式的异构是由于数据在存储模式上的差异所造成的。 通常的存储模式有关 系模式、对象模式和文档嵌套模式等几种,其中关系模式是目前应用中的最常见的存 储模式。此外,相同的存储模式下,数据的模式结构依然有造成数据异构的可能。 首都经济贸易大学硕士学位论文 本体中间件电信计费集成系统研究 第 4 页 共 50 页 (3 )语义层异构 信息资源之间在语义层面上存在着的异构现象就是语义层异构, 语义上的异构会 给实际工作带来很多的干扰和障碍。我们可以从简单的命名冲突中看到,例如对公安 与警察这对概念, 不同的系统由于无法识别出二者在语义之间的关系而不能实现互操 作,到相对复杂的结构上存在的语义层面的冲突。可以看到,语义冲突的存在使数据 集成工作变得更加复杂。因此,如何能够减少语义冲突,如何更好地实现数据内涵意 义的理解,就是目前数据集成工作中的一个理论研究中的重点任务。 2 . 2 中间件 2 . 2 . 1 中间件的概念与特点 中间件是一种独立的系统应用软件, 计算机分布式系统中的应用软件能够借助中 间件的作用,来实现在不同的数据源之间共享资源的目标。中间件的位置介于用户端 与后台数据系统之间,主要任务是对计算机资源进行有效管理。中间件的重要任务是 对不同层面的数据进行合理接合。中间件可以很好地对两个独立的应用程序,甚至是 独立系统的软件进行连接。 而对于被连接的系统而言, 即使其所具有的是不同的接口, 也能够通过中间件的作用实现相互之间信息的交互。因此,信息传递是中间件系统所 具备的一个重要功能。 最早提出中间件的概念的是 i b m ,其开发的 c i c s实现了相应的中间件在应用方 面的思想和功能,但 c i c s 并非是分布式数据环境的产品,这样业界通常会把 t u x e d o 称为第一个真正意义上实现中间件的思想的工业产品。a t 中间件的作用范围 不是仅仅能够实现各个应用程序的彼此调用的目标, 还需要实现各个应用系统之间更 多的交互,以及彼此之间的操作; 中间件一直被认为是基于分布式系统而研制开发出 来的应用软件,中间件在应用中的最大特点是其在网络数据信息交互功能方面的优 势。 2 . 2 . 3 中间件的发展情况 2 0 0 0年前后,互联网的快速发展和普及,也带来了一系列新生事物,应用服务 器就是其中之一。从实际应用的观点来看,中间件在某种程度上讲也是应用服务器的 一种,人们对这些新事物的区分方式是,传统的中间件作为分布交易中间件的形式得 以应用,原因是这些中间件的应用环境主要是在分布式系统下完成的,后期出现的一 些应用服务器,有人把它们定义为 j 2 e e中间件,近些年来,这些产品都得到了市场 的广泛认可。 目前在业界的应用方面已经有很多种形式的系统, 其中得到广泛应用的系统包括 三种,它们是三层结构、构件系统、基于 w e b 服务的系统。事实上,人们对这些中间 件系统的看法是:它们并不是一个单独的产品,而是可以理解为一种技术上的解决方 案,也就是通过中间件的应用,开发出一套软件将实际工作中所遇问题的解决。 中间件的远程过程调用功能在实际工作中的使用是非常广泛而且高效的。 远程过 程调用是中间件应用程序,作为一种使用范围十分广泛的、适用于分布式系统下的应 用程序处理方法, 为业界广泛使用。 通过使用 r p c 的解决方案, 一个应用程序可以 “远 程”执行,而所执行的对象就是一个位于不同系统里的过程,而单纯从执行的效果上 看,这一过程和调用本地的内部程序是完全相同的。事实上,通常的 r p c 应用是被分 开认识的,这其中包括了两个不同的部分:s e r v e r 和 c l i e n t 。s e r v e r 提供的是许多 个不同的远程调用程序; 首先是由c l i e n t 向s e r v e r 发出一个远程的调用命令。 s e r v e r 和 c l i e n t的位置有多种情况,可以是在同一台计算机之上,也可以是位置不同的两 个计算机,甚至可以是运行于不同计算机操作系统之上的应用。它们可以在计算机网 首都经济贸易大学硕士学位论文 本体中间件电信计费集成系统研究 第 7 页 共 50 页 络基础支持下实现通讯服务。这样通过相应的中间件运行,在应用中就可以实现对数 据的转换和信息传输服务的支持, 从而能够屏蔽不同计算机操作系统和多种网络协议 环境下的异构。该过程的 r p c 通讯服务可以看成是完全同步协调运行的。并且其实现 方式是通过线程的调用来实现异步调用的。 在 r p c 的应用系统模型中,c l i e n t 和 s e r v e r 只需要具备一个简单的条件,即相 应的 r p c 接口就可以实现相应的应用,并且支持中间件在 r p c 方面的实际运行,也可 以同时完成这一过程中相应的交互功能, 这样就不必仅仅将功能的实现进行过多的限 制,只局限于特定的 s e r v e r 之中。我们可以看到 r p c 的存在使 c l i e n t / s e r v e r 分布 式系统的工作能力得到很大的提升和促进,并向其提供了有力而坚实的支持。 2 . 3 中间件在数据集成中的应用 中间件在数据应用过程中体现出多种不同的性能, 在安全性方面上包括了对最终 用户的在身份确认方面上的认证和许可、节点连接过程中所涉及到的相关认证、系统 应用程序在实际运行过程中存在的安全认证、 用户所使用的系统管理界面在用户访问 权限设置上的控制、系统内部共享数据在传输过程中使用到的加密与解密功能、系统 硬件与软件层面上所设置的安全事件的报警。总的来看,中间件的使用可以对系统的 数据集成产生重要影响,具体地讲可以在以下几个方面提供帮助并实现相应功能: 语言内涵层面的集成与共享: 由于各应用设备制造厂商在语言内涵的初始定义上 存在巨大区别, 这样如何在同一个系统中对各个基础设备中储存的数据进行集成就成 为了我们实际工作中遇到的一个问题。 中间件的应用可以很好地把各设备间的数据进 行卓有成效地集成。在这一过程中,却不需要对应用设备的内部代码进行任何改动。 这样,通过一个中间层面软件的添加和整合,就能够非常妥善地将数据集成问题得到 很好解决,这一过程不但能够大大降低整合数据的成本,也能够很好地为基础设备后 续的扩展开发提供了合适的条件。 操作过程中的透明度: 用户在实际应用过程中可能对相同的管理对象使用的不相 同的操作, 这样的情况下是必须对对象内部的程序代码达到十分了解的基础下才能够 实现, 这样, 就会造成实际工作中的应用操作会表现出的系统应用透明性方面的问题。 而中间件的应用可以很好地解决这一问题, 实现用户以足够透明的方式对管理对象进 行适当的操作。 工作流程与管理对象的从整体的角度进行绑定: 工作流程是指一个用户使用的操 作从头到尾的完整的过程。毫无疑问,由于实际应用中的操作流程方面会产生很多变 化,这样,系统就必须再次对管理对象进行内部程序代码方面的编译,而事实上这一 过程中的绝大部分工作却是重复性的劳动, 这就大幅增加了在数据集成系统实施过程 首都经济贸易大学硕士学位论文 本体中间件电信计费集成系统研究 第 8 页 共 50 页 中遇到的难度。中间件的应用,能够很好地避免集成过程中这一问题的困扰,中间件 可以在软件内部对工作流程中的管理对象进行定义,而这一过程的工作量相对不高, 更是远远低于对工作流程中的管理对象重新定义进行所需要的工作量。 2 . 4 本章小结 本章首先对数据集成研究中的数据异构问题进行分析, 介绍了数据异构的原因与 相关背景。同时还介绍了中间件的相关概念与特性、中间件的运行机制以及当前的发 展现状。最后,在针对异构数据进行的数据集成研究中,介绍了中间件在其中的应用 价值。 首都经济贸易大学硕士学位论文 本体中间件电信计费集成系统研究 第 9 页 共 50 页 3 中间件技术 3 . 1 x m l 技术简介 w 3 c (万维网联盟)在 1 9 9 8 年发布了 x m l (可扩展标记语言)的应用技术标准, 这是一种为支持 w e b运行而创建的 s t a n d a r d g e n e r a l i z e d m a r k u p l a n g u a g e (标准 通用标记语言)的简要版形式的子集合。具体来说,作为一种中间媒介性质的标示化 语言标准的 x m l 为我们提供了一种能够表达构造化信息的语言形式, 这种文本格式以 统一化的形式在 w e b 上表达构造化形式存在的数据。 它和 h t m l 十分相似, 其开发之初 的目的就是作为一种表达信息数据的应用工具, 是一种相对比较常用的信息编辑和交 互应用工具,可以理解为是上层应用程序的基础语言规则。和 h t m l相比,x m l语言 注重于表示信息的内部构造,实现了分开展示信息和信息构造的目标。而且具备特别 优秀的适用性和延展性,在对信息资源内涵实现充分的表达的同时,还提供了信息资 源在储存过程中产生的构造特性,此外,x m l 还非常适于表达大多数形式存在的数据 资源,所以被业界专家普遍认可并应用,目前还在许多应用环境中发挥作用。 3 . 1 . 1 x q u e r y 技术简介 x m l目前作为信息传输与信息表达的通用方式,已经获得到相当高的业界认可 度。因此,更加迅捷、更加细致的检索和更加实用、更加先进的信息管理,在 x m l 信息以海量方式快速积累的背景下应运而生。近些年来,先后产生了很多专为 x m l 的检索而开发的应用语言,例如 x q u e r y 、x q l 、q u i t l等等,而应用范围最大的就是 x q u e r y 。 作为一种函数方式表达的语法规则,x d u e r y是由 w 3 c组织开发并设立的规范, 这项规范的特点是能够让检索应用表现得更低的复杂度、更加容易明白,并且可以以 很强的适用性对以海量方式存储的 x m l 信息数据进行有效检索。而且,在异构方式储 存的信息源信息被转化为 x m l文件后再对其进行检索,x q u e r y能够通过这种方式对 异构形式储存的信息进行非常有效的检索工作。 作为一个具备一定功能的检索规范语 言,它具备把检索显示成不同类型表现方式的能力,这样,借助不同表达式的应用, 从而对不同形式的数据形式都可以进行有效的查询。因为 x q u e r y显示方式具有很强 的嵌入功能,并且可以实现完全嵌套的功能,此外还可以做到子查询的实现,这样其 数据查询与信息检索能力就变得非常大。许多彼此相异的重点字段搜索、字符、操作 数构成了这种表述方式,同时其对象可以还是不同形式上表述方式。x q u e r y对信息 首都经济贸易大学硕士学位论文 本体中间件电信计费集成系统研究 第 10 页 共 50 页 形式的限制非常高,这种语言表述方式中一定是特定模式的运算函数、操作数和运算 字段。 f l w o r是 x q u e r y中功能最为强劲的表述方式,条件筛选、结论构造和方式协同 共同组成了 f l w o r的基础表述方式。其中,f o r 、l e t 、w h e r e 、o r d e r 、r e t u r n等重 要词语组成了 f l w o r 表达方式。f o r 子句把信息点整合到变量上面,这样可以持续往 复巡查体系中的所有信息点;l e t 子句可以对一个变量进行相应数值的赋予或者整个 序列的赋予;r e t u r n子句规范了所有应用中的元组在运行过程中需要回复的全部数 据; 而 w h e r e 子句, 假设它自身的布尔值可以认定为真, 那么这个元组将会得以留存。 3 . 1 . 2 x m l s c h e m a技术简介 与 h t m l不同,x m l并不具有一定规范的标志性记号和相关属性,使用者需要自 行规范所要使用的标示和相关属性以及相关实体。x m l要求这些规范工作需要在 d t d 中完成。在文档中运用的这些标示符号是在 d t d 中进行相应规范的,此外,还可以规 范这些标记符出现的顺序, 其中可以在其他标示符号中使用的标示符等等。 也就是说, x m l 文档中的特定规范是由 d t d 来设置的,其中有针对 x m l 文件的完整结构和语言使 用法则的准确规范等重要内容。 x m l 文件的语言使用法则是由它来规范的,同时 x m l 语言使用规范检验程序对一 个文件中标示运用的正确性进行的验证, 是由 x m l 稳定的语言规范法则来引发的。 d t d 由于不具备针对 x m l文件包含资源和内容含义的限制功能,这将很大程度上制约了 x m l 处理器去开展有效力的文档检索验证工作,这也是 x m l s c h e m a 得以开发的原因。 x m l 在功能上的力度大大高于 d t d ,因此可以用来更实用、更精细地对 x m l 文件 进行层次和语言规范的制定工作,其作为 w 3 c 提出的被广泛认同的模式,已经成为为 各方积极认可的最佳模型建立工具,并且已经代替的 d t d 的应用。x m l 文件规范对应 下的 x m l s c h e m a 运用的相应范式文件,同时也制约着的相应的信息关系和信息成分。 x m l s c h e m a 相对于 d t d 具备了非常突出的特点:第一,x m l s c h e m a 文件以更高的标 准从统一性限制、信息构造、信息形式等三个层面对 x m l 文件展开相关制约,d t d 中 不能够规范的法则在 x m l s c h e m a中得到了很好的规范,并且只是在构造上十分小的 范围内制约 x m l 文档。第二,d t d 具有自己特定的语言规范样式,x m l s c h e m a 文件自 己已经是一个相应的 x m l文件,通常分解分析时使用 x m l的相关功能。x m l s c h e m a 的语言规范结构的复杂程度大大超过了 d t d ,这也就意味着其具备比 d t d 更强的展示 能力,以及对于不同应用环境更强的实用性,这样看,d t d被 x m l s c h e m a代替已经 是一种必然的前进方向。 x m l s c h e m a具备两种常规的限制方式:信息形式制约与信息内涵限制。对于复 首都经济贸易大学硕士学位论文 本体中间件电信计费集成系统研究 第 11 页 共 50 页 杂形式,x m l s c h e m a使用内涵限制来得以完成,成分、特性和文件关联性以及成分 彼此之间关联的限制和构造由其制定。而信息的形式限制是由 x m l s c h e m a使用简单 形式来完成的。s i m p l e t y p e 和 c o m p l e x t y p e 分别是简单类型和复杂类型的标示。x m l 所自带的形式以及由其延展生成的形式都包含在简单形式之中, 其中不具备相关特性 与下级成分。由合成形式、简单形式、成分形式和空置形式其中之一或多个结合成的 是繁杂形式,也允许具备下级成分和相关特性。 信息表现形式和信息内涵的实用性可以由 x m l d t d 和 s c h e m a 来进行检查。并且 信息形式和信息间关联性以及信息限制关系都可以依据它进行制定, 这些子成分和数 据源较为相似,这样就能够达到信息源形式与 x m l 文件形式的对应关系,而检索则是 通过运用 x m l 的检索规则完成的。在 x m l 文件上制定出了常规信息源的集成策略,这 样,集成就具备了很好的适用性。 3 . 1 . 3 x m l 在数据集成方面的应用 早于 x m l 的数据集成方式中,通用的数据模式一般运用对象模式或者关系模式。 在 x m l被开发出来后,便成为互联网上文件内涵意义和文件构造方面的统一表述方 式,也同时变成了互联网上信息传输与交互的新制式,以 x m l 方式传输的信息可以表 达各种方式储存的信息源,这样就很好地屏蔽掉了下层数据源格式的多样性。通过 x m l 标准的应用,我们可以把那些出处不同的、格式上有区别的数据整合起来。同时, 对于这些结构上彼此相异的信息,能够实现有效检索的目标。此外还对这些信息源的 整合创造了条件。互联网上各个不同基础系统间的信息交互的重要方式就是信息整 合,因此当前信息整合的重点主要集中于 x m l 语言在这一方面的应用。 由于 x m l 是互联网上信息表达的通用性规范, 可以大大提升各个应用系统彼此的 交互效率,这种特性使其在异构信息整合与数据查询应用中起到了不可替代的功用。 其优势可总结如下: (1 )x m l是一种信息传递过程中起到中间介质作用的语言规范,这样的信息存 储方式就不会被信息的表现形式所限制。通过信息构成和信息表现之间彼此分离特 点,x m l 数据的适用性和交互流动性都得到了极大的提升 (2 )x m l的应用保证了新信息源在添加时只改动相对应信息模式的操作方式, 随时添加随时使用的简单便利方式得以实现。 (3 )x m l可以是解决异构信息源彼此在交互调用问题上的重要技术手段,这种 屏蔽掉操作系统间差异的能力在信息整合过程中起到了重要的作用。 (4 )x m l具备很强的延展性和自我表达性,因此信息便可以在不进行自我表达 的情况下被调用和运行,并可以在同一时刻对不同形式的信息进行描述。 首都经济贸易大学硕士学位论文 本体中间件电信计费集成系统研究 第 12 页 共 50 页 3 . 2 本体技术 3 . 2 . 1 本体的概念 本体是一个哲学领域的概念。在计算机领域内,一个被大家广泛接受的定义是: 本体是概念模型的明确规范说明。此后有人在这个理论上进行了有意义的扩展阐述: 本体可以看作交互思路下模式的明确形式化规则。对于上面的这些说明,更为详细的 探讨得出了这样的结论:本体是共享概念模型的明确的形式化规范说明。在以上的表 述中,有四层意义蕴含其中,它们分别是:表象化、交互方式、定义化和清晰化。 (1 )表象化:以精准的算术方式进行表达,是可以为计算机系统运行的,是可 以被计算机系统读取的。 (2 )交互方式:用户可以对其中所蕴含的知识实现共享。这些在本体中可以被 一致认同的知识对应着特定范围内被大家所广泛接受的概念集, 它面向着社会层面上 的共同认识而并非个别单体彼此的共同认识。 (3 )定义化:本体是对现实世界中实际存在事物的抽象概括,这种从现实世界 中获得实物现象,并以此进行概括从而得到相应的模型,其中所具备的知识结构是不 依赖于现实的背景情况。 (4 )清晰化:本体中的定义以及各个定义之间的关联都被细致地进行了规范。 其中所涉及的定义以及对这些定义的约束都具备非常清晰的说明。 本体事实上就是针对特定范围内事物的明确、标准的抽象表达,本体由类组成, 对于各个定义都有相应的特性进行表述,以及特性的制约机制。对于完整本体而言, 其中同时包括了与特定的类相对应的实例。本体由五个不同的建模原语构成:类、关 系、函数、公理和实例。 (1 )类:从语义层面看,类是对现实世界里客体的概括,它表示相似术语描述 的定义的一个集合,这个集合中包含着定义的名称和对定义的自然语言表达。 (2 )关系:关系是指该应用范围中各个定义彼此间的交互性,在形式上规范为 n 维笛卡儿积的子集。 (3 )函数:函数是一种独特的数学结构。函数里体现出的对应逻辑,能够将推 导从一个定义指向其他的定义。 (4 )公理:即为公众所广泛接受的论断。公理可以作为相关信息的制约出现, 还可以证实准确性或者推理出新信息。 通常本体里的定义是借助彼此间联系来实现关 联的,而公理的存在能够让定义间关联的表达得到了极大的扩展。 (5 )实例:实例是对定义的实例化,表示了某一特定定义的具体值。 首都经济贸易大学硕士学位论文 本体中间件电信计费集成系统研究 第 13 页 共 50 页 3 . 2 . 2 o w l 技术简介 本体中定义的内涵是借助对定义间关联的正确规范来实现的, 这种高级别的概括 保证了其内涵的准确性,表达了本体中一致认同的、交互使用的知识。本体的应用, 帮助系统形成了一个可以实现语义级数据集成和互操作目的的基础。对于本体的阐 述,我们能够使用自然语言来进行,还能够通过运用语义表述网络、内部框架或者规 范逻辑描述用语等方式来进行表达。 目前,o w l 已经是 w 3 c 认可的本体描述语言。o w l 包含了大量的原语来加强语言 含义层面表述与逻辑推导方面的能力。o w l 中增加了许多关于表述类和属性的用语, 比如类之间的不相交性等等。 这些词汇的增加可以应用于更准确表述那些语言集中出 现的用语以及用语彼此的映射关联, 而对于用语和用语彼此间关联的描述就是我们所 说的本体表达。 另外,对于在 o w l 不存在被规范的信息形式,我们可以引用 x m l s c h e m a 中所规 范的信息形式加以使用。o w l也包含了三种不同的描述力逐级加强的子语言:o w l l i t e 、o w l d l 及 o w l f u l l 。 o w l l i t e :应用于对定义层进行的分类和简单特性进行限制等方面的描述。 o w l d l :在阐述逻辑的前提上,确保了推导程序运算的可靠性和可控制性,同时 具备最强的描述能力。 o w l f u l l :和 r d f 维持最高的互相融合级别,允许把用语增加到本体预定义规范 的用语表上。 3 . 2 . 3 本体与数据集成 本体可以对定义和定义彼此间的关联进行详细规范并对定义内涵进行详细规范, 以此来表示那些被广泛接受以及交互使用的知识。 本体成为了语言含义层面上数据传 输和交互使用的基础。因此,将本体运用在信息整合上之后,将具备很好的阐述信息 源语义和破解结构相异数据问题的潜力。 本体赋予特别范围的实体称谓和描述, 对于实体彼此间的关联通过谓语来进行表 达。 它为描述与交互范围的知识提供了用语库, 并同时提供用语库中专用语言的关联。 语言意义结构相异情况的应对策略是应用形式化本体对系统用语集与中间媒介用语 集进行划定,本体对应关系则用来限定他们彼此的调用。本体在信息整合层面具备很 多优势:第一,本体中包含的用语库是信息源的接合点,并相对于信息形式保持独立 状态。第二,本体表达的知识可以保证所有信息源中的信息进行调换。第三,本体应 用中可以对统一性协调进行支持,并对形式相异信息进行辨别。第四,本体凭借术语 首都经济贸易大学硕士学位论文 本体中间件电信计费集成系统研究 第 14 页 共 50 页 的交互机制,在语言意义整合方面产生巨大功用。 在以本体为转换基础的数据整合方式中,本体可用于信息源内涵的详尽阐述,有 几种各具特点的方式用于整合:单一本体集成、多个本体集成和混合本体方法。 (1 )单一本体集成 单个本题集成是通过全局本体的使用,依靠共享用语集对用语内涵加以描述。全 部信息源都会和此全局本体产生关联关系。这种将全部信息源整合于一个特定范围 中,并具备全局图示来破解整合难题的方法就是单一本体方式。这种方法适用的情况 是,信息源具备大体类同的范围图示。可是对于一个信息源在一定范围中具有差异很 大的特殊情况,即具备了不同属性粒度的时候,这时就很难发现最低本体承诺。单一 本体更容易被信息源的更改所制约,因为在信息源产生一定变化时,全局本体和其它 信息源对于本土的对应关系就需要适当地进行改动。 单一本体的构造可以通过下图得 以说明: 3 . 1 单一本体 (2 )多个本体集成 每个信息源通过其自身本体进行阐述的方法就是多个本体集成。 多个本体具有无 需将各个局部本体和另外的信息源进行关联来产生其各自本体的优点,这样,在信息 源发生变化时,本体就不需要进行太大的修改。但是,这种方法也有缺乏单一全局本 体的问题,带来了和另外的不同信息源很难进行对照的缺点。多个本体的构造可以通 过下图得以说明: 首都经济贸易大学硕士学位论文 本体中间件电信计费集成系统研究 第 15 页 共 50 页 3 . 2 多个本体 (3 )混合本体集成 针对单一本体与多个本体都存在劣势的问题,一种混合本体的集成方式出现了。 这种方法与多个本体集成方法的类似之处是不同信息源都是通过自身的本体进行语 言意义的阐述。同时,在第一层设立的全局本体,这个全局本体的交互使用用语库可 以达到不同信息源本体彼此进行比照的目的。 通过这样将各个局部本体专用语词汇设 立在全局本体核心语上的方法,实现了局部本体彼此交互调用的目的。这种混合本体 集成方法的特别优势是方便了信息源的调整, 无需针对对应法则和交互使用用语集进 行修改,并且实现了本体的自我更新机制。同样,混合本体集成在全局本体和局部本 体间设立的对应关联,这种对应关联也因此成为了该方法中信息整合的重要方法。本 文中的信息集成方案运用的就是混合本体方法来进行数据集成。 混合本体的构造可以 通过下图得以说明: 首都经济贸易大学硕士学位论文 本体中间件电信计费集成系统研究 第 16 页 共 50 页 3 . 3 混合本体 3 . 3 w e b s e r v i c e s 技术 互联网应用中,w e b s e r v i c e s的出现为实现信息交互使用目标找到了新的集成 方案。在这种达到了信息交互使用的前提下,能否使各个独立信息源彼此实现交互调 用就成为了新的需要解决的问题, 这种需求目标是各系统之间实现顺畅的数据传输和 信息的交互调用。这时, w e b 应用就可以被我们认为是一个可以运用 x m l 信息经过互 联网进行调用的通道,这组能够调用的应用就是由这个通道来规范的。w e b 服务的特 点是可以做到独立于单个系统之外,同时能够绕过安全系统进行信息的流通。在这个 信息整合的体系中,互联网中大量彼此各异的服务单位上存在着形式各异的信息源, 这样,我们就能够借助 w e b 应用来实现分布式系统条件下,形式互异信息进行顺畅传 输的目标。 3 . 3 . 1 w e b s e r v i c e s体系结构 w e b 应用系统由多种角色组成,即服务供应商、服务注册平台、服务申请用户。 这三种角色之间的彼此调动触及了公布、检索和整合功能。这些功能和角色共同应用 在 w e b 提供的基础服务组件之中: w e b 应用中关于程序的阐述以及模式的构造。 其中, 首都经济贸易大学硕士学位论文 本体中间件电信计费集成系统研究 第 17 页 共 50 页 服务供应商对 w e b 应用提供的服务进行阐述并做出规范, 然后将其公布的注册平台里 面去。 服务申请用户可以运用检索功能在其自用系统或者注册平台里面检索关于所需 服务的阐述,之后应用服务阐述和服务供应商展开整合,最后对 w e b 应用进行正确的 申请来实现彼此之间的信息互动。 3 . 4 w e b s e r v i c e s 体系结构 3 . 3 . 2 w e b s e r v i c e s协议栈 w e b 应用的实现是由大量协议规范来支持的。w 3 c 的给出的 w e b 服务堆栈规范了 w e b 应用中涉及到的开发准则与改进方向,这些标准的协议规范全部是开放的,以一 个堆栈的方式共同存在于 w e b 服务中并互相调用。 w e b 服务堆栈是以互联网信息传输为前提设计的。在 w e b 服务中得到广泛应用的 是 h t t p ,以及 s m t p 和 f t p 这两种应用非常广泛的网络基础协议,这一系列网络协议 能够顺利通过 w e b上的安全系统。信息的阐述首先是由信息阐述层中的 x m l为 w e b 上层服务协议所提供的。在 w e b 服务中协调使用、描绘阐述、以及注册检索等功能, 也全部以

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论