(通信与信息系统专业论文)下一代网络元数据管理系统及实现技术研究.pdf_第1页
(通信与信息系统专业论文)下一代网络元数据管理系统及实现技术研究.pdf_第2页
(通信与信息系统专业论文)下一代网络元数据管理系统及实现技术研究.pdf_第3页
(通信与信息系统专业论文)下一代网络元数据管理系统及实现技术研究.pdf_第4页
(通信与信息系统专业论文)下一代网络元数据管理系统及实现技术研究.pdf_第5页
已阅读5页,还剩62页未读 继续免费阅读

(通信与信息系统专业论文)下一代网络元数据管理系统及实现技术研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

南京邮电大学硕上研究生学位论文摘要 摘要 用元数据统一描述用户、业务和网络信息是下一代网络实现自适应业务提供的关键技 术之一,元数据管理系统则是下一代网络自适应管理体系结构中的一个重要部件。论文基 于笔者参与国自基金项目“下一代网络自适应业务提供体系结构及关键技术 的研究心得, 对元数据管理系统的设计和实现技术作了较为系统的研究和探讨。 论文首先概述元数据的基本概念及其分类,对主流元数据描述语言进行简要介绍。然 后提出元数据管理系统的整体架构设计和详细的系统工作流程,该架构在常规的元数据管 理模块之外,引入了元数据采集模块和用户自适应列表生成模块。接着,论文深入讨论元 数据管理系统实现的应用元数据设计技术、元数据采集技术和自适应列表生成技术,给出 了用户元数据和业务元数据的采集过程,利用x f o r m 技术实现了元数据管理系统的元数据 采集功能,并研究自适应列表的生成策略,针对不同的用户需求提出了三种列表生成策略 算法。最后,论文给出两个元数据管理系统的应用,并对元数据管理系统的进一步研究方 向作了小结。 论文给出的自适应元数据管理系统设计及实现技术,可用于下一代网络自适应业务提 供体系架构的的元数据管理子系统设计,也可用于自成体系的元数据管理业务系统的设 计。 南京邮电大学 硕士学位论文摘要 学科、专业:工学通信与信息系统 研究方向:i p 与宽带网络技术 作者:2 0 0 5 级研究生杨赞指导教师糜正琨 题目:下一代网络元数据管理系统及实现技术研究 英文题目:t h es t u d yo nn g nm e t a d a t am a n a g e m e n ts y s t e ma n di t s i m p l e m e n t a t i o nt e c h n i q u e s 主题词:元数据自适应业务下一代网络 k e c w o r d s : m e t a d a t a a d a p t i v es e r v i c e s n e x t g e n e r a t i o nn e t w o r k a b s t r a c t m e t a d a t a , w h i c hi su s e da sau n i f i e dd e s c r i p t i o nt o o lf o ru s e r s ,s e r v i c e sa n dn e t w o r k i n f o r m a t i o n ,i so n eo ft h ek e yt e c h n o l o g i e sf o r t h en g na d a p t i v e s e r v i c ep r o v i s i o n i n g m e t a d a t am a n a g e m e n ts y s t e mi sa ni m p o r t a n tc o m p o n e n to ft h en g na d a p t i v em a n a g e m e n t a r c h i t e c t u r e t h i sp a p e ri sb a s e do nt h ea u t h o r sr e s e a r c he x p e r i e n c ei nt h en s f cp r o j e c t ”t h e a r c h i t e c t u r ea n dk e yt e c h n o l o g i e so ft h en g na d a p t i v es e r v i c e sp r o v i s i o n i n g ”i ts t u d i e sa n d d i s c u s s e st h em e t a d a t am a n a g e m e n ts y s t e md e s i g na n di m p l e m e n t a t i o nt e c h n i q u e sc o n c e m e d t h ep a p e ro u t l i n e st h eb a s i cc o n c e p to ft h em e t a d a t aa n di t sc l a s s i f i c a t i o na n dg i v e sab r i e f i n t r o d u c t i o no ft h em a i n s t r e a mm e t a d a t ad e s c r i p t i o nl a n g u a g e s t h e n ,t h eo v e r f l lm e t a d a t a m a n a g e m e n ts y s t e m a r c h i t e c t u r ei s d e s i g n e dw i t hd e t a i l e ds y s t e mw o r k i n gp r o c e d u r e s i n a d d i t i o nt ot h ec o n v e n t i o n a lm e t a d a t am a n a g e m e n tm o d u l e ,t h ea r c h i t e c t u r ei n c l u d e s t h e m e t a d a t ac o l l e c t i o nm o d u l ea n dt h eu s e ra d a p t i v es e r v i c el i s tg e n e r a t i o nm o d u l e i n - d e p t h d i s c u s s i o ni sd e v o t e dt ot h r e ei m p l e m e n t a t i o nt e c h n i q u e so ft h em e t a d a t am a n a g e m e n ts y s t e m , a p p l i c a t i o nm e t a d a t ad e s i g nt e c h n i q u e ,m e t a d a t ac o l l e c t i o nt e c h n i q u ea n da d a p t i v es e r v i c e l i s t g e n e r a t i o nt e c h n i q u e s p e c i f i c a l l yt h ep a p e rp r o p o s e st h eu s e rm e t a d a t aa n ds e r v i c em e t a d a t a c o l l e c t i o np r o c e d u r ea n dm e t a d a t ac o l l e c t i o ni m p l e m e n t a t i o nt e c h n i q u eb a s e do nx f o r r n t h e a d a p t i v es e r v i c el i s tg e n e r a t i o np o l i c e sa r ed e t a i l e d w i t ht h r e ep o l i c e sp r e s e n t e dc o v e r i n g d i f f e r e n tu s e rn e e d s f i n a l l y , t h ep a p e re x a m i n e st w oa p p l i c a t i o n so ft h em e t a d a t am a n a g e m e n t s y s t e ma n dc o n c l u d e sw i t has u m m a r yo ff u r t h e rs t u d yt o p i c s t h ea d a p t i v em e t a d a t am a n a g e m e n ts y s t e md e s i g na n di m p l e m e n t a t i o nt e c h n i q u e sp r o p o s e d i nt h i sp a p e rc a nb ea p p l i e dn o to n l yt ot h em e t a d a t am a n a g e m e n ts u b s y s t e md e s i g ni nt h en g n a d a p t i v es e r v i c e sp r o v i s i o n i n ga r c h i t e c t u r e ,b u ta l s ot ot h es t a n d a l o n em e t a d a t am a n a g e m e n t s y s t e md e s i g n i i 南京邮电大学 硕士学位论文摘要 学科、专业:工学通信与信息系统 研究方向:i p 与宽带网络技术 作者:2 0 0 5 级研究生杨赞指导教师糜正琨 题目:下一代网络元数据管理系统及实现技术研究 英文题目:t h es t u d yo nn g nm e t a d a t am a n a g e m e n ts y s t e ma n di t s i m p l e m e n t a t i o nt e c h n i q u e s 主题词:元数据自适应业务下一代网络 k e c w o r d s : m e t a d a t a a d a p t i v es e r v i c e s n e x t g e n e r a t i o nn e t w o r k 南京邮电大学学位论文独创性声明 本人声明所呈交的学位论文是我个人在导师指导下进行的研究 工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的 地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包 含为获得南京邮电大学或其它教育机构的学位或证书而使用过的材 料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了 明确的说明并表示了谢意。 研究生签名:缘霍 日期:2 必:幺z 南京邮电大学学位论文使用授权声明 南京邮电大学、中国科学技术信息研究所、国家图书馆有权保留 本人所送交学位论文的复印件和电子文档,可以采用影印、缩印或其 他复制手段保存论文。本人电子文档的内容和纸质论文的内容相一 致。除在保密期内的保密论文外,允许论文被查阅和借阅,可以公布 ( 包括刊登) 论文的全部或部分内容。论文的公布( 包括刊登) 授权 南京邮电大学研究生部办理。 研究生签名:叠壶拯导师签名: 南京邮电人学硕上研究生学位论文第一章引言 1 1 论文背景 第一章引言 元数据的广泛应用是因现代信息资源处理上的两大挑战而发展起来的,一是数字资源 逐渐成为信息资源的主流,而这些资源从产生、存档、管理到使用都和传统的纸介质文献 有很大的不同;二是网络和数字化技术使信息发布既快又便捷,由此而来的海量信息要求 有能与现代计算机技术和网络环境相适应的方便、快捷、有效的数据发现和获取方法【l j 。 在这种情况下,描述数据的元数据信息就显得非常重要,成为信息资源有效管理和应用的 重要手段。 在新的自适应业务体系结构中,为了支持环境适配的个性化业务,允许用户和不同类 型或位于不同地域的业务提供商交互,使用不同类型的终端接入,设置对业务的偏好选择, 也允许在变化的网络环境中使用业务。因此,用户、终端、业务、业务提供商、网络之间 存在比较复杂的关系。为了描述这种复杂关系并对其进行有效的管理,就有必要借鉴类似 于关系数据库对复杂关联数据的管理方式,引入元数据技术。 元数据的主要目的是解决数据管理和共享问题。元数据能够有效提高系统存储、检索 和移动数据的能力。当今生产和存储的大量数据对于用户是严重的挑战。如果用户无法知 道有什么数据和在哪里能找到它们,就无法使用它们。用户对这些大型数据集的应用能力 取决于对数据有效的访问及管理能力。 在移动通信系统中,业务信息( 业务文档) 和用户信息( 用户文档) 都保存在h l r 或 v l r 中,用户和业务提供商并不能对这些元数据信息进行方便有效的管理。对于用户来说, 由于数据库中所拥有的用户数据十分有限,系统还不能根据现有的用户文档为用户提供多 样化的自适应服务,用户也无法了解在其当前状况下所能得到的适合自己的服务内容。因 此,在下一代自适应网络中,为了更有利于不同的业务提供商进行业务发布并对其所发布 的业务信息进行管理,也为了使用户能够享受比较完善的自适应业务提供,业务信息和用 户信息都采用元数据描述,并有必要开发一个元数据统一管理和应用系统。这个系统可以 融合到下一代网络的整体体系结构中,也可以作为一种第三方业务单独存在,为网络提供 元数据管理功能。 现今对元数据的描述、采集、管理和应用都已经有较多的研究。关于元数据的描述, 除了使用x m l 2 】【3 】、r d f 4 1 之外,国际上现在比较流行使用o w l 5 1 语言。o w l 是w 3 c 推 堕室坚生盔兰堡主里窒生兰竺丝奎笙二兰! ! 童 荐的语义互联网中本体描述语言的标准,它的语义表达能力比x m l 和r d f 更好。由于 o w l 具有一定的推理功能,因此使用o w l 的机器上可以执行推理任务,这是x m l 和r d f 无法做到的。元数据的采集现在大多涉及到的都是用户数据的采集以及用户文档的生成问 题,业务相关的元数据一般由业务提供商直接提供。在下一代自适应网络中,除了用户向 元数据管理系统提供一部分静态用户信息之外,许多动态用户状态信息可以依靠各种传感 器进行采集,将这些静态信息和动态信息组合起来,就可以构成用户的元数据文档。通过 使用所开发的元数据管理系统,可以对用户文档进行随时更新,以便于向用户提供自适应 业务。 1 2 论文主要内容和本人所做的工作 在导师的指导下,笔者从2 0 0 5 年开始参与国自基金项目“下一代网络白适应业务提供 体系结构及关键技术”,并致力于研究下一代网络自适应业务提供关键技术中的元数据技 术,对下一代网络自适应业务管理体系结构中的元数据管理子系统进行开发研究。 论文第二章研究元数据的整体概念,根据下一代网络自适应业务管理体系的系统需求 对元数据进行分类,并跟踪研究了主流元数据描述语言。在此基础上,第三章提出了元数 据管理系统的整体架构设计,在常规的元数据管理模块之外,引入了元数据采集模块和用 户自适应列表生成模块,并给出了详细的系统工作流程。第四章深入讨论了元数据管理系 统实现的应用元数据设计技术、元数据采集技术和自适应列表生成技术,并具体描述了用 户元数据和业务元数据的采集过程,给出了元数据采集实现的部分程序,详尽研究了自适 应列表的生成策略,针对不同的用户需求提出了几种列表生成策略算法。第五章给出了两 个元数据管理系统的应用实例设计,验证所提出系统架构与技术的可行性。最后,第六章 的结语部分对元数据管理系统的进一步研究方向作了小结。 目前,通过项目组成员的共同努力,下一代网络自适应业务管理体系的总体架构已经 基本成型,论文给出的自适应元数据管理系统设计及实现技术,既可用于下一代网络自适 应业务提供体系架构的的管理子系统设计,也可用于自成体系的管理业务系统的设计。 2 南京邮电大学硕士研究生学位论文第二章元数据类型及描述 第二章元数据类型及描述 2 1 元数据的应用分类 元数据的种类繁多,目前未见综述性的文献对其进行具体的归类,本文根据元数据应 用的范围,将其分为用户元数据、终端元数据、业务元数据和网络元数据四类元数据。本 节对这些元数据进行简要的归纳介绍。 2 1 1 用户元数据 用户元数据是指描述用户信息的数据。一般来说,最基本的用户信息包括用户名( 用 户帐号) 和用户密码,用于业务对用户的鉴权。根据不同业务的需要,用户信息还可以包 括用户性别、用户类型、用户联系方式、用户使用语种、用户所在地、用户状态等。将业 务所需要的所有用户元数据集合起来,便构成了对应于该业务的用户文档。用户文档是提 供用户个性化业务的基础。 2 1 2 终端元数据 对用户终端能力的描述信息称为终端元数据。如果用户终端比较单一或者变化不大, 也可以将终端元数据归并到用户文档中,作为用户元数据的一部分。终端能力描述信息比 较广泛,可以包括终端类型、终端屏幕尺寸及分辨率、终端所支持语言、终端所支持色彩、 终端所支持音频及视频等。根据终端能力的不同,业务提供商所能提供给用户的业务也不 同,业务提供商可以通过获取用户的终端信息,从而对业务作出一定调整后再提供给用户, 使用户能够更好地体验业务。 2 1 3 业务元数据 为了便于业务发现,当业务提供商将业务注册发布到网络时,必须提供一定的业务相 关信息,这些对业务进行描述的信息便称为业务元数据,一个业务的所有业务元数据可以 组成该业务的业务文档。业务元数据可以包括业务名称、业务类型、业务提供商信息、业 务资费、业务所需终端能力等。在下一代自适应管理体系结构中,业务发现功能可以根据 用户所提出的业务要求进行业务查找,并将搜寻到的业务告知用户。最基本的业务查找便 3 南京邮电大学硕上研究生学位论文 第二章元数据类型及描述 是将用户的业务要求与网络中已注册所有业务的业务元数据进行比对,因此,完善业务元 数据是更好地实现业务发现功能的基础,也是实现为用户提供最合适的业务的保证。 2 1 4 网络元数据 网络元数据即用于描述网络状念信息的数据,不同的网络具有不同的网络参数,在下 一代自适应管理体系结构中,涉及最多的一般是网络的q o s 信息。在下一代网络中,业务 提供与网络状态息息相关。当网络状态变化时,业务提供商可以根据当前网络状况改变业 务提供模式,使得用户可以在不同的网络状态下享受同一业务,或者在用户进行不同网络 间切换时实现业务的无缝切换。 2 2 元数据的特征分类 除了将元数掘进行应用分类之外,也可以根据元数据特征将其简单地分为静态元数据 和动态元数据。 2 2 1 静态元数据 所谓静态元数据,严格意义上是指不随时间而变化的元数据,如用户名、业务名称、 业务类型等。但是从广义上讲,我们可以把在较长一段时间内保持不变的元数据也称为静 态元数据,例如用户密码、用户类型、终端类型等。这些元数据都是在用户注册或业务注 册时由系统收集,只有在用户或业务提供商提出信息更改要求时才会进行改变。 2 2 2 动态元数据 动态元数据就是指会随时间而改变的元数据,如网络q o s 信息。对于动态元数据,需 要有一套监视系统,随时对这些元数据进行测量、采集和处理,并送至相应的系统设备。 在下一代网络中,若要提供比较完善的自适应业务,必须充分合理地运用动态元数据,环 境感知技术便是一个很好的示例。 4 南京邮电人学硕士研究生学位论文 第二章元数据类型及描述 2 3 元数据描述语言 2 3 1x m l x m l 全称是e x t e n s i b l em a r k u pl a n g u a g e ( 可扩展标记语言) 。x m l 是互联网联合组 织( w 3 c ) 创建的一组规范,其目的不仅在于满足不断增长的网络应用需求,同时还希望 借此能够确保在通过网络进行交互合作时,具有良好的可靠性与互操作性。 x m l 是标记语言的成员。所谓标记,是指根据数据自身信息进行编码的方法。如果在 语言中为了标识某些信息而加入一些标记,这种语言就被称为标记语言。通常根据需要定 义一套标记,然后将这套标记添加到语言中,就变成了标记语言。标记语言不同于一般的 控制流程序设计语言,基本上可以被视为一种数据流的文档结构描述语言。在计算机处理 过程中,标记语言的标记既可以作为数据,也可以作为控制语句来使用。 信息在语法描述上的差异,我们往往可以通过必要的数据格式转化来将信息转化为目 标应用能够处理的语法格式。当然,更为理想的情况应该是所有的信息都采用同样的语法 来描述,x m l 的出现使得不同类型的数据表示成同一格式成为了可能。x m l 已经成为了 w e b 上数据表示和交换的事实标准,是应用之间或者机器之间共享数据的一种有效方式。 x m l 及其相关技术的发展极大地促进了信息表达和交换过程中语法描述上的统一,越来越 多的应用丌始选用x m l 作为其数据、配置信息、消息以及服务的语法描述模式。迄今为 止,x m l 已经成为了w e b 上最理想的数据表达方式。x m l 的可扩展性使x m l 可以满足 各种不同领域数据描述的需要,并可以对计算机之间交换的任何数据进行编码。 x m l 由许多部分组成,其中最主要的为三个部分,分别是文档类型定义( d t d ) ,也 就是x m l 的布局语言;可扩展的样式语言( e x t e n s i b l es t y l el a n g u a g e ,简称为x s l ) ,也 就是x m l 的样式语言;以及可扩展链接语言( x l l ) 。 文档类型定义( d t d ) 规定了文档的逻辑结构。它可以定义文档的语法,而文档的语 法反过来能够让x m l 语法分析程序确认某张页面标记使用的合法性。d t d 定义页面的元 素、元素的属性以及元素和属性之间的关系。例如,d t d 能够规定某个表项只能在某个列 表中使用。 理想的定义应面向描述与应用程序有关的数据结构而不是如何显示数据,即应把一个 元素定义为一个标题行,然后让样式表和脚本定义如何显示标题行。d t d 不是强制性的。 对于简单应用程序来说,开发商不需要建立自己的d t d 。可以使用预先定义的公共d t d , 或者根本不使用。即使某个文档已经有了d t d ,只要文档是组织良好的,语法分析程序也 气 南京邮电大学硕士研究生学位论文 第二章元数据类型及描述 可以不对照d t d 来检验文档的合法性。服务器可能已经执行了检查,所以检验的时间和 带宽将得以节省。 可扩展的样式语言( x s l ) 是用于规定x m l 文档样式的语言。x s l 能够使w e b 浏览 器改变文档的表示法,例如数据的显示顺序改变,就不需要再与服务器进行交换通信。或 者变换样式表,同一个文档可以显示得更大,或者经过折叠只显示外面一层,或者变为打 印格式。x s l 凭借其可扩展性能够无穷无尽地标记,而控制每个标记的方式也是无穷尽的。 可扩展链接语言( x l l ) 将支持目前w e b 上已有的简单链接,并且将进一步扩展链接, 包括结束死链接的间接链接以及可以从服务器中仅查询某个元素的相关部分的连接符“l ,o 2 3 2r d f x m l 所存在的问题是因为x m l 不具备语义描述能力。为此,w 3 c 推荐以资源描述 框架( r e s o u r c ed e s c r i p t i o nf r a m e w o r k ,简称r d f ) 标准来解决x m l 的语义局限。r d f 是一 个用于表达关于万维网上的资源的信息的语言,它是专门用于表达关于w e b 资源的元数 据。r d f 本身只有很少的语义定义元素,但通过对通常意义上的语义、语法和结构的支持, 可使不同的用户或团体在这一框架下定义他们自己的元数据元素,从而提供了各种不同的 元数据体系之间的互操作性。 r d f 的核心定义比较简单,它基于这样的思想:被描述的事物具有一些属性,而这些 属性各有其值,对资源的描述可以通过对上述属性及值的陈述来进行。r d f 用一套特定的 术语来表达陈述中的各个部分:陈述中用于识别事物的部分称为“主体”,用于区分陈述对 象主语的各个不同属性的那个部分称为“谓词”,而陈述中用于区分各个属性值的部分称为 “客体”。例如对于这样的陈述:e s o n sm a i l b o xi sd n _ y y 1 6 3 t o m 可以用r d f 陈述来表示: 主体e s o n ,谓词m a i l b o x ,客体岫 1 6 3 c o r n 。 r d f 用统一资源标识符( u n i f o r mr e s o u r c ei d e n t i f i e r s 或u r i s ) 来标识事物,用简单 的属性及属性值来描述资源。这使得r d f 可以将一个或多个关于资源的简单陈述表示为由 结点和弧组成的图,其中的结点和弧代表资源、属性或属性值。最简单的r d f 图如图2 - l 所示: 联傩捩( 弃体) 榭性( 潲西d ) 图2 - 1 :r d f 图 r d f 陈述中的客体,可以是u r i r e f s ,也可以是常量值,即用于表示某种属性值的字符串, 6 堕室坚皇查兰堡主堕壅生竺垡垒奎笙三皇垄鍪塑耋型垄塑堕 在这里称作文字。在r d f 的陈述中,文字一般不被用作主体或谓词。 在具体的实现上,r d f 提供了一种基于x m l 的语法,称为r d f x m l ,用于保存和 交换r d f 图。r d f x m l 是书写r d f 的规范性语法。 r d f 用u r i 引用( u r e f e r e n c e s ) 作为其标识机制的基础,一个u r i 引用( u 对r e f ) 是一个在尾部附加了可选的“片段标识符”的u 。比如,u r i 引用 h t t p :w w w w 3 o r g c o n t a c t - # m e 由前部分的u r ih t t p :w w w w 3 o r g c o n t a c t 和后部分的片段标 识符m e 组成,之间用符号样分隔。因为r d f 用u r i r e f 替代词语来命名陈述中的事物,r d f 称一个u r i r e f 的集合为词汇表。通常,一个词汇表中的所有术语都有一个相同的命名空间 u r i r e f ,这个u r i r e f 就定义了这个词汇表。包含在词汇表里的u r i r e f s 是通过在公用的 u r i r e f 的末端加上局部名称形成的,这样就构成了一套有着公用前缀的u r i r e f s 。 本文通过一个例子来说明r d f x m l 语法的基本思想:对于如下的叙述: h t t p :w w w e x a m p l e o r g i n d e x h t m lh a sac r e a t i o n d a t ew h o s ev a l u ei so c t 2 8 ,19 8 2 。对应于这 个陈述的r d f 图如下所示:( 其中的c r e a t i o n d a t e 属性已经指定了u r e f ) 图2 2 图2 2 所对应的r d f x m l 语法: ? x m lv e r s i o n = ,1 0 ,胗 。 o c t 2 8 19 8 2 第1 行为x m l 声明,它表明以下的内容是x m l ,x m l 版本号是1 o 。第2 行以r d f i r d f 元素开始。它表明以下直到 为止的x m l 内容用于表达r d f 。同一行紧随r d f i r d f 之后的是x m l 命名空间声明,该声明指明在当前内容中出现的所有前缀为r d f i 的标签都属 7 南京邮电大学硕十研究生学位论文第二章元数据类型及描述 于由下列u r i r c f 所标识的命名空间:h t t p :w w w w 3 o r g 1 9 9 9 0 2 2 2 - r d f - s y n t a x n s # 。以该命 名空间打头的u r i r e f s 用于标识来自r d f 词汇表中的术语。第3 行是另一个x m l 命名空 间,它指明前缀e x t e r m :与命名空间u r i r e fh t t p :w w w e x a m p l e o r g t e r m s 相关联。以该命 名空间开始的u 刚r e f s 用于由e x a m p l e 组织( e x a m p l e 组织为本文所举示例) 定义的词汇表 中的术语。第4 6 行是r d f 图中所示陈述的r d f x m l 主要部分。第4 行中的 r d f :d e s c r i p t i o n 起始标签表明了某个资源描述的开始,然后标识了陈述所针对( a b o u t ) 的 资源,即陈述的主体。第5 行用e x t e r m s :c r e a t i o n d a t e 作为标签,用来表示谓词和陈述的客 体。e x t e r m s :c r e a t i o n d a t e 这个属性元素的内容就是客体“o c t 2 8 ,1 9 8 2 ”,它可以扩展为 h t t p :w w w e x a m p l e o r g t e r m s c r e a t i o n - d a t e 。 2 3 3d a m l + oll x m l 、r d f 的语言其表达能力有限,研究者希望开发一种表达能力更强的模式语言, o i l 和d a m l o n t 应运而生。欧洲的研究机构设计了描述语言o i l ( o n t o l o g yi n t e r c h a n g e l a n g u a g e 或o n t o l o g yi n f e r e n c el a y e r ) ) ,o i l 是第一个将描述逻辑、框架语言和w 曲标 准( 如x m l 和r d f ) 联合起来的描述语言。d a m l o n t ( d a r p a a g e n tm a r k u pl a n g u a g e ) 是由美国国防高级研究计划局( d a r p a ) 资助,美国许多研究机构参与研究建立的一种描述 语言,它是r d f 在面向对象与基于框架知识的一个扩展。这两种语言都是基于r d f r d f s 之上的,这使得它们最终合并建立了d a m l + o i l 语言。 d a m l + o i l 采用了面向对象的方法,利用类和属性来描述域的结构,使用公理来声 明类和属性的特征。它继承了o i l 的特征,利用了严格形式化的描述逻辑,提供丰富的约 束条件描述知识,极大地增强了语言的表达能力。与r d f 不同的是,d a m l + o i l 不是数 据模型,而是用来限制和描述以r d f 数据模型显示的数据的结构语言。也可以认为d a m l + o i l 是另一种r d f s 语言,是r d f s 的扩展,加强了对类和属性的限制。 d a m l + o i l 语言由标题、类元素、属性元素和实例组成。标题中往往包括版本信息 与输入元素。d a m l + o i l 把总体分为两个部分:属于x m ls c h e m a 数据类型的值组成的 数据类型域和d a m l + o i l 类的成员对象组成的对象域。d a m l + o i l 主要关心的是那些 描述( 或定义) 部分对象域的类的创建,这些类被称为对象类,包含类元素。d a m l + o i l 将数据属性分为对象属性和数据类型属性。 南京邮电大学硕上研究生学位论文 第二章元数据类型及描述 2 3 4o w l o w l 全称w 曲o n t o l o g yl a n g u a g e ,是w 3 c 推荐的语义互联网中本体描述语言的标准。 它是从d a m l + o i l 发展起来的。 设计o w l 是为了提供一种能够理解信息语义内容的语言,其基本思想是在表达力和 推理复杂度之间取得平衡:既要满足表达w e b 信息的需求,又要控制推理复杂度,方便 应用的开发。o w l 可清晰地描述术语词汇及词汇实体间的关系,比r d f 、r d f s 和 d a m l + o i l 更能提高w e b 内容的机器可读性。 o w l 针对不同的需求分为三个子语言:o w ll i t e 、o w ld l 和o w lf u l l 。 o w l 整个的语言被称为o w lf u l l 。它可以应用所有o w l 语言中的所有定义的组成部 分。它同样允许利用r d f 和r d fs c h e m a 将这些组成部分进行组合。在o w lf u l l 中,一个类 可以被看作一个个体的集合,同时又可以将自身作为一个个体对待。o w l 能够在已经定义 好的( r d f s 或其它o w l ) o n t o l o g y 之上,增加更新的或改变原有的含义。o w lf u l l 的优 势在于提供最大的表达性,不论在语法上,还是在语义上,都能够与r d f 兼容。但另一方 面,也决定了它的缺点:o w lf u l l 的表达性是如此之强,以至于可能没有任何软件能够完 全支持o w lf u l l 的所有推理功能,更不用说高效推理。 o w ld l 支持那些对于表达能力要求较大,但同时又要求保持计算完整性的用户。o w l d l 包括了o w l 语言的所有组成部分,但要求它们只能够被应用于特定的环境之中,例如, 在o w ld l 之中,尽管允许一个类可以是许多类的子类,但明确要求一个类不能是另一个 类的实例。o w ld l 完全基于描述逻辑,它能够提供有效的推理支持。但o w ld l 的缺点 在于与r d f 的不完全兼容:为了让一个r d f 文件成为一个合法的o w ld l 文件,需要在某 些方面进行扩展,而在另一些方面加以限制。 o w ll i t e 是一个对o w ld l 的表达能力进行更进一步限制的语言。对于只需要一个分 类层次体系,以及某些简单推理的用户,o w ll i t e 是一个好的选择。o w ll i t e 去除了某些 o w l d l 中的语言结构,如它排除了列举类、非交语句,尽管它还支持基数限制( c a r d i n a l i t y c o n s t r a i n t s ) ,但它只允许基数为0 或1 的限制。这一语言的优点在于它易于被用户掌握,同 时易于加以实现。其缺点也显而易见,在于其表达能力的有限。 这三种子语言之间的关系是:每个合法的o w ll i t e 都是一个合法的o w ld l ;每个合 法的o w ld l 都是一个合法的o w lf u l l ;每个有效的o w ll i t e 结论都是一个有效的o w l d l 结论;每个有效的o w ld l 结论都是一个有效的o w lf u l l 结论。 9 南京邮电人学硕上研究生学位论文 第二章元数据类型及描述 2 。3 5 元数据描述语言比较 r d f 和x m l 是互为补充的。首先,r d f 希望以一种标准化、互操作的方式来规范 x m l 的语义。x m l 文档可以通过简单的方式实现对r d f 的引用。借助r d f ,表达同一 事实的x m l 描述就可以被转化为统一的r d f 陈述。通过在x m l 中引用r d f ,可以将 x m l 的解析过程与解释过程相结合。也就是说,r d f 可以帮助解析器在阅读x m l 的同时, 获得x m l 所要表达的主题和对象,并可以根据它们的关系进行推理,从而做出基于语义 的判断。x m l 的使用可以提高w e b 数据基于关键词检索的精度,而r d f 与x m l 的结合 则可以将w e b 数据基于关键词的检索更容易地推进到基于对象的检索。 其次,由于r d f 是以一种建模的方式来描述数据语义的,这使得r d f 可以不受具体 语法表示的限制。但是r d f 仍然需要一种合适的语法格式来实现r d f 在w e b 上的应用。 虽然r d f ( 模型) 既可以用n o t a t i o n 3 来表示,也可以用x m l 来表示。但是,由于x m l 已经成为被广泛支持的w e b 数据表示标准,便于应用的读取,因此将r d f 序列化为x m l 表示可以使r d f 获得更好的应用可处理特性,并使得r d f 数据可以像x m l 数据一样的 容易使用、传输和存储。 因此,r d f 是定制x m l 的良伴,而不只是对某个特定类型数据的规范表示,x m l 和 r d f 的结合,不仅可以实现数据基于语义的描述,也充分发挥了x m l 与r d f 的各自优点, 便于w e b 数据的检索和相关知识的发现。 r d f 的不足之处在于r d f 没有定义推理机制,推理能力差,虽然提供了修改s c h e m a 的方法,但无法适应w e b 迅速变化的特点。鉴于r d f s ( i m fs c h e m a ) 语义表达能力的 有限,o w l 借鉴了d a m l ,o i l 和d a m l + o i l 的经验,在r d f s 的基础之上,通过增加 语言构成要素,扩充了r d f s 的语义表达能力,并且提高了语义表述的精确性,然而随之 而来的是计算复杂性和推理难度的增加,有效可计算性的降低。描述逻辑的存在为o w l 语 言的设计打下了重要的基础,使o w l 能够在表达能力和可计算性之间找到平衡。 o w l 三种子语言与r d f 的关系是:o w lf u l l 可以看成是r d f 的扩展;o w ll i t e 和 o w lf u l l 可以看成是一个约束化的r d f 的扩展;所有的o w l 文档( l i t e ,d l ,f u l l ) 都 是一个r d f 文档;所有的r d f 文档都是一个o w lf u l l 文档:只有一些r d f 文档是一个 合法的o w l l i t e 和o w l d l 文档。 本章最后给出w 3 c 提出的本体语言栈,如图2 3 所示。从图中便可以看到每种描述语 言在语言栈中的的层次。 1 0 南京邮电人学硕上研究生学位论文 第二章元数据类型及描述 图2 - 3 本体语言栈 南京邮电大学硕士研究生学位论文 第三章元数据管理系统设计 第三章元数据管理系统设计 3 1 元数据管理系统概述 根据下一代网络自适应业务管理体系的系统需求,元数据管理系统应该完成元数据采 集、管理以及部分的应用功能。 在用户侧,首先,用户可以在元数据管理系统中注册一个个人帐户,系统会在用户注 册时采集用户元数据信息,储存在系统数据库中。在使用元数据管理系统时,用户必须先 登陆系统,然后可以选择用户元数据管理功能或业务代理下载功能。其中,用户元数据管 理功能可以满足用户随时对自身信息的修改和更新,而业务代理下载功能则会根据系统数 据库中的元数据信息为用户提供一个最适合该用户的自适应业务列表,供用户进行业务选 择。当用户使用了业务代理下载功能,并在自适应列表中选择了业务之后,系统便会将用 户所选业务的业务代理下载到用户的终端上,然后用户便可以通过该业务代理体验业务。 在业务提供商侧,业务提供商可以进行业务注册,系统将注册业务的业务元数据信息 储存在系统数据库中。对于已经存在子数据库中的业务信息,业务提供商也可以进行修改、 更新或删除。 3 2 元数据管理系统架构 为了实现上一节所提出的系统基本功能,本文提出元数据管理系统的整体架构如图3 1 所示。系统包括网关、服务器、元数据采集模块、业务提供商接口和数据库五个部分,系 统传递的信息均使用x m l 编码,因此元数据管理系统的服务器应为x m l 服务器。该服务 器必须包含一个x m l 解析器、相应的功能函数库和数据库接入a p i ,而实现用户自适应 业务列表生成的模块也可以包含在x m l 服务器中。 1 2 南京邮电大学硕上研究生学位论文 第三章元数据管理系统设计 3 2 1 网关 图3 - 1 元数据管理系统基本架构 网关是整个元数据管理系统的接e l 部分,它作为连接因特网和无线电话数据网络的桥 梁,将用户和元数据管理系统的其它部分连接起来,并使它们成功进行通信。这个网关必 须可以分派请求、对x m l 的请求和响应进行编解码,以及完成用户和业务提供商之间的 协议转换。 3 2 2x m l 服务器 x m l 服务器是整个元数据管理系统的核心,它由x m l 解析器、函数库、自适应业务 列表生成服务器和数据库接入a p i 四个部分所组成。x m l 服务器不但负责处理系统中所 有的x m l 请求和响应,也负责对数据库的访问。 3 2 3 数据库 元数据管理系统包含了2 个主要的数据库:用户元数据库和业务元数据库。 用户元数据库主要存储用户信息,如:用户名、密码、用户偏好、终端类型等。元数 据管理系统利用这个数据库来进行用户认证,用户状态核查以及用户数据管理,也要利用 部分该数据库信息来生成自适应业务列表。 1 3 堕室坚鱼查堂堡生婴窒生兰垡丝奎 笙三童垄鏊堡笪型墨竺堡生 业务元数据库主要存储了业务信息以及业务提供商的信息。元数据管理系统利用这个 数据库构建业务列表并可以通报业务提供商有哪些用户订购了他们的业务,而业务代理也 作为业务信息的一部分存储在这个数据库中。 3 。2 4 业务提供商接口 业务提供商接口是业务提供商和x m l 服务器之间的连接。当一个业务提供商需要注 册或管理其业务时,必须先与元数据管理系统中的业务提供商接口进行连接,然后向x m l 服务器发送一个x m l 请求,而x m l 服务器发送的x m l 响应也是通过这个接口传送给 业务提供商的。 3 3 系统工作流程 下面按功能详细给出元数据管理系统的工作流程。 3 3 1 用户注册登陆 用户注册的工作流程如图3 2 所示: 图3 2 用户注册 1 用户向元数据管理系统发出注册请求: 2 元数据管理系统调用用户注册认证函数; 1 4 查塞唑皇查兰堡:! 婴壅生兰垡笙奎笙三皇垂鍪塑篁型墨竺堡生 3 用户注册认证函数中的注册功能激活元数据采集管理模块,由该模块向用户采集基本 的用户静态信息: 4 用户提供系统所要求的静态信息后,元数据采集管理模块将这些信息合成用户静态文 档存入

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论