




已阅读5页,还剩73页未读, 继续免费阅读
(计算机软件与理论专业论文)语义门户网站开发方法研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
河海大学硕士学位论文 摘要 摘要 随着当前w e b 逐步演化成语义w e b ,研究下一代门户网站语义门户网站( 即语义w e b 技术 驱动的门户网站) 是一个必然的发展趋势。 早期的语义门户网站的开发主要采用“自底向上”的方法,即尽量利用本体技术( 和w e b 服务 技术) 来改造( “迁移”或“升级”) 现有的门户网站。然而,由于已有门户网站开发时使用的传统 w e b 开发技术存在固有缺陷,使得门户网站的“事后改造”很困难,改造成的语义门户网站也难称 得上是“理想的”语义门户网站。当前,随着语义w e b 本体技术的日臻成熟,相关学术界和工业界 提出了一些“自顶向下”开发语义门户网站的方法学和软件工程框架及工具集,但是利用现有这些 方法、框架和工具集开发出的语义门户网站也未能达到“理想的”语义门户网站要求。本文就是在 这种背景下,研究并提出一种“自顶向下”开发“理想的”语义门户网站的方法和软件工程框架 c a s e 4 s w p d ,并对其中一个关键过程( 即基于领域本体的关系数据库模式设计) 进行深入研究, 设计开发出相应c a s e 工具0 2 d d e s i g n e r 的原型。 0 2 d d e s i g n e r 根据输入的领域本体,按照预定义的本体到关系数据库模式的转换规则和转换算 法以及本体与关系数据库模式之间的( o n m r d b ) 元素映射关系x m l 表示格式,生成相应的关系 数据库模式( s q l d d l 语句) 以及o n t o r d b 元素映射关系( x m l 格式) 。该工具为网站工程师提 供了友好的人机交互界面,解析并可视化o w ld l 本体,网站工程师可以根据自身需求选择生成的 r d b m s 类型,工具将自动生成相应的关系数据库模式d d l 语句以及o n t o r d b 元素映射关系x m l 文件。 一个典型的案例研究验证了转换算法的可行性、o n t o - r d b 元素映射关系x m l 表示格式的合理 性以及已实现的原型工具的有效性;0 2 d d e s i g n e r 结果在语义门户网站中的个典型应用说明了基 于本体的关系数据库模式设计和c a s e 4 s w p d 框架之间的关系。 关键词:语义门户网站,软件工程,本体工程,o w l ,c a s e 工具,语义w e b 河海大学硕士学位论文 摘要 a bs t r a c t t h ec u r r e n tw e bi se v o l v i n gt ot h es e m a n t i cw e b ,t h e r e f o r er e s e a r c ho ft h en e x tg e n e r a t i o no fw e b p o r t a l s ( i e s e m a n t i cw e bp o r t a l s ,s e m a n t i cw e bt e c h n o l o g i e se n a b l e dw e bp o r t a l s ) t e c h n o l o g yi sa n a t u r a ld e v e l o p m e n t 仃e n d e a r l ys e m a n t i cw e bp o r t a ld e v e l o p m e n tf o c u s e so nb o t t o m u pm e t h o d s ,w h i c hm a k eu s eo fo n t o l o g y t e c h n o l o g y ( a n dw e bs e r v i c e st e c h n o l o g y ) t or e c o n s t r u c t ( e m i g r a t eo ru p g r a d e ) c u r r e n tw e bp o r t a l st o s e m a n t i cw e bp o r t a l s h o w e v e r , t h eb u i l t - i nl i m i t a t i o n so fc o n v e n t i o n a lw e bd e v e l o p m e n tt e c h n o l o g i e s , w h i c ha r eu s e dt od e v e l o pc u r r e n tw e bp o r t a l s ,m a k et h er e c o n s t r u c t i n gt a s ks od i f f i c u l tt h a tt h e r e c o n s t r u c t e ds e m a n t i cw e bp o r t a l sc a n n o tb ei d e a l c u r r e n t l y ,s e m a n t i cw e bo n t o l o g yt e c h n o l o g yi s b e c o m i n gm a t u r e ,r e l a t e d a c a d e m i cc o m m u n i t ya n di n d u s t r i a l c o m m u n i t yh a v ep r e s e n t e ds e v e r a l m e t h o d o l o g i e s ,s o f t w a r ee n g i n e e r i n gf r a m e w o r k sa n dt o o l - s u i t st od e v e l o ps e m a n t i cw e bp o r t a l si na t o p - d o w nw a y b u tt h e s e m a n t i cw e bp o r t a l sd e v e l o p e db ys u c h m e t h o d o l o g i e s ,f r a m e w o r k sa n d t o o l s u i t sa l s oc a n n o ta c h i e v et h eg o a l so fa ni d e a ls e m a n t i cw e bp o r t a l i nt h eb a c k g r o u n d ,t h i st h e s i s r e s e a r c h e sa n dp r o p o s e sas o f t w a r ee n g i n e e r i n gf r a m e w o r ka n dm e t h o d o l o g yc a l l e dc a s e 4 s w p df o r t h e d e v e l o p m e n to fa ni d e a ls e m a n t i cw e bp o r t a li nat o p d o w nw a y ,r e s e a r c h e sak e yp r o c e s sw i t h i nt h e f r a m e w o r kw h i c hi sd o m a i no n t o l o g yb a s e dr e l a t i o n a ld a t a b a s e ( r d b ) s c h e m ad e s i g n ,a n dd e s i g n sa n d d e v e l o p sac a s et o o lp r o t o t y p ec a l l e d0 2 d d e s i g n e rf o r t h ek e yp r o c e s s a c c o r d i n gt o as e to fp r e d e f i n e dc o n v e r s i o nr u l e sf r o mo n t o l o g yt or d bs c h e m a , a nc o n v e r s i o n a l g o r i t h ma n dt h ex m lr e p r e s e n t a t i o nf o r m a tf o re l e m e n tm a p p i n g sb e t w e e no n t o l o g ya n dr d bs c h e m a ( o n t o r d b ) ,0 2 d d e s i g n e ra u t o m a t i c a l l yg e n e r a t e sr d bs c h e m a ( s q ld d ls t a t e m e n t s ) a n do n t o - r d b e l e m e n tm a p p i n g sd a t ai nx m lf o r m a tb a s e do nt h ei n p u t t e dd o m a i no n t o l o g y 0 2 d d e s i g n e rp r o v i d e st h e p o r t a le n g i n e e rw i t haf r i e n d l yh u m a n - m a c h i n ei n t e r a c t i v ei n t e r f a c e i tc a np a r s ea n dv i s u a l i z ea no w ld l o n t o l o g y ,a u t o m a t i c a l l yg e n e r a t ea n do u t p u tr d bs c h e m ad d ls t a t e m e n t sa n do n t o r d be l e m e n t m a p p i n g sx i v i lf i l ea c c o r d i n gt op o r t a le n g i n e e r sc h o i c eo fr d b m st y p e at y p i c a lc a s es t u d yv a l i d a t e st h ef e a s i b i l i t yo ft h ec o n v e r s i o na l g o r i t h m ,t h er e a s o n a b l e n e s so f o n t o r d be l e m e n tm a p p i n g sx m l f o r m a t , a n dt h ee f f e c t i v e n e s so ft h ei m p l e m e n t e dp r o t o t y p et 0 0 1 a n d at y p i c a la p p l i c a t i o no ft h er e s u l t so f0 2 d d e s i g n e ri nas e m a n t i cw e bp o r t a ls h o w st h er e l a t i o n s h i p b e t w e e nd o m a i no n t o l o g yb a s e dr d bs c h e m ad e s i g na n dc a s e 4 s w p df r a m e w o r k k e y w o r d s :s e m a n t i cw e bp o r t a l ,s o f t w a r ee n g i n e e r i n g ,o n t o l o g i c a le n g i n e e r i n g ,o w l ,c a s et o o l , s e m a n t i cw e b 学位论文独创性声明 本人所呈交的学位论文是我个人在导师指导下进行的研究工作及取得 的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中 不包含其他人已经发表或撰写过的研究成果。与我一同工作的同事对本研 究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。如不实, 本人负全部责任。 论文作者( 签名) : 塞茎盔如占年 ,月为日 学位论文使用授权说明 河海大学、中国科学技术信息研究所、国家图书馆、中国学术期刊( 光 盘版) 电子杂志社有权保留本人所送交学位论文的复印件或电子文档,可 以采用影印、缩印或其他复制手段保存论文。本人电子文档的内容和纸质 论文的内容相一致。除在保密期内的保密论文外,允许论文被查阅和借阅。 论文全部或部分内容的公布( 包括于i 登) 授权河海大学研究生院办理。 论文作者( 签名) : 瓷扛苇 如占年易月j f 6 日 河海大学硕士学位论文 第一章绪论 第一章绪论 1 1 研究背景与选题依据 门户网站是一个提供公共主题( 如某个城市或感兴趣的领域) 信息内容的网站【1 1 。门户网站有 两种类型:水平门户网站,即通用目的网站,如y a h 0 0 1 、m s n 2 和新浪网3 等;垂直门户网站,即特 定领域或领域专属门户网站,如w 3 c 联盟( w o r l dw i d ew e bc o n s o r t i u m ) 4 和语义w e b 社区门户网 站( s e m a n t i cw r e bc o m m u n i t yp o r t a l ) 5 等。通常,门户网站为用户收集和显示相关信息,用户能在 其上发布事件或信息,根据个人喜好、主题等来定位自己感兴趣的信息内容,找到具有相同兴趣的 其它w e b 资源,而且具有一致兴趣的用户可以建立特定社区来提交和共享关于某个主题的信息。 由于门户网站是基于传统w e b 技术构建的,以人为使用对象,而传统w e b 技术在信息的搜索、 访问、提取、解释和处理方面表现出很大的局限性,如缺乏对w e b 上信息的描述,h t m l 提供的链 接缺乏语义,基于关键词检索的查中率低下,从而限制了门户网站对信息共享和通信的支持。门户 网站的这种缺陷归根到底在于当前w e b 是语法w e b ( s y n t a c t i cw e b ) 【2 】,其设计目的是面向用户直 接阅读与处理,机器难以自动处理w e b 上的信息,从而导致各种w e b 应用之间缺乏语义互操作性。 w e b 的缔造者t i mb e m e r - l e e 于1 9 9 8 年首次提出了语义w e b ( s e m a n t i cw e b ) 构想例:语义 w e b 上的信息都是机器可理解或可处理的。从而,语义w e b 上信息之间的语义关系能够被机器理解 和处理,w e b 应用之间的语义互操作性要求得以满足。简言之,语义w e b 是当前w e b 的一种扩充, w e b 信息将给予明确定义的含义( 语义) ,以使计算机和人更好地协同工作【4 】。语义w e b 的提出及 其相关研究的展开,为解决传统w e b 技术构建的门户网站中的瓶颈问题提供了新思路。 当前,语义w e b 作为w 3 c 领导的协作式研究计划f 卯,众多研究人员和工业伙伴参与其中,都 围绕着t i mb e m e r s l e e 提出的语义w e b 层次结构【6 】( 图1 1 1 ) 展开相关研究。如图1 1 1 所示,语 义w e b 层次结构的第一层是统一字符编码( u n i c o d e ) 和统一资源标识符( u n i f o r mr e s o u r c e i d e n t i f i e r s ,简称u r i ) ,作为整个语义w e b 的基础,提供w e b 资源编码、资源及资源间关系的唯一 标识,其中u n i c o d e 处理资源的编码,u r i 负责标识资源。第二层是可扩展标记语言( x m l ) 、命 名空间( n a m e s p a c e s ) 和x m l 模式( x m ls c h e m a ) ,表示数据的内容和结构,将w e b 上资源信息 的结构、内容与数据的表现形式进行分离,确保了语义w e b 的定义。第三层是资源描述框架( r d f ) 1 7 l 和r d f 模式( r d fs c h e m a ) 8 1 ( 统称为r d f ( s ) ) ,用于描述w e b 上的资源、资源类型以及资源 间的联系,是语法互操作性的基础。第四层是本体词汇( o n t o l o g yv o c a b u l a r y ) ,在更具表达力的知 识形式化描述层上提供语义互操作性,能够对词汇的变迁提供支持。第五层是逻辑( 1 0 9 i c ) ,提供公 h t t p :w w w , y a b o o c o r n h t t p :w w w m s n c o m h t t p :w w w s i n a c o m c n h t t p :w w w w 3 o r g h t t p :s e m a n t i c w e b o r e _ 河海大学硕士学位论文 第一章绪论 理和逻辑推理规则,为机器对具有语义的数据进行推理提供基础。第六层是证明层( p r o o f ) ,注重 于提供认证机制,执行逻辑层产生的规则,并结合信任层的应用机制来评判是否能够信敕给定的证 明。第七层是信任( 打u s t ) ,注重于提供信任机制,以保证用户代理进行个性化服务和彼此间交互合 作时更加安全可靠。 图111 语义w e b 层次结构图 本体( o n t o l o g y ) 作为语义w e b 的使能器一1 ,是解决语义层次上w e b 信息共享和交换的基础”l 。 本体源于哲学范畴,当前被计算机研究领域所广泛接受的本体定义为:本体是共享概念模型的明确 的形式化规范说明】。本体的目标是获取、描述和表示相关领域的知识,提供对该领域知识的共同 理解,确定该领域内共同认可的词汇( 术语) ,并从不同层次的形式化模式上给出这些词汇和词汇之 间相互关系的明确定义。本体在基于w e b 的应用程序间的知识处理、共享和重用扮演非常重要的角 色,是解决语义层次上具有不同知识表示格式的w e b 应用系统之间的信息共享和交换的基础,并促 进在不同系统之间共享、交换和复用数据和知识。 本体在w e b 上广泛运用需要一个重要的先决条件,即需要一种描述本体并使得本体之间能够进 行信息交换的语言标准。目前的主流w e b 本体语言( w e bo n t o l o g yl a n g u a g e ) 有r d f ( s ) 和 o w l 1 3 1 嘲。r d f 17 1 定义了机器可处理的数据模型,主谓宾三元组( o b j e c t - p r o p e r t y - v a l u e t r i p l e ) 作为基本的模型原语,用x m l 语法表示,由三种对象类型组成:u r l 命名的资源( r e s o u r c e ) ,用 于描述资源某一特性或关系的属性( p r o p e r t y ) ,以及一个命名属性加上某资源的该属性下的取值构 成一个r d f 语句( n a t e m e m ) 。r d fs c h e m a t 8 i 是描述r d f 资源属性和类的词汇表,规范了机制以约 束类及关系的组台和这些约束冲突的检测。r d f ( s ) 仅仅是简单轻量的本体语言口i ,其对知铡语义的 描述能力不足。冈此w 3 c 在r d f ( s ) 基础上开发了w e b 本体语言o w l 。 o w l 已经 :2 0 0 4 年2 月1 0 日被批准为w 3 c 的推荐标准( w 3 cr e c o m m e n d a t i o n ) 。根据不同 用户和实现,o w l 提供了三个描述能力逐渐增强的子语言l l “:o w l l i t e 、o w l d l 和o w l f u l l 。 2 河海大学硕 学位论文第一章绪论 o w ll i t e 提供简洁的本体语言,支持那些主要需要分类层次结构和简单约束的用户。o w ld l 对应 于描述逻辑( d e s c r i p t i o nl o g i c ) ,构成了o w l 的形式基础,在保证计算完备性( 保证所有的结论能 够计算而得) 和可判定性( 所有的计算可在有限的时间内完成) 的同时支持最大的描述能力。o w l f u l l 追求最大的描述能力和没有计算完备性保证的r d f 语法自由。 语义w e b 上信息借助本体技术能够被赋予机器可处理的语义,使自动工具( 和人) 能更有效地 发现、处理、集成和重用w e b 内容和服务。从而,基于传统w e b 技术构建的门户网站在信息共享 和通信方面存在的缺陷能够借助于语义w e b ( s e m a n t i cw e b ) 1 1 8 1 技术( 如本体技术纠和语义w e b 服 务1 1 9 1 ) 得到改善。因此,将语义w e b 中的本体技术以及语义w e b 服务技术运用到门户网站中,构 造语义门户网站( s e m a n t i cw e bp o r t a l ) ,是一个必然的发展趋势。 m i c h a e ls t o l l b e r g 等人在综述文献 2 0 1 1 2 1 1 中给出了语义门户网站定义: 它是一个w e b 门户,也就是说它为有一致兴趣的用户团体收集信息; 它为感兴趣的业界和不同业界之间的通信和信息交流提供工具; 它利用语义w e b 技术来提供高级的通信和信息交流工具。 目前,可供用户访问使用的语义门户网站的学术界主要成果有m i n d s w a pp o r t a l 、s w w sp o r t a l 、 e s p e r o n t op o r t a l 和o n t o w e bp o r t a l ,工业界主要成果有e m p o l i sk 4 2 和m o n d e c ai t m 。通过分析研究, 发现这些语义门户网站仅仅是以非常基本的方式来运用语义w e b 技术,还没有充分发挥作为语义 w e b 驱动的应用的全部潜能。因此,语义门户网站的开发还处于一个非常初级的阶段,缺乏一套整 体的方法学来支撑。 早期的语义门户网站的开发主要采用“自底向上”的方法,即尽量利用本体技术或和w e b 服 务技术来改造( “迁移”或“升级”) 现有的门户网站【2 2 1 。然而,由于已有门户网站开发时使用的传 统w e b 开发技术存在固有缺陷,使得门户网站的“事后改造”很困难,改造成的语义门户网站也难 称得上是“理想的”语义门户网站1 2 0 1 。 当前,随着语义w e b 本体技术的日臻成熟,相关学术界开始研究“自顶向下”开发语义门户网 站的方法学和软件工程框架及工具,s e a l l 2 3 1 、o n t o w e b b e r l 2 4 1 、o n t o w e a v e r l 2 5 1 & o n t o w e a v e r - s 2 6 1 等方法都是学术界的探索性研究成果,这些方法都提供了一些支持方法和工具。通过对上述方法学、 软件工程框架及工具的细致研究分析,发现用这些方法构造的语义门户网站并没有达到文献 2 0 1 1 2 1 】 中提出的“理想的”语义门户网站的要求,其原因在于这些方法各有其侧重点,提供的解决方案都 不够全面,从而开发出的语义门户网站达不到文献 2 0 2 1 1 的要求,所以本文研究目的是提出一种“自 顶向下”开发“理想的”语义门户网站的方法和软件框架。 3 河海大学硕士学位论文第一章绪论 1 2 技术现状综述 1 2 1 “理想的”语义门户网站的功能框架和特征 m i c h a e ls t o b e 喀等人在综述文献 2 0 【2 l 】中从功能角度提出了一个语义门户网站三层框架,如图 1 2 1 所示。在这个框架中: 基础技术层包括系统技术( 具体有系统体系结构、数据管理和系统维护) 和语义w e b 技术 ( 具体有本体和语义w e b 服务) ,是门户网站的技术构造块和底层支柱; 信息处理层是指门户网站的信息处理设施,包括信息项的五阶段处理生命周期( 创建、发 布、组织、访问和维护) 和协作特性( 如邮件、讨论论坛以及信息项的多用户编辑等) ; 信息访问层是用户界面,强调从用户角度来评价一个门户网站,包括其可用性和信息质量。 图1 2 1 语义门户网站三层框架( 功能视角) ”“ 语义门户网站是语义w e b 技术驱动的门户网站,而其中语义w e b 技术的运用主要体现在本体 技术和语义w e b 服务技术。 本体是语义门户网站的支撑技术1 2 ”,它将门户网站的领域知识以词汇( 术语) 形式存放在 本体中,从而提供机器可读的语义,为信息处理和自动信息交换奠定了基础。语义门户网 站中本体技术的运用主要表现在咀下三个方面1 2 0 】: + 本体为门户网站提供基础的数据模型,因此可以用一致风格来描述门户网站的结构和 内容; + 语义门户网站中的信息项可以借助于本体被语义标注,从而使得信息项添加上了机器 可处理的语义,促进了更有效的信息管理; 4 河海大学硕士学位论文第一章绪论 夺 本体促进w e b 上的自动化信息交流,从而促进了语义门户网站和其它语义w e b 应用 之间的互操作。 语义w e b 服务( s e m a n t i cw e bs e r v i c e s ) 是语义w e b 技术与传统w e b 服务技术( 如u d d l 6 、 w s d l 2 8 1 和s o a p 2 9 1 等等) 相结合,并且允许w e b 服务的自动定位、组装、调用和互操作 的新技术。在语义门户网站中使用w e b 服务和语义w e b 服务技术反映了语义门户网站功 能通过w e b 能以何种程度被访问。语义w e b 门户中运用( 语义) w e b 服务技术主要体现 在以下两方面f 2 1 1 : 语义门户网站的一些功能作为w e b 服务被用户使用,如内容搜索、内容发布等。从而, 用户可以通过用户界面( u s e r i n t e r f a c e ) 和w e b 服务来灵活使用语义门户网站; 夺 提供语义w e b 服务。语义信息作为支撑的w e b 服务允许服务的自动定位、组合、调 用和互操作。采用语义w e b 服务要考虑自动支持这些服务到何种程度。 根据m i c h a e ls t o l l b e r g 等人的综述文献【2 0 】【2 l 】,假如一个语义门户网站的开发方法和框架能够 从以上方面来运用本体技术和语义w e b 服务技术,使得其开发出的语义门户网站具备了图1 2 1 中 的功能特征,那么这个语义门户网站可以称| 乍“理想的”语义门户网站。 因此,一个语义门户网站是否能够作为“理想的”语义门户网站要从基础技术、信息处理和信 息访问三方面来衡量: 基础技术包括系统技术和语义w e b 技术:系统技术主要考虑系统体系结构、数据管理和系 统维护,而语义w e b 技术主要考虑本体和语义w e b 服务技术的运用程度; 信息处理包括对信息项的五阶段处理生命周期( 创建、发布、组织、访问和维护) 的支持, 以及所提供的协作功能( 如邮件、讨论论坛以及信息项的多用户编辑等) 及其支持程度; 信息访问包括门户网站的可用性和其信息的质量。 对一个语义门户网站的开发方法和框架要从以下方面衡量其优劣: 本体对语义门户网站建模支持:是否提供对领域知识、组织结构、用户信息、信息项以及 所提供的服务的建模支持,以及支持的程度; 网页和信息项的语义标注:是否对网页和信息项进行了语义标注,以及标注的程度; 语义标注的使用:语义标注在门户网站中是否被使用,或以何种方式被使用; 传统w e b 服务的提供:网站中提供了哪些传统w e b 服务,以及服务的可用性; 语义w e b 服务的提供:网站中是否提供了语义w e b 服务,或对语义w e b 服务自动支持的 程度。 6 h t t p :w w w u d d i o r g 5 河海大学硕士学位论文第一章绪论 1 2 2 现有主要语义门户网站综述 当前,可供用户访问使用的语义门户网站主要有m i n d s w a pp o a a l 、s w w sp o r t a l 、e s p e r o n t o p o r t a l 、k a o np o r t a l 、a i f bp o r t a l 、o n t o w e bp o r t a l 、v i s i o np o r t a l 、e m p o l i sk 4 2 和m o n d e c ai t m 。 表1 2 1 列出了现有主要的语义门户网站的名称、研发机构人员、主页以及主要开发方法。 表1 2 1 现有主要的语义门户网站 名称研究机构人员主页u r l主要开发方法 m i n d s w a p m a r y l a n d 大学m i n d s w a p 小组h t t p j w w w m i n d s w a p o r g | p o r t a l e u 资助项目s w w s ( i s t - 2 0 0 1 3 7 1 3 4 ) , s w w s p o r t a l i s o c 0 7 开发 h t t p j s w w s s e m a n t i c w e b o r g d u o n t o i o g y 方法 e u资助项目 e s p e r o n t o o d e s e w 知识门户 e s p e r o n t op o r t a lh t t p j w w w e s p e r o n t o n e t ( i s t - 2 0 0 1 3 4 3 7 3 ) ,u p m 的本体小组开发 生成器 k a r l s r u h e 大学的a i f b 学院和信息技术 k a r l s r u h e 本体和语 k a o np o r t a l 研究中- d f z l 8 研究开发 h t t p :k a o n s e m a n t i c w e b o r g 义w 曲工具集 k a o n 、s e a l 力- 法 k a r l s r u h e 大学a i f b 学院,f z i 信息技术 a i f bp o r t a l 研究中心和o n t o 州s eg m b h 9 开发 h t t p j w w w a i f b u n i - k a r l s r u h e d es e a l 方法 e u 资助项目o n t o w e b ( i s t - 2 0 0 0 - 2 9 2 4 3 ) o n t o w e bp o r t a l h t t p :w w w o n t o w e b o r g s e a l 方法 的一部分 v i s i o np o r t a le u 资助项i | v i s i o nr o a d m a pp r o j e c t h t t p j w w w k m v i s i o n o r g s e a l 方法 ( i s t - 2 0 0 2 3 8 51 3 ) e m p o l i sk 4 2 e m p o l i s 公司开发 h t t p j w w w e m p o l i s c o m | m o n d e e ai t mm o n d c c a 公司开发 h t t p :w w w m o n d e c a c o m | 其中,学术界的主要成果有m i n d s w a pp o r t a l 、s w w sp o r t a l 、e s p e r o n t op o r t a l 、k a o np o r t a l 、 a i f bp o r t a l 、o n t o w e bp o r t a l 和v i s i o np o r t a l ,工业界的主要成果有e m p o l i sk 4 2 和m o n d e c ai t m 。 下面分别简要介绍这些语义门户网站。 m i n d s w a pp o r t a l 是由m a r y l a n d 大学m i n d s w a p 小组研究开发的。网站所有者宣称这是第一 个使用语义w e b 技术的网站,采用了符合o w l 本体语言的本体技术。该网站试着展现本 体技术怎样改进网站的功能,然而它并没有以完全发挥语义w e b 技术的潜能,连搜索框或 菜单都没有采用语义技术,而仅仅是对网页的一些简单的标注,用户只能在网站中发现一 些嵌入式的r d f 文档。 s w w sp o r t a l 作为i s c o c o 开发的,作为e u 资助的s w w s ( i s t - 2 0 0 1 3 7 1 3 4 ) 项目成员共 享信息和发布信息的分发平台。s w w s 项目的研究目标是提供一个综合的w e b 服务描述 框架,定义一个w e b 服务发现框架,并提供一个规模可伸缩的w e b 服务仲裁中间件。 7 h t t p :w w w i s o c o t o m 8 h t t p :w w w f z i d e 9 h t t p :w w w o n t o p r i s e d e 6 河海大学硕士学位论文第一章绪论 e s p e r o n t op o r t a l 是由u p m 的本体小组( o n t o l o g y g r o u p ) 开发的,作为e u 项目e s p e r o n t o ( i s t - 2 0 0 1 3 4 3 7 3 ) 的内联网和外联网平台,是o d e s e w 3 0 】知识门户生成器的一个案例研究, 其技术基础是w e b o d e 3 11 。 k a o np o r t a l 是由k a r l s r u h e 大学的a i f b 学院和k a r l s r u h e 的信息技术研究中心f z i 合作开 发的。它是k a r l s r u h e 本体和语义w 曲工具集k a o n 3 2 】( k a r l s r u h eo n t o l o g ya n ds e m a n t i c w e bt o o ls u i t e ) 的项目展示站点,同时k a o np o r t a l 中也实现了s e a l ( s e m a n t i cp o r t a l ) 概 念体系结构i ”l 。k a o n 由几个e u 资助的项目合作开发,设计来提供本体和元数据基础设 施,以建立、使用和访问w e b 上和用户桌面上的语义驱动的应用。 a i f bp o r t a l 是由k a r l s m h e 大学的a i f b 学院开发的,为该学院研究小组的学生和研究人员 提供关于教材、考试、研究小组、人员、项目等信息,是s e a l 方法的案例研究。s e a l 方法是一个开发语义门户网站的通用方法,它利用语义来提供和访问门户网站中的信息, 以及构造和维护门户网站瞰1 。a i f bp o r t a l 能够与o n t o w e bp o r t a l 进行同步信息交流【3 5 1 。 o n t o w e bp o r t a l 是语义w e b 学术界和工业界的一个业界门户,有1 4 0 多个合作伙伴,这些 合作伙伴大部分在欧洲,同时也有指向美国和亚洲研究社区的链接。它作为e u 项目 o n t o w e b ( i s t - 2 0 0 0 2 9 2 4 3 ) 的一部分,是在s e a l 方法【3 6 】基础上建立。o n t o w e bp o r t a l 可 以分别与a i f bp o r t a l 和v i s i o np o r t a l 进行同步信息交流【3 5 1 。 v i s i o np o r t a l 是欧洲知识管理界和相关感兴趣团体的知识源,作为e u 项目v i s i o nr o a d m a p p r o j e c t ( i s t - 2 0 0 2 3 8 5 1 3 ) 的网站,为欧洲的当前事件、项目和k mr o a d m a p 提供信息。它 在扩充的s e a l 方法基础上建立,能够与o n t o w e bp o r t a l 进行同步信息交流【3 5 】。 e m p o l i sk 4 2 是一个基于t o p i cm a p 3 7 】的知识管理产品,由e m p o l i s l 0 公司开发。它提供一 个存储、查询和维护的基础设施,在这个设施之上,应用开发人员可以建立门户网站。目 前k 4 2 的功能已经被集成到e :k m s ( e m p o l i s :k n o w l e d g em a n a g e m e n ts u i t e ) 知识套件中。 m o n d e c a i t m 是一个知识管理和知识自动获取工具,由m o n d e c a 提供,用于内容组织和联 合的设计。换句话说,i t m 是一个基于语义技术、本体和语言工具的软件工具和开发平台。 在简要介绍了上述语义门户网站之后,下面对这些网站进行分析比较。由表1 2 1 可看出k a o n p o r t a l 、a i f bp o r t a l 、o n t o w e bp o r t a l 和v i s i o np o r t a l 是一系列有关联的研究项目,这些语义门户网 站的结构和构造方法都有相通之处,所以将它们归为一类,以代表性的o n t o w e bp o r t a l 作为典型来 进行分析比较。 m i n d s w a pp o r t a l 只提供了对网页的r d f 标注,可供用户查看,而且功能晦涩难懂,普通用户无 法理解。s w w sp o r t a l 只是利用本体结构化信息为用户提供语义搜索的查询引擎服务。m i n d s w a p p o r t a l 和s w w sp o r t a l 在一定程度上运用到本体技术,所提供的功能有限,而且可用性不高,只能 作为语义门户网站的雏形,因此,本文不作为研究重点。 e s p e r o n t op o r t a l ( 简称e s p e r o n t o ) 、o n t o w e bp o r t a l ( 简称o n t o w e b ) 、e m p o l i sk 4 2 ( 简称k 4 2 ) 1 0 h t t p :w w w e m p o l i s c o r n 7 河海大学硕士学位论文第一章绪论 和m o n d e c ai t m ( 简称i t m ) 门户网站都将本体技术作为支撑,提供基本的门户网站功能,如信息 的创建、访问和维护。下面的比较主要针对这四个门户网站。 系统技术。在数据存储和管理上,e s p e r o n t o 和k 4 2 采用文件系统,o n t o w e b 和k 4 2 采用 数据库,i t m 自主开发的知识存储库。在系统维护的权限上,o n t o w e b 和k 4 2 采用不同用 户角色( 分为管理员、注册门户网站成员和访客) ,e s p e r o n t o 、o n t o w e b 和k 4 2 采用口令 鉴别,而k 4 2 对此没有考虑。 本体技术。 夺 采用的本体:e s p e r o n t o 有5 个本体( 项目、文档、人、组织和会议) ,o n t o w e b 利用 o n t o w e b 本体( 描述网站中所有内容及其类型,包括出版物、本体技术、事件、链接 和教育资源) ,k 4 2 和i t m 中本体可以根据客户需要而定。 本体的结构和语言:e s p e r o n t o 中的本体通过联系链接,e s p e r o n t o 和o n t o w e b 中本体 主要采用r d f 语言,k 4 2 和i t m 中本体主要使用t o p i cm a p 模式。 基于本体的推论和推理:e s p e r o n t o 中利用w a b 公理编辑器检查信息的一致性,k 4 2 中提供类似于逆属性或对称属性的简单推理,o n t o w e b 和i t m 中目前没有提供,但 计划扩充该功能。 本体的管理和维护:本体和实例利用现有本体编辑器分别维护更新,e s p e r o n t o 中利用 w e b o d e 本体编辑器,o n t o w e b 中利用o i m o d e i l e r ,k 4 2 中利用w e b a u t h o r 和o n t o g e n , i t m 中利用自己创建的1 t m 编辑器。其中k 4 2 和i t m 在本体的首版导入后只能利用 自制的编辑器更新。但是,上述语义门户网站都没有提供足够的版本机制来追踪本体 不同版本之间的变化,而且对实例和一个正在变化的本体模式的匹配支持非常有限。 ( 语义) w e b 服务技术。上述语义门户网站都提供了传统w e b 服务功能,如内容定位和搜 索等,但都没有提供语义w e b 服务,其中e s p e r a n t o 、o n t o w e b
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 教师硬笔培训指南
- 2025年行车手势标准试题
- 护理支持保障科
- 2024年-2025年学年度下学期小学五年级语文教学工作总结模版
- 【途牛】2024清明旅游消费预测报告5462kb
- 浙江省衢州市五校联盟2024-2025学年高二下学期期中联考试题 生物 含答案
- 腹腔镜手术管理
- 新质生产力岗位
- 效益管理 培训课件
- 大学生职业规划大赛《医学影像技术专业》生涯发展展示
- 智慧监狱智能管控解决方案
- 凤凰实验中学校服供应商评价和退出机制
- 心绞痛健康宣教课件
- 老年中医药健康知识讲座
- 企业防范用工风险知识讲座
- 急性缺血性脑卒中静脉溶栓护理指南:常见问题与解答
- 水利水电重点复习知识点总结
- 完整版江苏省政府采购专家库入库考试题库(1-4套卷)
- 高校考试制度的弊端与改革
- 七年级下册英语单词默写表(直接打印)
- ERAS理念在妇科围手术期中的应用
评论
0/150
提交评论