(计算机软件与理论专业论文)基于本体的网络知识资源语义化平台研究.pdf_第1页
(计算机软件与理论专业论文)基于本体的网络知识资源语义化平台研究.pdf_第2页
(计算机软件与理论专业论文)基于本体的网络知识资源语义化平台研究.pdf_第3页
(计算机软件与理论专业论文)基于本体的网络知识资源语义化平台研究.pdf_第4页
(计算机软件与理论专业论文)基于本体的网络知识资源语义化平台研究.pdf_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于本体的网络知识资源语义化平台研究 东华大学学位论文原创性声明 本人郑重声明:我恪守学术道德,崇尚严谨学风。所呈交的学位论文,是本 人在导师的指导下,独立进行研究工作所取得的成果。除文中已明确注明和引用 的内容外,本论文不包含任何其他个人或集体己经发表或撰写过的作品及成果的 内容。论文为本人亲自撰写,我对所写的内容负责,并完全意识到本声明的法律 结果由本人承担。 学位论文作者签名:力、和 持j 日期:o 石年易月re t 基于本体的网络知识资源语义化平台研究 东华大学学位论文版权使用授权书 学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留 并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅或借阅。 本人授权东华大学可以将本学位论文的全部或部分内容编入有关数据库进行检 索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。 保密斫在弓年解密后适用本版权书。 本学位论文属于 不保密口。 指导教师签名: 日期:加锌乡月旧 i i 辆 蒋伯 名 月 签 另 者 年作,移 文 口 论 : 位 期 学 日 基于本体的网络知识资源语义化平台研究 基于本体的网络知识资源语义化平台研究 摘要 w e b 上内容呈几何级数增长,使得学习者可以利用的知识资源也增长到前所 未有的程度。但是,w e b 上现有的知识资源彼此异构且独立,而不同的知识资源 的用户界面也不同,给学习者利用知识资源进行学习带来很多不便。为满足学习 者对于某个知识点进行集中学习的需求,知识资源应该能够被集成在一个语义的 平台下。此外,网络上某些知识资源有清晰的语义信息,但也有很多知识资源的 语义信息隐藏在其字面意义下,我们称这些知识资源为隐性知识资源。因此,学 习者在查找与其知识相关的隐性知识资源的过程中必将遇到很多困难。 为解决以上问题,本文的主要工作是对基于本体的网络知识资源语义化平台 进行研究。在此项研究中,我们建立了领域本体对程序设计领域知识进行规范化 的描述。针对隐性知识资源,我们为其增加元数据来表示其知识性的语义信息, 这些信息也称为知识点语义注释。在进行语义注释的过程中,我们设计了知识点 采集器来收集知识点语义信息,语义注释生成器来处理采集来的知识点语义信息 并自动生成知识点语义注释,并用知识点语义注释本体来规范语义注释的结构。 此外,显性知识资源的知识点语义信息可以通过对其进行语法分析抽取得到。得 到知识资源的语义信息后,我们利用语义匹配策略对学习者的知识请求与知识资 源的属性进行匹配,进而根据不同的匹配程度推荐不同的知识资源给学习者。因 此,学习者可以便捷地得到与其知识逻辑相关的知识资源。 本项研究对隐性知识资源和显性知识资源进行了语义的集成,并在一定程度 上支持学习者的个性化学习。学习者利用本语义化平台可以获得与其知识逻辑相 关的知识资源。通过对系统的评价机制说明此系统确实能够将大量知识资源集成 在一起并提供较高的查询精确度和召回率,从而此方法也适用于对其他w e b 资 源进行语义的集成。 关键词:网络知识资源,本体,o w l ,语义注释,隐性知识资源 i i i 基于本体的网络知识资源语义化平台研究 o n t o l o g y b a s e ds e m a n t i cp l a t f o r mf o r l e a r n i n gr e s o u r c e si nt h ew e b a b s t r a c t t h ep r o l i f e r a t i o no ft h ew e bh a st a k e nt h ea v a i l a b i l i t yo fl e a r n i n gr e s o u r c e st oa n u n p r e c e d e n t e dl e v e l h o w e v e r , c u r r e n tl e a m i n gr e s o u r c e s i nt h ew e bd on o tr e l a t e dt o e a c ho t h e ra n dh a v ed i f f e r e n tu s e ri n t e r f a c e s i d e a l l y , t h e s el e a r n i n gr e s o u r c e ss h o u l d b ei n t e g r a t e di n t oas e m a n t i cp l a t f o r mt oa d d r e s sl e a m e r s f o c u s e dl e a r n i n gn e e d i n a d d i t i o n ,k n o w l e d g eo fs o m el e a r n i n gr e s o u r c e si se x p l i c i t ,b u tk n o w l e d g eo fm a n y o t h e rl e a r n i n gr e s o u r c e si se m b e d d e di nt h e i rl i t e r a ld e s c r i p t i o n t h e ya r ec o n s i d e r e d a si m p l i c i tk n o w l e d g el e a m i n gr e s o u r c e s t h e n ,l e a r n e r sm a yc o u n t e rd i f f i c u l t i e st o f i n da p p r o p r i a t el e a r n i n gr e s o u r c e sc o r r e s p o n d i n gt ot h e i rk n o w l e d g e a d d r e s s i n g t h e s e c h a l l e n g e s ,t h eo b j e c t i v e o ft h i sw o r ki st o d e v e l o p a n o n t o l o g y - b a s e ds e m a n t i cp l a t f o r mf o rl e a r n i n gr e s o u r c e si nt h ew e b i nt h es y s t e m ,t h e d o m a i no n t o l o g yi sd e v e l o p e dt os p e c i f yt e r m i n o l o g yo fp r o g r a m m i n gd o m a i n k n o w l e d g e m e t a d a t ai s a d d e dt oi m p l i c i tk n o w l e d g el e a r n i n gr e s o u r c e st op r o v i d e s e m a n t i cd e s c r i p t i o no ft h e i rk n o w l e d g e t h i si sa l s ok n o w na sk n o w l e d g ea n n o t a t i o n i nt h i sp r o c e s s ,ak n o w l e d g eh a r v e s t e ri su t i l i z e dt og l e a nk n o w l e d g ei n f o r m a t i o n , w h i l ea na n n o t a t i o nc r e a t o ri su s e dt op r o c e s sm a s s i v ek n o w l e d g ef o re a c hi m p l i c i t l e a r n i n gr e s o u r c ea n dt of o r mk n o w l e d g ea n n o t a t i o n sa u t o m a t i c a l l y t h es t r u c t u r eo f a n n o t a t i o n si ss p e c i f i e db yk n o w l e d g ea n n o t a t i o no n t o l o g y m e a n w h i l e ,k n o w l e d g e r e l a t e dt o e x p l i d tk n o w l e d g el e a r n i n gr e s o u r c e s i se x t r a c t e df r o mt h e i rl i t e r a l d e s c r i p t i o n h a v i n gt h es e m a n t i c so fl e a r n i n gr e s o u r c e s ,s e m a n t i cm a t c h i n gr u l e sa r e u s e dt om a t c hl e a r n e r s r e q u e s t st op r o p e r t i e so fl e a r n i n gr e s o u r c e s t h es y s t e m r e c o m m e n d sl e a r n i n gr e s o u r c e sa c c o r d i n gt od e g r e e so fm a t c h i n g t h e r e f o r e ,l e a r n e r c a n g e tc u s t o m i z e dl e a r n i n gr e s o u r c e sa c c o r d i n gt oo n e sk n o w l e d g e t h es y s t e ms e m a n t i c a l l ya s s e m b l e sb o t hi m p l i c i ta n de x p l i c i tk n o w l e d g el e a r n i n g 基于本体的网络知识资源语义化平台研究 r e s o u r c e si nas e m a n t i cp l a t f o r m ,a n ds u p p o r t sau n i f i e di n t e r f a c ef o rc u s t o m i z e d l e a r n i n g c o n s e q u e n t l y , l e a r n e r sc a nf i n dl e a r n i n gr e s o u r c e sc o r r e s p o n d i n gt o t h e i r k n o w l e d g ee f f i c i e n t l y t h ee v a l u a t i o nm e c h a n i s m so ft h es y s t e ms h o wt h a t t h e p r o p o s e dm e t h o dc a ni n d e e di n t e g r a t el a r g e a m o u n to fl e a r n i n gr e s o u r c e sw i t h p r o m i s i n gp r e c i s i o na n dr e c a l l i ti sb e l i e v e dt h a tt h es a m em e t h o dc a n a l s ob eu s e dt o i n t e g r a t eo t h e rw e b r e s o u r c e s s ux i a n g ( c o m p u t e rs o f t w a r ea n dt h e o r y ) s u p e r v i s e db y 圣h 堕q 望q = ji 堕 k e y w o r d s :w e bk n o w l e d g el e a r n i n gr e s o u r c e s ,o n t o l o g y , o w l , k n o w l e d g ea n n o t a t i o n ,i m p l i c i tk n o w l e d g el e a r n i n gr e s o u r c e s v 基于本体的网络知识资源语义化平台研究 目录 第一章绪论1 1 1 引言1 1 2 研究背景1 1 2 1 研究课题1 1 2 2 应用背景2 1 3 网络知识资源语义化平台的提出3 1 4 本文主要研究工作和研究方法3 1 4 1 研究工作3 1 4 2 研究方法4 1 5 论文组织结构6 第二章程序设计领域本体模型构建的研究8 2 1 引一言8 2 2 程序设计领域o n t o l o g y 9 2 2 1 程序设计领域知识层次结构o n t o l o g y 一9 2 2 2 程序设计领域知识点关系o n t o l o g y 1 0 2 3 程序设计领域知识o n t o l o g y 的o w l 表示1 l 2 4 对程序设计领域知识点o n t o l o g y 的评价机制1 2 第三章基于程序设计领域o n t o l o g y 的语义注释方法1 4 3 1 引言1 4 3 2 隐性知识资源和显性知识资源1 7 3 2 1 隐性知识资源1 7 3 2 2 显性知识资源1 8 3 2 知识点语义注释o n t o l o g y 及其o w l 表示一1 8 3 3 基于程序设计领域o n t o l o g y 的语义注释的系统架构2 0 3 4 基于程序设计领域o n t o l o g y 的知识点采集器的设计2 1 3 5 知识点语义注释生成器的算法及其设计2 3 3 6 知识点语义注释的例子分析2 5 3 7 本语义注释方法的评价机制2 6 3 8 本章小结2 8 第四章基于本体的网络知识资源语义化平台研究2 9 4 1 引言2 9 4 2 基于本体的网络知识资源语义化平台的需求分析和服务描述2 9 4 3 基于本体的网络知识资源语义化平台系统设计。3 1 4 4 语义匹配策略3 2 4 5 语义匹配策略的例子分析3 3 4 6 本章小结3 5 第五章基于本体的网络知识资源语义化平台的实例原型3 6 5 1 引言3 6 5 2 原型系统背景3 6 5 3 基于程序设计领域o n t o l o g y 的知识点采集器的实现3 7 v i 基于本体的网络知识资源语义化平台研究 5 4 知识点语义注释生成器的实现4 0 5 5 基于本体的网络知识资源语义化平台的接口设计4 1 5 5 1 学习者查询接口4 1 5 5 2 网络知识资源语义化平台管理员接口4 2 5 6 基于本体的网络知识资源语义化平台的实现和运行4 3 第六章结束语4 5 6 1 主要工作总结4 5 6 2 主要的创新与贡献4 5 6 3 进一步的研究方向4 6 参考文献4 7 附录l 知识点语义注释o n t o l o g y 的o w l 定义5 0 攻读硕士期间主要研究成果5 1 致谢5 2 v i i 基于本体的网络知识资源语义化平台研究 1 1 引言 第一章绪论 随着i n t e r n e t 的迅速发展,w e b 网汇聚了大量的资源,为用户利用这些资源 提供了可能。对学习者而言,尤为重要的是i n t e r n e t 上分布在世界各地的知识资 源,它们为学习者学习知识提供了许多便利。然而,分布在w e b 上的知识资源 往往是异构的,彼此无关的,而且不同网站有不同的界面。因此,当每一位学习 者需要利用这些知识资源时,就需要熟悉不同网站的界面,并且登录不同的网站 手动进行学习。而且在通常情况下,学习者往往难以根据其现有的知识查找到合 适的知识资源,这是因为从某些知识资源的语言表述往往很难获得其语义信息, 即很难确定与这些知识资源相关的知识。 本课题使用语义网络技术将分布在w e b 上异构的知识资源整合为一个机器 可操作的语义化平台,对个性化用户检索提供统一的界面。用户可通过本平台根 据知识资源的语义信息查询到真正与其需求逻辑相关的知识资源。 知识资源语义化平台的实现首先需要能够对知识资源中所包含的知识进行 清晰的、正规的描述。本文在详细研究了如何形式化的描述一个特定领域的知识 的基础上,对w 曲知识资源进行语义注释的过程进行了描述,而后再根据学习 者的需求将这些知识资源进行语义的集成,以不同的推荐程度推荐给学习者。籍 此,学习者可以利用本语义化平台获得与其需求逻辑相吻合的知识资源。 1 2 研究背景 1 2 1 研究课题 本课题是国家自然科学基金资助项目“面向资源自动发现的网络信息空间结 构化模型研究”的子课题之一。该课题针对在w e b 网中难以发现期望信息资源 的问题源头,提出结构化网络信息空间的概念,研究支持这种概念的机制与技术, 建立结构化网络信息空间的实验性仿真系统,其目标是在网络信息空间中采用面 向对象技术,引入一个模拟人类分类思维模式的全局统一结构,使机器能够自主 基于本体的网络知识资源语义化平台研究 地进行联想,自动地把每一个读者的浏览空间和每一个作者的表达空间联想映射 地组织在一起,以利于网络信息资源的自动发现和查找,使得每一位信息需求者 都拥有一个与其思维模式和习惯相容的完全个性化浏览空间成为可能。研究的主 要目的并不是提出一种网络信息资源查找的新技术,而是为所有相关问题的研究 提供一种可选择的源创性机理,其核心是机器联想映射和全局统一分类结构。 本课题在此项目中利用网络上的分布的异构知识资源作为作者表达空间的 一个特例进行研究。把语义信息引入到对知识资源的描述中。本课题主要研究内 容如下: 使用本体对特定领域内的知识进行清晰的语义描述,为知识资源的知识点 语义注释提供语义支持。 对知识点语义注释的本体模型进行研究,语义清晰地描述知识点语义注释 的结构。 针对网络上某类知识资源,设计一个基于领域知识的语义注释方法。利用 知识点采集器、语义注释生成器对这类资源进行知识点语义注释。 将语义信息集成在一个统一的语义平台下,对用户个性化检索提供支持。 1 2 2 应用背景 本课题应用于学校计算机教学环境中的程序设计训练系统。该系统为老师和 学生提供了一个程序设计网络自助学习的平台,推进学校计算机学科的教学改 革,提高学生程序设计的实际能力。 具体而言,本系统为我校计算机专业学生,特别是a c m ( a c m i c p c ,国际 大学生程序设计竞赛) 训练队的教练和训练队员提供便利,使他们可以更便捷在 利用网络上的知识资源,比如利用各个a c m 题库网站查找题目或者查看以前同 学的解题报告进行训练和学习。 例如:某同学在课堂上学习快速排序( q u i c k s o r t ) 的基本知识后,希望在a c m 题库网站中找到一些题目来检验自己对快速排序这一知识点的掌握情况。现在通 常的做法是该同学登录不同的网站寻找可能是需要快速排序来解决的题目,这些 分布在w 曲上的题目资源是异构的,彼此无关的,而且不同网站有不同的界面。 因此学生需要适应不同网站的题目查找方式;更兼题目的字面描述往往很难确定 解决该题目所需要的知识点,这样就只能凭主观臆断查找有可能合适的题目,查 基卡本体的网络知识资源语义化平台研究 找效率必然也极低。总之,这种方法使得同学很难快速、准确地找到与其所学知 识逻辑相关的题目。因此,我们需要寻找一种合适的基于w e b 的方法使同学便 捷地找到适合的题目资源。 1 3 网络知识资源语义化平台的提出 基于以上背景分析可见,虽然目前网络上有很多基于知识资源的学习和查询 系统,这些系统可以将网络上分散的学习资源集中到一起,并组织成为有效的学 习序列,为学习者提供网络学习的便利。但是这些系统存在的普遍问题是难以 将相关知识的学习资源集中到一起提供给学习者。 因此本文提出网络知识资源语义化平台,本平台将各类知识资源动态地集成 到一起,并根据学习者的需求,以不同的推荐程度提供给学习者。在集成的过程 中,我们使用程序设计领域o n t o l o g y 来表示程序设计领域知识,并利用领域知 识对隐性知识资源进行语义注释和进行语义匹配。针对抽取隐性知识资源语义信 息的困难,我们研究并开发了基于程序设计领域o n t o l o g y 的语义注释系统,此 系统利用知识点采集器和语义注释生成器抽取隐性知识资源的语义信息。抽取出 来的语义信息被称之为知识点语义注释( k n o w l e d g e a n n o t a t i o n ) ,知识点语义注释 用知识点语义注释o n t o l o g y 进行规范。为使学习者的知识请求和网络上的知识 资源能够达到语义的匹配,我们使用语义匹配策略对两者进行不同等级的匹配, 这样就可以把与其请求逻辑相关的知识资源提供给学习者。 1 4 本文主要研究工作和研究方法 1 4 1 研究工作 本文采用语义w e b 技术路线,选取了计算机学科程序设计领域作为实验原 型研究的领域,以计算机程序设计教学为应用背景,重点以w e b 知识资源中的 题目资源为应用实例,对基于本体的网络知识资源语义化平台的概念和关键技术 展开研究。本文主要研究内容包括: 1 程序设计领域o n t o l o g y 的构建。建立了程序设计领域o n t o l o g y 来表示程 序设计领域知识,程序设计领域o n t o l o g y 定义了该领域的术语,并形式化的清 晰地描述了这些术语之间的关系。程序设计领域o n t o l o g y 如同一本字典,它包 基于本体的网络知识资源语义化平台研究 含两个部分:程序设计领域知识层次结构o n t o l o g y 和程序设计领域知识点关系 o n t o l o g y ,程序设计领域知识层次结构o n t o l o g y 描述了程序设计领域知识的架 构,它类似于字典的索引表,而程序设计领域知识点关系o n t o l o g y 描述了该领 域概念及这些概念间的关系,它类似于字典的内容。 2 对基于程序设计领域o n t o l o g y 的语义注释方法的研究。提出了一种原创 性的新方法对网络上的难于提取语义信息的隐性知识资源进行知识点语义注释: 使用程序设计领域o n t o l o g y 、知识点语义注释o n t o l o g y 、知识点采集器和语义注 释生成器为隐性知识资源进行语义注释。该方法克服了目前存在的难以对网络上 隐性知识资源进行语义注释的问题,并解决了手工语义注释的大工作量的难题。 3 对网络知识资源语义化平台的研究。利用语义w e b 技术对各类知识资源 进行语义的集成。该语义化平台利用程序设计领域o n t o l o g y 、知识点语义注释和 语义匹配策略为学习者提供个性化的网络知识资源。此方法实现了对w e b 知识 资源的语义集成并在一定程度上满足了学习者的个性化检索需求。 4 实例原型系统一基于本体的网络知识资源语义化平台的开发和实现。在理 论和实验的基础上,设计实现了基于本体的网络知识资源语义化平台的原型实 例。验证了本文方法的可行性,体现了其应用价值。 1 4 2 研究方法 本课题主要以语义w e b 的先进技术为研究的主要方法。 语义w e b 的基本思想是为w e b 上任意的资源,包括页面,数据、程序和服 务,引入清晰的语义和结构化的描述,使计算机可以理解w e b 上的资源。机器 可以理解并不意味着机器能够真正像人一样地理解w e b 内容( 如利用自然语言 理解技术) ,而是通过制定标准,利用标准语言描述w e b 上资源的含义,这样 计算机可以根据标准去理解和自动处理,集成和重用w e b 上的内容和服务。这 使得一些基于w e b 的自动服务,如智能信息检索、电子商务、知识管理和智能 a g e n t 成为可能。 语义w e b 作为当前万维网的扩展,于1 9 9 9 年由t i mb e m e r s l e e 等人提出, 通过结构化和形式化,对w e b 上的资源添加元数据,以表达资源的语义,使得 计算机程序能够对网络资源进行分析和推理。为了实现语义万维网的梦想,w 3 c 提出了语义w e b 的体系结构【2 】,如图卜l 所示。 4 基于本体的网络知识资源语义化平台研究 佰任m t 杈l i 证明i f r o o f ) 逻辑灿西c ) 娟 席体词汇( 0 坩d o 劈c 小i d 羽y ) 雾 r d f + r d fs c h e m a 轻 x m l 4 n s + x m ls & a n a 统一字符编码( v a i e o d e )统一资源标识符f t r r i ) 图1 1 语义w e b 体系结构 语义w e b 体系结构的最底层是统一字符编码( u n i c o d e ) 口】和统一资源标识符 ( u n i f o l f i nr e s o u r c ei d e n t i f i e r ,u r i ) e 4 1 ,它们为w e b 上资源编码和定位资源提供了 标准。其上一层包括:x m l 和为合法的x m l 文档定义语法结构的x m ls c h e m a , 以及允许合成不同词汇的x m l 命名空i 盲- ( n a m es p a c e ,n s ) v ,是数据表示的语法 层,用于表示数据的内容和结构,形成语义w e b 资源表示的语法基础。 语义w e b 的目标是计算机能够理解语义w e b 上的资源,因此需要一种统一 的,形式化的元数据表示语言,用来描述w e b 上资源的含义,但x m l 只能定 义语法格式,没有形式化的语义,不足以用来描述w e b 资涮6 1 ,因此w 3 c 提出 了资源描述框架( r e s o u r c ed e s c r i p t i o nf r a m e w o r k ,r d f ) 【7 1 。r d f 采用三元组( 资 源,属性,值) 这种简单的数据模型,表示w e b 上资源的属性和值。它还需要定 义描述中使用的词汇,这就是r d f 的词汇描述语言r d fs c h e m a ( r d f s ) 【8 】。r d f s 是在r d f 的基础上引进了类的概念、类之间的包含关系、属性之间的包含关系, 以及属性的定义域和值域。r d f 和r d f s 一起构成了语义w e b 的数据层。 数据层的上层是本体( o n t o l o g y ) 层,o n t o l o g y 通过对概念的严格定义和概念 之间的关系来确定概念的精确含义,表示共同认可的、可共享的知识,它定义了 r d f 描述中使用的词汇的语义,是计算机理解w e b 资源的基础,因此在语义w e b 中,o n t o l o g y 具有非常重要的地位,为语义层次上w e b 信息共享和交换提供了前 提。目前o w l 是w 3 c 推荐的w e b 本体层的标准语言。它借鉴了人工智能领域对 知识表示的研究方法,特别是描述逻辑( d e s c r i p t i o nl o g i c ,d l ) 【9 】引入了 更加丰富的表达能力,例如属性取值约束、基数约束、属性的对称性和传递性等。 本体层的上层是逻辑层( l o g i c ) ,目的是用更丰富的逻辑语言表达w e b 上 基于本体的网络知识资源语义化平台研究 的资源,其中规则语言是最常用的,为逻辑推理提供形式规则。目前s w r l 和它 的一阶谓词逻辑( f i r s t o r d e rl o g i c ,f o l ) 【1 0 】扩展s w r lf o l 已成为w 3 c 推荐标准。 最上层是证明层( p r o o f ) ,目的是为了让用户看到语义w e b 上数据处理的过程, 为智能a g e n t 间进行验证和交换数字签名提供支持,目前尚未形成标准。 1 5 论文组织结构 论文共分6 章,各章节内容简述如下: 第一章为绪论,本章中首先说明论文的研究背景,而后提出基于本体的网络 知识资源语义化平台,说明本课题的主要研究工作和研究方法,最后给出论文的 组织结构。 第二章在详细研究领域本体的基础上,建立程序设计领域o n t o l o g y 。建立程 序设计领域o n t o l o g y 的目的是对隐性知识资源进行语义注释和在知识资源语义 化平台中进行语义匹配。该章分两部分来介绍程序设计领域o n t o l o g y ,并使用 w e b 本体描述语言o w l 描述领域知识库本体模型。同时给出一个对程序设计领 域o n t o l o g y 的简单评价。 第三章介绍了基于程序设计领域o n t o l o g y 的知识点语义注释方法。本章首 先根据知识资源的特性,对网络上的隐性知识资源和显性知识资源进行划分。而 后介绍了知识点语义注释本体模型及其o w l 表示并描述了基于程序设计领域 o n t o l o g y 的语义注释的系统架构。针对提取隐性知识资源语义信息的困难,本章 详细描述了知识点采集器和语义注释生成器的算法和设计,并以一个实例对知识 点语义注释进行说明。最后给出了基于程序设计领域o n t o l o g y 的语义注释系统 的评价机制及评价结果。 第四章对基于本体的网络知识资源语义化平台进行研究。首先介绍了基于本 体的网络题库资源语义化平台的需求分析和服务描述。而后介绍了语义化平台系 统架构并着重介绍了语义匹配策略,最后用一个实例对语义匹配策略进行了详尽 的阐述。 第五章给出了基于本体的网络知识资源语义化平台的实例原型系统。主要介 绍了实验系统背景、由作者开发的基于本体的网络知识资源语义化平台的相关工 具软件和语义化平台的接口。介绍这些工具的主要模块和实现技术,以及相关界 6 基于本体的网络知识资源语义化平台研究 面。 望。 第六章结束语。总结了本文研究工作的成果并对未来的工作进行了简单的展 基于本体的网络知识资源语义化平台研究 2 1 引言 第二章程序设计领域本体模型构建的研究 随着知识资源的不断丰富,如何对知识进行有效的组织和管理,实现知识的 共享和重利用,从而充分有效的利用知识资源是一项重要的研究课题。领域 o n t o l o g y 通过提供对领域知识的共同理解来实现知识共享。 在本项研究工作中,无论是对网络上的题目资源进行语义注释,还是将语义 注释集成到语义平台下,首先都需要对领域知识进行概念化的精确描述。这里, 所谓的概念化( c o n c e p t u a l i z a t i o n ) 是作为知识形式化表达的基础,是所关心领域中 的对象、概念、和其他实体,以及它们之间的关系【1 1 】。 定义1 概念化:结构c = ,其中d 是一个领域( d o m a i n ) ,r 是建立在d 上的集合或相应关系 i l 】。 那么,我们如何对概念领域的d 和r 进行准确的描述呢? 本体( o n t o l o g y ) 是对某一概念化做出的显式的解释说明。1 9 9 3 年,美国 s t a n f o r d 大学k n o w l e d g es y s t e ml a b o r a t o r y ( k s l ) 的g m b e r 在定义1 的基础上, 给出了在信息科学领域广泛接受的o n t o l o g y 的定义: 定义2 o n t o l o g y :a no n t o l o g yi sa ne x p l i d ts p e c i f i c a t i o no fac o n c e p t u a l i z a t i o n g r u b e r 认为:概念化是从特定目的出发对所表达的世界所进行的一种抽象 的,简化的观察。s t u d e r 对该定义进行深入研究后认为o n t o l o g y 是共享概念模 型的明确的形式化规范说明。这包含4 层含义:概念模型( c o n c e p t u a l i z a t i o n ) 、明 确( e x p l i c i t ) 、形式化( f o r m a l ) 矛u 共享( s h a r e ) 。“概念模型”指通过抽象出客观世 界中一些现象( p h e n o m e n o n ) 的相关概念而得到的模型。概念模型所表现的含义独 立于具体的环境状态。“明确”指所使用的概念及使用这些概念的约束都有明确 的定义。“形式化 指o n t o l o g y 是计算机可读的( 即能被计算机处理) 。“共享” 指o n t o l o g y 中体现的是共同认可的知识,反映的是相关领域中公认的概念集,即 o n t o l o g y 针对的是团体而非个体的共识。 o n t o l o g y q b 的对象以及它们之间的关系是通过知识表达语言的词汇来描述 的。因此,可以通过定义一套知识表达的专门术语来定义一个o n t o l o g y ,以人可 以理解的术语描述领域世界的实体、对象、关系以及过程等,并通过形式化的公 8 基于本体的网络知识资源语义化平台研究 理来限制和规范这些术语的解释和使用。因此,严格的说,o n t o l o g y 是一个逻辑 理论的陈述性描述【12 1 。 o n t o l o g y 的目标是捕获相关领域的知识,提供对该领域知识的共同理解,确 定该领域内共同认可的词汇,并从不同层次的形式化模式上给出这些词汇( 术语) 和词汇间相互关系的明确定义。 本章在以上o n t o l o g y 基本概念的基础上,提出一种建立程序设计领域 o n t o l o g y 的方法,并用o w l ( w e bo n t o l o g yl a n g u a g e ) 【1 3 1 表示该o n t o l o g y , 使程 序设计领域知识机器可以理解并达到有效的共享和重用。 2 2 程序设计领域o n t o io g y 本文建立了程序设计领域o n t o l o g y 来表示程序设计领域知识,程序设计领 域o n t o l o g y 定义了该领域的术语,并形式化的清晰地描述了这些术语之间的关 系。 程序设计领域o n t o l o g y 如同一本字典,它包含两个部分:程序设计领域知 识层次结构o n t o l o g y 和程序设计领域知识点关系o n t o l o g y ,程序设计领域知识 层次结构o n t o l o g y 描述了程序设计领域知识的架构,它类似于字典的索引表, 而程序设计领域知识点关系o n t o l o g y 描述了该领域概念及这些概念间的关系, 它类似于字典的内容。 2 2 1 程序设计领域知识层次结构o n t o l o g y 我们所建立的程序设计领域知识层次结构o n t o l o g y 是根据c o m p u t i n g c u r r i c u l a2 0 0 1f i n a lr e p o r t h 】中对程序设计领域的术语及术语间的关系的规范描 述而定义,因此它是对程序设计领域知识的形式化的描述。 定义3 :程序设计领域知识层次结构o n t o l o g y 程序设计领域知识层次结构o n t o l o g y 用三元组( 叩卿表示,c = b o d y ,a r e a , u n i t ,t o p i c ,k n o w l e d g e c o n c e p t ,是用来表示程序设计领域知识层次的概念的集 合,即程序设计领域知识按照不同的粒度被分成b o d y , a r e a ,u n i t ,t o p i c 和 k n o w l e d g e c o n c e p t 。r = h a s n a m e ,h a s p a r t ,i s p a r t o f 表示了以上概念之间的关系, h a s n a m e 表示概念名,h a s p a r t i s p a r t o f 表示概念间b ep a r to f 的关系,j 是c 中实 例的集合,即知识点。 9 基于本体的网络知识资源语义化平台研究 l : r o 掣a n m m l gd o m a i ni - l t l o w l e d g eb o d 3 7 i 箩1 越芝 la l g o r i t l m l sa 1 1 ( 1 ( 2 7 0 n l p l e 虹t ya l g o l i t l m t sa n dd a t as t l - u c t t u e s ;八乞: f u n d a n l e n m l c o n i ? u t m 珞l g o * i t l m x s i s p a i * o f o ( n l o g n ) s o r t i l 测g o l i f l u l l s i s p a t t o f q u i c l s o r t 图2 1 程序设计领域知识层次结构o n t o l o g y 如图2 一l 所示,在程序设计领域知识层次结构o n t o l o g y 中,程序设计领域 知识总体称之为p r o g r a m m i n gd o m a i nk n o w l e d g eb o d y ,p r o g r a m m i n gd o m a i n k n o w l e d g eb o d y 包含数个a r e a ,a l g o r i t h m sa n dc o m p l e x i t y 是其中一个a r e a , 就是说a l g o r i t h m sa n dc o m p l e x i t y 是a r e a 的一个实例。同时,p r o g r a m m i n g d o m a i nk n o w l e d g eb o d y 包含很多c o u r s e s ,a l g o r i t h m sa n dd a t as t r u c t u r e 是其中 一门课程。a l g o r i t h m s a n d c o m p l e x i t y 包含很多u n i t ,例如: f u n d a m e n t a l c o m p u t i n g a l g o r i t h m s ,而课程a l g o r i t h m sa n dd a t as t r u c t u r e 同样包含 f u n d a m e n t a l c o m p u t i n g a l g o r i t h m s 。 a l g o r i t h m s a n d c o m p l e x i t y 和 f u n d a m e n t a l c o m p u t i n g a l g o r i t h m s 是h a s p a r t i s p a r t o f 的关系。其他概念如u n i t , t o p i c 和k n o w l e d g e c o n c e p t 间的关系与此类同。 2 2 2 程序设计领域知识点关系o n t o l o g y 与程序设计领域知识层次结构o n t o l o g y 不同,程序设计领域知识点关系 o n t o l o g y 描述知识点概念及其间的关系。例如:0 ( n l o g n ) s o r t i n g a l g

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论