版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、语义维基的定义语义维基是一种根据知识模型组织页面的维基。语义维基系统就是将传统的维基系统和语义网技术结合起来,这样使得一方面维基系统可以利用语义网技术提供比目前的维基系统更好的用户界面、更先进的检索和导航工具,另一方面语义网也以借助维基的方便、简单性和共享性使得非技术的普通用户也能够参与到语义网建设中。(本部分摘自语义维基概述作者余胜爱)语义维基的层次整个语义维基系统分为三层:数据存储层、程序接口层、用户界面层。语义维基的分类第一类是强调语义网应用,将语义维基作为组织语义数据的工具,比较适合领域专家使用,但非技术用户只能敬而远之;另一类是强调“用户友好”,将语义作为维基的数据组织工具,针对普通
2、用户,但只能应用语义网的部分特性。用维基组织语义数据(Wikis for Semantic Data)当前的很多项目都是基于第一类,它们将词条作为概念(Concept),超链接作为对象或数据属性(Property),这种模型被称之为“维基本体(Wikitology)”。这类维基系统作为充分支持本体信息编辑的协作编辑工具,能帮助领域专家和本体工作者在一个系统里合作,同时维基页面里的文字内容既可以供人阅读同时也是正式的本体。即使这种维基不能编辑复杂的schema信息,它仍可能用来开发和存档本体词汇。这类语义维基的主要代表是Semantic MediaWiki(简称SMW)。它是在MediaWiki
3、(WikiPedia使用的维基引擎)的基础上引入语义标注,即在原有的维基标记语言(WikiML)基础上增加了新语法,建立标注属性、类型、值的关系的语法基础。SMW在每个页面下面增加了一个factbox,里面显示与当前维基词条相关的语义数据,同时还可将该语义数据输出为OWLRDF格式。同时SMW还提供一个浏览语义数据的界面你可以从输入一个词条名称开始,浏览所有语义相关的数据还可以通过点击按钮转到对应的维基页面。通过点击按钮查找所有具有相同属性值(property value)的语义数据。这类语义维基成了本体的动态和不断修正的工具,并使得维基内容从文本描述到正式概念的提升。这类语义维基并不适合普通
4、用户,用户需要学习WikiML及本体建模相关知识。语义作为维基的数据组织工具(Semantic Data for Wikis)目前有些应用只是引入语义工具来支持现有的维基,比如,通过语义搜索功能简化信息搜索。在这种情况下,语义数据主要目标是保持简单易用的原则,因此不会引入太多新的界面或功能,也不能进行大规模的推理。IkeWiki是这类语义维基的典型代表,支持从非正式文本到采用OWL正式本体的不同层次的形式化表达,并且具有丰富的界面交互。它基于JAVA技术,采用著名的Jena语义平台。IkeWiki与SMW最大的不同之处在于IkeWiki要求预先加载本体到系统中,也就意味着如果本体中没有OWL元
5、素属性,就无法在IkeWiki系统中进行谓词标注。另外一个不同在于IkeWiki将语义数据与维基页面内容分开存储。当呈现(rendering)一个页面时,呈现通道(rendering pipeline)将分别存储的文章内容和元数据组合成带有语义标注的页面文本。(本部分摘自语义维基概述作者余胜爱根据侧重的使用目的分类:语义Wiki的特征可被划分为五种类型的活动:创建,导航,检索,重用和社会协作。除了OntoWiki,它们都缺乏必要的社会协作手段。比较完善的语义Wiki引擎依次如下:OntoWiki、COW、Semantic MediaWiki、Makna、IkeWiki等。语义维基除了具有传统维
6、基的基本特点之外,还需要着重解决三个问题:如何对维基内容进行标注? 如何对内容进行形式化地描述? 如何对内容进行导航?PlatypusWiki、Semantic MediaWiki、SemperWiki、IkeWiki和WikSAR。这些系统都具备如下的特征:(1) 对链接进行标注。几乎所有的语义维基系统都能够通过给链接赋予一定的类型而对链接进行标注。这是因为,由用户所创建的链接几乎本身就带有一定的含义,而不仅仅是用于简单的链接导航。不同的系统采用不同的方法进行链接标注。一些语义维基系统把标注作为维基语法的一部分,如SemanticMediaWiki,而另外一些维基系统提供了一个独立的编辑器来
7、用于标注,如IkeWiki。(2) 上下文敏感的表达方式。许多语义维基系统可以根据语义标注来改变内容的表达方式。这包括:将语义相关的页面显示在一个独立的链接框中、显示来源于底层知识库的信息(如将属于同一层次结构下的内容以图形树的形式显示在对话框中) ,甚至可以根据上下文环境使得同一个页面的内容以不同的方式显示(如以多媒体方式显示或以文本方式显示)。(3) 增强的导航功能。对链接进行标注可以为导航提供更多的信息。传统的维基系统只是沿着链接方向导航,而语义维基系统则提供了描述链接关系的额外的信息,这些信息可以被用于提供更复杂的导航。(4) 语义检索。大多数的语义维基系统能够基于底层知识库进行语义检
8、索。通常采用SPARQL(一种用于RDF上的语言)查询语言来表达语义查询。通过使用语义检索,用户可以在语义维基系统中进行诸如“检索由莫扎特所谱写的所有作品”等的查询。(5) 支持推理功能。推理意味着使用预先定义的规则从知识库中存储的事实信息中获得额外的、潜在的知识。例如,从“曹雪芹创作了红楼梦”的事实信息中,具有推理功能的语义维基系统就可以推断“曹雪芹是一个作家”。尽管推理是一项重要的特征,但目前只有一小部分维基系统支持这一功能。(本部分摘自语义维基技术及应用作者龚立群)各类semantic wiki简介IkeWikiIkeWiki(ike表示knowledeg,Wiki表示fast)也来源于
9、夏威夷语,可以被翻译为“快速的知识”。IkeWiki系统是奥地利萨尔茨堡研究中心的Sebastian Schaffert等人所研发的语义Wiki原型系统IkeWiki( 或 或), IkeWiki主要的特征是使用语义术语对现有的数据进行语义标注来增加系统的检索和导航功能、基于现有的本体创建实例数据,也可以做为创建和编辑本体的工具。在进行设计时,IkeWiki遵从了如下的设计原则:(1)提供容易使用并具有交互功能的界面;(2)与Wikipedia/MediaWiki相兼容;(3)与语义网标准相兼容;(4)语义描述可以直接使用;(5)支持不同层次人员的工作。IkeWiki是采用Java实现的,运行
10、于Tomcat服务器,并使用JenaRDF知识库来存储元数据,系统使用了AJAX来实现系统与用户之间的交互。KaukoluKaukolu() 是建立在JSPWiki() 和Sesame()的基础之上的,它提供了EDF的输入和输出功能,提出了本地名字空间解决方案。Makna() 是基于JSPWiki和Jena2.0创建的,通过引用本体原语来标注Wiki的内容,同时保证语义模型的一致性,提供了基于内容和结构的查询功能和导航功能,能输出RDF或N3作为语义输出。Onto WikiOntoWiki是为支持敏捷分布式知识工程的工具( 或) 。 Ontowiki的架构Platypus WikiPlatyp
11、us Wiki()第一个语义Wiki系统,由Stefano Emilio Campanini等人开发。Platypus系统使用户能够为Wiki页面增加元数据,并用RDF属性来描述链接含义、提供导航层次。从Wiki的角度来看,Platypus中的每个页面都被分在某一个主题组下面,第一层目录代表一个相关页面集;从语义网的角度来看,每个页面都可以是一个类、属性或个体,第一层目录是一个本体的命名空间或一个知识库。Platypus用JAVA实现,使用了Sevlet和JSP技术,并使用了Jakarta Lucene作为搜索引擎来实现全文或元数据检索。Platypus使用Jena来管理RDF模型,并具有有限
12、的推理能力。Platypus Wiki可以用来作为个人知识管理系统,也可作为社区实践,该网站中提供了很多关于wiki的新闻。Semantic MediaWikiSemantic MediaWiki(系统包括五个组件:用户界面、解析器、页面服务器、分析器和内容存储器。用户界面向用户显示Wiki页面,并从页面服务器请求一个或多个页面(如页面内容、一个导航菜单、一组相关的项目和一个日历),页面服务器则从内容存储器中检索到用户所请求的页面。页面服务充当了内容存储器和其他组件间的中介,封装了Wiki的业务逻辑。当用户使用基于文本的Wiki语法编辑或创建一个Wiki页面后,解析器将页面转换成WIF(Wik
13、i Interchange Format)格式,然后页面服务器将页面存储在存储器中。内容存储器中存储了RDF数据和二进制数据,并能够支持版本和访问控制。分析器从结构层和语义层分析和整合数据。Semantic MediaWiki采用PHP实现,使用的是MySQL数据库。SemperWiki(http:/semperW/)系统最初是作为一个桌面应用系统由爱尔兰国立大学的Eyal Oren等人开发,后来他们将其移植到了Web上。SemperWikiSemperWiki系统最初是作为一个桌面应用系统由爱尔兰国立大学的Eyal Oren等人开发,后来他们将其移植到了Web上。SemperW
14、iki系统包含的组件有:一个用户界面、一个解析器、一个数据分析器和一个数据存储器。用户可以通过用户界面浏览、编辑和查询页面。用户界面应该能够使用户导航相关项目,并能够随着用户的不同而进行调整,以满足用户个性化需求。当用户对一个Wiki页面进行编辑时,用户界面就会通知解析器,解析器对页面上的文本进行分析,并抽取出描述和链接。所有的数据(文本和描述)都被存储在知识库中,从知识库中所存储的数据中,数据分析器计算出与当前页面相关的页面集,并通过用户界面显示给用户。SemperWiki用面向对象的脚本语言Ruby实现,并使用了GTK图形工具包。WikiSARWikiSAR(Semantic Author
15、ing and Retrieval within a Wiki)是由德国莱比锡大学的David Aumueller等人所开发的语义Wiki系统,该系统界面包括一个Wiki页面和一个可选的交互可视化图形界面。Wiki页面被分为三个组成部分:文本输入(编辑)框、文本显示区和包含有上下文链接的工具条。WikiSAR具有如下几个特征:简单易行的创建和语义编辑、基于上下文的导航、语义检索和与本体整合。WikiSAR系统用Perl语言实现,并将每个Wiki页面作为纯文本文件存储在WEB服务器中。WikiSAR原型系统使用Unix的“grep”来抽取RDF三元组,使用支持RDQL和SPARQL查询语言的查询
16、引擎RAP(RDF API for PHP)进行查询,并可以将查询嵌人到Wiki页面或模板中。SweetWikiSweetWiki基于CORESE语义搜索引擎来提供查询和推理,此外还提供安全管理和本体编辑工具。(摘自基于单元的语义wiki语义维基技术及应用等)语义Wiki中存在的问题虽然语义Wiki已经得到了一定的发展,但是目前它仍处于研发阶段,依然存在许多没有解决的问题,现有语义Wiki主要存在以下问题:1、 互操作性问题。(备注:互操作性是指不同的计算机系统、网络、操作系统和应用程序一起工作并共享信息的能力。)尽管语义web标准的一个主要议题之一就是解决互操作性问题,但是几乎所有的语义Wi
17、ki都不支持本体(RDF)数据的导入。一些Wiki允许使用本体(如OWL或RDF语言),但是集成到Wiki概念,本体是不可修正的。例如,本体的加载通常是不展示在Wiki中,它们一般被加载到另一个独立的知识库中。同时,本体被认为是保持不变的,并且它们不能被Wiki的用户进行编辑。此外,Tolksdorf和simperl认为,在传统的Wiki中存在一个重要限制(这在我们看来,同样存在于语义Wiki)就是设计决策时考虑一个Wiki将作为一个封闭的系统,没有与其他Wiki或其他服务互动的可能。他们提出的解决方法就是引入分布式和开放性作为未来的Wiki系统整体设计的理念,并提供一个实现这一目标的研究和发
18、展蓝图,但没有给出具体的实现方法。2、标注复杂性问题。在现有的语义Wiki当中,主要是用RDF来进行标注:RDF支持描述现有的供人阅读的特征的语义信息。因为Wiki的基本单元是页和页之间的链接,将一个Wiki映射为RDF,可以通过如下的方法来实现,将页看作是RDF的资源,Wiki页之间的链接是RDF资源之间的关系。这种典型方法的实现可以使用户将RDF三元组融入到Wiki页中,但是只能设置每个页之间URI为三元组的主体。由此得出结论,当使用RDFs时,Wiki页必须既支持典型Wiki:page又必须支持典型资源的描述。但是这样会有两大障碍:首先,从一个知识工程师的角度观点出发,实体的客观存在既可
19、能是一个文本(一个Wiki页面)又可能是页面中一个实例(例如一个具体的人),这不是我们想要的。其次,当这种方法非常方便地产生RDF数据,即浅层次的本体,它有一些类和许多关系,我们认为随着本体和结构越来越细致的时候,它就会迅速达到一个极限。3、本体的存储和管理问题。首先由于标注复杂性带来的本体的不断膨胀,本体规模越来越大,越来越繁杂,这将会给本体的存储和管理带来困难。4、数据模型问题。几乎(但不是全部)现有的语义Wiki都假定概念C的网页就是一个主体或者客体,每个Wiki网页上只有一个概念,这样的简化使得它非常容易表达一个概念的语义陈述。但如果你只能是指“网页的概念”,你怎么去指一个特定的网页片
20、段呢?而且一个网页一般情况下均会包含多个概念。5、名字空间问题。几乎所有的语义Wiki都只是解决了本地的内部名字空间问题,而且通常都是通过文本全文检索来解决的,但要达到互操作性,就要解决外部的名字空间问题。6、本体的编辑问题。现在的语义Wiki大多把本体当成是一个静态知识库来处理,本体通常情况下是预先定义好的,不能更改,也不能恢复。7、本体的灵活导入和导出问题。目前语义Wiki大多数都不支持本体的自由灵活地输入和输出。由于一般的语义Wiki都把本体视为静态的知识库,如一些语义Wiki将语义辞典WordNet引入其中作为其参照知识库,一般都是一次性引入,期间不会对WordNet做修改,否则会对其知识库产生致命的影响。8、平滑的迁移:现有的语义Wiki允许添加语义特征到现有内容(例
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年海南高考理科综合试卷题库附答案(新课标卷)
- 档案数字化加工技术方案
- 2026年贵州毕节市中考英语试题(附答案)
- 2025年广东珠海市初二学业水平地理生物会考考试真题及答案
- 2025年云南丽江市初二学业水平地理生物会考试题题库(答案+解析)
- 2025年西藏自治区拉萨市初二地理生物会考真题试卷(+答案)
- 被动体位护理健康宣教
- 2026年承揽合同范本下载
- 公务员试用期劳动合同范文
- 企业劳动合同模板(2026年适用)
- UL486C标准中文版-2019分线连接器UL标准中文版
- 高考英语3500词频表
- 2023医疗质量安全核心制度要点释义(第二版)对比版
- 小学语文阅读教学中情境教学法应用
- 工厂6S管理标准
- (高清版)JTG D50-2017 公路沥青路面设计规范
- 安全隐患排查及整改制度
- 2024年福建烟草海晟投资管理有限公司招聘笔试参考题库附带答案详解
- 人教版小学四年级信息技术上册知识点整理与归纳
- 2024年新华文轩出版传媒股份有限公司招聘笔试参考题库含答案解析
- 小学语文文言文教学策略
评论
0/150
提交评论