基于OWL的电子竞技领域本体的构建的设计毕业论文.doc_第1页
基于OWL的电子竞技领域本体的构建的设计毕业论文.doc_第2页
基于OWL的电子竞技领域本体的构建的设计毕业论文.doc_第3页
基于OWL的电子竞技领域本体的构建的设计毕业论文.doc_第4页
基于OWL的电子竞技领域本体的构建的设计毕业论文.doc_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

本 科 毕 业 论 文(设计)题目: 基于OWL的电子竞技领域本体的构建 目 录摘要11、绪论21.1 引言21.2 研究的背景及意义21.2.1 课题背景21.2.2 研究意义31.3 国内外研究发展现状31.4 面临的主要问题32、相关研究52.1本体语言OWL52.1.1使用OWL语言描述本体52.1.2 OWL语言的子语言52.1.3 OWL Lite构成要素52.2 OWL Lite语言描述62.2.1 基础特性(RDF Schema特性)62.2.2 等价性与相同性72.2.3 属性特征72.2.4 属性约束与受限基数72.2.5 类的交集83、电子竞技领域本体的构建93.1本体的构建概述93.1.1 构建方法93.1.2 构建的依据标准93.2电子竞技领域本体定义93.2.1 本体领域与范畴93.2.2 本体定义103.3电子竞技领域的概念模型103.4本体的构建113.4.1 领域概念的构建113.4.2 关系属性的构建124、电子竞技本体的OWL描述144.1 命名空间描述144.2 本体的OWL描述144.2.1 类的描述144.2.2 关系属性的描述144.2.3 实例的描述155、总结18致谢19参考文献20Abstract21基于OWL的电子竞技领域本体的构建【摘要】电子竞技是随着网络的普及而兴起的新兴行业,它几乎完全依靠着网络来承载相关信息。语义网技术通过对信息进行结构化规范从而解决了网络信息凌乱问题。本文即是基于这个问题而对电子竞技领域信息做了相应的规范。构建过程需收集电子竞技领域中能够代表本领域的词汇组成一个词汇集,再进一步分类归纳,定义每个词汇(概念)之间存在的内部联系,再通过相应的OWL本体开发工具进行构建。本课题对其进行初步试探并构建出本体,作为对电子竞技领域知识的初步规范。【关键词】电子竞技;OWL;本体;知识规范1、绪论1.1 引言万维网改变着人们彼此之间的交流方式和商业运作模式。随着整个社会慢慢地向知识型社会转型,万维网作为当前人们最主要的信息交流平台,它的改革也顺理成章的成为了整个社会改革的核心。经历了web1.0时代后,万维网步入了高速发展的阶段,随着web2.0时代的到来,网络中的信息量更加庞大,用户可以通过客户端向网络发布自己的信息,整个网络变得越发多种多样,诸如blog技术,它是web2.0的一个里程碑产品。日渐成熟的web2.0技术在21世纪大放光彩,短短的几年,使得网络成为了人们生活中必不可少的一部分。20世纪80年代后期发明万维网的Tim Berners-Lee提出他的万维网新蓝图语义网运动由此而发起,现在的万维网虽然有着海量的数据资源,但其中可供机器处理的语义资源相比之下却相当有限,语义网的出现将能够彻底解决了我们上面提到的各个问题,它采用一种更容易被计算机处理的方法来表示和描述万维网上的信息,并且,这并不需要使用到很多新的技术,相反的,这将是一个工程技术上的问题,而不是一个科学上的问题。语义网中很多重要的技术已经得了部分的实现,只不过目前需要做的,是集成这些技术,进一步标准化,吸纳更多的用户采用。语义网作为一种革命性的壮举,它将迎来崭新的万维网时代(web3.0),而在Tim Berners-Lee勾画出来的蓝图里,实现语义网的基础,则是本体论,在实现语义网之前必须对我们现在的各个领域知识进行规范,已达到普遍形成的共识,并在此共识的基础上,进而描述网络信息,使各种网络应用在处理网络信息时,能“知道”处理信息的内容。“本体”一词源自于哲学概念,但此处的本体赋予了其另外的意义,它指的是“给出构成相关领域词汇的基本术语和关系,以及利用这些术语和关系构成的规定这些词汇外延的规则的定义”。本体是构成语义网的关键部分,它是语义网技术中,各种语义的载体,为语义网应用中语义的标注提供词汇规范以及语义支持。利用本体来实现计算机处理数据时的智能化,就不会再以高匹配、低精度的现有方式去处理数据了。而是通过本体中定义的概念以及概念与概念之间的内部联系,实现数据的分类,关联,使得计算机能更有序,更智能的处理数据。1.2 研究的背景及意义1.2.1 课题背景本体(Ontology) 这个属于哲学范畴的概念,在信息技术应用方面,给予了重新定义,从而被引入该学科中。本体提供了对给定领域的一种共识。这种共识对于消除领域术语差别是必要的。本体技术作为语义网的基础,在语义网中占据着核心的位置。为了实现语义网的功能,本体提供一套语义描述机制,它的功能是能让计算机理解、结构化领域知识,并且拥有推理规则以实现自动化推理。相关研究者为了实现对本体的描述,在原有的RDF基础上发展出了RDFS。RDFS拥有本体构建的最基础语义描述特性,通过几个预先定义的词语(例如:Resource, Class, Property, subClassOf, subPropertyOf, domain, range)对概念之间的关系进行比较有限的描述。为了弥补RDFS的不足,能对本体内部结构提供更全面更符合语义要求的描述,W3C借助了对DAML与OIL的研究,在RDFS基础上提出了新的本体描述语言OWL(Web Ontology Language)。从2004年2月10日开始,OWL已经成为了W3C组织的一个推荐标准。1.2.2 研究意义从现阶段电子竞技领域的发展情况上看,这是个相对崭新的产业,最近几年在国内外迅猛发展,越来越得到了人们的肯定,在我国先后将其列为国家的“第99号运动”和“第78号运动”,由于只有短短的10年发展历程,导致其发展的许多方面都出现了相对的不稳定性,处于发展前期的电子竞技,领域内各种知识概念层出不穷,以至于整个电子竞技领域的各类信息异常的混乱,这将给领域内外的相关人士带来信息检索上的不便。另一方面,整个领域的形成以及发展几乎完全依赖于互联网,它是随着互联网的发展而发展的,网络信息的问题在电子竞技领域中显得更加突出,我们迫切需要一个电子竞技领域的知识结构规范,将其有序的进行归纳,形成普遍认可的电子竞技领域知识本体。1.3 国内外研究发展现状领域本体的研究是一个全球性事业,在国内外业界的大力支持和各国政府大量资金的资助下得到了很大的发展。美国,欧洲对语义网的各项研究项目几乎同时出现,都将其列为网络研究的关键内容之一,并取得了很多成果。Berners-Lee在2000年提出的7层体系结构,目前已经有4层结构通过W3C的标准出台,即:(OWL)Rules,(SWRL)Logic,(FOL)Proof,Trust。我国也在几年前慢慢开始注重领域本体的研究,相对于美国和欧洲来说,国内的研究进展还处于初级阶段,但几年来,涌现出一批研究本体的学者以及专家,相应的各种关于本体的学术文献也明显增多。中国学者在本体映射、推理技术、浏览与搜索等方面展开了研究工作,形成了研究气氛活跃的局面,通过这几年的发展,国内学者们在语义网的其它国际学术会议上也占据了重要位置。目前,中国已经成为了国际语义网研究队伍中的一个重要成员之一。1.4 面临的主要问题语义网看似一个对未来网络的美好假想,随着本体技术的提高,相信语义网语是可全面实现的,目前针对语义网和本体技术,其发展面临的主要问题有:(1)网络上的资源语言丰富,除了世界通用语言英语外,还包括中文,德文,俄文,日文等多个国家的多种语言,这必定有基于不同标准的编码方式,如何能找到一个统一的语言编码来编码网络上的所有内容成了语义网面临的首要问题。(2)如何辨别一词多义以及多词一义的问题。面对同一个2概念在不同领域中词义不同,或者不同的概念在同一领域中词义相同,语义网应用将如何去分清它。语言的二义性是现今世界各种语言中都存在的普遍现象。(3)保证能有行之有效的信任机制,确保网络中所被描述的资源的来源具有真实性和可靠性。(4)语义网相关标准的制定问题,语义网作为现如今开放式网络的一个扩展,它必定允许个人、组织自有的发布资源,而语义网必须建立在拥有一个标准的基础上,建立相关标准成为了语义网最迫在眉睫的任务。(5)本体作为语义网中领域知识的概念化、形式化、确定化的规范,是对领域知识描述和理解的标准,对本体的研究目前尚处于初级阶段,后续的诸如“本体合并”、“本体演化”、“本体映射”、“本体标注”等技术至今仍旧尚未成熟。(6)世界上的语言多种多样,这决定了每种语言之间对特定概念的描述或理解存在着不同,如何解决不同语言语义的兼容性,使得各种资源可以更加方便的沟通与交流。(7)语义网的实现,其最突出的优点在于网络资源的检索上不仅智能化,并且其具有很强的信息搜索广度和深度,这也带来了另外一个问题,就是安全隐患与隐私保护的问题。这将要求语义网必须建立起安全与隐私的防护机制。显然,语义网的发展面临着层层困难,但这些都不足于影响语义网成为新一代网络的可能性,语义网技术从提出发展至今已经将近10年,发展相对比较缓慢,这是人们对网络的需求所决定的,目前的万维网处于相对成熟的时期,仍旧能满足人们对于网络应用的需求。导致了语义网的推广以及技术应用上得到了很大的阻碍,但是每一个具有革命性的产物,其发展的过程最初都是艰难的,我们有理由相信,随着人们需求的日益增长,当现有网络无法满足人们的时候,语义网将最终取而代之成为新一代智能型网络。2、相关研究2.1本体语言OWL2.1.1使用OWL语言描述本体OWL 语言增添了很多本体描述的细节,它被设计为满足对本体语言的需求。OWL是W3C一系列与语义网相关的并不断扩大的规范的一部分。RDF是一个关于对象资源和它们之间关系的数据模型,并且为数据模型提供了较为基础的语义,这个数据模型能够使用XML(可扩展标记语言)语法表示。而RDF Schema则是一个描述RDF数据资源(属性和类)的词汇表,提供了关于这些属性和类的层次结构的语义。OWL 在RDF Schema的基础上添加了更多的用于描述属性和类的词汇,例如类之间的不相交性、基数、等价性、属性的更丰富类型、属性特征等。2.1.2 OWL语言的子语言OWL作为一种描述本体的语言,它还提供了三种子语言(即对原OWL语言的增强),分别面向特定的使用者。这三种语言分别是OWL Lite、OWL DL、OWL Full:OWL Lite是表达能力最弱的子语言。它是另一个子语言OWL DL的一个子集,它降低了OWL DL中的公理约束,以保证推理过程中的迅速高效。它在OWL的基础上扩充了对基数进行约束,但约束基数的取值只能是0或1。同样因为OWL Lite表达能力相对比较弱,支持工具的开发上也较另外另外两个子语言多。OWL Lite语言主要提供给那些只需要一个分类层次和较简单约束的使用者。OWL DL(Description Logic缩写,译为:描述逻辑)把可判定推理能力和较强的表达能力作为语言设计的首要目标,忽略了与RDF Schema的兼容性问题。OWL DL涵盖了其父语言OWL语言的所有成分,它是一个研究作为OWL 形式基础的逻辑的研究领域,使用时必须遵照一定的约束,使用上受到一定的限制性。OWL Full囊括了父语言的所有语言成分,取消了OWL DL中的使用约束,将RDF Schema语言扩充为一个完整的本体语言,支持那些不需要保证可计算性,但却必须拥有较强表达能力和完全自由的RDF Schema使用者。OWL Full语言的使用中,类可以当成是所有类的实例的集合,也可以单独当做是一个个的个体。但由于OWL Full语言取消了部分约束,不能对可判定推理有所保证,所以大部分推理软件只能支持对OWL Full的部分推理。2.1.3 OWL Lite构成要素OWL Lite的构成要素主要包括:基础特性、等价性、属性特征、属性约束、受限基数、头信息、类的交集、版本信息、注释属性、数据类型。本课题将使用OWL Lite语言来对本体进行描述,上面所列举的构成要素中的一部分将会在下一节中结合电子竞技领域本体进行详细描述。2.2 OWL Lite语言描述 OWL Lite语言作为本课题中使用的本体语言,有必要在本章中着重介绍与本课题相关的各个构成要素,并结合电子竞技领域本体中的简单例子进行详细说明。部分本课题未涉及的内容将不在下面内容中被列出。2.2.1 基础特性(RDF Schema特性) (1)Class(类):一个类定义了因共有某些属性而同属一组的一些个体9。例如,李晓峰与王栩文这两个人可以抽象出一个共同的属性为“一线职业玩家”,所以“一线玩职业家”作为一个类,反过来,李晓峰和王栩文作为“一线职业玩家”类的成员(实例)。OWL Lite的基础特性中拥有两个内置类,thing和nothing,thing表示任何事物,它是所有类的父类,而nothing没有任何实例,所以它是所有类的子类。(2)rdfs:subClassOf(子类):可以给出一个或多个关于“一个类是另一类的子类”的陈述来创建一个类层次结构(Class hierarchies)9。例如,定义“一线职业玩家”是“职业玩家”的一个子类,即确立2个类之间的关系为“is-a”,即“一线职业玩家”is-a“职业玩家”。推理过程为:某人是一线职业玩家,那他也是职业玩家。(3)rdf:Property(属性):属性能用来表述个体之间或者从个体到数值的的关系9。即属性在OWL Lite中分为两种,owl:ObjectProperty和owl:DatatypeProperty,第一种用来描述个体之间关系,第二种用来描述个体到值的关系。例如:李晓峰“挑战”王栩文,此处的属性“挑战”为个体与个体之间的关系,属于owl:ObjectProperty(对象属性);再如,李晓峰的“ID为”SKY,SKY是一个字符串(rdf:string)类型,因此“ID为”这个属性属于owl:DatatypeProperty(数据类型属性),owl:ObjectProperty 和 owl:DatatypeProperty 都是rdf:Property 的子类。(4)rdfs:subPropertyOf(子属性):通过给出一个或多个陈述声明“某属性是另外一个或多个属性的子属性”可建立属性层次9。例如,“玩家邀请”与“战队邀请”都可以作为“邀请”的子属性。推理过程为:如果一个个体以“玩家邀请”与另一个个体关联,那么,他也一定与那个个体以“邀请”属性关联。(5)rdfs:domain(定义域):一个属性的定义域用来约束该属性可以适用的个体9。即如果个体X以属性P和另一个体Y相关联,并且属性P用某个类作为它的定义域,那么个体X必然属于这个类。例如,李晓峰“挑战”王栩文,“挑战”属性声明的domain为“电竞玩家”,也就是说,“挑战”属性的主体个体李晓峰肯定是属于“电竞玩家”的一个实例。(6)rdfs:range(值域):一个属性的值域用来限制哪些个体可以成为属性的值9。即如果个体X以属性P和另一个体Y相关联,并且属性P用某个类作为它的值域,那么个体Y必然属于这个类。例如,(5)中例子的“挑战”属性声明的range也为“电竞玩家”,同样的,“挑战”属性的值王栩文也肯定是属于值域“电竞玩家”的一个实例。(7)Individual(个体):个体是类的实例,个体之间可以用属性相互关联9。例如,李晓峰作为“一线职业玩家”类的一个实例。并可以通过前面所提到的“挑战”属性与另外个体进行关联。2.2.2 等价性与相同性(1)equivalentClass(等价类):两个类可以被声明为等价,即它们拥有相同的实例9。等价性可以用来创建同义类。例如,“职业玩家”类就与“职业选手”类是相互等价的。推理过程为:如果某个个体是“职业玩家”的成员,那么他必定也是“职业选手”的成员。(2)equivalentProperty(等价属性):两个属性也可以被声明为等价。相互等价的属性将一个个体关联到同一组其它个体9。例如,“战胜”属性与“击败”属性就属于互为等价属性,推理过程为:个体X通过“战胜”属性与另外一个个体Y关联,那么X也可以通过“击败”属性与个体Y关联;另一种推理过程为:“战胜”是“击败”的子属性,“击败”也是“战胜”的子属性。(3)sameAs(相同):两个个体也可以被声明为相同。这个构词可以被用来创建一系列指向同一个个体的名字9。即相同含义的不同名称。sameAs可以用来构建一系列指向相同个体的若干名称。例如,“竞技网站”类中的其中一个个体“R”,它和“RN”与“锐派游戏网站”指向的都是同一个个体,所以是属于相同含义的不同名称。(4)differentFrom(不同):一个个体可以声明为和其它个体不同。例如,“竞技网站”类中的两个个体“锐派游戏网站”与“魔兽俱乐部”就是不同的个体。在没有指定两个个体是differentFrom的情况下,OWL语言并不认为一个个体只有唯一的一个名字,事实上OWL推理过程虽然不会推出两个个体是相同的,但同样,也不会认为两个个体是不同的。2.2.3 属性特征(1)inverseOf(互逆):一个属性可以被声明为另一个属性的逆属性9。即可以声明两个属性互为逆属性。假设声明P1与R2互为逆属性,那么如果一个个体X通过R1关联到个体Y,则个体Y通过R2关联到个体X。例如,“击败”属性与“惜败于”属性互为逆属性,个体李晓峰“击败”个体王栩文,推理可推出:王栩文“惜败于”李晓峰。(2)TransitiveProperty(传递属性):声明属性为传递属性,即属性具有传递性。设属性P为传递属性,如果(x,y)和(x,z)都是属性P的实例,那么(x,z)同样也是属性P的实例。例如,“队友为”属性就为传递属性,其中(李晓峰,王栩文)是属性“队友为”的实例,(王栩文, 苏浩)也是属性“队友为”的实例,那么(李晓峰, 苏浩)也必定是属性“队友为”的实例。推理过程为:李晓峰的“队友为”王栩文,王栩文的“队友为”苏浩,那么,李晓峰的“队友为”苏浩。(3)SymmetricProperty(对称属性):声明属性为对称属性,即属性具有对称性。设属性p为对称属性,如果(x,y)是属性p的实例,那么(y,x)也是属性p的实例。例如,“挑战”属性具有对称性,将其声明为对称属性,个体李晓峰“挑战”个体王栩文,推理可推出:王栩文“挑战”李晓峰。2.2.4 属性约束与受限基数 属性约束约束了属性对于某个特定类使用时的适用性声明,限制了什么值是可以用的。(1)allValuesFrom(任意):约束allValuesFrom是对属性适用于某个类时声明的。它的意思是这个属性用于这个类时有一个局部性值域约束。如果某个类的实例通过allValuesFrom的属性与另一个体关联,那么另外那个个体则能被断定是该局部值域约束类的一个实例9。例如,电竞玩家“参加”电竞比赛,此时“参加”属性设置为allValuesFrom,则推理机并不能从属性“参加”中得知,电竞玩家是否至少存在“参加”一个电竞比赛,即电竞比赛的实例可以是任意个,即0个或多个。(2)someValuesFrom(存在):约束someValuesFrom是对属性适用于某个类时声明的。一个类可能对它的属性有个约束,即这个属性至少有一个值是属于某个类型9。例如,电竞比赛通过“举行项目有”属性与电子竞技比赛项目关联,“举行项目有”这个属性设置为someValuesFrom,则推理结果为:电竞比赛“举行项目有”电子竞技比赛项目,并且必须存在至少一个电子竞技比赛项目的实例。 受限基数约束了属性对于某个特定类使用时的基数限制性声明,限制了可以取值的个数是多少。(1)minCardinality(最小基数):用来限定属性对应的值域的最小基数。例如,电竞比赛的“参赛者”属性中,除了指定“参赛者”的值域为“电竞玩家”外,还可以利用minCardinality限制基数,如大于等于2。推理过程为:电竞比赛的“参赛者”是电竞玩家,并且参赛者必须大于等于2。(2)maxCardinality(最大基数):用来限定属性对应的值域的最大基数。例如,电竞玩家与战队之间存在一个关系属性为“玩家归属”,再利用maxCardinality限制基数为小于等于1。推理过程为:电竞玩家“玩家归属”于战队,并且一个电竞玩家实例只能“玩家归属”于0个或1个战队。(3)cardinality(基数):用来限定属性对应的值域的基数为一个确定的数值,其本质是由限制minCardinality和maxCardinality的交集。例如,职业战队与俱乐部之间存在一个“战队归属”属性,cardinality=1,推理过程为:职业战队“战队归属”于电竞俱乐部,并且,一个职业战队的实例必须“战队归属”于1个(有且仅有)电竞俱乐部。2.2.5 类的交集intersectionOf(交集):表示某个类可以是其它两个上级类的交集。例如,“职业玩家”类可以定义为“玩家”类与“战队领队”类的交集,推理过程为:“职业玩家”类的实例可以作为“玩家”类的一个实例,也可以是“战队领队”类的一个实例。3、电子竞技领域本体的构建3.1本体的构建概述3.1.1 构建方法电子竞技领域本体在建立过程中,尝试性采用比较切合目前实际情况的本体构建方法循环获取法。该构建方法呈环状结构,主要流程为:基本流程如下:(1)确定目标数据源:这是整个流程的切入点,是普通本体建立的过程,即确立一个电子竞技领域本体的实体文本作为最初的概念提取源。(2)概念提取:从确定的目标实体文本中提取出电竞领域概念,并初步建立概念之间的层次关系,形成电竞本体的最原始版本。(3)领域概念精确化:在原始版本的基础上,对所有概念进行统一审核,去除电子竞技领域无关或者相关性较低的概念,构建出电竞本体的概念结构。(4)关系细化:大部分属性源自于基础本体的继承,不断从实体电子竞技实体文本中挖掘较细叫深层次的关系。(5)评估:对本体进行整体评估,再通过重复上述步骤来完善。3.1.2 构建的依据标准基于目前尚未出现比较标准的本体构建方法,普遍认同的的构建方法是参照Gruber在1995年提出的五条本体构建标准,分别是:(1)确定性和客观性。本体应该能用自然的语言给出每个术语具有确定性的语义定义,并且定义描述是客观的。(2)完整性。(1)中所给出的定义描述必须是完整的,能充分表达其术语含义的。(3)一致性。知识推理的结果必须与术语本身的含义不产生矛盾。(4)最大单向可扩展性。扩充本体时(如加入新术语),无需对原本体的内容进行修改或修改较少。(5)最少约束。对每个概念进行建模时,应尽量少对术语进行条件约束。3.2电子竞技领域本体定义3.2.1 本体领域与范畴目标本体的构建基于整个电子竞技领域,包括电子竞技领域本身以及与电子竞技领域相关的部分,抽象出相关概念,并定义了概念(类)与概念(类)之间的关系(属性),并指定了明确的约束。电子竞技领域本体的构建过程中,分别从电竞比赛、电竞玩家、电竞比赛项目、电竞资讯、电竞工作者、电竞组织等几个大方面进行概念的收集与提取,并从其它电竞的相关方面抽象出需要的概念。整个电子竞技领域本体的构建过程遵循以下几个原则。(1)在分类到具体类的下面,不再建立抽象的子类。(2)不允许循环继承关系。(3)对类的划分不采用“其他”作为余下所有的集合,遵守可扩展性原则。(4)父类已经有等价类的说明,则其子类不在建立与父类互为等价类的子类。例如:“电竞组织”与“电子竞技组织”互为等价类,则“电竞组织”的子类“电竞媒体”不再建立相应的“电子竞技媒体”。(5)由于汉语本体在属性的命名时比较困难,所以大部分属性加上“于”、“为”等介词作为修饰。(6)电竞领域属于平民化领域,本体概念构建需要专业化,故此,本课题实现时尽量追求达到两者的平衡点。3.2.2 本体定义(1)本体约定:本体中所有类的父类为“thing”,所有类的子类为“nothing”。(2)类的提取:对目前电子竞技领域的能够构成领域知识的概念进行提取、抽象,并规范性命名,确保能与源概念命名相近。再相关领域中建立相关的概念,辅助性描述电子竞技本体的整体化知识。(3)属性的确定:采用电子竞技领域术语(行语)描述,利用中文具备的特性对属性进行建立。(4)关系的描述:包括RDF基础特性设置、类的等价性与交集设置、属性特征说明、属性约束以及受限基数的限制等。(5)建立具体类实例:对具体类建立对应的实例对象,原则为目前电子竞技领域中出现概率较大的对象(即热门对象),并为其属性建立对应的属性实例。3.3电子竞技领域的概念模型在构建本体的过程中,从电竞领域的各个组成部分出发,参照其它领域本体构建结构,在构建分类时考虑到电竞本体在电竞领域中的通用性,增强可扩展性和共享性,将领域划分为电竞比赛、电竞比赛项目、电竞资讯、电竞玩家、电竞工作者、电竞组织共六个主要组成部分(其它次要部分以及等价类未列出)。电竞比赛是整个电竞界的核心部分,按照比赛的面向性可分为职业比赛、业余比赛与混合比赛。电竞比赛项目在操作过程中,其介质主要依赖的于手机与电脑。电竞资讯是电子竞技领域与其它领域关联最多的一个分类,按照资讯类别可以分为文字类、音频类、视频类、资源类。电竞玩家同样式电竞界的核心,按照玩家的职业程度将其分为职业玩家与业余玩家。电竞组织是电竞行业的载体,按照其在电竞行业中发挥的职能不同,可分为战队、俱乐部、媒体、赛事主办方、粉丝团。电竞工作者是支撑整个电子竞技的群体,并且推动着电子竞技的发展。按照其个体是否职业化,将其分为职业工作者与志愿者。以上描述作为本体的最基础结构,细分类别并未列出,如图1所示。电子竞技领域电竞比赛电竞比赛项目电竞资讯电竞组织电竞工作者电竞玩家职业比赛业余比赛混合比赛手机游戏项目电竞文字资讯电竞视频资讯电竞资源职业玩家业余玩家电脑游戏项目电竞音频资讯战队电竞俱乐部电竞媒体赛事主办方电竞粉丝团职业工作者电竞志愿者图1 电子竞技领域本体基础结构图3.4本体的构建目标本体使用Protg 3.1作为开发工具,Protg是斯坦福大学基于Java语言开发的本体编辑和知识获取软件,支持可视化开发,支持OWL本体开发语言。在利用Protg构建本体的过程中,每一个成果往往不是一蹴而就的,每个过程都需要反复的斟酌,对一些细枝末叶不断的推敲,泛化,从而对其进行修改与完善。基于本体的构建过程具有普遍性,以下各小节,我们重点来描述一下电子竞技中的核心组成部分“电竞比赛”类与“电竞玩家”类的在本体中的构建。包括“电竞比赛”类与“电竞玩家”类的结构,它们之间的关系属性,以及OWL语言对它们之间的各种约束等。涉及其它类的内容时会加以特殊说明。3.4.1 领域概念的构建前面基础结构图已经给出了电竞比赛和电竞玩家的下一层分类,即电竞比赛包括:职业比赛、业余比赛、混合比赛,电竞玩家包括:职业选手、业余选手。类的分层式基于类与类之间的“父子”关系,也就是说,上下层建立的关系为父类与子类的关系,在描述中,可以用“is a”代替。经过反复推敲后,确定的“电竞比赛”和“电竞玩家”完整结构(Protg视图)如图2和图3所示: 图2 “电竞比赛”类结构图 图3 “电竞玩家”类结构图图2和图3是开发工具Protg中的概念结构图,其中表示类,表示该类具有等价类(rdfs:equivalentClass),(或)表示该类具有子类(由于两个类相互等价也可以视为互为子类,故等价类前面也有此符号)。电竞比赛与电竞玩家分别作为两棵树的根节点,即各自所有类的父类。父类所拥有的属性皆通过一级一级传递给所有子类,每个子类拥有自己特有的属性,或覆盖原父类的属性。子类是其父类的特殊化,故其拥有的属性多于或等于它的父类的属性,处于最低级别的类(叶子节点)拥有的属性是最多的。图2中,电竞比赛与电竞赛事互为等价类,联赛与职业联赛互为等价类。3.4.2 关系属性的构建属性体现了领域知识的内部联系,属性的描述在整个构建过程中是最为复杂的,下面仅以“电竞比赛”与“电竞玩家”这两个基础类中,其各自的子类在领域知识中存在的属性作为示例。其它关联至这两个基础类以外的属性不予列出。关联图如图4所示:电竞比赛职业比赛业余比赛混合比赛普通赛对抗赛邀请赛表演赛职业联赛电竞玩家业余玩家职业玩家一线职业玩家二线职业玩家娱乐赛网吧赛Is aIs aIs aIs aIs aIs aIs aIs aIs aIs aIs aIs aIs aIs a参加参赛者有被邀请邀请挑战战胜队友为地区对抗赛游戏元素对抗赛Is aIs a图4 “电竞比赛”与“电竞玩家”属性关联图图4中,存在关系的类用箭头进行关联。箭头始端为属性的定义域,末端为属性的值域。属性“Is a”作为本体概念中,最为基本的关系,它表示一个类是另一个类的子类,其定义域为子类,值域为父类。“Is a”属性在本体构建中无需对其进行手动建模。对于电竞比赛树来说,其内部各节点彼此之间的关系除了“Is a”没有其他的属性关联,存在4个与电竞玩家树关联的属性,分别是“参加”、“参赛者有”、“邀请”、“被邀请”。而电竞玩家树中,除了“Is a”以及与电竞比赛树关联的4个属性外,其内部节点存在着属性关联,并且为自关联(定义域与值域相同),如图中的“队友为”、“挑战”、“战胜”3个属性皆是对电竞玩家类的自关联。4、电子竞技本体的OWL描述4.1 命名空间描述电子竞技领域的构建只基于单个分类层次,故使用OWL Lite语言来对本体进行描述,由于本体本身的复杂性,本节包括后续节均用示例性描述。下面是电子竞技领域本体的命名空间描述:rdf:RDF xmlns:rdf=/1999/02/22-rdf-syntax-ns# xmlns:xsd=/2001/XMLSchema# xmlns:rdfs=/2000/01/rdf-schema# xmlns:owl=/2002/07/owl# xmlns=/unnamed.owl#4.2 本体的OWL描述4.2.1 类的描述以“电竞比赛”的基础结构(即只列出2层结构)作为示例给出示例描述,其它的详细结构以及电竞比赛项目、电竞资讯、电竞玩家、电竞工作者、电竞组织的结构与此类似。OWL描述如下: 4.2.2 关系属性的描述描述的属性示例为“电竞玩家”类与“电竞比赛”类中的3个属性示例,分别是电竞玩家关联到电竞比赛的属性“参加”,以及电竞比赛关联到电竞玩家的属性“参赛者有”(在本课题构建的本体中,“参赛者有”属性定义了等价属性“参赛选手有”,OWL描述中有列出。注意:“参加”与“参赛者有”并不是互为逆属性)。“参加”的OWL描述如下: 由于属性“参加”的属性约束设置为rdf:allValueFrom,既可有参加比赛,也可无参加比赛,所以OWL的无描述无法体现出电竞玩家必有通过“参加”关联至电竞比赛,只说明了“参加”的定义域跟值域。“参赛者有”的OWL描述如下:2 从OWL描述中可以看出,属性“参赛者有”不单单可以作为电竞比赛到电竞玩家的关联,即定义域为电竞比赛,值域为电竞玩家,OWL还体现出了必须有此关联,并且受限基数为大于等于2,即电竞比赛的参赛者必须是玩家,并且个数不得小于2。另外描述中,可以看出其拥有等价属性“参赛选手为”。4.2.3 实例的描述(1)类的实例。下面列举“一线职业玩家”里面的个体作为示例,关系如图5所示:一线职业玩家李晓峰王栩文苏浩实例实例实例图5 “一线职业玩家”类实例图上图中,“李晓峰”、“王栩文”、“苏浩”作为类的实例。OWL描述如下:rdf:ID在此处表示该类对应的个体实例名称。(2)属性的实例。下面列举“普通赛”中一个名为“WCG” 的实例,以及其对应的部分属性(赛事名为、赛事举办时间为、主办方为、参赛者有)实例。关系如图6所示:普通赛WCG实例DataTime2009-11-11 17:00实例StringWCG2009世界总决赛实例举办时间为赛事名为赛事主办方韩国国际电子营销公司实例主办方为一线职业玩家李晓峰实例即时战略类项目魔兽争霸3实例参赛者有举行项目有王栩文实例War3sameAs图6 “普通赛”的实例“WCG”的属性实例关系图其中,String与DataTime类型分别是标准命名空间下的字符串类型和日期时间类型。实例“魔兽争霸3”拥有同名实例“War3”。“李晓峰”与“王栩文”作为“一线职业玩家”类的2个实例。OWL描述如下: WCG2009世界总决赛 2009-11-11T17:00:00 OWL描述中的“/2001/XMLSchema#”是一个标准命名空间,其预先定义好了各种常用的数据类型(比如例子中的String和DataTime)。owl:sameAs用来表示同名实例。5、总结建立一个相对比较完善的领域本体,是一件困难的事,它需要不断对所在领域的知识进行研究,挖掘。通过提高本体的构建者对于领域知识的认识、理解水平,在构建的过程中,慢慢地对目标本体进行补充,改进。对于电子竞技领域来说,这个行业属于正处于高速发展的阶段,领域内部正在不断的发生着知识概念的更新与淘汰。并且,相对于其它领域来说,电子竞技是一个趋向于平民化的领域,比较少有正式的国家正规机关或媒体介入,其知识的标准化进程也发展的比较缓慢,出现了较多偏僻词语或者网络低俗用语,这使得本体在建立的时候,很难依照“专业化”这个构建标准,并且因没有相关先进领域的本体作为参考,建立这个目标本体前期稍显乏力,特别是在概念的提取中需要特别长的时间来斟酌提取出来的概念(本体中的class)是否恰当,当然,介于目前国内的本体构建热度不断的提升,可供参考的经验也多了一些,这也促进了对于电子竞技领域本体的建立。另一个重要方面是中文在使用上的局限性,我们知道中文是世界上最博大精深的语言,也因为如此,而使得语言在描述上的多样性,以及不确定性,例如同一个意思的语言可以表述成几种。并且中文汉字发展到今天,已经掺杂了许多新的元素,如外国音译词,网络新词等等,这在某种程度上,增大了标准化的难度。当然,本课题的实现上肯定会有不完善的地方,但这也将为我日后对本体的认识和实践上做好了知识与经验的铺垫,也希望通过我的努力,能够让电子竞技领域知识的规范化向前迈进一步。致谢 毫不夸张的说,在此之前,我是完全没接触过语义网,对语义网的相关技术更是一无所知,特别感谢我的指导老师蔡树彬老师引领我迈入了语义网的殿堂,感谢他经常在百忙中抽出时间对我进行指导,对我的提问也是给予了耐心的解答与讲解。在本体建立的过程中,老师给了我很多很好的建议,也经常和我一起讨论一些疑难问题,最终让我能够顺利的完成本课题。再次感谢蔡老师。【参考文献】1 杜小勇, 李曼, 王大治. 语义Web与本体研究综述J. 计算机应用. 2004, 24(10):14-20.2 冯志伟. 术语学中的概念系统与知识本体J. 术语标准化与信息技术. 2006.3 杜小勇, 李曼, 王珊. 本体学习研究综述J. 软件学报. 2006, 17(9):1837-1847.4 何召卫, 陈俊亮. 受限本体相似. 计算机学报J. 2006, 39(6):858-866.5 张维明, 宋峻峰. 面向语义web的领域本体表示、推理与集成研究J. 计算机研究与发展.2006, 43(1):101-108.6 刘浩公, 蔡东风, 张桂平. 一种基于词典的领域本体建立方法J. 通讯和计算机. 2007, 4(2):61-64.7 薛云, 叶东毅, 张文德. 基于中国分类主题词表的领域本体构建研究J. 情报杂志. 2007:15-18.8 钟秀琴, 符红光, 畲莉, 黄斌. 基于本体的几何学知识获取及知识表示J. 计算机学报.2010, 33(1):167-174.9 W3C. OWL Web Ontology Language Overview. W3C RecommendationS. February 2004.10 Berners-Lee T, Hendler J, Lassila O. The semantic WebJ. Scientific American. May 2001:29-37.11 Dieter F. Ontology-based knowledge managementJ. IEEE Computer. 2002, 35(11):56-59.12 M.Ackermann et al. Semi-automatic Construction of Topic OntologiesJ. Springer-Verlag. 2006:121-131.13 Guoqiang Zhang, Suling Jia, Qiang Wang, and Qi Liu. REA-based Enterprise Business Domain Ontology ConstructionJ. JOURNAL OF SOFTWARE. May 2010.OWL-based Electronic Sports Domain Ontology Construction【Abstract】With the popularity of the network,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论