

文档简介
西安电子科技大学 硕士学位论文 机械产品设计领域动词多施受动对象结构的研究与应用 姓名:郝远 申请学位级别:硕士 专业:机械制造及其自动化 指导教师:赵克 20100101 摘要 本文将自然语言理解系统应用到了产品设计中,对以自然语言形式表达的用 户需求里出现的动词多施动和多受动对象情况进行理解和分析,从而将用户需求 自动转化成概念设计要求,为后续的设计提供支持,以提高产品设计的效率。 首先,依据自然语言理解在设计领域中的特点,确定应用于产品设计的自然 语言理解应该采用基于知识为主的方法。其次,介绍了目前几种常见的知识表示 和语义分析方法,选择概念从属理论作为基于知识的方法的重要补充。然后,从 动词本身出发,对本文研究的多施受动对象结构进行了分类,并结合概念从属理 论对其中出现的并列关系和歧义现象进行了详细描述。再次,在以上工作的基础 上,阐述了自然语言理解系统中有关动词多施受动对象结构的理解实现,并根据 并列关系和歧义现象的分析对其进行理解实现。最后,将自然语言理解的语义分 析应用于联轴器设计需求分析原型系统,对其中的多施受动对象进行处理,并结 合系统其余模块的运行,经过初步调试,取得了一定的成果。 关键词:自然语言理解语义分析动词多施受动对象概念从属理论 a b s t r a c t t h et h e s i sa p p l i e sa p p l i c a t i o no fn a t u r a ll a n g u a g eu n d e r s t a n d i n gs y s t e mi n t ot h e p r o d u c td e s i g na n da n a l y s e st h es u b j e c t sa n do b j e c t sf o ro n ev e r bs u b o r d i n a t et o u s e r r e q u i r e m e n t sw h i c ha r eb a s e d0 1 1t h el a n g u a g es y s t e m t h er e a s o n s a l ea sf o l l o w s f i r s t o fa 1 1 i tc a nm e r e f o r et r a n s f o r mi n t ot h ec o n c e p t u a ld e s i g nt of u l f i l lt h ec u s t o m e r s r e a u i r e m e n t si na u t oi nb a s i so f t h ef e a t u r e si nn a t u r a ll a n g u a g eu n d e r s t a n d i n g t h en e x t , i tw i l lp r o v i d es u f f i c i e n ts u p p o r tf o rt h ed e s i g no ft h ef o l l o w - u p a n de n h a n c et h e e f f i c i e n c yo fp r o d u c td e s i g n f i r s t l v i tt e l l st h en a t u r a ll a n g u a g eu n d e r s t a n d i n go ft h ep r o d u c td e s i g ns h o u l d b e m a i n l yb a s e do nk n o w l e d g e ,a c c o r d i n gt on a t u r a ll a n g u a g eu n d e r s t a n d i n g f e a t u r e so f p r o d u c td e s i g n s e c o n d l y , t h i sp a p e ri n t r o d u c e ss e v e r a lc u r r e n t l yc o m n l o nk n o w l e d g e r e p r e s e n t a t i o nm e t h o d sa n ds e m a n t i ca n a l y s i sm e t h o d s c o n c e p t u a ld e p e n d e n c yt h e o r y i sc h o s e na sa ni m p o r t a n tc o m p l e m e n t a r i t yt ot h em e t h o db a s e do nk n o w l e d g e t h i r d l y , s t a n i n gf 而mt h ev e r bi t s e l f , t h i ss t u d yo nt h es t r u c t u r eo fs u b j e c t sa n do b j e c t sf o ro n e v e r bi sc l a s s i f i e d a n dc o m b i n i n gw i t ht h ec o n c e p to fd e p e n d e n c yt h e o r y , p a r a l l e l r e l a t i o n s h i pa n da m b i g u i t yp h e n o m e n ah a v e b e e n e l a b o r a t e dd e s c r i b e d f o u r t h l y , d i s c u s sh o wt od e a lw i t ht h es t r u c t u r eo fs u b j e c t sa n do b j e c t sf o ro n e v e r bi nt h en a t u r a l l a n g u a g eu n d e r s t a n d i n gs y s t e mo nt h eb a s i so ft h ea b o v ew o r k a c c o r d i n g t oa n a l y z i n g o fp a r a l l e lr e l a t i o n s h i pa n da m b i g u i t yp h e n o m e n o n ,t h en a t u r a ll a n g u a g eu n d e r s t a n d l n g s y s t e mc a nu n d e r s t a n da n da c h i e v ei t l a s t l y , s e m a n t i ca n a l y s i s o fn a t u r a ll a n g u a g e u n d e r s t a n d i n gi sa p p l i e dt or e q u i r e m e n ta n a l y s i sa r c h e t y p a ls y s t e mf o rt h ed e s i g no f c o u p l i n g t h es u b j e c t sa n do b j e c t sf o ro n e v e r bi nu s e rr e q u i r e m e n t s1 su n d e r s t o o da n d a n a l y z e d w i t ho t h e rm o d e l sr u n n i n g ,t h es y s t e mr u n s w e l la f t e rd e b u g k e y w o r d :n a t u r a ll a n g u a g eu n d e r s t a n d i n g s e m a n t i ca n a l y s i ss u b j e c t s a n do b j e c t sf o ro n e v e r b c o n c e p t u a ld e p e n d e n c yt h e o r y 西安电子科技大学 学位论文独创性( 或创新性) 声明 秉承学校严谨的学风和优良的科学道德,本人声明所呈交的论文是我个人在 导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标 注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的研究成 果;也不包含为获得西安电子科技大学或其它教育机构的学位或证书而使用过的 材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中做了明确的说 明并表示了谢意。 申请学位论文与资料若有不实之处,本人承担一切的法律责任。 本人签名: 西安电子科技大学 关于论文使用授权的说明 本人完全了解西安电子科技大学有关保留和使用学位论文的规定,即:研究 生在校攻读学位期间论文工作的知识产权单位属西安电子科技大学。学校有权保 留送交论文的复印件,允许查阅和借阅论文;学校可以公布论文的全部或部分内 容,可以允许采用影印、缩印或其它复制手段保存论文。同时本人保证,毕业后 结合学位论文研究课题再撰写的文章一律署名单位为西安电子科技大学。 本人签名:聋茎 导师签名: x 辛 逝毙 日期红:! :7 日期塑垒:! :2 第一章绪论 1 第一章绪论 1 1 引言 在社会高速发展以及计算机技术飞速提高的大背景下,现在几乎各行各业都 将计算机的智能控制和人工智能技术融合进去,当然机械产品设计也不例外。科 学技术的迅猛发展引起了科学的交叉与综合,使机械设计已不再是纯属于工程技 术范畴,而是自然科学、人文科学和社会科学相互交叉、科学技术与工程技术高 度融合所形成的一门现代设计科学【l j 。 面对激烈的市场竞争,世界各国普遍重视提高产品的设计水平,以增强产品 竞争力。现代产品的竞争主要体现在对市场的争夺,而市场竞争的生命力却在于 对产品的不断创新,任何科技成果要转变成有竞争力的产品,创新设计都在其中 起着关键性的作用。创新设计的核心是在需求分析概念设计阶段产生新的有市场 竞争力的概念或者工作原理。 将作为人工智能重要分支的自然语言理解应用在机械产品设计中,也是当前 智能化研究的一个热点。如何通过计算机技术及人工智能技术快速有效地收集用 户的需求信息,并且对用户需求进行分析,将用户需求转化为产品概念设计要求 从而设计出满足用户需求的产品,在产品设计中已经成为越来越引人注意的问题。 如果要让计算机理解这种要求,就需要利用自然语言理解这种手段,让自然语言 理解系统充当用户和产品设计、分析等系统之间的智能接口,通过了解用户想要 什么,指导设计人员的工作。设计人员对用户需求进行分析,将用户需求转化为 产品的概念设计、要求,从而设计出满足用户需求的产品,已经成为产品设计主 要的环节。一般来说用户不同于专业的开发人员,他们对设计领域内术语的了解 往往很低,仅仅是以自己的通俗语言表达自己对产品的要求要让计算机理解。这 种要求如前面所说到的,就需要利用自然语言理解这种手段让自然语言理解充当 用户和产品设计、分析等系统之间的智能接口,通过了解用户想要什么来指导设 计人员的工作。 本文将尝试自然语言理解在机械产品设计需求中的应用,通过对以汉语自然 语言形式表达的用户需求进行理解和分析,建立起相应的语言理解模型和具体设 计系统,并将分析得到的结果转化成概念设计要求,为后续设计提供强有力的支 持和保证。 机械产品设计领域动词多施受动对象结构的研究与应用 1 2 1 自然语言理解概念 1 2 自然语言理解概述 自然语言理解 2 1 ( n a t u r a ll a n g u a g eu n d e r s t a n d i n g ) 俗称人机对话,其是人工 智能的分支学科。研究用电子计算机模拟人的语言交际过程,使计算机能理解和 运用人类社会的自然语言如汉语、英语、德语等,实现人机之间的自然语言通信, 以代替人的部分脑力劳动,包括查询资料、解答问题、摘录文献、汇编资料以及 一切有关自然语言信息的加工处理。这在当前新技术革命的浪潮中占有十分重要 的地位。自然语言理解是一门新兴的边缘学科,内容涉及语言学、心理学、逻辑 学、声学、数学和计算机科学,其中以语言学为基础。 1 2 2 自然语言处理的层次 当今主流做法是以传统计算语言学为基本理论,循序研究语素词一短 语句子语段篇章。但是也有跟传统的基于句法知识的语言表述及处 理模式不同的理论,如黄曾阳先生的h n c ( h i e r a r c h i c a ln e t w o r kc o n c e p t ,概念层 次网络) 理论 3 1 。该理论吸收菲尔墨( f i l l m o r e ) 、山克( s h a n k ) 等人的有益思想。h n c 理论建立了一个模拟人类语言感知过程的理论模式。该理论认为:人对语言的理 解本质上是一种认知行为,计算机对自然语言的处理就应建立在模拟人脑的这种 语言感知过程的基础上。而人脑的认知机制“绝不是语法或句法而是概念联想网 络“ ,对联想网络的表述是语言深层( 即语言的语义层面) 的根本问题。联想网络 分为局部和全局两类,前者对应着词汇层面、后者对应着语句层面。语料库加工 的基本步骤为:语义块感知和句类假设句类分析语义块构成分析。 虽然从自然语言理解这一理论的提出至今,已有几十年的发展时间,但是由 于其难度很大,至今仍然未能够达到很高的水平。这主要就是由于人类语言以及 知识本身的复杂性以及多样性。由于我国自然语言理解的研究起步较晚,另外, 汉语作为一种自然语言有其自身的特点,而其中有些特点使得它特别不适合计算 机来处理【4 j 。因此,国内汉语自然语言理解的水平较之国外( 特别是欧美) 还是有 一定差距的。不过经过数十年的发展,汉语自然语言理解技术还是获得了长足的 进步,取得了很多重要的成果。 语言的构成呈现出一种层次性,一个文字表达的句子是由词素一 词或词形 一 词组或句子构成,其中每个层次都受到语法规则的制约。因此,语言的处理过 程也应当是一个层次化的过程【) j 。许多现代语言学家把这一过程分为五个层次:语 音分析、词法分析、句法分析、语义分析和语用分析。虽然这种层次之间并非是 第一章绪论 3 完全隔离的,但这种层次化的划分的确有助于更好地体现语言本身的构成,并且 在一定程度上使得自然语言处理系统的模块化成为可能。在本文中所提到的自然 语言理解系统是忽略了对语音分析的研究,从词法分析开始的【6 l 。 1 词法分析主要完成词的切分及词义选择,当然,还包括一些纠错功能。 2 句法分析的目的是确定每个词在句子中的功能以及句子的合法性,然后产 生合适的表示,为进一步语义分析做准备。句法分析通常以事先精心定义 的一系列语言规则为基础。 3 语义分析则是解决句中的词、短语、直至整个句子的语义问题。由于自然 语言的模糊性和不精确性,这项工作要做得完善非常困难。通过语义分析 找出词义、结构意义及其结合意义,从而确定语言所表达的真正含义或概 念。在语言自动理解中,语义愈来愈成为一个重要的研究内容。 4 :语用分析的目的是进一步解决模糊语义、省略、引用问题以及建立句与句 之间的逻辑关系。它是最为困难,也是研究最少的问题。 上述四种分析在一个系统中往往是相互关联、交叉进行的。就目前的情况而 言,词法分析和句法分析相对成熟,语义分析逐渐成为研究重点。实际上只有在 篇章的范围内分析,省略、指代和句子的固有歧义等问题才可能解决。 1 2 3 自然语言处理的过程 到目前为止,对自然语言理解的计算机处理一般情况下是要经过以下4 个过 程【7 】: 1 首先,从语言学的角度提出要解决的问题和理论,并对语言的句法语义进 行分析和描写,即语言的知识描写。 2 其次,把这些语言知识形式化,用数学公式表示出来,使之成为一定数学 形式的规则系统。 3 再次,在计算机上将上述知识用算法实现,成为形式化的数学表示。 4 最后,根据算法编进计算机程序,使之在计算机上加以实现。 上面的处理过程只是现阶段最合适的一个处理过程,但并不是一成不变的。随 着对自然语言理解的认识不断深入,理解不断加深,之前的处理方法会得到相应 的改变,为自然语言理解的应用提供更多的帮助。 1 2 4 自然语言处理存在的问题 目前存在的问题有两个方面:一方面,迄今为止的语法都限于分析一个孤立 的句子,上下文关系和谈话环境对本句的约束和影响还缺乏系统的研究,因此分 4 机械产品设计领域动词多施受动对象结构的研究与应用 析歧义、词语省略、代词所指、同一句话在不同场合或由不同的人说出来所具有 的不同含义等问题,尚无明确规律可循,需要加强语用学的研究才能逐步解决。 另一方面,人理解一个句子不是单凭语法,还运用了大量的有关知识,包括生活 知识和专门知识,这些知识无法全部贮存在计算机里。因此一个书面理解系统只 能建立在有限的词汇、句型和特定的主题范围内;计算机的贮存量和运转速度大 大提高之后,才有可能适当扩大范引羽。 汉语是一种依赖语义理解型语言,如何将语义知识合理、有效地应用到句子 分析中去,一直是计算语言学界十分关切的问题。将语义知识融合到句子分析中 的必要性自不待言,关键是如何将汉语的语义知识进行形式化的描述,这是一项 非常有意义的研究工作,但是它的发展有赖于汉语语义资源的开发和多学科的通 力协作。 因此在今后的语言学研究工作中,一方面要及时吸取和借鉴国外在语言学方 面研究的最新成果。另一方面要结合汉语自身的特点开展和加强基础理论的研究, 为汉语语言理解构造理论框架。由此可见计算语言学研究在今后的发展趋势将向 着语法、语义、语用和语境各方面的综合研究方向迈进。 1 3 动词施受动对象研究概述 1 动词在语义处理中的地位 句子结构中的各种语言单位之间总是存在着一定的关系,这种关系在句中主 要体现在语言单位之间的句法语义关系上。而在对句法、语义关系这个语法研究 的核心问题上,许多语法学家和语法理论、语法流派,无论中外,都强调动词是 句子结构的中心,倡导“动词中心说“ 。因为词与词之间客观存在的句法语义联系 主要就表现在动词对其他词( 主要是名词) 的制约上。 在汉语语法学界,吕叔湘早在4 0 年代就认识到动词是叙事句的中心,其他成 分都是围绕着动词而构句的。到了8 0 年代,吕叔湘更是明确地认为动词和句型“这 是语法研究的第一号重要问题。动词为什么重要,因为在某种意义上,动词是句 子的中心、核心、重心,别的成分都跟它挂钩,被它吸引,【引。胡裕树、范晓也认 为“动词研究是汉语语法中的第一号重要课题,也是语法研究中最复杂的问题 动词在句法结构中活动能力最强,大部分词类都要跟它发生一定的结合关系;动 词是一般句子里最重要的部分。”【9 】这些都说明了,在汉语的语句中,动词对其他 的词语具有选择限制能力,在动词和名词的相互选择上,动词起到了核心的作用。 因此,对动词的语义研究成为汉语语义分析工作中的主要任务。 2 动词的语义分析方法 动词是指描述人或物的动作、情况以及变化的词。从自然语言处理角度来看, 第一章绪论 s 动词的作用是通过串连名词来实现意义表达的。 动词的各种语义关系比较复杂,而且词义要比名词灵活得多,根据动词的这 种特点,本文对动词采取了如下处理: 1 ) 如果几个不同的动词均采用了同一个意义,则用一个标准动词来表示,用 事实来记录。将其中的一个动词选取出来作为标准动词,作为该意义的动 词概念,其他的几个同义动词都聚类于这个标准动词的意义之下。 2 ) 对于某一个具有多个意义的动词,也就是多义词,则采用规则实现其语义 分析。首先先假定一个意义,然后进行语义规则分析,如果匹配正确,则 采用该语义;否则重新选择该动词的其他意义。 虽然动词的词义灵活,但当动词与其他词( 主要是名词) 进行匹配后,动词的 词义就相对确定下来了,因为动词的语义是与其相匹配对象( 例如名词) 的概念紧 密联系的。所以说,动词是一类与语境关联最密切的词汇。 3 动词语义分析中的施事和受事 在对自然语言理解研究的整个过程中,动词的研究始终占据着相当重要的地 位。参阅了众多有关著作和文章后,知道动词施事、受事是动词属性的必选项。 二者是一个动作发生时必然涉及的要素,否则该动作没有执行和承受的载体。若 不考虑省略现象,所有动作都有其执行者和承受者,实际语言运用中,由于省略 现象的普遍存在,施事或受事常常可能省略。但其实它们都是必选项,至少其中 之一不可缺少,其中施事表示在执行该动作时的动作执行者,它从动作执行者的 具体要求和数量方面来限制,受事表示在执行该动作时的动作承受者,它从动作 承受者的具体要求和数量来限制i l o 1 1 1 。 通过对之前动词施事和受事相关文献的参考和研究发现,它们讲到的只是施 事和受事对象一些语义上的说明、彼此的区分以及相关的用法,并没有就多施事 或多受事对象这个问题展开一个深入的分析和讨论,尤其是在句中对两者具体个 数的判定上目前没有很好的分类和处理的方法,可以说其在动词施事和受事处理 中还属于薄弱环节,这就有必要对其进行分类研究。( 说明:本文中施动和受动 对象与施事和受事对象等价) 1 4 本文工作 到目前为止,对动词的研究一直都是语言学界的重要课题,有人说动词研究 好了,语法问题就解决了一半。国内外对此已经做了大量的研究,取得了一定的 成果。本文从现有的对动词施事和受事对象的研究基础上出发,从一个崭新的方 面对汉语动词中施动对象和受动对象进行了一定的探讨,对动词中出现的多施动 与多受动对象进行必要的分析和分类并讨论其在自然语言处理系统当中实现的办 6 机械产品设计领域动词多施受动对象结构的研究与应用 法。通过对以自然语言形式表达的领域知识进行理解和分析,为后续的理解和工 程运算提供支持。 本文主要完成的工作如下: 第一章查阅大量相关资料,对国内汉语自然语言理解领域的动态有了一定了 解。同时在分析自然语言发展状况的基础上,分析了动词中多施受动对象研究的 现状。 第二章分析和比较了目前比较流行的自然语言理解的知识表示的理论和方 法,并利用概念从属树相关理论,提出了应用于自然语言理解有关动词施事和受 事分析的知识表示方法和知识库构建的方法。 第三章提出“动词多施受动对象”的概念并讨论其意义。然后,先从动词本 身出发对现有的动词进行新的分类,接着重点分析和理解通过语言表达简约而生 成的多施受动对象结构,在此基础上对施受动对象之间的关系以及在语义理解上 产生的歧义现象做了相应的讨论。 第四章介绍了与动词施受动对象相关的模板,并在对动词中多施动与多受动 分类的基础上讨论多施受动对象结构的处理实现。 第五章把自然语言理解的在动词多施受动对象结构应用于机械设计加工需 求分析原型系统中,建立相应的静态事实库,设计了机械设计加工领域的汉语自 然语言理解系统。最后通过使用该系统对机械设计加工中的一个实例进行分析与 处理后,说明了此系统在该领域应用的可行性。 结束语总结本文的工作内容,进一步分析了今后的工作重点和研究方向。 第二章自然语言理解相关理论基础 7 第二章自然语言理解相关理论基础 对自然语言的理解最终是要归结到对语义的深层次理解,单纯的语法分析无 法完成这一任务,必须同语义分析结合,同时语义分析也是自然语言理解的重点 和难点。汉语自然语言理解不仅要从语法层面上进行研究,语义层面的研究也是 非常重要的一个部分。有些句子在语法上是对的,但从语义角度上考虑却是错误 的。为避免这类问题的发生,语义分析就显得尤为重要。本章对现有的语义分析 方法进行了比较,分析了各自的优缺点。在此基础上进行理解体会,并为后面的 章节做出铺垫。 2 1 知识与知识表示 人类的知识活动过程主要是一个获得并应用知识的过程,知识是智能的基础。 为了使计算机具有智能,使它能模拟人类的智能行为,就必须使它具有知识。但 知识需要有适当的模式表示出来才能存贮到计算机中去。 知识表示实际上就是对知识的一种描述,或者说是一种约定,一种计算机可 以接受的用于描述知识的数据结构。对知识进行表示的过程就是把知识编码成某 种数据结构的过程。知识表示方法又称为知识表示技术,其表示形式称为知识表 示模式【1 2 l 。 2 1 1 知识的定义 知识是人们在长期的生活及社会实践、科学研究及试验中积累起来的对客观 世界的认识与经验。它是通过人的智慧将自然原始信息转换为人类信息的,具有 确定意义的第二信息集合,它必须通过智慧( 人类智慧和工作智能) 才能对环境 发生作用。知识在其获得、储存和应用中体现出它的特有属性,它是一个极为复 杂、开放性的体系。知识具有强大的生命力,在智慧的引导和作用下,能够创造 和更新自身体系,知识在与环境发生互动作用的过程中,创造和改变着环境。 自然原始信息在其转换为人类信息的过程中,它本身的特有属性并没有发生 改变,发生改变的只是存在形态和人类赋予它的特定意义【l 引。在人工智能中,把 前一种知识称为“事实”,而把后一种知识,即用“如果则关联起来所 形成的知识称为“规则”。 8 机械产品设计领域动词多施受动对象结构的研究与应用 2 1 2 知识表示 知识表示【1 4 】是指把知识客体中的知识因子与知识关联起来,便于人们认识和 理解知识。知识表示是知识组织的前提和基础,任何知识组织方法都是要建立在 知识表示的基础上。知识表示有主观知识表示和客观知识表示两种。在某种意义 上讲,知识表示可视为数据结构及其处理机制的综合: 知识表示= 数据结构+ 处理机制 因此在专家系统中,知识表示是能够完成对专家的知识进行计算机处理的一 系列技术手段。目前用得较多的知识表示方法有:状态空间法,谓词逻辑表示法, 框架表示法,产生式表示法,语义网络表示法,脚本表示法,过程表示法,概念 从属表示法等。 对同一知识,一般都可以用多种方法进行表示,但效果却不相同。因为不同 领域中的知识一般都有不同的特点。由于不同的知识结构都有其针对性和局限性 ( 每一种表示方法也各有自己的长处与不足) ,在建立一个具体的智能系统时,究 竟采用哪种表示模式,目前还没有统一的标准,也不存在一个万能的知识表示模 式。但一般来说,在选择知识表示方法时,应从以下几个方面进行考虑: 1 充分表示领域知识; 2 有利于对知识的利用; 3 便于对知识的组织、维护与管理; 4 便于理解和实现。 要让计算机理解人类的语言就必须研究人类语言的计算机表示。由于知识本 身的特点以及汉语语言自身的特殊性,因此,在构建适合领域汉语特点的知识表 示模型时,有必要先对目前比较有代表性的几种知识表示方法作些分析比较,以 便从中吸取经验和教训。 2 1 3 几种现有的知识表示方法1 5 l 1 问题归约知识表示法 问题归约法从目标( 要解决的问题) 出发,逆向推理,通过一系列变换把初始 问题变换为子问题集合和子子问题集合,直至最后归约为一个平凡的本原问题集 合。这些本原问题的解可以直接得到从而解决了初始问题,用与或图来有效地说 明问题归约法的求解途径。问题归约法能够比状态空间法更有效地表示问题。状 态空间法是问题归约法的一种特例。在问题归约法的与或图中,包含有与节点和 或节点,而在状态空间法中只含有或节点。 2 谓词逻辑知识表示法 第二章自然语言理解相关理论基础 9 谓词逻辑法采用谓词合式公式和一阶谓词演算把要解决的问题变为一个有待 证明的问题,然后采用消解定理和消解反演来证明一个新语句是从己知的正确语 句导出的,从而证明这个新语句也是正确的。谓词逻辑是一种形式语言,能够把 数学中的逻辑论证符号化。谓词逻辑法常与其它表示方法混合使用,灵活方便, 可以表示比较复杂的问题。 谓词逻辑表示法的优点:它是最早使用的一种知识表示方法,具有简单、自 然、精确、灵活、模块化等优点。它的推理机制采用归结原理,这种推理方法严 格、完备、通用,比较适用于定理方法求解问题的系统。 谓词逻辑表示法的缺点:首先,不能表示不确定性的知识和复杂知识;其次, 在其推理过程中,随着事实数目的增大及盲目地使用推理规则,有可能形成组合 爆炸;再次,谓词逻辑表示知识时,其推理是根据形式逻辑进行的,把推理与知 识的语义割裂了开来,这就使得推理过程冗长,降低了系统的效率。 3 框架表示法 框架是一种结构化表示方法。框架通常由指定事物各个方面的槽组成,每个 槽拥有若干个侧面,而每个侧面又可拥有若干个值。它可以描述对象的某一属性, 也可用描述其他对象的框架来填充。一般地,一个对象采用一个框架描述,其属 性则用“槽描述。一个框架可以如表2 1 所示: 表2 1 框架表示法所用框架 框架名名字 槽1 名槽1 的值 槽2 名槽1 的值 约束1约束条件1 约束2约束条件2 4 语义网络表示法 语义网络是一种结构化表示方法,它由节点和弧线或链线组成。节点用于表 示物体、概念和状态,弧线用于表示节点间的关系。语义网络的解答是一个经过 推理和匹配而得到的具有明确结果的新的语义网络。语义网络可用于表示多元关 系,扩展后可以表示更复杂的问题。 语义网络表示法的优点:结构性,能把事物以及事物间的各种语义联系显式 地表示出来;自然性,语义网络对事物的属性及事物间的联系的表示比较直观, 便于理解,自然语言与语义网络间的转换也比较容易实现;联想性,语义网络可 把节点间的联系以明确、简洁的方式表现出来,通过这些联系很容易找到结点间 机械产品设计领域动词多施受动对象结构的研究与应用 的有关信息,不仅便于以联想的方式实现对系统的检索,而且它所具有的这种自 索引能力使之可以有效地避免搜索时所遇到的组合爆炸问题。 语义网络的缺点:首先,表示有限,而且形式过于简单,结点间的联系只局 限于几种典型的关系。其次,有效性低,结点和弧本身没有确切的含义,因此逻 辑推理不具备逻辑系统那样的有效性。再次,网络中结点之间的联系可能是线状 的、树状的、也可能是网状的,甚至是递归的,这就给知识的存储、修改、和检 索带来不少困难。最后,非严格性,语义网络没有公认的形式表示体系。一个给 定的语义网络所表达的含义往往依赖于处理程序如何对它进行解释。在推理过程 中,有时不能区分事物的“类”与“个体“ ,其推理不能保证正确性【1 6 1 。 5 状态空间知识表示法 状态空间法是一种基于解答空间的问题表示和求解方法,它是以状态和操作 符为基础的。在利用状态空间图表示时,从某个初始状态开始,每次加一个操作 符,递增地建立起操作符的试验序列,直到达到目标状态为止。由于状态空间法 需要扩展过多的节点,容易出现“组合爆炸”,因而只适用于表示比较简单的问题。 6 规则表示法 规则表示法也叫产生式表示法。它的一般形式是:i f t h e n ( 或 ) ,它的推理机制以演绎推理为基础。产生式系统最初是由p o s t 于1 9 4 3 年提 出的一种计算机制。1 9 6 5 年由s i m o n 和n e w e l l 引入到基于知识的系统中来。目前 已是专家系统中使用最广泛的一种表示方法,一般将这种系统称为基于规则的系 统。 此处只是对其中几种常见和常用知识表示的方法做了一定叙述,还有其他的 知识表示法就不过多的进行介绍,这里的目的就是让大家对本文所要研究问题依 靠的理论先有一定的了解,为后面详细的阐述做必要的铺垫。 2 2 自然语言理解分析方法 1 格框架约束分析技术【1 1 7 1 9 】( 格语法) 格语法是由语言学家c h a r l e sf i l l m o r e 于1 9 6 8 年在他的论文“格“ 辨“t h e c a s ef o rc a s e “ 中提出。其基本思想是:动词在句中起中心作用,参与动作的各个 体称为“语义格“ ,且“格”的数量是有限的。针对每个动词的义项,由可能的“语 义格“ 子集构成格框架,这一子集分为必要的和可选的两个集合。 在传统语法中,格是一种语法范畴的名称,它表示名词( 或代词) 在句子中 的语法功能。例如英语有三种格,即主格,所有格和宾格。主格用作动词的主语; 所有格也称属格,表示占有或所有;宾格用于动词的直接宾语或间接宾语。在格 框架约束中,“格“ 是指潜存于句子深层结构里的名词( 包括代词) 与谓语动词之 第二章自然语言理解相关理论基础 1 1 间的一种固定不变的语义结构关系。 格语法给出了各格成分之间的深层语义,即句子的深层结构。格语法适应于 汉语的分析。格语法最大的特点是承认语义在句法中的主导作用,由格语法分析 可以得到句子的深层语义结构,给出各成分的语义角色,对于确定正确的句法结 构有很大帮助。 格语法在汉语分析中存在以下几个缺点: 1 ) 无法解决汉语的连动和兼语句式。格语法认为动词在句中起中心作用, 那么分析句子时首先要确定句子的核心。汉语缺乏形态特征,作为核心 的主动词通常也缺乏形态特征。如何在有多个动词的连动式和兼语式中 找出句子的核心是汉语信息处理的一个很难的问题,也是格语法无法解 决的问题。 2 ) 短语内部各成分间关系无法确定。格语法提出的各种格关系都是名词性 短语和动词之间的语义关系,对于名词性短语内部和动词短语内部各成 分关系的确定没有给出。 2 语义网络文法【2 0 2 1 】 语义网络( s a m a n t i cn e t w o r k ) 是由m r q i l l i o n 首先提出,是人工智能重要的知 识表达形式。语义网络通过由一些节点以及用于连接节点的有向弧构成的有向图 来描述,节点代表物体、概念和事件等实体,而有向弧则代表实体之间的二元关 系。图2 1 就是语义网络的一个例子。 语义网络各个概念之间的关系,主要由i s a ( 表示“具体抽象“ 关系) , p a r t - o f ( 表示“整体一构件关系) ,i s ( 表示一个节点是另一个节点的属性) , h a v e ( 表示“占有、具有“ 关系) ,b e f o 眦f t e 刚a r ( 表示事物间的次序关系) , l o c a t e d o n ( 表示事物间的位置关系) 等谓词表示【2 2 j 一 3 知网 知网【2 3 】是董振东老师提出的,是一个以汉语和英语词语所代表的概念为描述 对象,以解释概念与概念之间以及概念所具有的属性之间的关系为基本内容的常 识知识库。知网借鉴了概念从属理论的原语概念,提出了1 5 0 0 多个义原,用来描述 概念、概念之间的关系及属性与属性之间的关系。义原具有层次性,分为实体、 事件、属性、属性值、数量、数量值、句法特征、次要特征和动态角色等类别。 概念由义原描述,也具有层次性和分类。知网对每个事件义原给出了角色框架, 列出了某一类事件发生时框架中的必要绝对角色。知网描述了1 6 种关系:上下位 关系、同义关系、反义关系、对义关系、部件整体关系、属性宿主关系、材料一 成品关系、施事经验者关系主体事件关系、受事内容领属物等事件关系、工 具事件关系、场所事件关系、时间事件关系、值属性关系、实体值关系、事件 角色关系和相关关系。 机械产品设计领域动词多施受动对象结构的研究与应用 交通工具 t i sa i a i sa 汽车 船 t i sa i t sa 非机动车机动车 i 。上l 汽车火车 t 。 。 is | a t 。一 坫al s 。 货车客车轿车 图2 1 语义网络i s a 链图 除了上面提出的几种自然语言理解用到的语义分析方法外,还有很多语义分 析理论,如生成语义学、解释语义学、境况语义学过程语义学等。 2 3 概念从属理论 在此处我们将概念从属理论单独列出来进行说明,因为在后面文章的论述中 用到的地方比较多,而且其在自然语言理解中占据着相当重要的位置。接下就将 详细的介绍概念从属理论相关理论知识。 1 概念从属理论概述1 2 4 - 。2 7 ( 简称“c d 理论“ ,下同) 概念从属理论( c o n c e p t u a ld e p e n d e n c yt h e o r y ) 又称为概念依存理论( 简称c d 理论) ,是美国计算语言学家香克( s c h a n kr ) 在七十年代初提出的描述句义和语义 的方法。它是以词的概念为基础的理解系统,词汇只是概念的符号,从整体而言, 系统里没有词,只有概念。他认为,人在理解自然语言时依赖的是潜在的概念表 述,而不是具体的词或句子。人们总是用以前遇到的更简单、更基本的事来理解 现在所遇到的事情。因此,当计算机理解自然语言时,也要依赖事件的概念表述 而不是特定的词或句。 概念从属理论的目标是表达自然语言中潜在的概念从属结构。它试图以若干 第二章自然语言理解相关理论基础 原语概念( 如抽象转换a t r a n t s m a b s t r a c tt r a n s f e r 的缩写) 的组合加上一些中 间状态和因果关系来表示各种动作( a c t ) 。句子、短语、词组都是由概念组成的; 这里的概念是若干基本动作的抽象,相当于原语或中间语言;句子、短语、词组 都有一个核心概念;其它概念称作附加概念;附加概念是以核心概念的存在或相 互存在而存在。 概念是指动作或在某一方向上对一物体做些什么,所有概念都可以由少量作 用于物体的原语动作来描述,这是概念从属理论的基本思想。原语可以表达大量 动词潜在的意义,是描述事件的基础,其它动作都可由这些动作原语组合而成。 因此,合适的原语概念表述体系对自然语言理解是必需的,原语的能力越强,理 解系统的能力就越强。c d 理论具有两个特点:( 1 ) 便于构思对于语句的推论;( 2 ) 不 依赖于指出语句的源语言。 c d 理论希望对常识进行系统而又具体的描写,并利用原语来进行推理,从而 达到对语言的自动理解。由于用c d 理论来理解自然语言时,大量使用到语义知识, 使得对纯粹语法分析有二义性的句子亦能赋以唯一的解释。但从另方面看,c d 对常识描写是相当刻板和定式的。 概念从属理论的三条重要原理如下所示: 1 ) 任何语言中的两个意义相同的句子,其意义的表达式只有一个。 2 ) c d 表达式可由数目有限的若干个语义基元组成,概念依从理论从整个自然 语言中归纳出1 1 种概念行为,即 a t r a n s ( 抽改)抽象关系的转移。如:g i v e ( 给) p t r a n s ( 位变) 对象的物理位置的转移。如:g o ( 去) p r o p e l ( 推进)对一对象施加物理力量。如:p u s h ( 推) m o v e ( 移动)移动自己的某一部分。如:垴c k ( 踢) g r a s p ( 抓住)行为者控制对象。如:t h r o w ( 抛) i n g e s t ( 摄入)动物摄取对象。如:e a t ( 吃) e x p e l ( 吐出)动物体内排出某些东西。如:c r y ( 哭) m t r a n s ( 转息)思维信息的转移。如:t e l l ( 告诉) s p e a k ( 发声)产生声音。如:s a y ( 说) m b u i l d ( 生思)依据原有信息建立新信息。如:d e c i d e ( 决定) a t t e n d ( 集中)将感官器官的注意力向着刺激。如:l i s t e n ( 听) 这些表示基本行为的概念之间的关系叫做从属关系或依存关系,其数目也是 有限的,每种从属关系用一种特殊的箭头在图上表示出来。例如,“他给了小赵 一支笔这个句子的c d 表达式如图2 2 : 1 4 机械产品设计领域动词多施受动对象结构的研究与应用 。p 他 他 a t r a n s + 止笔+ 剖k 小赵 图2 2c d 表达式图 其中,他、笔、小赵叫做概念结点;a t r a n s 也是结点,它表示一个基本行 反映的是“给这种抽象关系的转移;标有r 的三道箭头表示他、小赵和笔之间的 接受或给予的从属关系。因为小赵从他那里得到了一支笔,标有o 的箭头表示“宾 位”从属关系,即书是a t r a n s 这个基本行为的目的物。 3 ) 在句子的意义表达式中,必须把隐晦地存在于句中的信息尽量地显现出 来。 2 用概念从属模式来表示知识,使得知识推理更方便 1 ) 当知识未分解成原语时,需要的推理规则比要求的少。使用c d 原语而 不用高级术语表达知识的好处在于,对每一原语a c t ,规则只须表达 一次,而对描述那个a c t 的每个单词就不止表达一次了。 2 ) 许多推理已包含在表达中。用c d 表达知识的好处是构造知识。我们 不仅能指出与使用在句中的明显信息,而且还用与具体信息联系在一 起的一组推论规则。这些规则一经应用,它们的结果就作为表达的一 部分存贮起来,而且那些规则能反复使用且不必再应用规则。 3 ) 为表达包含在语句中的信息而建立的初始结构,将有一些需待填充的 槽。这些槽可作为理解后随句子的程序的标注符。在一段信息的表达 中未明确指定的元素,可用来理解后续事件的焦点。 3 概念从属理论的优点与缺点 概念的观点、结构的推理、高度抽象的概念行为及其框架的思想,都是十分 有价值的。该理论的优点在于:( 1 ) 对知识世界的分析,采用了抽象化、规范化的 方法;( 2 ) 该理论是针对理解的,是一种逻辑语义学的形式化的方法。( 3 ) 适用于各 种语言的语义表示形式,其表示形式主要体现为输入语句的语义特征,而不关心 具体自然语言特性,相应于每一个格的内容要求以概念形式表示,与具体的词汇 无关。因而,它是一种独立于具体语言的语义表示形式,它具有其他表示方法所 无法比拟的通用性。( 4 ) 整个对常识进行系统而又具体的描写,并利用那些基本动 作进行方便地推理,从而达到对语言的自动理解。 但是相应地c d 理论存在一些缺点【2 8 l :( 1 ) 由于目前还无法找到不含多义性的、 对具有相同语义的不同输入有同一表示的最优原语组合,但是在某一具体领域中 可以找到原语的最优或次优组合是可以实现的。( 2 ) 理论的具体实现是试图以若干 原语概念的组合( 如抽象转换) 加上一些中间状态和因果关系表示各种动作( a c d 。 因此,概念从属要求把所有知识分解为相当低级的原语,可能低效或在某种情况 下也许做不到。( 3 ) c d 理论是一种事件表达理论,但为表达复杂程序可能需要的所 第二章自然语言理解相关理论基础 有信息,就要求能表达除事件之外的其它事情。但是总的来说,这套理论对受限 语言的应用领域是非常有用的,也是可以实现的。 概念从属理论在本文中的应用主要体现在概念从属树的建立和使用上。 2 4 本章小结 本章首先指出如何描述和表示知识是
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 六一怀旧风活动方案
- 六一汉服诗歌活动方案
- 六一活动宝宝活动方案
- 六一活动常规活动方案
- 六一活动抽纸活动方案
- 六一活动游泳馆活动方案
- 六一活动车展活动方案
- 六一节商场活动方案
- 六一讲故事比赛活动方案
- 六一茶坊活动策划方案
- Unit9SectionB2a-2e课件-人教版八年级英语下册
- KRONES灌装检测工作原理及工艺参数调整
- SJG 01-2010 深圳市地基基础勘察设计规范
- 物业维修流程培训
- 大学美育(同济大学)学习通测试及答案
- 2024年中考模拟试卷数学(湖南卷)
- 医院培训课件:《便携式血糖仪临床操作和质量管理》
- 充电桩工程施工技术方案
- 急性心肌梗死健康教育课件
- 2024年教师资格考试小学面试科学试题及答案指导
- (一模)宁波市2024学年第一学期高考模拟考试 数学试卷(含答案)
评论
0/150
提交评论