(机械制造及其自动化专业论文)面向产品设计的汉语自然语言复合句语义理解.pdf_第1页
(机械制造及其自动化专业论文)面向产品设计的汉语自然语言复合句语义理解.pdf_第2页
(机械制造及其自动化专业论文)面向产品设计的汉语自然语言复合句语义理解.pdf_第3页
(机械制造及其自动化专业论文)面向产品设计的汉语自然语言复合句语义理解.pdf_第4页
(机械制造及其自动化专业论文)面向产品设计的汉语自然语言复合句语义理解.pdf_第5页
已阅读5页,还剩62页未读 继续免费阅读

(机械制造及其自动化专业论文)面向产品设计的汉语自然语言复合句语义理解.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 本文将自然语言理解应用于产品设计中,通过对以自然语言形式表达的用户 需求进行理解和分析,并将分析结果转化成概念设计要求,为后续设计提供支持。 首先,根据设计领域自然语言理解的特点,确定应用于产品设计的自然语言 理解应该采用基于知识的方法。其次,利用本体的优点建立了领域自然语言语义 知识本体模型,利用格语法和概念从属理论中的合理思想建立了语义知识本体中 的动态语义关系,并利用语义知识本体模型建立了领域自然语言语义分析模型。 然后,具体实现了语义知识本体模型和语义分析模型,并详细讨论了领域复合句的 语义分析过程。再次,从领域应用意图出发提出了领域自然语言理解分为表层理 解和意图理解的分层思想,并利用该思想建立了领域自然语言自动建模系统的总 体结构,接着初步实现了行程领域的自动建模系统。最后,结合机械设计领域, 建立了一个基于自然语言理解系统的计算机辅助机械产品需求分析系统原型,并 实现了在机械传动装置需求分析中的应用,经初步调试,取得了一定的成果。 关键词:产品设计概念设计自然语言理解语义分析本体 a b s t r a c t a b s t r a c t n a t u r a ll a n g u a g eu n d e r s t a n d i n g ( n i 。u ) i sa p p l i e dt ot h ep m d u c td e s i g n t h i u u g h u n d e r s t a n d i n ga n da n a l y z i n gt h eu s e r sn e e d se x p r e s s e di nt h ef o 册o fn a t u r a ll a n g u a g e a n dt r a l l s f o m i n ga n a l y s i sr e s u l tc o n c e p td e s i 印i n gr e q u i r e m e n t ,s u b s e q u e md e s 咖i s s u p p o n e d f i r s to fa l l ,a c c o r d i n gt ot h ec h a r a c t e r i s t i co ft h en l ui nt h ed e s i g n i n gf i e l d ,t h e m e t h o db a s e do nk n 0 1 1 e d g es h o u l db ea d o p t e dj nt h en i 。ua p p l i e dt op r o d u c td e s i g n s e c o n d l y ,a c c o r d i gt ot h ea d v a n t a g eo fo n t o l o g y ,m eo n t o l o g ym o d e lo fs e m a n t i c k n o w l e d g eo fn a t u r a l l a n g u a g ei nt h ef i e l dw a ss e tu p ,a c c o r d i n gt ot h er e a s o n a b l e t h o u g h to ft h et h e o r yo fc a s eg 姗m a ra n dc o n c e p t u a ld e p e n d e n c y ,t l l ed y n a m i c s e m a t i cr c l a t i o no ft h es e m a n t i ck n o w l e d g eo n t o l o g yw a se s t a b l i s h e d ,a n dt h e n ,b a s e d o nt h eo n t o l o g ym o d e lo fs e m a i l t i ck n o w l e d g c ,t h cs e m a n t i ca i l a l y s i sm o d e lo fn a t u r a l 1 a n g u a g ei nt h ef i e l dw a ss e tu p t 1 1 e n ,t h eo n t o l o g ym o d e lo fs e m 柚t i ck n o w l e d g ea n d s e m a n t i ca n a l y s i sm o d e lw a sr e a l i z e ds p e c i f i c a l l y ,a n dt h es e m a n t e m ea n a l y t i cp r o c e s s o ft h ec o m p o u n ds e n t e n c ei nt h ef i e l dw a si n t m d u c e di nd e t a 丑m o r e o v e r ,a c c o r d i n gt o t h e a p p l i c a t i o 一i i l t e n t i o n o ft h ef i e l d ,t h en l us h o u l db ed e v i d e di n t o t o pl a y e r u n d e r s t a n d i n ga n di n t c n t j o nu n d e r s t a n d i n g ,a n db a s e do nt h et h o u g h t ,t h eo v e r a l l s t r i l c t u r eo fa u t om o d e l i n gs y s t e mo ft h en l ui nt h ef i e l dw a sb u i l t ,m e nl h ea u t o m o d e l i n gs y s t e mo fn l ui nt h e6 e l do fj o u m e yw a sr e a l i z e d f i n a l ly ,ap r o t o t y p e s y s t e mo fc o m p u t e ra i d e dm e c h a n i c a lp m d u c ta l l a l y s i sw a sb u i l t ,w h i c hw a sa p p l i e dt o t h ea n a l y s i so fr e q u i r 锄e n t so fm e c h a l l i c a l t r a n s i m i s s i o nd c v i c e ,a l l dr u n sw e na f t c r d e b u g k e yw o r d s :p m d u c td e s i g nc o c e p t u a id e s i g n a t u 飓l i a n g i l a g e u n d e r s t a n m n g ( n l u ) s e m a n t i ca n a i y s i s 0 n t o l o g y 声明 y8 s 8 7 5 9 创新性声明 本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究 成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不 包含其他人已经发表或撰写过的研究成果;也不包含为获得西安电子科技大学或 其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做 的任何贡献均已在论文中做了明确的说明并表示了谢意。 本人签名:缢,速日期建! 丛:! :! 关于论文使用授权的说明 本人完全了解西安电子科技大学有关保留和使用学位论文的规定,即:研究生 在校攻读学位期间论文工作的知识产权单位属西安电子科技大学。本人保证毕业 离校后,发表论文或使用论文工作成果时署名单位仍然为西安电子科技大学。学 校有权保留送交论文的复印件,允许查阅和借阅论文:学校可以公布论文的全部 或部分内容,可以允许采用影印、缩印或其它复制手段保存论文。( 保密的论文在 解密后遵守此规定) 本人签名: 导师签名:女垒日期2 盟签:! 第一章绪论 第一章绪论 1 1 引言 随着企业生产自动化程度的日益提高,产品的功能与结构日趋复杂,产品设 计在整个生命周期内占有越来越重要的位置。作为只占5 产品成本的设计活动往 往决定占到7 0 8 0 的产品成本【1 】。因此,深入研究产品设计过程的特点及其方 法、规律成为产品设计的主要研究课题。 设计的过程一般分为:需求分析、概念设计和详细设计三个阶段。概念设计 阶段的主要目标是提出满足客户需求和设计指标的方案,此阶段决定着产品8 0 以上的最终价值【2 1 。详细设计阶段是将方案变成具体的产品结构和部件。对一些重 要的设计性能,关键的设计参数在这个阶段确定下来,并最终确定所有的详细参 数。尽管设计过程分为不同的设计阶段,但在各种设计阶段之间并无明确的界限, 各个设计阶段的不断重复在整个设计过程中都存在。产品设计的过程可描述为如 图1 1 所示: 图1 1 产品设计过程的描述 随着计算机技术的日益发展,产品设计过程正在发生彻底的变化,计算机已 渗透到产品设计开发与制造的各个环节。o 狮、o 堰、c a p p 、c a m 、p d m 等软 件的使用将使设计的对象和设计的过程模式化,通过建立设计对象的数学模型和 设计过程的模型,将使方案决策、设计计算、图纸绘制等阶段全都实现计算机化。 这样无论是方案设计、结构设计还是工艺设计,无论是设计图、计算说明书、技 术文件还是工艺卡片,都将不再使用纸张、尺子、笔和图板。现代设计将成为无 纸设计,计算机技术将使整个设计过程实现计算机化既 然而上面所说的产品设计计算机化主要体现在产品的后期设计与制造阶段, 对产品开发的早期设计规划的支持不够,具体来说是对用户需求分析和概念设计 提供的支撑较少。而用户需求分析和产品概念设计恰是产品设计过程中极为重要 面向产品设计的汉语自然语言复合句语义理解 的步骤。目前,由于经济全球化的发展,产品竞争愈演愈烈,产品具有市场竞争 力的关键因素是满足用户需求,对用户需求的正确分析往往会为设计指明方向。 概念设计阶段能够产生新的有市场竞争力的概念或工作原理,是产品创新设计的 核心。然而我国企业特别是机械行业,概念设计目前仍然处于经验设计阶段,影 响了产品的市场竞争力。推广应用较成熟的设计理论,提高产品的创新设计能力, 对我国的产业调整,特别是机械行业的结构调整具有重要的意义【4 】。 如何通过计算机技术及人工智能技术快速有效地收集用户的需求信息,并且 对用户需求进行分析,将用户需求转化为产品概念设计要求从而设计出满足用户 需求的产品,已经成为产品设计中越来越引人关注的问题。一般来说,用户不同 于专业的开发人员,他们对设计领域内的术语不是很了解或根本不了解,他们仅 仅以自己的通俗语言表达自己对产品的要求。要让计算机理解这种要求,就必须 利用自然语言理解这种手段,让自然语言理解充当用户和产品设计、分析等系统 之间的智能接口,通过了解用户想要什么,从而指导设计人员的工作。 本文尝试将自然语言理解应用于产品设计中,通过对以自然语言形式表达的用 户需求进行理解和分析,并将分析结果转化成概念设计要求,为后续设计提供支 持。希望本文的工作能够对上面所提到的问题有所帮助。 1 2 自然语言理解概述 1 2 1 什么是自然语言理解 自然语言是指人们日常使用的语言、如汉语、英语、法语、日语等它是人 类学习环境和互相通讯的工具。自然语言理解是指用计算机对自然语言的形、音、 义等信息进行处理。即对字、词、句、篇章的输入、输出、识别、分析、理解、 生成等操作和加工,其关键是要让计算机“理解”自然语言【5 】。 自然语言的计算机理解和处理是一个涉及了语言学、计算机科学、逻辑学、 心理学、人工智能等领域知识的跨学科研究领域,是一门交叉综合学科,也是一个 十分活跃和富有挑战性的研究课题。 1 2 2 自然语言理解的观点 第一是系统工程观点。用系统论的观点来观察分析对象,用系统工程的观点 来求其实用。所谓系统就是由相互作用和相互联系的若干组成部分结合而成的具 有特定功能的有机整体。我们研究的系统是人工系统,它也要遵循整体性和有机 第一章绪论 性。当我们把对象分解为若干个组成部分时,要密切注意他们间的相互联系和相 互制约的关系,要密切注意成员与系统的界面和系统与环境的界面。要注意系统 工程的观点,各部分要有机地进行组织。因为系统中的每一个成分在系统中的形 式和作用,并不等于它独立于系统之外的形式和作用,因此,系统工程的观点要 求我们用“整体大于部分之和”的目标来组织系统,这才能做到系统是有机的整 体。 第二是用层次结构观点来分析归纳语言现象。语言是分层次的符号系统。有 声语言系统的底层是一套音位,如现代汉语普通话有二十几个声母、三十几个韵 母和四个声调。上层中的第一层是音义结合的最小单位“汉字”,第二层是由一个 或多个汉字组成的词,它是语言系统中能独立使用的单位,第三层是短语,再后 是句子、段落和篇章层次。 第三是层次问单向依赖观点。语言系统的各个层次间存在单向依赖关系。这 是因为在语言系统中,任何一个大的语言单位的理解,必须在小的语言单位理解 的基础上进行而小的语言单位的理解,又受大的语言单位的制约【“。 本文从自然语言理解的层次结构观点和层次间单向依赖观点出发,首先建立 了语义基元的语义分析模型,其次在语义基元的基础上实现了领域复合句( 语法 上的单旬) 的语义理解。 1 2 3 目前自然语言理解中并存的两大流派 语言分析技术可以分为基于知识的方法与基于统计数据的方法两大类。基于知 识的分析方法可以称之为自然语言处理中的”理性主义h 【7 1 。系统主要依赖于语言专 家人工通过内省得到的规则知识。语言和知识具有极强的整体性、关联性的这一 特质,迫使我们在研究自然语言处理系统时,必须对此予以考虑,否则研制出的 系统就会先天不足,难以处理众多复杂的语言现象。人类处理语言的能力是一种 高度的智能行为,如果把智能理解为一种运用知识解决问题的能力,那么构造任 何基于知识的人工系统的过程就是收集知识、整理知识和计划运用知识的镱略。 人类可以利用语言进行交流的关键在于人的大脑中存有大量的知识,这些知识包 括句法的、语义的和其他各类常识。知识在自然语言使用中起着不可缺少的作用, 几乎可以这样说,没有知识的参与,语言使用,如语言的产生和理解是无法进行 的。对知识重要性的逐步认识,引起了对知识表达和操作技术的重视,产生了基 于知识的自然语言理解系纠到。要做到真正意义上的理解,必须以一定的知识为基 础。人工智能为自然语言理解注入了新的思想,即理解只能建筑在语义之上,而 语义的基本成份是概念,概念又以知识的形式存储在记忆中。对任何语言单位的 处理,都有赖于这种知识。 面向产品设计的汉语自然语言复合句语义理解 由于计算机与人有着极大的不同,知识需要显式表示出来,然而许多知识是 模糊的、难于量化的,换言之,寻求适宜的、有效的知识表示方法是利用现有计 算机资源实现自然语苦处理系统的唯一途径。理论上,我们不难把某些有关外部 世界的知识授于计算机,难就难在世上的知识是无穷尽的。由于涉及的知识过于 复杂,知识库规模过于庞大,规则之间的冲突变得越来越多,采用人工编写和维 护规则系统的做法要保持知识库的一致性变得非常困难。目前,基于知识的方法 基本上掌握了单个句子的分析技术,但是还很难覆盖全面的语言现象,特别是对 于整个段落或篇章的理解还无从下手。 基于统计的分析方法被称之为自然语言处理中的”经验主义”【8 j 。统计方法又被 称为语料库方法,统计信息是从大规模真实的语料库获得的,统计方法使自然语 言理解的研究从定性阶段过渡到了定量阶段,其意义无疑是巨大的。对语料库的 研究分成3 个方面:工具软件的开发、语料库的标注、基于语料库的语言分析方 法。采集到以后未经处理的生语料不能直接提供有关语言的各种知识,只有通过 词法、句法、语义等多层次的加工才能使知识获取成为可能。加工的方式就是在 语料中标注各种记号,标注的内容包括每个词的词性、语义项、短语结构、句型 和旬间关系等。随着标注程度的加深语料库逐渐熟化,成为一个分布的、统计意 义上的知识源。利用这个知识源可以进行许多语言分析工作,如根据从已标注语 料中总结出的频度规律可以给新文本逐词标注词性,划分句子成分等。语料库中 的语料是否丰富,它们的关系结构是否利于存取,所蕴含的相关知识是否便于发 现和表达,是衡量一个语料库性能优劣的重要指标r ”。 语料库提供的知识是用统计强度表示的,而不是确定性的,随着规模的扩大, 旨在覆盖全面的语言现象。但是对于语言中基本的确定性的规则仍然用统计强度 的大小去判断,这与人们的常识相违背。而且,通过实践人们发现纯统计信息很 难表达那些深层次、高概括性的知识,而这正是通过专家总结规则方法的优点。 现在,人们普遍认识到,对于需要对语言傲全面和深层次分析的自然语言理 解系统来说,统计方法和规则方法各有优缺点,单纯的基于知识的方法和统计方 法都很难达到理想的效果,二者的融合是大势所趋。 1 2 4 汉语的特点 汉语作为一种自然语言有其自身的特点,而其中有些特点使得它特别不适合 计算机来处理【9 1 。 ( 1 ) 汉语的词不分写,而且词无明显的形态标志,这给计算机进行汉语的词法分析带 来了困难。 ( 2 ) 汉语在构词方法上主要是词根复合法,而不是词缀派生法,缺乏形态标识,主要 第一章绪论 以语序和虚词表示各种语法关系。另外类与句法成分之间不存在一。一对应的关 系,如动词既可作谓语、主词,又可作定语、宾语等。这对于用计算机来进行 汉语句子理解是极其不利的。 ( 3 ) 汉语的形态不发达,增加了语言的表层语法结构对语义的依赖性,所以,汉语 的句子成分的语法作用强烈地依赖于该成分的意义。 ( 4 ) 汉语语法有重“意合”,轻形式,以意驭形的特点,例如( 狼咬死了猎人的狗、 他打死了咬死了猎人的狗、装修图书馆的工人正在装修图书馆的大厅) ,使得 语形分析和语义分析往往不能相对独立,而只有将二者结合起来同时或交叉进 行才能获得满意的结果。这大大增加了汉语句子理解的复杂度。 f 5 ) 汉语各个分析层面上的歧义现象非常严重。句子的歧义切分、语法分析时的多 义词和兼类词、句法分析时的同形异构、语义分析时的语义组合层次歧义和语 义组合关系歧义等等,这些都是计算机难以处理的 另外,现有的自然语言处理理论和技术大多都是以英语为研究对象语言发展起 来的,而汉语无论在语音、文字表示,还是在词汇、语法、语义及其语用等各个层面 上都与之存在着很大的差异,这使得无法直接套用西方已成熟的理论和技术。 1 2 5 汉语句子分析的研究 现有的句子分析方法大体上分为两种:语法搭配顺序匹配和短语捆绑【1 0 l 【1 1 】【1 2 】。 1 如果只是从语法结构顺序搭配分析句子,有时句子的分析结果虽然完全符合语 法规则,同时也是正确的分析结果,但是从语义上理解则不合理。汉语的句子分 析分为语法结构分析和语义分析,虽然二者之间不存在严格的一一对应关系,但 是为了使语法结构分析结果尽可能地便于句子的语义分析理解,在进行句子分析 时,不但要考虑主要句子成分之间的关系,而且还要分析非句子成分之间以及非 句子成分与句子成分之间的关系,这样分析出来的句子无论从语法角度还是从语 义角度都能够说得通。 为了弥补语法搭配顺序匹配的不足,减少分析结果的语义缺陷,在分析句子 时,将非句子成分之间以及非句子成分与句子成分之间的关系确定下来,然后将非 句子成分按修饰或说明关系分别归靠到相应的句子成分上,形成短语,最后由短 语来担当句子成分,这样,分析的结果无论从语法平面还是从语义平面都比较说 得过去。 2 如果从短语捆绑的角度来分析句子,以往的做法是根据词性搭配及统计搭配 概率来确定哪些词语可以捆绑在一起组成短语。 可是由于汉语的词语所能担当的角色( 句子成分或非句子成分) 与其所在的句 子及句子中的位置是息息相关的。既使是同一个词语或同一个短语在不同的句子 面向产品设计的汉语自然语言复合句语义理解 中就会有不同的组合情况,且可以充当不同的句子角色。例如“狼咬死了猎人的 狗”和“他打死了咬死了猎人的狗”两句中都有一部分相同的语段:咬死了猎人 的狗,单单就这个语段而言,可以有两种理解:( 某动物) 把猎人的狗咬死了;( 那 只) 把猎人咬死了的狗。到底应该是哪一种意义,单从语段无法确定,而必须将 其放回句子中进行综合分析。从上述分析的结果中,我们看到,语段:咬死了猎 人的狗在两个句子中划分归靠的结果不一样,语段中词语担当的角色也不一样。 因此,句子分析改进措施和基本分析策略便是从确定句子的中心语入手,由于 绝大多数汉语句子的中心语是由动词( 短语) 担当的,所以确定句子的中心语就 等于确定句子的中心动词( 短语) 。 1 3 本文的研究路线 本文通过对产品设计的过程进行了研究,认识到用户需求分析和概念设计在产 品设计的重要性,而且认识到计算机技术对产品设计的早期用户需求分析和 概念设计的支持不够,从而引出了本文问题:如何将用户需求转化为概念设计要 求。解决办法是将自然语言理解应用于产品设计,通过计算机对用户需求进行理 解和分析,从而将用户需求转化为概念设计要求。 针对基于知识的方法和基于统计的方法的优缺点,根据设计领域内自然语言理 解的特点,选择基于知识为主的方法作为我们建立自然语言理解系统的理论基础。 对于采用基于知识的方法所带来的系统涉及的知识过于复杂,知识库规模过于庞 大,规则之间的冲突变得越来越多,采用人工编写和维护规则系统的做法要保持 知识库的一致性变得困难等问题,我们采取从抽象层次上来考虑问题,将自然语 言理解涉及的语义知识采用本体的方法进行组织,一方面可以减小知识库规模, 提高效率和正确率,另一方面可以使语义知识共享和重用。 针对汉语在各个分析层面上的歧义现象非常严重的特点,本文将自然语言理 解的研究限制在产品设计领域内,这样可以从各层面上减少汉语的歧义现象。针 对汉语语法有重“意合”,轻形式,以意驭形的特点,本文侧重于汉语的语义理解, 这样也可以为汉语的句法分析提供一个评判标准。 在实现了对领域内的自然语言理解后,本文将它应用于机械产品设计中,取得 了不错的应用效果。 1 4 本文主要工作 针对产品设计计算机化对产品开发的早期设计规划的支持不够,对用户需求分 析和概念设计提供的支撑较少的问题,本文对自然语言的语义理解在产品设计中 第一章绪论 的应用做了初步的探讨。通过对以自然语言形式表达的用户需求进行理解和分析, 并将分析结果转化成概念设计要求,为后续设计提供支持。本文完成的主要工作 如下; 1 了解国内外自然语言理解的动态,分析比较了基于知识的方法和大规模语 料库方法的优缺点,并结合设计领域自然语言理解的特点,确定以基于知 识的方法为研究应用的总体方向。 2 详细介绍了自然语言理解中几种常用的知识表示方法,最后结合这些方法 的优点和特点建立了领域n l u 语义分析中的知识描述与表示体系。 3 在详细讨论本体中的概念及其之间关系的基础上,将本体与自然语言结合 建立了领域n l u 语义知识本体模型,最后在语义知识本体模型的基础上 建立了领域n l u 语义分析模型。 4 在以上工作的基础上,利用框架知识表示方法具体实现了领域n l u 语义 知识本体模型和领域n l u 语义分析模型中的知识体,详细介绍了领域 n u j 语义分析模型的实现过程,最后在语义分析模型的基础上详细讨论了 领域复合句的语义分析过程。 5 从领域应用意图出发提出了领域自然语言理解分为表层理解和意图理解 的分层思想,意图理解实现了隐含知识的挖掘,并在此基础上建立了领域 n l u 自动建模系统的总体结构,最后初步实现了行程领域的自动建模系 统。 6 结合机械设计领域,建立了一个基于n l u 系统的计算机辅助机械产品需 求分析系统原型,并实现了在机械传动装置需求分析中的应用。 总之,全文结合自然语言理解的语义分析在产品设计中的应用,从选择自然语 言理解的模型出发,讨论了自然语言理解的语义知识表示,探讨了对语言进行语 义分析的方法,并且研究了面向领域应用意图的自动建模系统,结合实际应用, 取得了一定的成果,相信这一工作对自然语言理解在各个领域中的应用都是有益 的。自然语言理解一直是人工智能学科内引人注目而又困难重重的一个核心研究 课题。随着计算机技术和人工智能总体技术的发展,自然语言理解不断会取得进 步,前途是光明的。 1 5 本文约定 1 本文的自然语言均是指汉语自然语言; 2 “自然语言”的英文为“n a t u r a ll a n g u a g e ” ,简称n l ; 3 “自然语言理解”的英文为“n a t u r a ll a n g u a g eu n d e r s t a n d i n g ”,简称n l u ; 4 本文约定“领域n l u ”指的是“领域汉语自然语言理解”的简称。 面向产品设计的汉语自然语言复合句语义理解 第二章领域n l u 语义分析的理论基础 基于知识的领域自然语言理解系统中,涉及到的知识有语法知识、语义知识、 领域知识和常识知识等。因此,首要任务将是如何描述和表示这些知识。 本章重点介绍了几种知识表示方法,其中,格语法和概念从属理论主要是面 向自然语言的语义处理,适合于描述语义知识;本体是知识工程中最新提出来的 一种知识表示方法,适合于从总体结构上组织知识;框架和产生式规则很容易在 计算机中实现,目前有许多人工智能开发工具支持这两种知识表示方法,如c i j p s 、 j e s s 、d a o k ( j e s s 的改进) 等。 2 1 框架表示法 框架表示法是一种表达知识的数据结构,它由一组“槽”所组成。这些“槽” 可以有任意有限数目的“侧面”,一个侧面又可以有任意有限数目的“值”,它可 以描述对象的某一属性,也可用描述其他对象的框架来填充。一般地,一个对 象采用一个框架描述,其属性则用“槽”描述。一个框架可以形式地表示为: f r a m e 槽1 :侧面1 l :侧面值1 1 1 ,侧面值1 1 2 侧面1 2 :侧面值1 2 1 ,侧面值1 2 2 槽n :侧面n l ;侧面值n 1 1 ,侧面值n 1 2 侧名m :侧面值姗l ,侧面值n m 2 框架表示法的特点:框架是一种经过组织的结构化知识表示方法,适合于 表示类型的概念、事件和行为。框架之间可以形成层次的和复杂的关系,组成 一种框架网络,代表整块的知识结构,可以表示复杂的知识内容。附加过程是 框架系统的重要特征之一,它使得描述性知识和过程性知识紧密融合在一起,有 机地形成一个一体化系统。框架表示法体现了人们在观察事物时的思维活动, 当遇到新事物时,通过从记忆中调用类似事物的框架,并将其中某些细节进行修 改、补充,就形成了对新事物的认识,这与人们的认识活动是一致的。 其缺点是:首先,不善于表达过程性的知识。因此,它经常与产生式表示方法 结合起来使用,以取得互补的效果。其次,多重继承可能产生多义性,如何消除 继承过程中概念属性的歧义,目前还没有一种统一的方法。 第二章领域n l u 语义分析的理论基础9 2 2 产生式表示法 产生式表示法也叫规则表示法。一个规则的一般形式为:p q 。它可以看成 是一个“前提p 一结论q ”对。前提是情况认识部分,它是该产生式规则使用时所 必须满足的条件:结论即行为部分,是前提满足时由推理而得到的结论【1 4 j 。规则 用于描述单个对象内以及对象问关系的所有可能为真的每一个事实。 规则表示法的特点是:产生式系统用“如果,则”的形式表示知 识,直观、自然、特别适合在事实性知识间进行推理。产生式规则是规则库中 最基本的知识单元,与推理机构相对独立,便于模块化,给知识的增、删、改带 来了方便,给规则库的建立和扩展提供了可管理性。产生式规则能有效地表达 多种领域中的知识,既可以表示精确的知识,也可以表示不精确、不完全的知识。 产生式有固定的格式,任何一个产生式都由前提与结论这两部分组成,这种统 一的格式既易于设计、控制。又易于进行知识的一致性、完整性检测。 产生式表示法的局限性表现在:首先,产生式系统求解问题的过程是一个反 复进行“匹配一冲突消除一执行”的过程。规则库一般比较庞大,匹配非常费时, 因此,此工作效率是不高的。其次,产生式适合表示具有因果关系的过程性知识, 但对具有结构关系的知识却无能为力,它不能将具有结构关系的事物间的区别与 联系表示出来。再次,表达能力低。它只便于表示定性的、浅层的知识,不便于 表示定量的、深层的复杂知识。 2 3 本体论简介 在2 0 世纪9 0 年代初期,随着在知识工程发展过程中遇到的两大障碍:( 1 ) 如 何实现知识重用。( 2 ) 如何实现知识共享,人们已经注意到:知识工程要想在目 前的基础上有突破性的进展,须向本体工程发展。因此,“本体”作为本体工程的 核心近年来被广泛地研究。 2 3 1 本体的定义 本体论是哲学的一个分支,是一门有关存在及其本质和规律的科学。本体论是 指关于世界某个方面的特定的分类体系,这个系统不依赖于任何一种特定的描述 语言。近年来,本体论的这些思想被人们引入知识工程领域,其最终目的是为了 解决知识的重用和共享。知识重用要求大家对某件事的认识一致,已经到达认识 事物本质的地步;知识共享要求人和机器的交流建立在对所交流领域共识的基础 上,它要求知识表达的粒度要适中,使机器能够操作知识f 1 5 j 【1 6 j 。 面向产品设计的汉语自然语言复合句语义理解 在知识工程领域,研究者们普遍接受的呈现高引用率的本体( o n t 0 1 0 9 y ) 定义是 t g r u b e r 于1 9 9 3 年提出的:“本体是对共享的概念化进行形式的盟式规范说明。 概念化是现实世界中现象的抽象模型,作为知识形式化表达的基础,是所关 心领域中的对象、概念和其他实体,以及它们之间的关系。显式的意思是指被 使用概念的类型以及概念在使用中的约束被明确地定义出来。形式的意思是指 本体应该是机器可读的。共享是反映本体中的知龊是中立豹、一致认可的。 2 。3 2 本体的建模元语 概念和概念之间的关系是本体的两个非常重要的组成元素。此外,还包括用于 知识推理的公理。p e r e z 等人用分类怯组织了o n t o l o g y ,归纳出5 个基本的建模 元语( m 0 d e l i e p 凼1 m ) : ( 1 ) 类( d 嬲踮s ) 或概念( 螂p 船) 指任何事务,如工作描述、功能、行为、策略和推理过程。从语义上讲,它 表示的是对象的集含。 r 2 ) 关系( r e l a l i o n s ) 在领域中概念之间的交互作用,形式上定义为n 维笛卡儿积的子集:r :c 1 c 2 c n 。如子类关系( s u b d a _ 0 f ) 。在语义上关系对应于对象元组的集合。 o ) 函数( 向n c t :| 0 n s ) 一类特殊的关系。该关系的豁n 一1 个元素可以唯一决定第n 个元素。形式化 的定义为f :c l x c 2 c 娃,1 一( n 。如m o t h c 碰就是一个函数,m o t h c h 嘛y ) 表示v 是x 的母亲。 ( 4 ) 公理( a x i o m s ) 代表永真断言,如概念乙属于概念甲的范围。 ( 5 ) 实例( i s l c c s ) 代表元素。从语义上讲实例表示的就是对象。 2 4 格语法 格语法是由语言学家c h a d e sf i l l m o m 于1 9 6 8 年在他的论文格”辨“1 1 1 e c a s ef o rc a s e ”中提出。虽然称之为“语法”,其实它已经涉及句子深层的语义处理。 在传统语法中,格是一种语法范畴的名称,它表示名词( 或代词) 在句子中的语 法功能。例如英语有三种格,即主格,所有格和宾格。主格用作动词的主语;所 有格也称属格,衷示占有或所有;宾格用于动词的直接宾语或间接宾语。在格语 法中。“格”屉指潜存于句子深层结构里的名词( 包括代词) 与谓语动词之间的一 第二章领域n l u 语义分析的理论基础1 1 种固定不变的语义结构关系【1 7 】【1 ”。 f j n m o r e 认为格的传统概念,只能处理句子的表层结构。在深层结构中所需要 的不是这些表层语法关系,而是深层的句法语义关系,格语法给出了各格成分之 间的深层语义,即句子的深层结构。这样,有不同表层形式的、含义相同的句子 有同样的格框架。 例如: h e 0 p e n e d t h e d o o r w i t ht h e k e y 在这句话中,o p c n 是中心动词,h e 是施事,d o o r 是受事,k c y 是工具 再例如:n ek e yo p e dt h e d o o r t 1 l e d o o r 叩e n e d 从格语法的观点看,虽然k e y 可能作为一句话的表层主格,但相对于动词o p e n 来说,它是句于中深层结构的工具格,无论d o o r 是作为表层结构的主格还是宾格, 它总是动词o n 的受事格。 f i l l m o r e 提出以下8 种格: a g e n t 事件主体( 主格) c o u m e r a g e n t 对为接受者所施加的力或阻力( 反动作主格) o b i e c t 被移动、改变、或其存在或位置正被考虑的实体( 受事格) r e s u l t 作为行为结果而存在的实体( 结果格) i n s t m m e n t 事件发生的刺激原因和直接物理原因( 工具格) s o u - c e 物体移动前的位置( 来源格) g o a l 物体移动后的位置( 目标格) e x p c d e n c e 接受、获得、或者经历、经受行为影响的实体( 经验者格) 格语法定义还规定了与主要动词相对应的一些必有格、随意格和禁止格。必 有格是为了使动词有意义所必须给出的格;随意格是可有或可无的格,如果有, 则可提供更多的信息,如果没有,也不损害动词的完整性;禁止格是不能与主要 动词一起给出的格格框架并不依赖于词序,除了依赖于语法信息,主要地依赖于 语义信息。不同的语言学家对选择格的标准和格的数目各不相同,有的选用4 5 个格,有的选用格的数目超过3 0 个。在具体应用时需要根据具体情况做出切合实 际的选择。 格语法最大的特点是承认语义在句法中的主导作用,由格语法分析可以得到 句子的深层语义结构,给出各成分的语义角色,对于确定正确的句法结构有很大 帮助。 “格语法”在汉语的语义分析上也是最有吸引力的一种方法,因为它从深层 结构上分析句子结构,可以弥补汉语形态缺乏的缺陷。已有许多学者将“格语法” 应用在了汉语语义的研究上,如美国麻州大学的邓守信先生结合汉语的特征认为 “句子的语义结构完全是以动词的选择搭配特征来决定的,即由动词的特征指派 1 2 面向产品设计的汉语自然语言复合句语义理解 若干名词充当旬中某些角色,这是动词中心论( f i l l m o r e 则是名词中心论) 【1 7 】,。 他把每种名词格的出现条件都放到跟动词搭配特征上去考虑。因此要实现汉语的 语义分析,就必须深入地研究句子中的动词与名词等短语的这种固定不变的深层 次的动态语义关系。 2 5 概念从属理论 概念从属理论( c o n c e p t u a ld e p e n d e n c y l l l e o r y ,简称c d 理论) 又称为概念依 存理论,最初是由r s c h a n k 在6 0 年代末、7 0 年代初发展起来的。 该理论有两个基本观点:一是山克认为,人在理解自然语言时依赖的是潜在 的概念表述,而不是具体的词或句子。人们总是用以前遇到的更简单、更基本的 事来理解现在所遇到的事情。因此当计算机理解自然语言时,要模拟人理解自然 语言的心理过程。二是建立c d 理论的公理:具有相同意义的两个句子,不管它们 的词语是否相同,或词语排列次序是否相同。它们都有相同的内部表示,深层结 构是一致的。一个句子的主动态形式和被动态形式虽然表达上不同,但意义上是 相同的i ”j 。 计划、脚本、概念依存就是山克概念依存理论的三个层次。人们要完成一件 事,需先进行适当安排,再作有关事宜。计划中的每一步都是一个脚本。脚本主 要用来描写平时在遇到一些常见场景或场合时所采取的一些基本固定的成套动 作。概念依存层规定了一组动作原语,而其他动作则是由这些动作原语组合而成。 这些动作原语就是核心“概念”,它们支配主体、客体、时间、地点等附属概念, 构成一种依存关系。这样,我们可以用最简单的一组动作来表示很多复杂的行为。 概念依存理论提出的动作原语如下: 1 1行为原语_ f 气孤a n s 、p t r a n s 、p r o p e l 、m 0 、g r a s pd 婚e s t 、 e x p e l 、r a n s 、m b u l d 、 s p e a k 、a t e n d 、c p 、l n “ 2 )状态原语a n t i c i p 灯1 0 n 、a w 剐r l h 虹强s 、a n g e r 、c o l o r 、f l 弘姗s s 、 h e a l :n 、l e n g 埘、u g h ,r _ 黼n s h y 、m a s s 、m e n t is m 气强、p h y s i c a l s t 戌1 1 e 、s p e e d 3 ) 关系原语一一c o n t r o l 、w d 髓1 、p o s s 、o w n e r s h p 、c o p l l :a i n 、 p r o x i m r r y 、p h y s c o n t 。 4 ) 因果原语一一个行为( 意味着一个事件) 或一个状态( 物理的或精神的) 可 以作为另一个行为的出现或状态的改变的原因。包括以下几种情况: a 1c s l 由行为导致状态变化; b ) c s 2 由状态或状态的改变导致的行为; c ) c s 3 一由状态或其变化被阻止的行为; 第二章领域n l u 语义分析的理论基础 d ) c s 4 一由状态或行为引起的精神状态或其变化; e 1c s 5 由精神状态或其变化引起的行为; f ) c s 6 一由思维行为引起的物理行为; 曲c s 7 一由行为导致的使另一个行为出现的状态; h 1 c s 8 一由行为或状态引起的导致另一个行为出现的思想。 2 6 领域n l u 语义分析中的知识表示 在基于知识的领域n l u 语义分析中首先要考虑的问题是如何在知识库中组织 语义知识。语义知识组织的好坏将直接影响知识库的规模以及语义分析系统的效 率。基于上述考虑,本文采用本体的方法从公认的抽象概念层次上来组织领域自 然语言语义知识,一方面可以使语义知识能够被重用和共享,另一方面可以减少 语义约束规则的数量提高语义分析效率。 概念和概念之间的关系是本体的两个最基本的元素,要在计算机内表示语义 知识本体就必须充分的表示这两个元素,而表示这两个元素正是框架法的优点所 在,因此本文采用框架法来实现语义知识本体。 由于产生式规则适合在事实性知识间进行推理,所以本文利用产生式规则来 实现语义约束流程和语义分析控制流程。 格语法和概念依存理论认为动词在句子语义分析中占主导地位,它们支配着 句子中其它的成分,如施事、受事、时间、地点等,且这种支配关系是句子中固 定不变的深层次语义结构关系,本文在语义知识本体中将这种支配关系抽象成动 词概念与其它概念之间的动态语义关系。 2 7 本章小结 本章首先指出如何描述和表示知识是基于知识的自然语言理解系统的首要任 务,接着详细介绍了自然语言理解中几种常用的知识表示方法,最后结合这些方 法的优点和特点建立了领域n l u 语义分析中的知识描述与表示体系。 1 4 面向产品设计的汉语自然语言复合旬语义理解 第三章基于本体的领域n l u 语义分析模型 3 1 1 概念 3 1o n t 0 1 0 9 y 中的概念及基本关系 1 定义( d e f i n i ti o n so fc o n c e p t ) ( 1 ) 思维学的定义:概念是反映客观事物本质属性的思维形式,是构成判断 和推理的基本单位【删。 ( 2 ) 逻辑学的定义:就是用邻近的种概念加属差。( 如杂文是文艺性的政论文。 杂文是被定义的概念,政论文是邻近的种概念,文艺性是属差。) ( 3 ) 知识工程的定义:概念是物体或事件的模型知识。( m o d u l a rk n o w l e d g eo f t h i n g sa n de v e n t s ) 。例如,线段和延长分别是物体和事件的模型知识,它们都 是知识。 2 属性( a t t r i b u t e so fc o n c e d t ) 概念属性是概念的一些描述方面,在概念层上没有属性值,例如“三角形” 有“角度”。属性可分为基本属性和角色属性,在本体中也要作相应的处理:( 1 ) 基本属性指的是本质的属性,例如“高度”;( 2 ) 角色属性是指基本属性在不同 领域的应用,例如与基本属性“高度”相对应的角色属性有“海拔”、“深度”等。 2 性质( p r o p e r t i e so fc o n c e p t ) 概念的性质是所有实例所共同具有的一般抽象的特征,是用来区分概念集中 的不同的概念。在本体中概念的性质与属性是不同的,概念是用来区分概念集中 的不同的概念,而属性是用来区分同一概念约束下的不同实例。 3 内涵与外延 概念的内涵描述了事物的本质,它反映了事物稳定性的一面,是不同概念之 间的区别所在;概念的外延描述了事物的变化范围,反映了事物多样性的一面。 内涵与外延成反比关系,即内涵增加或减小会引起外延的减小或扩大。例如:“大 学”到“师范大学”再到“南京师范大学”,概念的内涵逐渐增加,外延逐渐缩小。 对概念的内涵与外延的详细讨论请参考文献【3 9 】。 4 概念的个体实例( i n d i v i d u a li n s t a n c e so f

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论