




已阅读5页,还剩53页未读, 继续免费阅读
(机械制造及其自动化专业论文)基于领域的抽象具体化模型及其在机械设计中的应用.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 将自然语言理解应用于机械设计领域是人工智能技术应用的重点和难点之 一。本文研究并实现了基于自然语言理解的领域抽象具体化建模系统,并将其应 用于机械产品的设计过程中。对以自然语言形式表达的用户需求进行智能分析, 对其中的抽象概念进行具体化,实现了系统与用户问的良好交流,并为后续设计 提供支持。 本文通过分析现有的知识表示方法的优缺点和设计领域自然语言的特点,给 出了基于自然语言理解的领域抽象具体化建模系统的知识表示方法,并构建了领 域抽象具体化建模系统的知识库。在此基础上,结合语义分析和篇章分析的结果, 依据资源模型中概念之问的关系和概念之间的操作,提出了以领域确定、抽象概 念获取、抽象概念具体化以及接口生成为总体框架的领域抽象具体化建模方法。 然后结合以上工作,实现了领域问题的抽象概念具体化。 最后将领域抽象概念具体化建模系统应用于机械产品设计的用户需求分析过 程中,并结合系统其余模块的运行,通过了系统测试。 关键词:自然语言理解抽象概念抽象具体化机械产品设计 a b s t r a c t t h ea p p l i c a t i o no fn l ut e c h n o l o g yi nt h ed e s i g no fm e c h a n i c a lm a n u f a c t u r i n g p r o c e s si so n eo ft h em o s ti m p o r t a n ta n dd i f f i c u l t ya p p l i c a t i o no f a i t e c h n o l o g y t h i s p a p e rd e s i g n e da n dr e a l i z e da b s t r a c tc o n c e p te m b o d y i n g s y s t e m ,w h i c hi sb a s e do nt h e d o m a i nc h i n e s el a n g u a g eu n d e r s t a n d i n gs y s t e m ,a n da p p l i e di t i nt h em e c h a n i c a l p r o d u c td e s i g np r o c e s s i ta c c o m p l i s h e dt h et r a n s i t i o n f r o mt h eu s e r sr e q u i r e m e n t e x p r e s s e db yn a t u r a ll a n g u a g et ot h ed e s i g n i n gr e q u i r e m e n to f t h ec o n c e p td e s i g no r d e s i g np a r a m e t e r a n da l s oi tc a ne m b o d y t h ea b s t r a c tc o n c e p to ft h eu s e r7 sr e q u i r e m e n t s oi tr e a l i z e dag o o de x c h a n g eb e t w e e nt h es y s t e ma n du s e r s ,a n dp r o v i d e sas t r o n g s u p p o r tf o rt h ef o l l o w i n gd e s i g n i n t h i sp a p e r , f i r s t l y , s o m ec u r r e n tm e t h o d sa n dt h e o r i e so fn l uk n o w l e d g e e x p r e s s i o na n dt h ec h a r a c t e r i s t i co fn a t u r a ll a n g u a g ei nd e s i g nd o m a i na r ep r e s e n t e da n d c o m p a r e d a n d i tp r e s e n t sam e t h o dt oe x p r e s sn l ud i s c o u r s ei n f o r m a t i o n ,a n da p p l i e d t ot h ec o n s t n l c t i o no fn l ud i s c o u r s ek n o w l e d g eb a s e b a s e do nt h ek n o w l e d g eb a s e , c o m b i n e dt h er e s u l t so fs e m a n t i ca n a l y s i sa n dd i s c o u r s ea n a l y s i sa n dt h ec o n n e c t i o n b e t w e e r lc o n c e p t so fr e s o u r c em o d e l ,t h em e t h o do fa b s t r a c tc o n c e p te m b o d y i n g l s g i v e n ,w h i c hi n c l u d e sc o n f i r m i n gt h ed o m a i n ,s e e k i n ga b s t r a c tc o n c e p t ,e m b o d y i n g a b s t r a c tc o n c e p ta n db u i l d i n gi n t e r f a c e b a s e do nt h ew o r kd o n e ,w ec a r r yo u t t h e a b s t r a c tc o n c e p te m b o d y i n go ft h ed o m a i np r o b l e m f i n a l l y ,t h e a b s t r a c tc o n c e p te m b o d y i n gs y s t e m i s a p p l i e d t o a n a l y z e a n d u n d e r s t a n dt h eu s e r sr e q u i r e m e n t so ft h em e c h a n i c a lp r o d u c td e s i g np r o c e s s t e s t e d a n dd e b u g g e dt o g e t h e rw i t ho t h e rp a r t so fn l us y s t e m ,i t sr e s u l tt u r n st ob es a t i s f i e d k e y w o r d s :n a t u r a ll a n g u a g eu n d e r s t a n d i n g ,a b s t r a c tc o n c e p t ,a b s t r a c tc o n c e p t e m b o d y i n g ,m e c h a n i c a lp r o d u c td e s i g n 西安电子科技大学 学位论文独创性( 或创新性) 声明 秉承学校严谨的学风和优良的科学道德,本人声明所呈交的论文是我个人在 导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标 注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的研究成 果;也不包含为获得西安电子科技大学或其它教育机构的学位或证书而使用过的 材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中做了明确的说 明并表示了谢意。 申请学位论文与资料若有不实之处,本人承担一切的法律责任。 本人签名:l 牟遵 西安电子科技大学 关于论文使用授权的说明 本人完全了解西安电子科技大学有关保留和使用学位论文的规定,即:研究 生在校攻读学位期问论文工作的知识产权单位属西安电子科技大学。学校有权保 留送交论文的复印件,允许查阅和借阅论文;学校可以公布论文的全部或部分内 容,可以允许采用影印、缩印或其它复制手段保存论文。同时本人保证,毕业后 结合学位论文研究课题再撰写的文章一律署名单位为西安电子科技大学。 ( 保密的论文在解密后遵守此规定) 本学位论文属于保密,在一年解密后适用本授权书。 f i 期塑2111 堡 同期地卫兰:墨 第一章绪论 第一章绪论弟一早珀t 匕 1 1 引言 众所周知,机械产品从产品调研丌始到投放市场,一般要经过总体方案设计、 技术设计、工艺设计和加工制造等阶段。据统计分析,机械产品成本中8 0 为制 造费用,而其技术经济性能的8 0 则取决于设计阶段l jj ;由此可见机械设计在机 械产品设计的全部生命周期中占有何等重要的地位。 伴随着计算机技术的不断进步,尤其是人工智能技术的发展,使得各行各业 都积极地将计算机的智能控制融合进去,机械产品设计同样也是如此。机械设计 己不再纯属于工程技术范畴,而是自然科学、人文科学和社会科学相互交叉、科 学技术与工程技术高度融合所形成的一门现代设计科学。 在机械产品设计中所涉及到的概念设计以及需求分析等,都是需要自然语言 理解才能够得到实现。而产品证确的需求分析是整个产品设计的自订提,产品的概 念设计是产品开发最关键的一步,决定着产品寿命循环价格的7 5 - , , 8 0 1 2 , 3 】。在 解决用户的需求分析问题时,如何通过计算机技术及人工智能技术快速有效地收 集用户的需求信息,并且对用户需求进行分析,将用户需求转化产品概念设计要 求从而设计出满足用户需求的产品,已经成为产品设计中越来越引人关注的问题。 一般来说,用户和专业的丌发人员不同,他们对设计领域内的术语不是很了解或 根本不了解,他们仅仅以自己的通俗语言表达自己对产品的要求。要让计算机理 解这种要求,就必须利用自然语言理解这种手段,让自然语言理解充当用户和产 品设计、分析等系统之间的智能接口,通过了解用户想要什么,从而指导设计人 员的工作。 本文尝试将自然语言理解相关技术应用于机械产品设计中,通过对以自然语 言形式表达的用户需求进行理解和分析,并将分析结果转化成概念设计要求,为 后续设计提供支持。 2 基丁领域的抽象具体化模型及其在机械设计中的应用 1 2 自然语言理解概述 伴随着计算机的同益普及、互联网的迅猛发展,社会的信息化程度越来越高。 面对越来越丰富的信息资源,人们渴望能用本民族语言以十分自然的方式同计算 机进行交流,由计算机去处理各种信息,从而满足自身的需要。自然语言作为信 息的重要载体,作为人与机器沟通的最自然的方式,使得对自然语言的计算机理 解显得格外重要【5 1 。 1 2 1 自然语言理解简介 “自然语言理解”又叫做“人机对话”【4 】,他研究怎样y j 。能使电子计算机学会 懂得人类同常的自然语言( 如汉语、英语等) ,他模拟人类语言交际的过程,建 立人跟计算机之问用自然语言( 而不限于“人工语言”) 交谈的模型。 自然语言理解是一个十分困难的课题【5 1 ,因为人的自然语言本身往往具有二义 性,再加上同一句话在不同的时间、地点、场合往往有不同的含义。理解困难的 另一个原因是,究竟什么是理解,几乎和什么是智能一样,至今还是一个没有完 全明确的问题,因而从不同的角度有不同的解释。从微观来讲,理解是从自然语 言到机器内部表示的一种映射:从宏观来讲,理解是指能够完成我们所希望的一些 功能。 自然语言的计算机处理是计算机科学领域与人工智能领域中的一个重要方 向,目的是使计算机能f 确的理解人们用自然语言输入的信息,并能i f 确的理解 出输入信息中的有关问题。并且,计算机对输入的信息,计算机能产生相应的摘 要,能够用不同的词语复述输入的信息。使计算机能把某一种语言翻译成另一种 汪i 兰【6 】 丁口0 自然语言理解是语言学、认知学、信息学的交叉领域,涉及的问题很多,而且 难度很大。它的研究最终能实现人与计算机之删用自然语言进行有效通信。n l u 是 自然语言理解( n a t u r a ll a n g u a g eu n d e r s t a n d in g ) 的缩写。 1 2 2 自然语言理解的现状 语言不仅是一个复杂的社会现象,同时也是一个复杂的自然现象。人们普遍承 第一章绪论 3 认,语言是人类进化到一定阶段的产物,并伴随着人类社会的发展同益丰富和复 杂。随着计算技术和人工智能总体技术的发展,对自然语言的理解不断取得进展。 关于自然语言理解的研究可以追溯到2 0 世纪5 0 年代初期【o j 。当时由于通用 计算机的出现,人们开始考虑用计算机把一种语言翻译成另一种语言的可能性, 在此后的1 0 多年中,机器翻译一直是自然语言理解中的主要研究课题。进入2 0 世纪7 0 年代以后,一批采用句法一语义分析技术的自然语言理解系统脱颖而出, 在语言分析的深度和难度方面都比早期的系统有了长足的进步。这期间,有代表 性的系统主要有维诺各拉德( t w i n o g r a d ) 于1 9 7 2 年研制的s h r d l u :伍德( w w o o d s ) 于1 9 7 2 年研制德l u n a r ;夏克( r s c h a n k ) 于1 9 7 3 年研制的m a r g i e 等。进入2 0 世纪8 0 年代以后,更强调知识在自然语言理解中的重要作用,1 9 9 0 年8 月在赫尔 辛基召开的第1 3 届国际计算机语言学大会上,首次提出了处理大规模真实文本的 战略目标并组织了“大型语料库在建造自然语言系统中的作用”、“词典知识的获 取与表示”等专题讲座,预示着语言信息处理的一个新时期的到来。近十年来, 基于语料库的自然语言理解方法崛起,并f 在逐步走向成熟。 我国自然语言理解的研究起步较晚,比国外晚了1 7 年。国外在1 9 6 3 年就建 成了早期的自然语言理解系统,而我国直到1 9 8 0 年才建成了两个汉语自然语言理 解模型,都以人机对话的方式来实现。归纳而言,国内的自然语言理解研究经历 了以语形分析为主基于语法规则的早期阶段、注重语义分析基于语义规则的中期 阶段、基于语料库统计方法的近期阶段和基于统计与规则并举的现阶段等几个阶 段。在机器翻译、语料库研究、汉语电子语- g 词典等方面取得了显著成果,如清 华大学黄昌宁等人的汉语句法分析模型、中科院黄曾阳先生概念层次网络理论 h n c 引、董振东等人的h o wn e t 9 1 、俞士汝等的现代汉语语法信息词典纠0 1 。 1 2 3 自然语言理解的中的难点 当前,自然语言理解有了很大的发展,比如根据数据库罩的信息回答问题或 处理事务,按照自然语言的命令做一些简单的事情等等。但要使计算机达到人的 理解力,目前在技术上还面临着艰巨的挑战【i i 2 1 。 首先,自然语言是极其复杂的符号系统。一个人尽管可以对自己的母语运用 自如,但却无法用计算机可以接受的方式将自己母语的构成规律、意义表达规律 和语言使用规律彻底说清楚。传统的语言学是在没有计算机参照的条件下发展起 来的,虽然为自然语言理解积累了宝贵的财富,但那是讲给人的,要真诈地让语 4 基丁领域的抽象具体化模型及其在机械设计中的麻川 言知识在计算机上具有可操作性,需要大量既懂语言学又懂计算机的人员在j 下确 技术路线的指导下一起做大规模的研究工作。 其次,自然语言的各个层次上都含有巨大的不确定性。语言学上把这些不确 定性叫做“歧义”。歧义一般不能通过发生歧义的语言单位自身获得解决,而必须 借助于更大的语言单位乃至非语言的环境背景因素和常识来解决。 另外,自然语言不是一成不变的死的语言,它在社会生活中发展,一个词、 一个说法可能在一夜之问突然流行起来;特殊的人群结构变化会导致新的语言或 新的语言变体( 如方言、网络流行语言等等) 的出现。所有这些都要求理解自然 语言的计算机程序要具备对外界语言环境的应变能力。 最后,自然语言是人们交流思想的工具。既然交流的是思想,那思想本身在 计算机罩的组织结构就显得格外重要。在人工智能旱,这就是“知识表示的问 题。可以说,在知识表示问题上的突破,对于自然语言理解的进展将产生决定性 的影响。 由此可知,要想建立一个全面覆盖多种语法现象的自然语言理解系统,不仅 工作量大,周期长,而且目f j 还没有可靠的理论支持,其难度可想而知。 1 3 抽象具体化的分析概述 1 3 1 抽象具体化概述 机械产品设计是一个复杂的过程,为了对设计过程进行描述,需要采用设计 过程模型,该类模型是工业界真实设计过程的一种抽象,并能回答真实设计过程 中的问题】。通常模型都是由人建立的,随着产品设计的只益发展,人工建模已 越来越不能适应模型建立的各种任务要求,自动建模技术的丌发和应用是必然的 发展趋势f 眨】。 在自动建模之6 ,j 进行对目标问题进行汉语自然语言理解的一般过程:语法分 析、语义分析和篇章分析。自动建模属于自然语言理解中的语用分析。在自动建 模的过程中,首先进行领域确定,然后是信息挖掘。 信息挖掘的过程主要就是进行抽象概念具体化的过程。在自动建模中进行抽 象具体化的主要目的是对目标问题中的抽象概念进行实例化、具体化。在通过对 第一章绪论 5 大量的例子的语义理解结果进行总结分析,发现许多被分析的例句中存在着大量 的没有具体对象的名词概念。从概念抽象度的角度来讲,就是指这些概念相对于 有具体对象的概念来说是抽象的,本文中称其为抽象概念。而这些抽象概念的存 在直接影响到机器理解的语义理解结果。所以必须有一个抽象概念具体化的过程 对问题中的抽象概念进行具体化、实例化。 对于一个待建模的问题,首先要对句子中的抽象概念进行提取,判断一个概 念是否是抽象概念需要根据问题的求解域来进行判断。提取出抽象概念后,由于 自然语言理解的篇章分析可以理解一个概念在整个段落篇章的范围内的含义,所 以,需要借助篇章分析得到这些抽象概念在整个段落中的具体含义,从而将这些 概念准确的具体化。 本文所研究的抽象具体化模型,是一种在自然语言理解的基础之上,承接自 然语言理解中词法、语法、语义、篇章理解所生成的结果事实,并对其进行分析 最终建立模型的过程。在这个过程中,词法、语法、语义、篇章理解所生成的事 实之间必然存在着紧密的联系。知识就是这些联系所存在的基础。本文f 是通过 这种紧密联系柬完成抽象概念具体化的过程的。 1 3 2 基于自然语言理解的抽象具体化建模研究现状 当前,基于自然语言的抽象具体化建模随着自然语言理解的发展,逐步的被 人们所重视,也出现了一些建模的方法,但相对而言基于自然语言的抽象具体化 建模还处于发展的过程,还没有形成统一的理论和方法。抽象具体化建模仍然是 一个复杂的过程2 1 。主要体现在以下几个方面: 1 、抽象具体化建模系统需要结合领域知识来对问题建立模型,所以,如何结 合并使用这些知识就成为必须要解决的问题。 2 、对抽象概念进行具体化的过程需要明确问题的求解域,因为在不同的求解 域中,同一个概念可能是抽象的,也可能是具体的。因此求解域的明确是抽象具 体化过程中的一个问题。 3 、在抽象具体化建模系统中对抽象概念进行具体化首先需要对抽象概念进行 获取,因此,是否能够获耿到所有的抽象概念,并且是否所有获取到的抽象概念 都是语义理解所需要的是一个不容忽视的问题。 6 基丁领域的抽象具体化模型及其在机械设计中的戍川 4 、由于抽象具体化建模系统是以自然语言理解为基础的,所以,一切精确的 建模系统首先来自于准确的词法、语法、语义理解的结果和完善的自然语言理解 的方法。而目前,由于整个自然语言理解都处在一个逐步发展并完善的阶段,所 以,自然语言理解系统所面临的困难和问题,同样也是建模所必须克服的。 5 、抽象具体化建模系统是基于知识的,而知识的庞大性和知识不断更新的特 点成为建模一个不容忽视的难点。 所以,建立一个基于自然语言理解的抽象具体化建模系统是一个复杂的过程, 本文采用一些方法解决了部分难题,但是要想得到一个完整的建模系统还需要不 断的研究和探索。 1 4 本文主要工作 目前,对于自然语言的计算机理解的抽象具体化模型国内外已经做出了一些 研究,提出了一些理论,并且取得了一些成果。本文在阅读了大量的资料的基础上, 分析了自然语言理解和抽象具体化建模的难点后,以知识表示和知识库的构建为 基础,在前人做出词法、句法、语义分析和篇章分析系统的基础上,结合框架理 论、概念依存理论、资源模型等核心理论和方法,提出了一种基于领域的抽象具 体化的模型。同时也为自然语言理解的其它后续处理以及后续设计提供了支持。 本文完成的主要工作如下: 1 、了解围内外自然语言理解领域及建立抽象具体化模型的动态,对基于知识 的自然语言处理的方法有了一定的认识,并结合产品设计领域自然语言的特点, 分析了现有基础上建立抽象具体化模型现状和难点。 2 、介绍了自然语言理解的各种知识表示方法及其优缺点,在此基础上形成了 以资源模型为核心、以框架式结构为基础、以概念从属树和产生式规则为表现, 体现概念i h j 关联的知识表示方法,并将其应用于模型建立过程中所要使用的知识 库构建。 3 、通过搜集问题,分析了设计领域内的语言结构特点以及建立抽象具体化模 型的主要问题。通过与资源模型中的理论结合,提出了基于概念关系及概念操作 的建立抽象具体化模犁的方法。 4 、依据自然语言理解的资源模型,结合语义分析和篇章分析具体实现了领域 第一章绪论 7 问题的抽象具体化模型的建立。首先提出了总体框架,然后又分别对每一步的具 体实现做了详细介绍。 5 、结合机械产品的设计过程,通过对用户需求的理解和分析,实现了基于机 械产品设计领域的自然语言抽象概念具体化模型在机械设计的用户需求分析过程 中的应用。 自然语言理解是一个十分庞大的系统工程,但是在领域内,可以较为方便地 建立知识库,从而在某种程度上降低系统实现的难度。所以,本文采用基于领域 的方法,对专业领域内语言的特点进行分析和抽象,结合实际应用,建立了基于 领域的抽象具体化模型,并在机械产品的设计过程中得到了应用。 第二章自然语言理解中抽象具体化模型的相关理论 9 第二章自然语言理解中抽象具体化模型的相关理论 自然语言理解的根本目标是使计算机具有智能,使它能模拟人类的智能行为 理解人类的语言。在自然语言的理解系统中,整个理解分析和建模的过程都要以 篇章信息、世界知识和当前领域知识为基础。其中语言知识是最重要的,在语言 知识罩既包含与语言形式无关的概念知识,又包含与语言形式有关的纯语言知识。 人工智能的自然语言理解是计算机为工具的,所以如何在计算机中将知识以 合适的模式表示出来并存储到计算机中去是一个非常重要的问题。关于知识表示 的问题是一切自然语言理解系统的基础。自然语言理解的理解分析的过程以及抽 象具体化模型的建立的过程也是基于知识的,它们所面临的根本问题同样也是知 识的表示和知识的利用问题。 基于自然语言理解的领域抽象具体化建模系统采用的是基于知识的建模方 法,它所面临的根本问题同样也是知识的表示和知识的利用问题。 在本章中,简要阐述了一阶谓词逻辑表示法、产生式规则表示法等几种常用 的知识表示方法以及资源模型理论。最后根据多种知识表示方法以及资源模型理 论的不同特点阐述了抽象具体化模型建立过程中的知识利用和知识表示方法。 2 1 知识表示方法概述 我们所生活的这个世界的丰富性与复杂性,远远超出了我们用语言或符号进 行完整描述的能力范围。人类想要了解这些知识是比较容易的,但是计算机要拥 有这些知识,人类就必须做出大量的工作,将这些知识以抽象简洁的结构表示为 某种符号。 知识表示是研究用机器表示知识的可行性和有效性的一般方法,是一种数据 结构与控制结构的统一体,既考虑知识的存储又考虑知识的使用。知识表示也可 以看成是一组描述事物的约定,以把人类知识表示成机器能处理的数据结构。要 实现一个自然语言理解系统,所需要的知识是庞大的,而且所需知识的类型也是 不一样的,要让计算机知道这些知识,需要多种知识表示形式。 目前,许多学者和研究人员提出了许多理论和知识表示的方法。 1 、一阶谓词逻辑表示法【1 3 , 1 4 】 谓词逻辑是一种形式语言,也是到目前为止能够表达人类思维活动规律的一 种最精确的语言,它与人们的自然语言比较接近,又可方便的存储到计算机中去 并被计算机做精确处理。因此,它成为最早应用于人工智能中表示知识的一种逻 l o 基丁领域的抽象具体化模型及其在机械设计中的麻川 辑。 一阶谓词逻辑提出了一种很强的从旧知识导出新知识的方法一数学演绎。在 这种形式表示机制中,实际世界中的事实被表示成合式范式。同时提供了一种对 知识的推理逻辑。它适合于表示事物的状态、属性、概念等事实性的知识,也可 以用来表示事物问确定的因果关系。 一阶谓词逻辑表示法的优点有:1 、表示形式接近于自然语言,表示的知识易 于理解;2 、谓词逻辑是二值逻辑,只有“真与“假”,并能保证经演绎推理所 得结论的精确性;3 、谓词逻辑具有严格的形式定义及推理规则,利用这些推理规 则及有关定律证明技术可以已知事实推出新的事实,或证明所作的假设;4 、用谓 词逻辑表示的知识可以比较容易地转换为计算机地内部形式,易于模块化,便于 对知识地增加、删除及修改。 一阶谓词逻辑表示法的缺点有:l 、不能表示不确定的知识和复杂知识;2 、 在其推理过程中,随着事实数目的增大及盲目地使用推理规则,有可能形成组合 爆炸;3 、谓词逻辑表示知识时,其推理时根据形式逻辑进行的,把推理与知识的 语义割裂丌来,这就使得推理过程冗长,降低了系统的效率。 2 、语义网络【1 5 , 1 6 , 1 7 语义网络( s a m a n t i cn e t w o r k ) 是2 0 世纪6 0 年代由m r q i l l i o n 首先提出,人 工智能重要的知识表达形式。q i l l i o n 认为记忆由概念之| 日j 的联系实现,概念以及 概念之f b j 的各种关系构成了语义网络。 语义网络通过由一些节点以及用于连接节点的有向弧构成的有向图末描述, 节点代表物体、概念和事件等实体,而有向弧则代表实体之问的二元关系。语义 网络特别适合根据非常复杂的分类进行推理的领域以及表示事件的性质、状况以 及动作之i b j 关系的领域。 由于语义网络知识表示方法能把各种事务有机的联系起来,比较f 确反映了 人们对客观事件的认识,体现了联想思维过程,因此在人工智能中得到广泛应用, 但是语义网络的管理和维护比较复杂。 3 、产生式表示法【1 8 1 9 2 0 】 产生式表示法又称为产生式规则表示法。 “产生式”这一术语是由美国数学家波斯特( f p o s t ) 在1 9 4 3 年首先提出末 的,他根据串替代规则提出了一种波斯特计算模型,模型中的每一条规则称为一 个产生式。在此之后,1 9 7 2 年纽厄尔和西蒙在研究人类的认知模型中丌发了基于 规则的产生式系统。目自,j 它已经成为人工智能中应用最多的一种知识表示模式。 产生式通常用于表示具有因果关系的知识,其基本形式是: 前提p 一 结论q 第一二章自然语言理解中抽象具体化模型的相关理论 1 1 或者 i f p t h e nq 其中,p 是产生式的前提,用于指出该产生式是否可用的条件;q 是一组结论 或操作,用于指出当前提p 所指示的条件被满足时,应该得出的结论或应该执行 的操作。整个产生式的含义是:如果前提p 被满足,则可推出结论q 或执行q 所 规定的操作。 由于上述关于产生式表示法的特点,产生式表示法适合于表示具有下列特点 的领域知识: 1 ) 由许多相对独立的知识元组成的领域知识,彼此间关系不密切,不存在 结构关系。 2 ) 具有经验型及不确定性的知识,而且相关领域中对这些知识没有严格、 统一的理论。 3 ) 领域问题的求解过程可被表示为一系列相对独立的操作,而且每个操作 可被表示为一条或多条产生式规则。 4 、主题框架【2 1 盈】 框架表示法是以框架理论为基础发展起来的一种结构化的知识表示方法, 1 9 7 5 年美国著明的人工智能学者明斯基在其论文“af r a m e w o r kf o rr e p r e s e n t i n g k n o w l e d g e ”中提出了框架理论,并把它作为理解视觉、自然语言对话及其它复杂 行为的基础。他认为人们对客观事物的认识往往是以一种类似于框架的结构存储 在大脑中,当人们接受新的信息时,就与大脑中存储的框架知识进行匹配,匹配 成功就意味着获得了新信息。 框架结构是固定的,由一组槽( s l o t ) 构成,槽描述了事物的属性,槽值是事物 属性的取值。主题框架的每一个槽往往跟各种各样的信息相联系,特别是跟一些 限制条件相联系。限制条件指明可填充槽的值的类型。槽还可以和多个程序相联 系,每个程序执行一种专门的任务。这类程序中包含许多背景知识,从而使背景 知识组织得井井有条。 主题框架是围绕着一个主题建立的,因此是种面向特定应用领域的知识表 示方法。主题框架适于表示有标准形式的事件过程,但是其陈套固定的模式却不 利于描述事件发展的动念性。 框架系统作为一种比较常用的知识表示方法,在各种各样的系统知识表示中 体现出良好的通用性。它主要有以下的特点: 1 ) 结构性 框架表示法最突出的特点是它善于表达结构性的知识,能够把知识的内部结 构关系及知识之l 日j 的联系表示出来,因此它是一种组织起来的结构化的知识表示 1 2 基丁领域的抽象具体化模型及其在机械殴计中的应用 方法。这一特点是产生式表示法所不具备的。 2 )继承性 框架表示法通过使槽值为另一个框架的名字实现框架间的联系,建立起表示 复杂知识的框架网络。在框架网络中,下层框架可以继承上层框架的槽值,也可 以进行补充和修改,这样不仅减少了知识的冗余,而且还较好的保证了知识的一 致性。 3 )自然性 框架表示法体现了人们在观察事物时的思维活动,当遇到新事物时,通过从 记忆中调用类似事物时的框架,并将其中某些细节进行修改、补充,就形成了对 新事物的认识,这与人们的认识活动是一致的。 作为一种知识表示方法,在面对复杂的知识库表示中,框架系统也存在众多 不足之处:知识表现的多样性,给知识问的整合性和完全性检查带来困难;框架中 的附加过程会降低知识库系统的清晰度:由用户设计推理机,加重了用户方的负 担;框架系统中知识的层次化和知识属性的继承性给知识库的设计增加了难度。 5 、概念从属理论【2 3 2 4 】( c d 理论) 概念从属理论( c o n c e p t u a ld e p e n d e n c y t h e o r y ) 又称为概念依存理论,c d 理 论最初是由r s c h a n k 在6 0 年代未、7 0 年代初发展起来的。它的主要着眼点是放 在句子地意义上,而不是句子的形式上。 c d 理论描述了三个层次:一是概念依存层次关系;一组原语,其他动作由原 语组合而成;二是剧本,描述常见的场合和基本上是固定的成套动作;三是规划 ( 有些叫计划) ,是为达到某一目的和完成某一任务而指定计划或规划。它的步骤 单位是剧本,即用最简单的动作表示最复杂的过程。 概念的观点、结构的推理、高度抽象的概念行为及其框架的思想,都是十分 有价值的。 该理论的优点在于: 1 ) 对知识世界的分析,采用了抽象化、规范化的方法。 2 ) 该理论是针对理解的,是一种逻辑语义学的形式化的方法。 3 ) 适用于各种语言的语义表示形式,其表示形式主要体现为输入语句的语 义特征,而不关心具体自然语言特性,相应于每一个格的内容要求以概念 形式表示,与具体的词汇无关。因而,它是一种独立于具体语言的语义表 示形式,它具有其他表示方法所无法比拟的通用性。 4 ) 整个对常识进行系统而又具体的描写,并利用那些基本动作进行方便地 推理,从而达到对语言的自动理解。 但是相应地c d 理论存在一些缺点: 第二章自然语言理解中抽象具体化模型的相关理论 1 3 1 ) 由于目前还无法找到不含多义性的、对具有相同语义的不同输入有同一 表示的最优原语组合,但是在某一具体领域中可以找到原语的最优或次 优组合是可以实现的。 2 ) 理论的具体实现是试图以若干原语概念的组合( 如抽象转换) 加上一些 中间状态和因果关系表示各种动作( a c t ) 。因此,概念从属要求把所有 知识分解为相当低级的原语,可能低效或在某种情况下也许做不到。 3 ) c d 理论是一种事件表达理论,但为表达复杂程序可能需要的所有信息, 就要求能表达除事件之外的其它事情。但是总的来说,这套理论对受限 语言的应用领域是非常有用的,也是可以实现的。 目前人工智能常用的知识表示的方式有产生式规则和框架。产生式规则可以 看成是一个“前提一结论”对,即“i f 前提t h e n 结论”。前提是该产生式规则 使用时所必须满足的条件,结论即为前提满足时由推理而得到的结构。规则用于 描述单个对象内以及对象间关系的所有可能为真的每一条事实。由于一条规则相 对简单,不可能完整地描述一个对象,因此必须以一组规则来描述对象,这样就 给知识库的管理工作带来了麻烦,尤其是对大型知识库中的一致性维护及消除冗 余工作。同时也不能用于建立有关某一对象的完整概念,不便于表达有关“继承” 与“缺省”等关系。 框架则是一种表达知识的数据结构,它由一组“槽”所组成。这些“槽”可 以有任意有限数目的“侧面”,一个侧面又可以有任意有限数目的“值”,它可 以描述对象的某一属性,少可用描述其他对象的框架来填充。一般地,一个对象 采用一个框架描述,其属性则用“槽”描述。这种方法可以给概念的内涵以完整 的描述,且易于描述“继承”、“缺省”等关系。但是该方法将概念外延所涉及 的各个变量分散在相关的属性中描述,不能给外延提供一个完整的描述,同时也 妨碍了对象之f b j 的操作,如两个以上对象的综合。 2 2 1 概念从属树的定义 2 2 概念从属树 树形结构是一种矢h i g , 表示框架。直观看来,树是以分支关系定义的层次结构。 树结构在客观世界中广泛存在,在计算机领域中也广泛应用,而且树的各种搜索 策略也进行了深入的研究,如深度优先搜索、广度优先搜索等。这罩我们把树应 用在自然语言理解中的知识表示方面,结合现有的知识表示方法和概念研究理论, 将树的层次关系与概念从属理论结合起来,形成概念从属树模型。 1 4 基丁领域的抽象具体化模刑及其在机械设计中的应h j 抽象化是人们认识事物本质的一条重要途径。抽象化作为一种思维方式,广 泛存在于日常生活的各个方面,尤其在解决复杂问题上,作用尤为突出,它能透 过事物的表象直达事物的本质。概念从属关系是指一个概念的外延包含另一个概 念的全部外延。其中外延较大的概念叫抽象概念,外延较小的概念则称为具体概 念。确定概念问这种从属关系的过程就是一个抽象化的过程。 将特定知识域利用从属关系进行抽象处理,使其形成具有不同抽象层次的知 识结点构成的树状层次结构,其中父结点与其子结点之间存在明确的分类方法, 我们把这种加入从属关系的树模型,称为概念从属树。 2 2 2 概念从属树的表示方法 概念从属树是一种比较直观的知识表示方法。在概念从属树中,树中的每个 结点均表示概念,树根为最抽象的概念,树叶是最具体的概念,树根与树叶间的 结点分别是不同抽象层次的概念,它们通过结点与结点问的线连成一棵概念从属 树。 以机床为例,如果我们用列举的方法一一表示出来,详细描述每一种机床, 必然会导致各种机床的描述中有大量重复的部分,造成了知识的冗余。而建立概 念从属树模型后,我们将各种机床中共性的知识抽象出来,作为根结点机床的属 性,例如对所有机床而言,它都有主轴、刀架、工作台这三个执行件,这些就可 以作为根节点的属性,而不必在每种机床的属性中都加以说明。在其它机床的描 述中,只需要记录其特有的属性就可以了,例如单轴自动车床它主轴的个数是1 个, 这就是它的特有属性。在描述单轴自动车床时需要将这个属性单独记录下来。机 床的概念从属树如图2 1 所示: 图2 i “机床”的概念从属树 第- 二章自然语言理解中抽象具体化模型的相关理论 1 5 2 2 3 概念从属树的特点 对于某一特定领域,名词概念和动词概念的数量是最多的,而且其规模往往 十分庞大,如果将这些概念的内涵与外延在领域词库中一一表示出来,必然扩大 了知识库的规模,为知识处理带来困难。因此,我们采用了概念从属树模型来表 示名词概念和部分动词概念。为领域中常用的名词概念和部分动词概念建立概念 从属树,并将其存入概念从属树库中。通过概念从属树,为领域中的各种概念建 立联系。概念从属树有以下的特点: l 、概念从属树对知识进行了有效的分类。分类是人类对事物认识的一种结果, 也是人类认识事物的一种手段。概念从属树通过对知识的分类,既节省了存储空 间( 子结点可以继承所有父结点的语义特征) ,又可避免单个义项描写时遗漏语 义特征出现的分歧。 2 、概念知识的层次组织结构更加清晰,组织管理更加方便,用知识之间的从 属联系来组织、管理知识,更形象直观,比较符合人们的习惯。通过建立其从属 树,可利用树的本身层次结构关系映射知识之间的联系。 3 、树形结构有利于节省大量的储存空间。树形结构是一种很好的数据结构。 它的子结点可以继承父结点的知识。由于比较具体的概念要比抽象概念所包含的 知识多,这样,在具体概念结点中只需记录它自身特有、不能从抽象概念结点继 承来的部分,其他的部分则根据继承就可得到。因此,用概念从属树建立知识库 可以降低了知识的冗余度,减小了知识库的规模,节省大量的储存空间。 4 、概念从属树的建立提高了系统的搜索效率。树形结构的搜索效率是比较高 的,在知识的查找中,把这棵树作为搜索空问,可以大大地缩小程序的搜索空间。 这样不但可以简化程序的复杂度,而且可以显著的提高系统的效率。 5 、采用概念从属树结构可以使用现有的成熟的理论与算法。目前树形结构的 处理理论与算法相当成熟,例如对树的搜索算法有广度优先搜索、深度优先搜索、 有界深度优先搜索等等。采用概念从属树的形式就可以借鉴现有的这些理论和算 法进行知识的处理。 2 3 抽象具体化模型中的知识表示 抽象具体化的过程必须以自然语言理解为基础,而知识表示又是自然语言理 解的基础。所以,必须首先确定抽象具体化模型的知识表示形式。通过分析现有 的知识表示方法和资源模型以后,确定了抽象具体化模型的知识表示方法。 根据分析可知,现行的知识表示模式,就其概念而言主要从概念的内涵或概 1 6 基丁领域的抽象具体化模型及其在机械没计中的应h j 念的外延来表示知识,而忽略了概念的内涵和概念外延之间联系的表示。因此, 在处理主要涉及内涵或外延的领域如识别时,表现不错,但用于同时需要考虑内 涵币n j , b 延的领域时,则表现力不从心。而在抽象具体化的模型中,需要同时涉及 到资源的内涵和外延。首先它需要依据资源的内涵对资源进行识别,区分出抽象 概念和相对抽象概念,再根据所求解问题域的大小确定是否需要概念的外延所包 含的参量确定为所需要的具体的值,并且需要根据这些具体值所确定的新事实在 内涵所涉及的范围内进行推理和演绎。所以,本文采用将多种知识表示方法与资 源模型相结合的方法。 首先,利用概念从属理论与框架相结合的知识表示方法,将知识最终以模板 的形式表现。模板中有许多的属性槽,用以描述概念的内涵和外延。模板填充了 各槽后就会成为一个具体的实例,代表实际语境中的一个实体,实体拥有各个属 性,并与其它的实体发生关联。模板是框架式结构的典型模式。实际的内容包括 两个方面:静态模板和动态模板。静态模板存在于知识库,静念模板的实例就是 一条条知识;动态模板存在于处理的过程中,记录处理规程中所产生的所有的具 体实例。由于概念之间存在着层次结构,所以,使用树状结构来表示这种层次结 构,即建立概念从属树来表示概念之问的层次关系。 其次,根据资源模型的知识表示方法,确定了抽象概念与具体概念之问的关 系,通过对概念的外延和内涵的操作,使得概念在不同的抽象层次上变化。并且 在新生成的概念内涵所涉及的范围内进行事实的推理。 然后,在分析和推理过程中使用的大量的领域知识,则是以规则的形式柬表 现。 最后,整个自然语言理解系统所涉及的知识是大量的,在词法,句法,语义 和篇章分析阶段会用到其它的知识表现形式,在这罩就不再阐述。 确定了知识表示方法,下一步将进行构建系统知识库以及整个模型系统的分 析和实现工作。 2 4 本章小结 本章详细介绍了自然语言理解中几种常用的知识表示方法,重点介绍了概念 从属树的理论模型。最后结合这些方法的优缺点和抽象具体化过程的特点,提出 了抽象具体化模型中的知识表示方法,为后续进行的工作奠定了基础。 第三章自然语言理解抽象具体化模型分析 1 7 第三章自然语言理解抽象具体化模型分析 在自然语言理解中,语用分析是十分重要的,语用分析涉及到语言和语言使 用环境的作用、以及对语言分析结果的使用情况。语用分析是语言处理和实际应 用之i 日j 的桥梁。所有的处理分析结果最终要汇到语用分析中。 抽象具体化是语用分析中很重要的一个分析过程。对抽象概念的具体化涉及 到对抽象概念的信息挖掘。其重点在于对抽象概念的划分标准以及如何对抽象概 念进行具体化。 3 1 自然语言理解的总体流程 3 1 1 汉语自然语言理解系统整体结构 自从计算机问世以来,人类一直希望能让计算机理解和合成人类的自然语言, 即人类的同常语言,这就是“自然语言理解”。机器翻译、人机对话、语音识别和 语音合成、汉字的识别,都是自然语言理解关心的问题。其中最核心的目标是让 计算机理解和合成自然语言,即教会计算机听话和说话【2 5 】。如果这一核心目标能 够达到,人类也将从计算机理解和合成自然语言的过程中观察到人类心智活动的 机制。不少专家曾经估计,实现计算机理解和合成自然语言不会是一个遥远的路 程。 在研究像语言这样的复杂问题的时候,常常需要把问题进一步划分,然后再 对每一部分进行单独处理【2 6 ,2 7 1 。语言研究典型的划分为以下几个方面:第一方面是 语音和文字,即基本语言信号的构成:第二层次是语法和句法( 合称“语法”) ,即语 言基本运用单位的构成和组合的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 水文统计考试题及答案
- picc专科护士考试试题及答案
- 中信长沙分行面试题及答案
- 教师副业面试题及答案
- 戒毒遴选面试题及答案
- 阅读危机面试题及答案
- 二建离谱试题及答案
- 2025年贵州成黔矿产品贸易有限公司员工招聘考试试题(含答案)
- 2025年广东省桥式起重机Q2证考试练习题库(含答案)
- 2024年陕西省西安市《考评员》专业技能鉴定考试题库与答案大全
- 普惠金融业务讲座
- 水电站安全生产应急预案
- 2025年采购人员考试题库及答案
- 造林更新工职业技能等级评价理论知识考试测试题含答案(F卷)
- 2025年低压电工证考试题及参考答案
- 巡检员质量培训
- JJG 693-2011可燃气体检测报警器
- 消防水池监理规划样本
- 某办公楼室内外装修改造工程施工进度计划横道图
- 六年级上册英语素材重点单词及句型整理 join in剑桥英语
- 施工工艺做法表
评论
0/150
提交评论