




已阅读5页,还剩58页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 摘要 本文研究并实现了基于自然语言理解的领域自动建模系统,并将其应用于电 子产品的设计过程中。依托整个领域自然语言理解系统实现了对以自然语言形式 表达的用户需求的理解和分析,并将分析结果转化成概念设计要求和设计参数, 为后续设计提供支持。 本文通过分析现有的知识表示方法的优缺点和设计领域自然语言的特点,给 出了基于自然语言理解的领域自动建模系统的知识表示方法,并构建了领域自动 建模系统的知识库。在此基础上,结合语义分析和篇章分析的结果,依据资源模 型中概念之间的关系和概念之间的操作,提出了以领域确定、信息挖掘、信息约 减以及接口生成为总体框架的领域自动建模方法。在以上工作的基础上,给出了 领域自动建模系统的实现,从而实现了领域问题的自动建模。 最后将领域自动建模系统应用于数字滤器设计的用户需求分析领域,并结合 系统其余模块的运行,经过初步调试,取得了一定的成果。 关键词:概念设计自然语言理解自动建模资源模型 a b s t r a c t a b s t r a c t t h i sp a p e rd e s i g n e da n dr e a l i z e da u t o m a t i cm o d e l i n gs y s t e ma n da p p l i e di ti nt h e e l e c t r o n i c a l p r o d u c td e s i g np r o c e s s b a s e d o nt h ed o m a i nc h i n e s el a n g u a g e u n d e r s t a n d i n gs y s t e m , i ta c c o m p l i s h e dt h et r a n s i t i o nf r o mt h eu s e r sr e q u i r e m e n t e x p r e s s e db yn a t u r a ll a n g u a g et ot h ed e s i g n i n gr e q u i r e m e n to ft h ec o n c e p td e s i g no r d e s i g np a r a m e t e r , t 0s u p p l yt h es u s t a i nf o rn e x td e s i g n f i r s t ,s o m ec u r r e n tm e t h o d sa n dt h e o r i e so fn l uk n o w l e d g ee x p r e s s i o na n dt h e c h a r a c t e r i s t i co fn a t o r a ll a n g u a g ei nd e s i g nd o m a i na r ep r e s e n t e da n dc o m p a r e d , t h e na w a yt oe x p r e s sn l ud i s c o u r s ei n f o r m a t i o ni sg i v e na n da p p l i e dt ot h ec o n s t r u c t i o no f n l ud i s c o u r s ek n o w l e d g eb a s e b a s e do nt h ek n o w l e d g eb a s e ,c o m b i n e dt h er e s u l t s o fs e m a n t i ca n a l y s i sa n dd i s c o u r s ea n a l y s i sa n dt h ec o n n e c t i o nb e t w e e nc o n c e p t so f r e s o u r c em o d e l ,t h em e t h o do fa u t o m a t i cm o d e l i n gi sg i v e nw h i c hi n c l u d e sc o n f i r m i n g t h ed o m a i n ,d i g g i n ga n do r g a n i z i n gi n f o r m a t i o no ft h ep r o b l e m , r e d u c i n gi n f o r m a t i o n a n db u i l d i n gi n t e r f a c e b a s e do nt h ew o r kd o n e ,t h ep r o c e s s i n gf l o w c h a r to ft h ew h o l e s y s t e mi sg i v e n , w h i c hc a nf i n i s ht h ea u t o m a t i cm o d e l i n go f d o m a i np r o b l e m f i n a l l y , t h ea u t o m a t i cm o d e l i n gs y s t e mi sa p p l i e dt oa n a l y z ea n du n d e r s t a n dt h e u s e r sn e e d so f t h e d i g i t a lf i l t e rd e s i g n t e s t e da n dd e b u g g e dt o g e t h e rw i t l lo t h e rp a r t so f s y s t e m ,t h em o d e li ss a t i s f i e d k e y w o r d s :c o n c e p td e s i g n ,n a m r a ll a n g u a g eu n d e r s t a n d i n g , a u t o m a t i c m o d e l i n g ,r e s o u r c em o d e l 西安电子科技大学 学位论文( 独创性) 创新性声明 秉承学校严谨的学风和优良的科学道德,本人声明所呈交的论文是我个人在 导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标 注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的研究成 果;也不包含为获得西安电子科技大学或其它教育机构的学位或证书而使用过的 材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中做了明确的说 明并表示了谢意。 申请学位论文与资料若有不实之处,本人承担一切的法律责任。 本人签名:弛 西安电子科技大学 关于论文使用授权的说明 本人完全了解西安电子科技大学有关保留和使用学位论文的规定,即:研究 生在校攻读学位期间论文工作的知识产权单位属西安电子科技大学。学校有权保 留送交论文的复印件,允许查阅和借阅论文;学校可以公布论文的全部或部分内 容,可以允许采用影印、缩印或其它复制手段保存论文。同时本人保证,毕业后 结合学位论文研究课题再撰写的文章一律署名单位为西安电子科技大学。 ( 保密的论文在解密后遵守此规定) 本学位论文属于保密,在一年解密后适用本授权书。 本人签名:趣 导师签名:塾夔 日期堡:! :, 日期! 墨:! :丑 第一章绪论 第一章绪论 1 1 引言 产业革命使人类从事的笨重体力劳动由机器代替了。随着计算机的出现和日 益广泛的应用,产品设计的过程也在发生着翻天覆地的变化,计算机已经渗透到产 品设计开发和制造的各个环节。各种产品设计软件的出现使设计的对象和设计的 过程模式化。最终使人类的劳动效率大大提高。 随着计算机技术的普及和快速发展,计算机辅助分析技术在工程技术领域的 应用越来越广泛,为传统的电子电路系统分析与设计提供了新的手段。在这个发 展过程中,产品也变的越来越复杂,设计作为现代工业生产的关键性环节,在产 品的整个生命周期中占有极其重要的位置,它从根本上决定着产品的质量及成本。 设计阶段决定着产品成本的7 0 ;而运用产品制造的工程阶段只决定着2 0 的产品 成本;生产管理阶段只影响成本的1 0 9 6 ”。由此可见,设计是决定产品命运的最重 要环节。 在产品设计过程中,产品正确的需求分析是整个产品设计的前提,产品的概 念设计是产品开发最关键的一步,决定着产品寿命循环价格的7 5 8 0 1 2 】【3 】。由于 需求分析过程中频繁的人机交互,概念设计过程中需要更多的创新设计,采用各种 设计方法如协同设计、并行设计等,就必然要求建立良好的人机接口,让计算机 自动理解用户的需求、自动设计人员的思路和理解内涵,尤其需要人工智能技术 的辅助。因此,如何通过计算机技术及人工智能技术快速有效地收集用户的需求 信息,并且对用户需求进行分析,将用户需求转化产品概念设计、要求,从而设 计出满足用户需求的产品,已经成为产品设计中越来越引人关注的问题。 概念设计中面临的着一个问题,对于不同于专业的开发人员的一般用户,他 们对设计领域内的术语不是很了解或根本不了解,他们仅仅以自己的通俗语言表 达自己对产品的要求要让计算机理解。这种要求就使得我们必须利用自然语言理 解的手段让自然语言理解充当用户和产品设计分析等系统之间的智能接口,通过 了解用户想要什么从而指导设计人员的工作。 自动建模研究的最终目的是在前人研究成果的基础上,不断完善和扩展一个 基于领域的自然语言理解系统,通过对以自然语言形式表达的用户需求进行理解 和分析,并将分析结果转化成概念设计要求,为后续设计提供支持。希望本文的 工作能够对上面所提到的问题有所帮助。 面向产品设计的领域自动建模方法的研究与实现 1 2 自然语言理解概述 1 2 1 自然语言理解简介 自然语言,是人类借以思维和互相交际的一个音义结合的符号系统,是一个 变动的音义结合的系统结构。自然语言理解是指用计算机对自然语言的形、音、 义等信息进行处理。即对字、词、句、篇章的输入、输出、识别、分析、理解、 生成等操作和加工,其关键是要让计算机“理解”自然语言1 4 】。 自然语言的计算机处理是计算机科学领域与人工智能领域中的一个重要方 向,目的是使计算机能正确的理解人们用自然语言输入的信息,并能正确的理解 出输入信息中的有关问题。并且,计算机对输入的信息,计算机能产生相应的摘 要,能够用不同的词语复述输入的信息。使计算机能把某一种语言翻译成另一种 语言5 1 。 自然语言理解是语言学、认知学、信息学的交叉领域,涉及的问题很多,而且 难度很大。它的研究最终能实现人与计算机之间用自然语言进行有效通信。n l u 是 自然语言理解( n a t u r a ll a n g u a g eu n d e r s t a n d i n g ) 的缩写。 1 2 2 自然语言理解的现状 语言不仅是一个复杂的社会现象,同时也是一个复杂的自然现象。人们普遍承 认,语言是人类进化到一定阶段的产物,并伴随着人类社会的发展日益丰富和复 杂。随着计算技术和人工智能总体技术的发展,对自然语言的理解不断取得进展。 关于自然语言理解的研究可以追溯到2 0 世纪5 0 年代初期i ) 儿o j 。当时由于通用 计算机的出现,人们开始考虑用计算机把一种语言翻译成另一种语言的可能性, 在此后的l o 多年中,机器翻译一直是自然语言理解中的主要研究课题。进入2 0 世纪7 0 年代以后,一批采用句法一语义分析技术的自然语言理解系统脱颖而出, 在语言分析的深度和难度方面都比早期的系统有了长足的进步。这期间,有代表 性的系统主要有维诺各拉德( t w i n o g r a d ) 于1 9 7 2 年研制的s h r d l u :伍德( w w o o d s ) 于1 9 7 2 年研制德l u n a r ;夏克( r s c h a n k ) 于1 9 7 3 年研制的m a r g i e 等。进入2 0 世纪8 0 年代以后,更强调知识在自然语言理解中的重要作用,1 9 9 0 年8 月在赫尔 辛基召开的第1 3 届国际计算机语言学大会上,首次提出了处理大规模真实文本的 战略目标并组织了“大型语料库在建造自然语言系统中的作用”、“词典知识的获 取与表示”等专题讲座,预示着语言信息处理的一个新时期的到来。近十年来, 基于语料库的自然语言理解方法崛起,并正在逐步走向成熟。 第一章绪论 3 我国自然语言理解的研究起步较晚,比国外晚了1 7 年。国外在1 9 6 3 年就建 成了早期的自然语言理解系统,而我国直到1 9 8 0 年才建成了两个汉语自然语言理 解模型,都以人机对话的方式来实现。归纳而言,国内的自然语言理解研究经历 了以语形分析为主基于语法规则的早期阶段、注重语义分析基于语义规则的中期 阶段、基于语料库统计方法的近期阶段和基于统计与规则并举的现阶段等几个阶 段。在机器翻译、语料库研究、汉语电子语言词典等方面取得了显著成果,如清 华大学黄昌宁等人的汉语句法分析模型、中科院黄曾阳先生概念层次网络理论 h n c t 7 】、董振东等人的h o wn e t 8 1 、俞士汝等的现代汉语语法信息词典等 9 1 。 1 2 3 自然语言理解的中的难点 当前,自然语言理解有了很大的发展,比如根据数据库里的信息回答问题或 处理事务,按照自然语言的命令做一些简单的事情等等。但要使计算机达到人的 理解力,目前在技术上还面临着艰巨的挑战l ”】【l l 】。 首先,自然语言是极其复杂的符号系统。一个人尽管可以对自己的母语运用 自如,但却无法用计算机可以接受的方式将自己母语的构成规律、意义表达规律 和语言使用规律彻底说清楚。传统的语言学是在没有计算机参照的条件下发展起 来的,虽然为自然语言理解积累了宝贵的财富,但那是讲给人的,要真正地让语 言知识在计算机上具有可操作性,需要大量既懂语言学又懂计算机的人员在正确 技术路线的指导下一起做大规模的研究工作。 其次,自然语言的各个层次上都含有巨大的不确定性。语言学上把这些不确 定性叫做“歧义”。歧义一般不能通过发生歧义的语言单位自身获得解决,而必须 借助于更大的语言单位乃至非语言的环境背景因素和常识来解决。 另外,自然语言不是一成不变的死的语言,它在社会生活中发展,一个词、 一个说法可能在一夜之间突然流行起来;特殊的人群结构变化会导致新的语言或 新的语言变体( 如方言、网络流行语言等等) 的出现。所有这些都要求理解自然 语言的计算机程序要具备对外界语言环境的应变能力。 最后,自然语言是人们交流思想的工具。既然交流的是思想,那思想本身在 计算机里的组织结构就显得格外重要。在人工智能里,这就是“知识表示”的问 题。可以说,在知识表示问题上的突破,对于自然语言理解的进展将产生决定性 的影响。 由此可知,要想建立一个全面覆盖多种语法现象的自然语言理解系统,不仅 工作量大,周期长,而且目前还没有可靠的理论支持,其难度可想而知。 4 面向产品设计的领域自动建模方法的研究与实现 1 3 1 自动建模概述 1 3 自动建模的分析概述 产品设计是一复杂的过程,为了对设计过程进行描述,需要采用设计过程模 型,该类模型是工业界真实设计过程的一种抽象,并能回答真实设计过程中的问 题【1 0 1 。这些模型一方面应与工业界真实的设计过程基本相符,另一方面又要提出 规范的或优化的设计过程,并为设计者提供设计方法与工具,以达到提高设计质 量、降低设计成本、减少开发周期,提高产品竞争力等目的。通常模型都是由人 建立的,随着产品设计的日益发展,人工建模已越来越不能适应模型建立的各种 任务要求,自动建模技术的开发和应用是必然的发展趋势【12 1 。 所谓自动建模就是由专门的建模程序代替人工完成从所研究的物理结构及各 种动态影响因素到系统动态数学模型。自动建模技术根据应用难度可以分为三种: 复杂自动建模:主要应用于复杂系统的模型建立,通过专用建模工具,建立 复杂的系统模型,应用难度大。 相对简单自动建模:主要应用于中小系统的模型建立,也有自己的专用工具, 应用范围较大,应用难度相对简单。 简单自动建模:主要应用于简单系统的模型建立,通过对系统的简单分析和 总结,抽象出系统模型,应用简单而且使用广泛。 目前应用较多的自动建模方法有基于知识的建模和基于变量的建模。基于变 量的建模是根据系统中能被引起变化的几何属性和特征属性变量等信息建立模 型。基于知识的建模是根据知识库的自我学习得到的知识建立模型。模型的因素 关联是自动建模的重要思路【1 2 】【1 3 】。系统之所以能够组合成一个有机体,系统中的 各个实体间必然存在着紧密的联系,这些联系是模型自动生成的纽带。 本文所研究的自动建模系统,是一种在自然语言理解的事实基础之上,对自 然语言理解的词法、语法、语义、篇章理解所生成的结果事实进行分析最终建立 模型的过程。在这个过程中,词法、语法、语义、篇章理解所生成的事实之间必 然存在着紧密的联系。知识就是这些联系所存在的基础。本文正是通过这种紧密 联系来完成自动建模的目的。 1 3 2 基于自然语言理解的自动建模研究现状 当前,基于自然语言的自动建模随着自然语言理解的发展,逐步的被人们所 重视,出现了一些自动建模的方法,比如基于可拓学的自动建模的方法等【1 3 】【1 4 j 【1 5 】。 第一章绪论 5 但相对而言基于自然语言的自动建模还处于发展的过程,还没有形成统一的理论 和方法。 自动建模虽然取得了一些进步,但是要想使计算机模拟人脑的思维来对自然 语言进行理解并进行自动建模仍然是一个复杂的过程。 主要体现在以下几个方面: 1 、自动建模系统需要结合领域知识来对问题建立模型,所以,如何结合并使 用这些知识就成为必须要解决的问题。 2 、由于自动建模系统的一个主要任务是对自然语言理解的结果事实进行推理 和分析,以达到挖掘事实之间的隐含关系的目的。所以,如何挖掘事实之间的隐 含关系也是自动建模系统所面l 临的一个难点。 3 、自动建模系统是根据对自然语言理解的结果事实推理以后得到的事实来进 行建模的,但并不是所有推理得到的事实都是建模所必须的。所以,如何对推理 的结果进行有效的约减和组织也是一个不容忽视的问题。 4 、由于自动建模系统是以自然语言理解为基础的,所以,一切精确的自动建 模系统首先来自于准确的词法、语法、语义理解的结果和完善的自然语言理解的 方法。而目前,由于整个自然语言理解都处在一个逐步发展并完善的阶段,所以, 自然语言理解系统所面临的困难和问题,同样也是自动建模所必须克服的。 5 、自动建模系统是基于知识的,而知识的庞大性和知识不断的更新的特点成 为自动建模的一个不容忽视的难点。 所以,建立一个基于自然语言理解的自动建模系统是一个复杂的过程,本文采 用一些方法解决了部分难题,但是要想得到一个完整的自动建模系统还需要不断 的研究和探索。 1 4 本文主要做的工作 目前,对于自然语言的计算机理解的自动建模国内外已经做出了一些研究, 并且取得了一些成果,也提出了一些理论。本文在阅读了大量的资料的基础上, 分析了自然语言理解和自动建模的难点后,以知识表示和知识库的构建为基础, 在前人做出词法、句法、语义分析和篇章分析系统的基础上,结合框架理论、概 念依存理论、资源模型等核心理论和方法,提出了一种基于领域的自动建模的方 法。同时也为自然语言理解的其它后续处理以及后续设计提供了支持。 完成的工作如下: 1 、了解国内外自然语言理解领域及自动建模的动态,对基于知识的自然语言 处理的方法作了深刻认识,并结合设计领域自然语言的特点,分析了现有基础上 自动建模的现状和难点。 6 面向产品设计的领域自动建模方法的研究与实现 2 、介绍了自然语言理解的各种知识表示方法及其优缺点,在此基础上形成 了以资源模型为核心、以框架式结构为基础、以概念从属树和产生式规则为表现, 体现概念问关联的知识表示的方法,并将其应用于自动建模系统的知识库构建。 3 、通过搜集大量问题,深入的分析并总结了设计领域内的语言结构特点。通 过与资源模型中的理论结合,提出了基于概念关系及概念操作的自动建模方法。 4 、依据自然语言理解的资源模型,结合语义分析和篇章分析具体实现了领域 问题的自动建模系统。首先提出了总体框架,然后又分别对每一步骤的具体实现 做了详细介绍。最后,讨论了内涵知识的应用。 5 、结合测控领域,建立了相应的知识库,编写了部分事件的处理规则,通过 对用户需求的理解和分析,实现了自动建模系统在测控领域的应用。 自然语言理解是一个十分庞大的系统工程,但是在领域内,可以较为方便地 建立领域的知识库,从而在某种程度上降低系统实现的难度。所以,采用基于领 域的方法,对专业领域内语言的特点进行深入的分析和抽象,结合实际应用,建 立的领域自动建模系统,在测控领域的产品设计中发挥了一定的作用。 第二章基于自然语言理解的领域自动建模相关理论 第二章基于自然语言理解的领域自动建模相关理论 人工智能自然语言理解的根本目标是使计算机具有智能,使它能模拟人类的 智能行为理解人类的语言。这种智能活动过程主要是一个获得并运用知识的过程, 知识就是智能的基础。而知识是需要适当的模式表示出来才能存储到计算中去, 因此,关于知识表示的问题是一切自然语言理解系统的基础。基于自然语言理解 的领域自动建模系统采用的是基于知识的建模方法,它所面临的根本问题同样也 是知识的表示和知识的利用问题。所以,本章阐述了一阶谓词逻辑表示法、产生 式规则表示法、概念从属理论、语义网络、主题框架等几种常用的知识表示方法 以及资源模型理论。最后根据多种知识表示方法以及资源模型理论的不同特点阐 述了自动建模系统的知识利用和知识表示方法。 2 1 现有的知识表示方法 知识表示是研究用机器表示知识的可行性、有效性的一般方法,是一种数据 结构与控制结构的统一体,既考虑知识的存储又考虑知识的使用。知识表示也可 以看成是一组描述事物的约定,以把人类知识表示成机器能处理的数据结构。要 实现一个自然语言理解系统,所需要的知识是庞大的,而且所需知识的类型也是 不一样的,要让计算机知道这些知识,需要多种知识表示形式。 目前,许多学者和研究人员提出了许多理论和知识表示的方法。 l 、一阶谓词逻辑表示法【5 】【1 6 】【1 7 】 谓词逻辑是一种形式语言,也是到目前为止能够表达人类思维活动规律的一 种最精确的语言,它与人们的自然语言比较接近,又可方便的存储到计算机中去 并被计算机做精确处理。因此,它成为最早应用于人工智能中表示知识的一种逻 辑。 谓词逻辑适合于表示事物的状态、属性、概念等事实性的知识,也可以用来 表示事物间确定的因果关系,即规则。事实通常用谓词公式的与或形表示,所谓 与、或形是指用合取符号( 八) 及析取符号( v ) 连接起来的公式。规则通常用蕴涵 式表示。例如对于 如果x ,则y 可表示为 x y 8面向产品设计的领域自动建模方法的研究与实现 用谓词公式表示知识时,需要首先定义谓词,指出每个谓词的确切含义,然 后再用连接词把有关的谓词连接起来,形成一个谓词公式表达的一个完整意义。 阶谓词逻辑是一种形式语言系统,它用逻辑方法研究推理的规律,即条件 与结论之间的蕴涵关系,其表示知识方法有如下优点: 1 ) 自然性 谓词逻辑是一种接近于自然语言的形式语言,人们比较容易接受,用它表示 的知识比较容易。 2 ) 精确性 谓词逻辑是二值逻辑,其谓词公式的真值只有“真”与“假”,因此可用它表 示精确知识,并可保证经演绎推理所得结论的精确性。 3 ) 严密性 谓词逻辑具有严格事实定义即推理规则,利用这些推理规则及有关定理证明 技术可从事实推出新得事实,或证明做出假设。 4 ) 容易实现 用谓词逻辑表示的知识可以比较容易地转换为计算机地内部形式,易于模块 化,便于对知识地增加、删除及修改。用它表示知识所进行的自然演绎推理及归 结演绎推理都易于在计算机上实现。 当然一阶谓词逻辑表示法除具有上述优点外,尚有如下的局限性: 1 ) 不能表示不确定性的知识 谓词逻辑表示知识时智能表示精确性的知识,不能表示不精确、模糊性的知 识,但是由于人类的知识大多都不同程度地具有不确定性,这就使得它表示知识 的范围受到限制。另外,谓词逻辑难以表示启发性的知识及元知识。所谓启发性 知识是指与问题特性有关的知识。 2 1 组合爆炸 在其推理过程中,随着事实数目的增大及盲目地使用推理规则,有可能形成 组合爆炸。 3 ) 效率低 用谓词逻辑表示知识时,其推理是根据形式逻辑进行的,把推理与知识的语 义割裂了开来,这就使得推理过程冗长,降低了系统的效率。 2 语义网络【1 8 】【1 9 】【2 0 】 第二章基于自然语言理解的领域自动建模相关理论 9 语义网络( s a m a n t i cn e t w o r k ) 是2 0 世纪6 0 年代由m r q i l l i o n 首先提出,人 工智能重要的知识表达形式。q i l l i o n 认为记忆由概念之间的联系实现,概念以及 概念之间的各种关系构成了语义网络。 语义网络通过由一些节点以及用于连接节点的有向弧构成的有向图来描述, 节点代表物体、概念和事件等实体,而有向弧则代表实体之间的二元关系。语义 网络特别适合根据非常复杂的分类进行推理的领域以及表示事件的性质、状况以 及动作之间关系的领域。 由于语义网络知识表示方法能把各种事务有机的联系起来,比较正确反映了 人们对客观事件的认识,体现了联想思维过程,因此在人工智能中得到广泛应用, 但是语义网络的管理和维护比较复杂。 3 产生式表示法【2 l 】【2 2 p a l 产生式表示法又称为产生式规则表示法。 “产生式”这一术语是由美国数学家波斯特( f p o s t ) 在1 9 4 3 年首先提出来 的,他根据串替代规则提出了一种波斯特计算模型,模型中的每一条规则称为一 个产生式。在此之后,1 9 7 2 年纽厄尔和西蒙在研究人类的认知模型中开发了基于 规则的产生式系统。目前它已经成为人工智能中应用最多的一种知识表示模式。 产生式通常用于表示具有因果关系的知识,其基本形式是: 前提p 一 结论q 或者 i fpt h e n q 其实,p 是产生式的前提,用于指出该产生式是否可用的条件;q 是一组结论 或操作,用于指出当前提p 所指示的条件被满足时,应该得出的结论或应该执行 的操作。整个产生式的含义是:如果前提p 被满足,则可推出结论q 或执行q 所 规定的操作。 产生式规则表示法主要有一下的优点: 1 ) 自然性 产生式系统用“如果,则”的形式表示知识,直观、自然、特别适 合在事实性知识间进行推理。 2 ) 模块性 产生式规则是规则库中最基本的知识单元,与推理机构相对独立,便于模块 化,给知识的增、删、改带来了方便,给规则库的建立和扩展提供了可管理性。 3 ) 有效性 产生式规则能有效地表达多种领域中的知识,既可以表示精确的知识,也可 以表示不精确、不完全的知识。 4 ) 清晰性 l o面向产品设计的领域自动建模方法的研究与实现 产生式有固定的格式,任何一个产生式都由前提与结论这两部分组成,这种 统一的格式既易于设计、控制。又易于进行知识的一致性、完整性检测。 除以上的优点外,它亦有如下一些不足之处: 1 1 效率不高 产生式系统求解问题的过程是一个反复进行“匹配一冲突消除一执行”的过 程。规则库一般比较庞大,匹配非常费时,因此,此工作效率是不高的。 2 1 不能表达具有结构性的知识 产生式适合表示具有因果关系的过程性知识,但对具有结构关系的知识却无 能为力,它不能将具有结构关系的事物间的区别与联系表示出来。 由于上述关于产生式表示法的特点,可以看出产生式表示法适合于表示具有 下列特点的领域知识: 1 ) 由许多相对独立的知识元组成的领域知识,彼此间关系不密切,不存在结 构关系。 2 ) 具有经验型及不确定性的知识,而且相关领域中对这些知识没有严格、统 一的理论。 3 ) 领域问题的求解过程可被表示为一系列相对独立的操作,而且每个操作 可被表示为一条或多条产生式规则。 4 主题框架【2 4 】【2 5 】 框架表示法是以框架理论为基础发展起来的一种结构化的知识表示方法, 1 9 7 5 年美国著明的人工智能学者明斯基在其论文“af r a m e w o r kf o rr e p r e s e n t i n g k n o w l e d g e ”中提出了框架理论,并把它作为理解视觉、自然语言对话及其它复杂 行为的基础。他认为人们对客观事物的认识往往是以一种类似于框架的结构存储 在大脑中,当人们接受新的信息时,就与大脑中存储的框架知识进行匹配,匹配 成功就意味着获得了新信息。框架是一种描述所论对象( 一个事物,一个事件或 一个概念) 属性的数据结构。在框架理论中,将其视作知识表示的一个基本单位。 框架结构是固定的,由一组槽( s l o o 构成,槽描述了事物的属性,槽值是事物 属性的取值。主题框架的每一个槽往往跟各种各样的信息相联系,特别是跟一些 限制条件相联系。限制条件指明可填充槽的值的类型。槽还可以和多个程序相联 系,每个程序执行一种专门的任务。这类程序中包含许多背景知识,从而使背景 知识组织得井井有条。 主题框架是围绕着一个主题建立的,因此是一种面向特定应用领域的知识表 示方法。主题框架适于表示有标准形式的事件过程,但是其陈套固定的模式却不 利于描述事件发展的动态性。 框架系统作为一种比较常用的知识表示方法,在各种各样的系统知识表示中 第二章基于自然语言理解的领域自动建模相关理论 1 l 体现出良好的通用性。它主要有以下的特点: 1 ) 结构性 框架表示法最突出的特点是它善于表达结构性的知识,能够把知识的内部结 构关系及知识之间的联系表示出来,因此它是一种组织起来的结构化的知识表示 方法。这一特点是产生式表示法所不具备的。 2 ) 继承性 框架表示法通过使槽值为另一个框架的名字实现框架间的联系,建立起表示 复杂知识的框架网络。在框架网络中,下层框架可以继承上层框架的槽值,也可 以进行补充和修改,这样不仅减少了知识的冗余,而且还较好的保证了知识的一 致性。 3 )自然性 框架表示法体现了人们在关查事物时的思维活动,当遇到新事物时,通过从 记忆中调用类似事物时的框架,并将其中某些细节进行修改、补充,就形成了对 新事物的认识,这与人们的认识活动是一致的。 作为一种知识表示方法,在面对复杂的知识库表示中,框架系统也存在众多 不足之处:知识表现的多样性,给知识间的整合性和完全性检查带来困难;框架中 的附加过程会降低知识库系统的清晰度;由用户设计推理机,加重了用户方的负 担;框架系统中知识的层次化和知识属性的继承性给知识库的设计增加了难度。 5 概念从属理论【2 6 】【2 7 】( c d t 里论) 概念从属理论( c o n c e p t u a ld e p e n d e n c yt h e o r y ) 又称为概念依存理论,c d 理 论最初是由r s c h a n k 在6 0 年代末、7 0 年代初发展起来的。它的主要着眼点是放 在句子地意义上,而不是句子的形式上。 c d 理论描述了三个层次:一是概念依存层次关系;一组原语,其他动作由原 语组合而成;二是剧本,描述常见的场合和基本上是固定的成套动作;三是规划 ( 有些叫计划) ,是为达到某一目的和完成某一任务而指定计划或规划。它的步骤 单位是剧本,即用最简单的动作表示最复杂的过程。 概念的观点、结构的推理、高度抽象的概念行为及其框架的思想,都是十分 有价值的。 该理论的优点在于: 1 ) 对知识世界的分析,采用了抽象化、规范化的方法; 2 ) 该理论是针对理解的,是一种逻辑语义学的形式化的方法。 3 ) 适用于各种语言的语义表示形式,其表示形式主要体现为输入语句的语 义特征,而不关心具体自然语言特性,相应于每一个格的内容要求以概念 形式表示,与具体的词汇无关。因而,它是一种独立于具体语言的语义表 1 2 面向产品设计的领域自动建模方法的研究与实现 示形式,它具有其他表示方法所无法比拟的通用性。 4 ) 整个对常识进行系统而又具体的描写,并利用那些基本动作进行方便地推 理,从而达到对语言的自动理解。 但是相应地c d 理论存在一些缺点: 1 1 由于目前还无法找到不含多义性的、对具有相同语义的不同输入有同一 表示的最优原语组合,但是在某一具体领域中可以找到原语的最优或次 优组合是可以实现的。 2 ) 理论的具体实现是试图以若干原语概念的组合( 如抽象转换) 加上一些 中间状态和因果关系表示各种动作( a c t ) 。因此,概念从属要求把所有 知识分解为相当低级的原语,可能低效或在某种情况下也许做不到。 3 1c d 理论是一种事件表达理论,但为表达复杂程序可能需要的所有信息, 就要求能表达除事件之外的其它事情。但是总的来说,这套理论对受限 语言的应用领域是非常有用的,也是可以实现的。 目前人工智能常用的知识表示的方式有产生式规则和框架。产生式规则可以 看成是一个“前提一结论”对,即“i f 前提t h e n 结论”。前提是该产生式规则 使用时所必须满足的条件,结论即为前提满足时由推理而得到的结构。规则用于 描述单个对象内以及对象间关系的所有可能为真的每一条事实。由于一条规则相 对简单,不可能完整地描述一个对象,因此必须以一组规则来描述对象,这样就 给知识库的管理工作带来了麻烦,尤其是对大型知识库中的一致性维护及消除冗 余工作。同时也不能用于建立有关某一对象的完整概念,不便于表达有关“继承” 与“缺省”等关系。 框架则是一种表达知识的数据结构,它由一组“槽”所组成。这些“槽”可 以有任意有限数目的“侧面”,一个侧面又可以有任意有限数目的“值”,它可 以描述对象的某一属性,少可用描述其他对象的框架来填充。一般地,一个对象 采用一个框架描述,其属性则用“槽”描述。这种方法可以给概念的内涵以完整 的描述,且易于描述“继承”、“缺省”等关系。但是该方法将概念外延所涉及 的各个变量分散在相关的属性中描述,不能给外延提供一个完整的描述,同时也 妨碍了对象之间的操作,如两个以上对象的综合。 2 2 1 资源模型概述 2 2 资源模型 资源由两部分组成,分别称为本体与变体。资源的本体描述了资源的本质与 第二章基于自然语言理解的领域自动建模相关理论 1 3 内涵,是资源稳定性的一面。它是资源外在表象的基础,是一种资源与另一种资 源的区别所在,也是关于该资源进行信息交流的基础。资源的变体描述了资源的 变化范围,是资源中的可变部分,它反映了事物多样性的一面,是人们进行信息 交流的内容阱1 1 2 9 。 资源的本体是关于该资源所有事实的集合,这一集合也是该资源变体的约束 集合,本体中任何事实的增减都将引起资源变化。 由于事实可描述为永真命题,因此,本体可描述为一系列永真命题的公式。 根据命题逻辑及其推理的研究可知,在资源内关于本体事实的推理是可靠的且完 全的。 与每个永真命题相关联的,是由该永真命题引出的等价永真命题。 设本体中的命题为q l ,q 2 ,q i ,q n ,q i 的等价永真命题为q i l ,q 函,q i m ,则 本体q 可描述为: q 付q 1 q 2 ( q i a q i l a q i 2 八八q i m ) q l l式( 2 - 1 ) 采用集合论符号,对资源曰变体描述如下:变体v 由变量v l ,v 2 ,v k 组成, 相应的值域分别为d l ,d 2 ,d k ,这些值域构成一个笛卡尔乘积空间d = dl d2 d k ,d 中满足q 的约束子集称为资源r 的变化范围,记为d7 。d 中任一个点 ( d l ,d 2 ,e e e 7d k ) ,记为d k 。变体中的变量可以是连续变量,也可以是离散变量。当4 变量的值域包含无穷多个值时,笛卡尔乘积空间是一个无穷集合,其子集可以是 无穷集合,也可以是有限集合。对于离散且有限集合的变体可以采用关系数据库 的二维表格来表示。 定义1 资源:设q ,v 为资源r 的本体与变体,q h q l q 2 八( q i 八q i l 八 八q i m ) 八q 。,其中q i 为本体的永真命题。变体中的变量为v bv 2 ,eeejv k ,相应值 域为d 1 ,d 2 ,d l c 。笛卡尔乘积d = d l x d 2 x d k ,d 为满足q 约束的子集,d 称 为资源的变化范围,d k = ( d l ,d 2 ,ee l , dl 【) 是资源中的一点,( q ,dk ) 为资源r 的一个实 例。资源r 可表示为: r = q , d k i d kd7 八d d ) 式( 2 2 ) 从该模型中可以看出,资源本体中的每一命题都是变体的一个约束,整个本 体是变体的约束集合,变体是在本体约束下的笛卡尔空间。而一个资源的应用价 值在于其本体的永真性与稳定性,也取决于变体的变化范围。而本体的价值则取 决于其中的所有命题。 定义2 选择:设f 是一命题公式,其运算对象是常量或变体的分量。运算符 为算术比较运算符,逻辑运算符。则资源r 关于f 的选择运算( 记为5 ,( 且) ) 定义为: 占f ( r ) = q , d 7 l d7 = ( d l ,d 2 ,d k ) a ( q ,d7 ) r a f ( v i l ,v i 2 ,v i i ) = t r u e ) = q a f ( v i l ,v i 2 ,e eo v i i ) , d l d = ( d l ,d 2 ,d k ) a ( q 八f ( v i l ,v i 2 ,v i i ) ,d ) r ) 式( 2 3 ) 1 4面向产品设计的领域自动建模方法的研究与实现 其中f ( v i l ,v i 2 ,v i i ) 表示f 是关于变量v i l v i 2 ,v i i 的命题公式。 定义3 例化:设资源r 变体v 由变量v 1 ,v 2 ,v k 组成,变量v i 值域为d i ,v i 在d j 中的任意一次取值记为m ( v i ) ,称作资源r 的一次例化,记为m i ( r ) 例化的定 义可表示为: ,i ( r ) = q , d i d : d l d 2 ,d i 1 d i ,d i + l “,d k ) a ( q ,d7 ) r a d i = 7 ( v i ) ) = 0 a ,( v i ) , d i d = ( d 1 ,d 2 ,d i _ l ,d i ,d i + l ,d k ) 八( 0 ay ( v i ) ,d r 式( 2 4 ) 定义4 连接:资源r 与s 相互独立,q r 与q s 分别为r 与s 的本体,d k l 与d k 2 分别为r 与s 变体中任意一点,则r 与s 的连接可表示为: r s = q r q s , d l d = 八( q r d k l ) r 八( q s d 垃) e s j ) 式( 2 6 ) 其中d i k l ad j k 2 表示资源r 变体的第i 个分量与资源s 变体的第j 个分量关于a 运算的命题为真。 定义6 投影:设q 为资源r 的本体,q 中第m 个永真命题的投影可表示为: 口。( r ) = q m i q 付q l 八0 2 a a q 。八八q 1 1 ) 式( 2 - 7 ) 从该模型中,我们可以看出,一个资源的应用价值在于其本体的永真性与稳 定性,也取决语变体的范围。而本体的价值则取决于其中的所有命题,或者说所 有的性质。 事实上,人类知识的积累过程使对资源本体的不断完善,对永真命题的脱坡 及对资源变体不断具体化的过程。在人类发展的历史长河中,每一次对资源本体 的突破,都伴随着人类拥有资源的大量增加。对变体的具体化也同样引起了极大 的变革,如对于集成电路变体中的变量一一集成度不断的提高,不仅带来了计算 机的飞速发展,同时也引起了集成电路在数控机床、程控电话等领域的广泛应用。 2 2 2 资源的性质 资源模型不仅可以描述系统化的领域知识,还可以描述从抽象资源到具体资 源的演化过程及资源破坏与内涵的关系等性质 3 0 1 1 3 1 1 1 3 2 1 。 性质l :如果r7 = 睇( r ) ,则r7 r 。 第二章基于自然语言理解的领域自动建模相关理论 1 5 证明:可由定义2 直接得出。 性质l 说明,任何一个资源,当其内涵加入关于外延的新约束后,变体变化 的范围缩小,对外界的适应能力降低,对产品而言,意味着产品使用范围的降低。 对设计人员而言,意味着约束的增加,使设计人员的创造力降低。 性质2 :如果r = 】,i ( r ) ,则r7 r 。 证明:可由定义3 直接得出。 由定义2 与定义3 ,性质1 与性质2 说明:每一次例化、选择实际上都是资源 本题事实增加( 或约束增加) ,变体变化范围缩小的过程,也可以说是概念内涵增 加、外延缩小的过程。产品设计中,每一次例化、选择实际上都是产品不确定性 减少的过程。 本体加入事实后,可推理得到新事实。本体内关于事实的推理,可借助于人 工智能的现有技术,如命题归结到专家系统技术。产品设计中,充分实施选择运 算,并采用推理技术,可以教查出新加入的事实是否与原有事实冲突,以避免设 计中的许多修改工作。 从定义2 与定义3 可知,实施例化与选择运算后的资源完全集成了原有资源 的本题,因此,这两种运算具有继承性。 定义6 说明,资源本体内的命题是永真的,不可变的,但本体内构成某一命 题的资源并非不可变。产品设计中,通过投影运算,可在保证本体永真性的前提 下,不断完善产品本身。 性质3 设q 为资源r 本体q 中的命题,若q 为假,则q 为假。 证明:可由资源本题的定义直接得出。 性质3 说明,本题中某一命题由真变为假,这说明资源中某部分或某个协调 关系已被破坏,因此,将导致资源某些功能的破坏或资源的破坏。若资源是产品, 则产品可能不能使用或功能会减少。若资源是一个成功的设计,则说明企业中某 些消极因素已经产生,并有可能导致设计失败,这也是说明“内因是变化的根据”。 2 3 自动建模系统知识表示 自动建模系统以自然语言理解为基础,而知识表示做为一切自然语言理解的 基础。所以,必须首先确定自动建模系统的知识表示形式。通过分析现有的知识 表示方法和资源模型以后,确定了自动建模系统的知识
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年四川省乐山市中考地理真题(原卷版)
- (教研室提供)2025年山东省临沂市沂水县中考二模英语试题
- 财务会计期末复习指导
- 部编版四年级下册第五单元《海上日出》教案
- 建筑施工特种作业-桥(门)式起重机司机真题库-10
- 建筑施工特种作业-建筑架子工(普通脚手架)真题库-10
- 2023-2024学年云南省临沧市云县高二下学期期末考试数学试卷(解析版)
- 2023-2024学年江苏省宿迁市高二下学期6月期末考试数学试题(解析版)
- 2023-2024学年河北省承德市高二下学期期末考试数学试题(解析版)
- 资助育人-课题
- 主、被动防护网施工方案-图文
- GB/T 45565-2025锂离子电池编码规则
- 1、人教部编版二年级下册语文看拼音写词语(一类生字和书后词语)
- 2025年济南高新区九年级中考数学二模考试试题(含答案)
- 花椒库存收购协议书
- DB22-T2979-2019-基质沥青相似度检测红外光谱法-吉林省
- 《小王子绘本教学课件》
- 金华市皓升再生资源有限公司年回收拆解20万辆电动自行车生产线技改项目
- 2025年金融衍生工具试题
- 2025-2030中国陶瓷瓦行业市场现状供需分析及投资评估规划分析研究报告
- 电池管理系统(BMS)的智能化升级-全面剖析
评论
0/150
提交评论