已阅读5页,还剩59页未读, 继续免费阅读
(机械电子工程专业论文)基于产品设计领域的动词块语义分析.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 研究了基于产品设计领域的自然语言语义分析方法,重点是动词块的语义处 理过程。并把它应用到机床夹具的需求分析中,以提高机械设计的自动化、智能 化。 首先分析了研究与设计领域自然语言理解系统的必要性和可行性。其次,对 现有知识表示进行了评析,以概念从属理论知识表示结构为基础,建立了适合领 域自然语言的知识表示体系一概念从属树知识表示结构。再次,对现有的语义分 析方法进行对比,选用概念从属理论作为本文语义处理的基础理论。接下来对领 域自然语言语义结构进行归纳、总结,提出以“动词块”为中心、基于“事件” 的语义处理思想。并在此思想理论的指导下,详细研究了领域自然语言中简单句、 部分复合句、事件、事件性名词等的语义处理过程。最后,把领域自然语言理解 应用到机床夹具的用户需求分析中的人机交互中去,建立了相应的知识库和和部 分事件的语义处理规则,经调试,运行情况良好,有望于实现计算机辅助的用户 需求分析。 关键词:自然语言理解概念从属理论语义分析产品设计需求分析 a b s t r a c t t h es e m a n t i c a n a l y s i s o fn a t u r a l l a n g u a g eu n d e r s t a n d i n g w i t h i n p r o d u c t s d e s i g n i n gd o m a i ni s r e s e a r c h e dh e r ea n dt h es e m a n t i cp r o c e s s i n go fv e r b g r o u p si s i t s e m p h a s i s a l s o ,i t h a sb e e na p p l i e dt ot h e r e q u i r e m e n ta n a l y s i so f m a c h i n ec l a m p sf o rt h ep u r p o s eo f i m p r o v i n gt h ea u t o m a t i o na n di n t e l l i g e n c eo f t h e m e c h a n i c a ld e s i g n a tf i r s t ,t h e n e c e s s i t ya n df e a s i b i l i t yo fr e s e a r c h i n ga n dd e s i g n i n gt h en l u s y s t e mw i t h i nd o m a i n s i sd i s c u s s e d s e c o n d ,t h ep r e s e n tm e t h o d so fk n o w l e d g e e x p r e s s i n ga 诧e v a l u a t e da n dt h ec o n c e p t u a ld e p e n d e n c yt r e e an e ww a y t oe x p r e s s t h ek n o w l e 起eo fd o m a n i a ln a t u r a l l a n g u a g e i s p u tf o r w a r d t h i r d ,t h ep r e s e n t s e m a n t i ca n a l y s i sm e t h o d sa r eb a l a n c e da n dt h ec o n c e p t u a ld e p e n d e n c yt h e o r yi s c h o s e na st h ef o u n d a t i o no ft h es e m a n t i ca n a l y s i so ft h ep a p e r l a t e r , t h es e m a n t i c f r a m eo fd o m a n i a ln a t u r a ll a n g u a g ei ss u m m a r i z e da n dt h et h o u g h to fs e m a n t i c a n a l y s i sb a s e d o ne v e n ti sb r o u g h tf o r w a r dw i t hv e r bg r o u p sa si t sc e n t e r a tt h es a m e t i m e ,t h es e m a n t i cp r o c e s so fs i m p l es e n t e n c e s ,s o m ec o m p l e xs e n t e n c e s ,e v e n t sa n d n o u n sw i t l le v e n tp r o p e r t i e sa r es t u d i e di nd e t a i l a tl a s t t h es e m a n t i ca n a l y s i si s a p p l i e dt ot h ed e s i g no ft h em a n m a c h i n ei n t e r f a c ei nm a c h i n ec l a m p s m e a n w h i l e , t h ek n o w l e d g ed a t a b a s ea n ds o m er u l e so fs e m a n t i ca n a l y s i so fe v e n t sa l ee s t a b l i s h e d a n di tr u n sw e l la f t e rd e b u g g i n g ,i ti s h o p e f u lt o r e a l i z et h e c o m p u t e r - a i d e du s e r r e q u i r e m e n ta n a l y s i s k e y w o r d s :n a t u r a l l a n g u a g eu n d e r s t a n d i n gc o n c e p t u a ld e p e n d e n c y t h e o r y s e m a n t i ca u a l y s i s p r o d u c t sd e s i g nr e q u i r e m e n ta n n t y s i s 声明 创新性声明 本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究 成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不 包含其他人已经发表或撰写过的研究成果;也不包含为获得西安电子科技大学或 其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做 的任何贡献均己在论文中做了明确的说明并表示了谢意。 本人签名:尘垒盘! 兰日期) ,| 嘭,f 关于论文使用授权的说明 本人完全了解西安电子科技大学有关保留和使用学位论文的规定,即:研究生 在校攻读学位期间论文工作的知识产权单位属西安电子科技大学。本人保证毕业 离校后,发表论文或使用论文工作成果时署名单位仍然为西安电子科技大学。学 校有权保留送交论文的复印件,允许查阅和借阅论文;学校可以公布论文的全部 或部分内容,可以允许采用影印、缩印或其它复制手段保存论文。( 保密的论文在 解密后遵守此规定) 本人签名:垒玺! 兰 导师签名:垒虫 日期 1 0 0 奄5 日期型堕生 第一章绪论 第一章绪论 1 1 产品设计的现状与发展目标 设计是人类的一种重要创造性活动,而且任何人类的创造活动必然包含设计。2 0 世 纪,人类文明达到了前所未有的高度。科学技术的迅猛发展,促使科学技术综合化、整 体化以及人文和科技相互渗透、相互融合的趋势加速。机械设计己不再纯属于工程技术 范畴,而是自然科学、人文科学和社会科学相互交叉、科学技术与工程技术高度融合所 形成的一门现代设计科学。 任何科技成果要转变为有竞争力的商品,设计起着关节性的作用。设计是产品研制 的第一道工序,设计工作的质量和水平,直接关系到产品的质蠹、性能、研制周期和技 术经济效益。 产品设计是设计者利用可用资源及领域知识,通过设计过程,将用户需求转化成待 设计产品的过程,是一种有计划、有步骤、有目标、有方向的创造活动。产品设计过程 可以分为四个阶段:产品需求分析、概念设计、技术设计及详细设计o 。 目前,随着计算机硬件、软件水平的发展,产品设计过程正在发生彻底的变化,计 算机技术已渗透到产品设计开发与制造的很多环节。c a d c a m 已经成为当代先进的生产 力,被国际公认为2 0 世纪9 0 年代的十大重要技术成果之一。c a p p 、c a e 、p d m 等技术的 研究进一步促进机械设计的计算机化。它们的发展与应用不仅改变了产品设计、制造的 传统作业方式,还有利于提高企业的产品创新能力、技术水平和市场竞争力。目前,在 产品设计过程中,大多数活动都可以用c a d 技术来完成,但也有一些活动尚难用c a d 技 术来实现,如设计的需求分析,可行性研究,概念设计等。下图就说明了设计过程与c a d 过 图1 i 产品设计过程 从图中我们可以看出,目前产品设计计算机化主要体现在产品的后期设计,对产品 2 基子产品设计领域的动词块语义分析 开发的早期设计支持不够。如果能把计算机技术应用于产品设计中起关键性作用的早期 阶段,产品设计的过程将会大大简化,对设计人员的要求将会显著降低,产品设计的周 期将会缩短,所设计的产品也将会更充分地满足用户需求,更具有市场竞争力,更适合 经济全球化的发展需要。 现代c a d 技术的最终目的是要尽可能采用自动化设计技术,集成化、网络化、智能 化是它所追求的功能目标。”。其中智能化是设计活动的显著特点,也是走向自动化的重 要途径。这是因为设计的本质是创造和革新,作为一种创造性活动,设计实际上是对知 识的处理和操作。 要实现设计向集成化、智能化、自动化方向发展的目标,就必须大大加强设计专家 与计算机工具这一人机结合的设计系统中机器的智能,使计算机能在更大的范围内,更 高水平上帮助或代替人类专家处理数据、信息与知识,做出各种设计决策,大幅度提高 设计自动化的水平。就目前设计发展的现状来看,智能化的近期目标就是让计算机技术 尽可能地深入到设计过程的早期阶段。 1 2 自然语言理解概述 随着“计算机文化”社会的到来,语言己不仅是人与人之间的交际工具,而且是人机 对话的基础。将计算机与语言学有机结结合起来,彼此互助,彼此互补,从而实现计算机 高度智能化是计算机研究、人工智能等领域的个富有挑战性的课题”。 1 2 1 自然语言理解研究的内容 自然语言理解就是研究如何让计算机理解人类自然语言的一个研究领域。从计算机 科学特别是从人工智能的观点看,自然语言理解的任务是建立一种计算机模型,这种计 算机模型能够给出像人那样理解、分析并回答自然语言的结果。 几十年来,自然语言理解的研究是把一个文字表达的句子看作是一个层次化的结构, 它由词素一词或词形一词组或句子形成,其中每个层次都是受到语法规则的制约。因而 对语言的分析和理解过程也是一个层次化的过程,这个过程一般分为3 个层次:词法分 析,句法分析和语义分析0 1 。虽然这种层次之间并非是完全隔离的,但是这种层次化的 划分的确有助于更好地体现语言本身的构成。 词法分析主要完成词的切分以及词义选择,还包括一些纠错功能。汉语中词的切分 是一个重要而棘手的问题。 句法分析的目的是确定每个词在句子中的功能以及句子的合法性,然后产生合适的 表示,为进一步的语义分析作准备。语法分析通常以事先精心定义的一系列语言规则为 基础。 语义分析是解决句子中的词、短语、直至整个句子的语义问题。由于自然语言的模 糊性和不精确性,这项工作要做得完善非常困难。通过语义分析找出词义、结构意义及 第一章绪论 其结合意义,从而确定语言所表达的真正含义或概念。在语言自动理解中,语义愈来愈 成为一个重要的研究内容”。 1 2 2 自然语言理解的艰巨性 通常,人与人用自然语言( 包括口头的与书面的) 进行交流并没有困难,而要让计算 机完全模拟人来理解自然语言,近阶段是不可能的。自然语言理解研究的艰巨性主要表 现在以下几个方法: 首先,自然语言是极其复杂的符号系统。一个人尽管可以对自己的母语运用自如, 但却无法把自己母语的构成规律、意义的表达规律和语言使用的规律用计算机可以接受 的方式彻底说清楚。传统的语言学虽然为自然语言理解积累了宝贵的财富,但那是讲给 人的,真正要让语言学知识变成计算机上可操作的,绝不是那么简单,也不能那么模糊。 其次,自然语言的各个层次上都含有巨大的不确定性。在语音和文字层次上,有一 字多音、一音多字的问题;在词法和句法层次上,有词类词性、词边界、句法结构的不 确定性问题;在语义和语用层次上,也有大量的因种种原因造成的内涵、外延、指代、 言外之意的不确定性。语言学上把这些不确定性叫做“歧义”。歧义一般不能通过发生 歧义的语言单位自身获得解决,而必须借助于更大的语言单位乃至非语言的环境背景 因素和常识来解决。 再次,自然语言不是一成不变的死的语言,它在社会生活中发展,在操不同语言和 同一语言不同变体的人们的相互影响中变化。因此,理解自然语言的计算机程序要要具 有对外界语言环境的应变能力。 而且,自然语言是人们交流思想的工具。既然交流的是思想,那思想本身在计算机 里的组织结构就显得格外重要。目前的知识表示方法都各有优缺点,没有一个完全符合 自然语言的知识表示方法。 最后,要让机器真正理解自然语言,还必须弄清楚人是怎样理解自然语言的,特别 是,儿童是如何学会母语的。这涉及到人类智能的本质的研究。对这类重大问题的探索 需要多学科协作攻关。 从上面的分析可以看出,自然语言理解是语言学、逻辑学、生理学、计算机科学和 数学等相关学科发展和结合而形成的- f l 学科,对它的研究将是一个艰难、漫长的过程。 1 2 3 现阶段自然语言理解的目标 对自然语言的理解是一个十分艰巨的任务,即使建立一个只能理解片言断语的计算 机系统,也是很不容易的。因此,目前对自然语言理解的研究主要集中在应用领域。一 般认为,对自然语言所要达到的目标“”是: 1 能正确理解用自然语言输入的信息,并能正确回答输入信息中的有关问题。 2 对输入的信息,计算机能产生相应的摘要,能用不同的词语复述输入信息的 内容。 3 计算机能把用某一种自然语言表示的信息自动地翻译为另一种自然语言。例 基于产品设计领域的动词块语义分析 如把英语翻译成汉语,或把汉语翻译成英语等。 1 3 国内外自然语言理解研究的发展 国外关于自然语言理解方面的研究起步较早,些卓有成就的语言学家、逻辑学家和 心理学家都在自然语言理解中的语法、句法及语义分析等方面提出了一系列较为系统的 理论的方法。 在语法方面,1 9 5 7 年,美国乔姆斯基( n c h o m s k y ) 创建了转换生成语法 ( t r a n s f o r m a t i o n a lg e n e r a t i v eg r a m m a r ) “”“。接下来,计算机学者们抛弃转换生成语法, 转向短语生成语法,于是出现了各种增强的短语结构语法。如受限语言( r e s t r i c t e d l a n g u a g e ) 和扩充转移网络( a u g e m e n t e d t r a n s i t i o nn e r w o r l ,简称a t n ) 。“。1 9 5 9 年法国的 语言学家特思耶尔( l u c i e n t e s n i e r e ) 提出了依存语法( d e p e n d e n c y g r a m m a r ) ,主张主要动 词作为一个句子的中心,支配其他成分。1 9 7 0 年美国伍兹( w a w o o d s ) 设计了扩展转换网 络( a u g m e n t e d t r a n s i t i o n n e t w o r k ,简称a t n ) ,并于1 9 7 2 年建成了l u n a r 模型。2 0 世纪 8 0 年代,乔姆斯基提出了管辖与约束理论( t h e t h e o r y o f g o v e r n m e n t a n db i n d i n g ) ,简称 g b 理论。1 9 7 5 年,美国学者j o s h i 等人最早提出了树邻按语法( t r e e a d j o i n i n g g r a m m a r , 简称t a g ) 。1 9 8 0 年盖兹达( g g a z d a r ) 、克莱因( e k l e i n ) 、沙格( i s a g ) 和普鲁姆 ( g p u l l u m ) 等人共同提出了广义短语结构语法( g e n e r a l i z e dp h r a s es t r u c t u r eg r a m m a r , 简称g p s g ) 。它克服了短语结构语法生成能力过奖的缺点。接着1 9 8 5 年美国语言学家 c a r lp o l l a n d 和i v a ns a g 又在广义短语结构语法的基础上提出的中心语驱动的短语结构 语法( h e a d - d r i v e dp h r a s es t m e t t t r eg r a m m a r ,摘称h p s g ) 。还有美国语言学家布列斯南 ( j b r e s n a n ) 卡普兰( r m k a p l a n ) 一起于1 9 8 2 年提出了词汇一功能语法 ( 1 e x i c a l f u n c t i o n a lg r a m m e r r ,简称l f g ) 。马丁凯依( m a r t i nk a y ) 于1 9 8 3 年提出了“合 一语法”( u n i f i c a t i o ng r a m m e r ,简称u g ) ,于1 9 8 5 年提出了“功能合一语法”( f u n c t i o n a l u n i f i e a t i o n a lg r a m m e r ,简称f u g ) ”“。 语法研究发展的同时,语义研究也在逐步发展与深化。1 9 6 8 年菲尔摩( c j f i l l m o r e ) 提出了格语法( e a s eg r a m m a r ) ,1 9 6 9 年美国奎廉( q u i l i a n ) 首次提出了语义网络 ( s e m a n t i c n e t w o r k ) ,1 9 7 0 年美国蒙塔鸩( r m o n t a g u e ) 创建了一个完备的自然语言体系 一蒙塔鸠语法( u n i v e r s a lg r a m m a r ) 。美国学者西蒙斯( r f s i m m o n s ) 进一步改进了语 义网络理论。玛考利等提出了生成语义学,威尔克斯( y a 晰蚴提出了优选语义学 ( p r e f e r e n c es e m a n t i c s ) 。1 9 7 3 年美国计算机科学杉克( r c s c h a n k ) 提出了概念依存理 论( c o n c e p t u a ld e p e n d e n c yt h e o r y ,简称c d 理论) ,并且用此理论建立了m a r g i e 系统和 s a m 系统。1 9 8 3 年美国的巴杯士( j o h n b a r w i s e ) 和佩里o o h n p e r r y ) 建立了系统的语义学 一境况语义学( s i t u a t i o ns e m a n t i c s ) 。基于自然语言理解的需要,又有学者提出言谈语义 学( d i s c o u r s el i n g u i s t i c s ) 和语用学( p r a g m a t i c s ) “。 第一章绪论 近几年来,语料库语言学在国际范围内掀起了新的研究热潮。6 0 年代初,美国b r o w n 大学建立了世界上第一个标准语料库b r o w n 语料库。7 0 年代后在此基础上开发了词类标 注软件t a g g 系统。7 0 年代初又开发了与b r o w n 语科库类似的l o b 语料库。b r o w n 语料 库和l o b 语料库可称为第一代语料库的代表。8 0 年代初,由c o l l i n s 出版社资助的 c o b u i l d ( c o l l i n sb i r m i n g h a mu n i v e r s i t yi n t e r n a t i o n a ll a n g u a g ed a t a b a s e ) 语料库成为第二 代语料库。进入9 0 年代以后,语料库的发展也就进入了第三代,其特点是规模更大, 加工深度更深。如美国p e n n s y l v a n i a 大学建立了大规模的树库p e n nb a n k ,成为当前国 际计算语言学领域的一个重要资源“1 。 国内起步较晚。从1 9 7 8 年我国才开始真正意义上的汉语理解研究。经过2 0 余年的 时间,无论在句法和语义分析方面,还是在各语言单位的语义表示与获取方面,以及在歧 义消解等方面都取得了较大进展。 国内汉语理解的研究历程与国外自然语言理解的发展大致相同。早期主要以语法规 则为主,采用转换生成语法、扩充转移网络等语法理论等,注重汉语句子的句型分析,通 过对句子的形式描述和分析,建立了一批汉语句子理解系统和人一机接口实验系统。从 8 0 年代开始,我国结合汉语的特点,借鉴国外的自然语言语义理论,如格语法,语义网 络等,先后提出了一系列符合汉语特点的语义分析方法和语义表示理论。如汉语格语法 理论、汉语的各种信息在语义网络中的表示方法等。9 0 年代以后我国计算语言学研究者 广泛开展了语料库语言学的研究,建立不同规模和不同用途的语料库。如清华大学按照 系统性原则收集的5 0 0 0 万汉字原始语料库。哈尔滨工业大学机器翻译研究室在1 9 9 9 年 也建立了一个6 4 万词次带有词性标注的汉英双语语料库。”。 目前,我国在自然语言理解方面针对汉语提出的最突出的语言理解理论有两个,一 个是知网“5 、”1 ,另一个是概念层次网络理论“。知网是董振东老师在概念从属理论的继 承上提出的,概念层次网络理论h n c ( h i e r a r c h i c a ln e t w o r ko fc o n c e p t ) ,是由中国科 学院的黄曾阳先生在进行自然语言理解研究中,经历了长达8 年的探索和总结,在语义表 达方面归纳出一套具有自己特色的理论。 虽然在汉语自然语言理解方面的研究已经取得了一定的成绩,但目前比较成熟和系 统的理论体系并较好地付诸于实践的大多是在以词性标注为分析目标的语法方面,虽说 在语义、语用和语境方面的研究,也出现了不少有价值的理论成果,但在进一步的理论运 用方面所作的尝试却远远不够,因此在这方面我国计算语言学工作者尚需继续努力,而 且任重而道远。 1 4 产品设计领域的自然语言理解研究 产品设计领域的自然语言理解研究是将自然语言理解与产品设计领域相结合,设计 领域范围内的自然语言理解系统。 6 基于产品设计领域的动诃块语义分析 把自然语言理解应用到产品设计中是把计算机技术应用到产品设计早期阶段的重要 的一步,也是实现设计智能化的关键的一步。一般来说,用户由于对设计领域内的术语 不是很了解或根本不了解,他们对于产品的要求通常是用自己的自然语言来描述的,因 此设计人员接受到的产品需求都是用自然语言表示的。要计算机代替设计人员快速有效 地收集用户的需求信息,并且对用户需求进行分析、自动提取有用信息、从需求分析转 化为产品概念设计,首要的一步就是让计算机懂得自然语言。 本文将尝试把自然语言理解应用于产品设计中,应用计算机技术对用户需求进行理 解和分析,并把分析结果转化成概念设计前提要求,从而实现计算机深入产品设计的早 期阶段,为产品设计的智能化提供支持。 基于领域研究自然语言理解不仅有利于领域应用,而且还可以实现系统设计的自动 建模,有助于提高系统设计的自动化水平。除此之外,基于领域的自然语言理解把自然 语言进行领域划分,在较小的范围内进行语言处理要比在人类语言空间内进行语言理解 容易的多,其主要原因是: 首先,由于人类自身的局限性,对一个庞大的复杂系统进行研究时需要相当长的时 间与足够的经验作基础。尤其,汉语是个大字符集的语言,要建立一个包括全部汉语知 识的知识库和汉语处理系统,不论在理论上和实践上都是一个相当大的挑战。基于领域, 缩小范围有利于系统研究与实现。而且,目前对自然语言理解的应用是基于一定领域中 的。 其次,领域的自然语言理解面对的是相对狭窄的问题领域内的语言。领域内的语言 不是无限的,它的词汇量褶对少的多,而且专业词汇词义确定,不会产生歧义。对于很 多概念,虽然其自身有很多含义,但是在特定的领域中,这些概念的含义就比较确定, 因此歧义的发生就会大幅度减少,语义推理就相对比较简单。此外,领域中概念间的联 系较密切,容易分类、抽象,知识库的建设相对来讲也比较容易。 再次,领域中语句的表述形式相对固定,变化较少。因此,领域自然语言语句的处 理复杂性就会降低。如,在机械设计领域中,主动句子较多,像“设计一个变速器”、 “螺栓的直径是l o m m ”等。 最后,设计领域的自然语言理解需要深层次的知识,但这些深层知识一般包含在专 业知识中。设计领域自然语言理解主要用于用户需求的理解、分析和一些应用模块( 如 c a d c a m ) 的用户接口上,具体到对用户需求的理解和分析,要深入理解用户的需求, 需要挖掘用户的潜在或隐含需求,有时还需要体会出用户的“言外之意”,而不能仅仅 停留在简单字面意思的理解,如,有时设计要考虑地区、环境、气候的影响。虽然对于 隐含知识的处理一致是一项非常困难的事,但是,由于这些潜在或隐含的知识不是无范 围界定的,而是与专业知识密切相关,所以,通过把自然语言隐含知识的范围限定在一 个领域范围内,语言理解的难度就会大大降低。 近几年,我国自然语言理解的研究取得了很大的成绩,并建立了一批汉语理解的实 第一章绪论 验系统,其中一些系统已实用化和商品化,这些研究成果是我们设计领域自然语言理解 的基础。 综上所述,设计领域自然语言理解是现实应用的需要,基于我国自然语言理解的现 有成果,设计基于领域的自然语言理解具有可行性。利用自然语言理解让计算机参与产 品设计的用户需要分析、概念设计等过程,一方面有利于减轻设计人员的工作量,另一 方面有利于增加计算机的智能,实现c a d 技术的智能化。 1 5 本文的研究内容 机械设计早期阶段所面对的是与用户进行语言交流,分析用户要求,准确判断其内 容,用自然语言合理表达其信息。由此可见,机械设计早期阶段最重要的是与自然语言 打交道。本文针对这一点,探索将自然语言理解应用于产品设计中,让计算机来完成用 户要求的理解与分析,并将理解的结果转化概念设计所需要的知识。 对于智能系统丽言,知识是其实现智能的基础,因两本文采用对领域知识的表示方 法进行了深入的研究。由于单纯的语法或语义分析都不能解决语言理解的所有问题,本 文采用语法处理与语义处理相结合的方法,语法处理作为语义处理的辅助,语义处理是 重点。 语言理解的目的是要理解整个句子的含义。动词在句子中起连接作用,在旬义理解 中占据核心地位,因此对动词的处理相当重要。动词具有多义性,动词的搭配非常灵活, 句子类型对动词的处理也有很大的影响等待,这些因素使得动词的处理非常的困难。本 文的重点就是研究动词的语义处理,通过对动词的分析与研究,抽象出事件的概念,把 动词的语义与事件相结合,通过事件的处理来完成动词的语义处理。 本文的语义处理是整个自然语言理解的一大模块,它要结合系统其他处理模块如名 词块处理,介词处理,数量词处理等来完成整个领域自然语言的理解,为产品设计的需 求分析、概念设计等阶段提供支持。 本文的主要工作如下: 了解国内外自然语言理解的研究现状与发展趋势,探索现有的自然语言分析方 法,选取概念从属理论作为本文语义处理的理论基础,提出领域自然语言的语 义处理思路。 对现有的知识表示方法进行分析。结合领域自然语言的特点,建立了适合领域 知识表示的概念从属树知识表示结构,并分析了其优缺点。 本文深入研究了动词概念,为解决动词的多义性、灵活性等特点,抽象出事件 概念。以事件为重点处理对象,详细介绍事件的语义处理过程,完成动词的语 义处理以及简单句的旬义理解。 结合机械领域特点,把自然语言理解应用到机床夹具的需求分析中,实现计算 8基于产品设计领域的动词块语义分析 机理解用户需求和信息提取,为下一步的概念设计和后续设计做好准备。 第二章知识表示与语义分析理论方法9 第二章知识表示与语义分析理论方法 要使计算机具有理解和处理自然语言的能力,必须让计算机拥有丰富的语言知识。 因此,本章对现有的知识表示方法进行了比较,分析了各自的优缺点。在自然语言理解 的研究中,语义分析是理解的核心与难点,本章对现有的语义分析方法也进行了讨论, 重点介绍概念从属理论。 2 1 知识与知识表示 人类的知识活动过程主要是一个获得并应用知识的过程,知识是智能的基础。为了 使计算机具有智能,使它能模拟人类的智能行为,就必须使它具有知识。但知识需要有 适当的模式表示出来才能存贮到计算机中去的,因此关于知识的表示闯题就成为人工智 能中一个十分重要的研究课题。 2 1 1 知识的概念 知识是人们在长期的生活及社会实践中、科学研究及试验中积累起来的对客观世 界的认识与经验。知识反映了客观世界中事物之间的关系,不同事物和相同事物建的不 同关系形成了不同的知识。例如:誓雪是白色的”是一条知识。它反映了“雪”与“颜 色”之间的一种关系。又如“如果地上湿了,则有可能天下过雨”是一条知识,它反映 了“地上湿”和“天下过雨”间的一种因果关系。在人工智能中,把前一种知识称为“事 实”,而把后一种知识,即用“如果则”关联起来所形成的知识称为“规则”。 知识具有相对正确性、不确定性、不完全性、可表示性与可利用性、可存储性( 可 记忆性) 、可处理性等特性。 2 1 2 知识表示”“ 世界上的每一个国家或民族都有自己的语言和文字,它是人们表达思想、交流信 息的工具。任何需要进行交流、处理的对象都需要用适当的形式表示处理出来才能被应 用,对于知识当然也是如此。人工智能研究的目的是要建立一个能模拟人类智能行为的 系统,为达到这个目的就必须研究人类智能行为在计算机上的表示形式,只有这样才能 把知识储存到计算机中去,供求解现实问题使用 t e l o 所谓知识表示实际上就是对知识的一种描述,或者说是一种约定,一种计算机可以 接受的用于描述知识的数据结构,更为简洁的说,是知识的符号化。对知识进行表示的 过程就是把知识编码成某种数据结构的过程。 目前用得较多的知识表示方法有:一阶谓词逻辑表示法,产生式表示法,框架表示 法,语义网络表示法,脚本表示法,过程表示法,p e t r i 网表示法,面向对象表示法, 概念从属表示法等。 1 0 基于产品设计领域的动词块语义分析 对同一知识,一般都可以用多种方法进行表示,但效果却不相同。因为不同领域中 的知识一般都有不同的特点。由于不同的知识结构都有其针对性和局限性( 每一种表示 方法也各有自己的长处与不足) ,在建立一个具体的智能系统时,究竟采用哪种表示模 式,目前还没有统一的标准,也不存在一个万能的知识表示模式。但一般来说,在选择 知识表示方法时,应从以下几个方面进行考虑: 1 充分表示领域知识 2 有利于对知识的利用 3 便于对知识的组织、维护与管理 4 便于理解和实现 要让计算机理解人类的语言就必须研究人类语言的计算机表示。由于知识本身的 特点以及汉语语言自身的特殊性,因此,在建构适合领域汉语特点的知识表示模型时, 有必要先对目前比较有代表性的几种知识方法作些分析比较,以便从中吸取经验和教 训。 2 1 3 几种现有的知识表示方法 1 一阶谓词逻辑知识表示法 一阶谓词逻辑的知识表示提出了一种很强的从旧知识导出新知识的方法数学演 绎。在这种形式表示机制中,实际世界中的事实被表示成合式范式。同时提供了一种对 知识的推理逻辑。它适合于表示事物的状态、属性、概念等事实性的知识,也可以用来 表示事物间确定的因果关系。 一阶谓词逻辑表示法的特点:自然性。表示形式接近于自然语言,表示的知识易 于理解;精确性,谓词逻辑是二值逻辑,只有“真”与“假”,并能保证经演绎推理 所得结论的精确性;严密性。谓词逻辑具有严格的形式定义及推理规则,利用这些推 理规则及有关定律证明技术可以已知事实推出新的事实,或证明所作的假设;容易实 现。用谓词逻辑表示的知识可以比较容易地转换为计算机地内部形式,易于模块化,便 于对知识地增加、删除及修改。 一阶谓词逻辑表示法的不足是:首先,不能表示不确定性地知识和复杂知识;其次, 在其推理过程中,随着事实数目的增大及盲目地使用推理规则,有可能形成组合爆炸; 再次,谓词逻辑表示知识时,其推理时根据形式逻辑进行的,把推理与知识的语义割裂 了开来,这就使得推理过程冗长,降低了系统的效率。 2 规则表示法 规则表示法也叫产生式表示法。一个规则的一般形式为:p q 。它可以看成是一个 “前提p 一结论q ”对。前提是情况认识部分,它是该产生式规则使用时所必须满足的条 件;结论即行为部分,是前提满足时由推理而得到的结构。规则用于描述单个对象内以 及对象间关系的所有可能为真的每个事实。 产生式表示法的特点是:自然性。产生式系统用“如果,则”的形式表 第二章知识表示与语义分析理论方法 示知识,直观、自然、又便于推理;模块化,产生式规则是规则库中最基本的知识单 元,同推理机构相对独立,便于模块化,给知识的增、删、改带来了方便,给规则库的 建立和扩展提供了可管理性:有效性。产生式能有效地表达多种领域中的知识,既可 以表示精确的知识,也可以表示不精确、不完全的知识;清晰性。产生式有固定的格 式,任何一个产生式都由前提与结论这两部分组成,这种统一的格式既易于设计、控制。 又易于进行知识的一致性、完整性检测。 产生式表示法的局限性表现在:首先,产生式系统求解闽题的过程是一个反复进行 “匹配一冲突消除一执行”的过程。规则库一般比较庞大,匹配非常费时,因此,此工 作效率是不高的。其次,产生式适合表示具有因果关系的过程性知识,但对具有结构关 系的知识却无能为力,它不能将具有结构关系的事物间的区别与联系表示出来。再次, 表达能力低。它只便于表示定性的、浅层的知识,不便于表示定量的、深层的复杂知识。 3 框架表示法 框架标识法是一种表达知识的数据结构,它由一组“槽”所组成。这些“槽”可以 有任意有限数目的“侧面”,一个侧面又可以有任意有限数目的“值”,它可以描述对 象的某一属性,也可用描述其他对象的框架来填充。一般地,一个对象采用一个框架描 述,其属性则用“槽”描述。一个框架可以形式地表示为: f r a m e 槽名1 :侧面名i :侧面值1 侧面名n l :侧面值n 1 槽名n :侧面名1 :侧面值1 侧面名n n :侧面值n n 框架表示法的特点:结构性。框架是一种经过组织地结构化知识表示方法,适合 于表示类型的概念、事件和行为。继承性,框架之间可以形成层次的和更复杂的关系, 组成一种框架网络,代表整块的知识结构,可以表示复杂的知识内容。继承在支持概念 抽象和信息共享的思想,在框架系统中起了极其重要的作用;附加过程,附加过程是 框架系统的重要特征之一,它使得描述性知识和过程性知识紧密融合在一起,有机地形 成一个一体化系统;自然性,框架表示法体现了人们在观察事物时的思维活动,当遇 到新事物时,通过从记忆中调用类似事物的框架,并将其中某些细节进行修改、补充, 就形成了对新事物的认识,这与人们的认识活动是一致的。 其缺点是:首先,不善于表达过程性的知识。因此,它经常与产生式表示方法结合 起来使用,以取得互补的效果。其次,多重继承可能产生多义性,如何解决继承过程中 概念属性的歧义,目前还没有一种统一的方法。 4 语义网络表示法 1 2 基于产品设计领域的动词块语义分析 语义网络式种采用网络形式表示人类知识的方法。语义网络知识表示中,一个语 义网络就是一个由表示实体、概念、情况等的结点和表示结点之间各种语义关系的弧或 链( 带有箭头的弧) 组成。结点和弧都必须带有标号,以便区分各种不同的对象以及对 象间的各种不同的语义联系。每个结点可以带有若干属性,一般用框架或元组表示。另 外,结点还可以是一个更细致的语义子网络。因此可把它一层层细化下去,直到最基 本的原子对象为止,从而形成一个多层的嵌套结构。 语义网络知识表示法的特点是:结构性。能把事物以及事物间的各种语义联系显 式地表示出来。下层概念结点可以继承、补充、变异上层概念的属性,从而实现信息的 共享。自然性。语义网络对事物的属性及事物间的联系的表示比较真观,便于理解, 自然语言与语义网绍间的转换也比较容易实现。联想性。语义网络可把节点间的联系 以明确、简洁的方式表现出来,通过这些联系很容易找到结点间的有关信息。这样,不 仅便于以联想的方式实现对系统的检索,使之具有记忆心理学中关于联想的特性,而且 它所具有的这种自索引能力使之可以有效地避免搜索时所遇到的组合爆炸问题。 语义网络的缺点是:首先,表示有限,而且形式过于简单;结点间的联系只局限于 几种典型的关系。其次,效性低。结点和弧本身没有确切的含义,因此逻辑推理不具备 逻辑系统的那样的有效性。再次,网络中结点之间的联系可能是线状的、树状的、也可 能是网状的,甚至时递归的,这就给知识的存储、修改、和检索带来不少困难。最后, 非严格性。语义网络没有公认的形式表示体系。一个给定的语义网络所表达的含义往往 依赖于处理程序如何对它进行解释。在推理过程中,有时不能区分事物的“类”与“个 体”,其推理不能保证正确性。 2 2 自然语言语义分析方法 “语言是思维的直接表达”。没有语义的语言是不存在的。因此,语义理解是自然语 言理解的关键。 2 3 1 语义分析在自然语言理解中的地位 在自然语言理解的领域中,越来越多的论著强调语义分析的重要性,这是容易理解 的。在汉语中,很容易举出例子:“猴子吃香蕉”、“学生吃食堂”、“老乡吃大碗”。对于 这些例子,仅仅在句法的层次上分析出“吃”是动词,“香蕉、食堂、大碗”是名词, 且动词与名词之间是述宾关系,并不能妥普地解决机器理解的问题,必须进行语义分析, 如给“吃”附以“动物的一种行为”,在句子中需有“蘸事”与“受事”,只有食品类的 名词才可以充当其“受事”,还要给“苹果、食堂、大碗”分别附以“食品、处所、器 具”的语义标记。 语法分析不能辨认所谓“语法正确、语义荒谬”的句子,如“无色的绿色思想在狂 怒地睡觉”,“所有的石头都死了”,也不能辨认大部分所谓搭配不当的语法错误,如 第二章知识表示与语义分析理论方法 “秋天的北京是美丽的季节”,“盐在血液循环中起着重要地位”。对这些“语义荒谬” 或“语义搭配不当”错误的判断,只有应用语义分析采用可能解决。 因此可见,语义分析已成为自然语言理解的迫切需要。在语义层面建立语句分析的 理论模式和方法是一项任重道远的探索,本文只是一点小小的尝试。 2 3 2 语义分析的研究方法 自从2 0 世纪6 0 年代语义分析被提出来以后,在语义分析方面相继出现了一系列的 语义分析理论,如,格语法、语义网络、概念依从理论等等。下面就简要讨论几种语义 分析理论的优缺点。 1 格语法 格语法的基本思想是:动词在句中起中心作用,参与动作的各个体称为“语义格”,且 “格”的数量是有限的。针对每个动词的义项,由可能的“语义格”子集构成格框架,这 一子集分为必要的和可选的两个集合。 格语法给出了各格成分之间的深层语义,即句子的深层结构。格语法适应于汉语的分 析。格语法最大的特点是承认语义在句法中的主导作用,由格语法分析可以得到句子的 深层语义结构,给出各成分的语义角色,对于确定正确的句法结构有很大帮助。 格语法在汉语分析中存在以下几个缺点: ( 1 ) 无法解决汉语的连动和兼语句式。格语法认为动词在旬中起中心作用,那么分析 句子时首先要确定句子的核心。汉语缺乏形态特征,作为核心的主动词通常也缺乏形态 特征。如何在有多个动词的连动式和兼语式中找出句子的核心是汉语信息处理的一个很 难的问题,也是格语法无法解决的问题。 ( 2 ) 短语内部各成分间关系无法确定。格语法提出的各种格关系都是名词性短语和动 词之间的语义关系,对于名词性短语内部和动词短语内部各成分关系的确定没有给出。 2 语义网络 语义网络的基本原理是以概念为基点,按一定的语义关系将不同的概念连接起来, 构成一种语义表达形式。这种形式可以用来分析并记忆句子所包含的语义关系,并在需 要时生成和输出有意义的语句,执行自然语言处理和理解的任务。 语义网络能把实体的结构、属性与实体间的因果关系显式而简明地表达出来,与实 体相关的事实、特征和关系可以通过相应的结点弧线推导出来。由于与概念相关的属性 和联系被组织在一个相应的结点中,因而概念易于受访和学习。同时语义网络表现问题 更加直观,更易于理解,适于知识工程师与领域专家沟通。语义网络中的继承方式也符 合人类的思维习惯。 然而语义网络也有其不可避免的特点:语义网络结构的语义解释依赖于该结构的推 理过程而没有结构的约定,因而得到的推理不能保证十分正确:点间的联系可能是线状、 树状或网状的,甚至是递归状的结构,使相应的知识存储和检索可能需要比较复杂的过 程;此外,语义网络结构庞大、复杂,系统开销大。 1 4 基于产品设计领域的动词块语义分析 3 知网 知网是针对汉语提出的。它提出了1 5 0 0 多个义原,用来描述概念、概念之间的关系 及属性与属性之间的关系。 知网适合于汉语的语义分析,但知网也有以下不完善的地方:首先,知网强调了概 念即义项之间的关系,但比义项更大的语义单位即语义块则没有提及。其次,知网给出 事物类概念和事件类概念之间的关系,但对事件类概念之间的关系没有给出,不利于解 决汉语主动词的确定问题。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 租房加盟协议合同范本
- 货物采购交付合同范本
- 药品经销商合同协议书
- 租房中介担保合同范本
- 烘焙材料购销合同范本
- 维修校园围栏合同范本
- 物业连廊维修合同范本
- 绿植绿化维护合同范本
- 衣物购货合同范本模板
- 灯光照明改造合同范本
- 开展村干部评选活动方案
- 2025年河南理工大学计算机导论试题
- 供应商准入资格评估表模板
- 软骨素市场发展前景及投资可行性分析报告(2025-2026年)
- T/CIMA 0057-2022卧式拉力试验机
- 《分数除法》单元整体教学设计
- 2025国开电大【国际贸易实务】形考12答案+终结性测试答案
- 中央2025年度中国船级社招聘人才50名笔试历年参考题库附带答案详解
- 气象知识科普讲座
- 安全评价通则aq8001-2023
- 果树绿色防控技术课件
评论
0/150
提交评论