已阅读5页,还剩58页未读, 继续免费阅读
(机械电子工程专业论文)基于产品设计领域的名词短语语义分析.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 本文将自然语言理解应用于产品设计中,对以自然语言形式表达的用户需求中 名词短语进行理解和分析,同时结合系统其余模块的运行,将最终的分析结果转 化成概念设计要求,为后续设计提供支持。 首先,根据设计领域自然语言理解的特点,确定应用于产品设计的自然语言理 解应该采用基于知识为主的方法。其次,通过对目前现有的几种语义分析方法的 分析和比较,选择概念从属理论作为基于知识的方法的重要补充。然后,根据概 念从属理论建立了概念从属树来表示概念间的关系。并在详细分析概念内涵和外 延的基础上,用基于知识的方法建立了名词、动态名词和名词短语的模板。将名 词短语的识别归结为中心名词的识别及组成成分间关系确定,实现了基于名词间 偏正关系、同位关系及联合关系的名词短语的自然语言理解。再次,在以上工作 的基础上,编写出对名词短语进行语义分析的程序,可以实现对领域内名词短语 的理解。最后,将自然语言理解的语义分析应用于轴承设计需求分析原型系统, 对其中的名词短语进行识别,并结合系统其余模块的运行,经过初步调试,取得 了一定的成果。 关键词:自然语言理解语义分析概念从属理论产品设计名词短语 a b s t r a c t b a s e do nt h ea p p l i c a t i o no fn a t u r a ll a n g u a g eu n d e r s t a n d i n gt op r o d u c td e s i g n ,t h e n o u n p h r a s es u b o r d i n a t e t ou s e rr e q u i r e m e n t s ,w h i c h e x p r e s s e di nn a t u r a ll a n g u a g es t y l e i su n d e r s t o o da n da n a l y z e d w i t ht h ew h o l es y s t e mr u n n i n g ,t h er e s u l t sa r ec o n v e r s e d i n t ot h er e q u i r e m e n to f c o n c e p t u a ld e s i g nt os u p p o r tt h ef u t u r ed e s i g n f i r s t ,m e t h o db a s e do nk n o w l e d g es h o u l db ea d o p t e di n t h en a t u r a l l a n g u a g e u n d e r s t a n d i n ga p p l i e d t o p r o d u c td e s i g nd o m a i na c c o r d i n gt o t h ec h a r a c t e r i s t i co f n a t u r a l l a n g u a g eu n d e r s t a n d i n g i n p r o d u c td e s i g n d o m a i n s e c o n d ,c o n c e p t u a l d e p e n d e n c yt h e o r yi sc h o s e na sa ni m p o r t a n tc o m p l e m e n t a r i t yt ot h em e t h o db a s e do n k n o w l e d g e ,t h r o u g ha n a l y s i sa n dc o m p a r e s o fs e v e r a le x i s t i n gs e m a n t i ca n a l y s i sm e t h o d p r e s e n t t h i r d ,c o n c e p t u a ld e p e n d e n c yt r e e s a r cs e t u pb a s e d o nt h ec o n c e p t u a l d e p e n d e n c yt h e o r y t od e n o t et h er e l a t i o no fc o n c e p t s b yd e t a i l e d a n a l y s i s o ft h e i n t e n s i o na n dt h ee x t e n s i o no f c o n c e p t s ,n o u n ,d y n a m i cn o u na n dn o u np h r a s ec l a s s e s t e m p l a t e sa r ee s t a b l i s h e do nm e t h o db a s e do nk n o w l e d g e t h ee m p h a s i so f n o u n p h r a s e u n d e r s t a n d i n g i sp u to nt h es e a r c hf o rk e yw o r d sa n dt h ed e f m i t u d ea b o u tt h em l a t i o no f m e m b e r s 。a sar e s u l t ,a c c o m p l i s h e dt h eu n d e r t a n d i n go fn o u np h r a s eb a s e do nt h e a t t r i b u t i v e c e n t e r e dr e l a t i o n ,c o o r d i n a t er e l a t i o n 。a n da p p o s i t i v er e l a t i o n f o r t h ,s e m a n t i c a n a l y s i sp r o g r a mi sw r i t t e nt ou n d e r s t a n dn 0 1 mp h r a s eo nt h eb a s i so ft h ew o r kd o n e , w h i c hc a nu n d e r s t a n dt h ec h i n e s en o a np h r a s ei nc o r r e s p o n d i n gf i e l d s l a s t ,s e m a n t i c a n a l y s i so f n a t u r a ll a n g u a g eu n d e r s t a n d i n gi sa p p l i e dt or e q u i r e m e n t a n a l y s i sa r c h e t y p a l s y s t e mf o rt h ed e s i g no fb e a r i n g s t h en o u np h r a s ei nu s e rr e q u i r e m e n t si su n d e r s t o o d a n da n a l y z e d w i t ho t h e rm o d e l sr u u n i n g ,t h es y s t e mr u n sw e l la f t e rd e b u g k e yw o r d s :n a t u r a ll a n g u a g eu n d e r s t a n d i n g s e m a n t i ca n a l y s i s c o n c e p t u a l d e p e n d e n c yt h e o r yp r o d u c td e s i g n n o u n p h r a s e 第章绪论 第一章绪论 1 1 引言 随着企业生产自动化程度的目益提高,产品的功能与结构日趋复杂,产品设 计在整个生命周期内占有越来越重要的位置。作为只占5 产品成本的设计活动往 往决定占到7 0 8 0 的产品成本【l i 。因此,深入研究产品设计过程的特点及其方 法、规律成为产品设计的主要研究课题。 设计的过程一般分为:需求分析、概念设计和详细设计三个阶段。概念设计 阶段的主要目标是提出满足客户需求和设计指标的方案,此阶段决定着产品8 0 以上的最终价值【2 。详细设计阶段是将方案变成具体的产品结构和部件。对一些重 要的设计性能,关键的设计参数在这个阶段确定下来,并最终确定所有的详细参 数。尽管设计过程分为不同的设计阶段,但在各种设计阶段之间并无明确的界限, 各个设计阶段的不断重复在整个设计过程中都存在。产品设计的过程可描述为如 图1 1 所示: 图1 1 产品设计过程的描述 随着计算机技术的日益发展,产品设计过程正在发生彻底的变化,计算机已 渗透到产品设计开发与制造的各个环节。c a d 、c a e 、c a p p 、c a m 、p d m 等软 件的使用将使设计的对象和设计的过程模式化,通过建立设计对象的数学模型和 设计过程的模型,将使方案决策、设计计算、图纸绘制等阶段全都实现计算机化。 这样无论是方案设计、结构设计还是工艺设计,无论是设计图、计算说明书、技 术文件还是工艺卡片,都将不再使用纸张、尺子、笔和图板。现代设计将成为无 纸设计,计算机技术将使整个设计过程实现计算机化吼 然而上面所说的产品设计计算机化主要体现在产品的后期设计与制造阶段, 对产品开发的早期设计规划的支持不够,具体来说是对用户需求分析和概念设计 基于产品设计领域的名词短语语义分析 提供的支撑较少。而用户需求分析和产品概念设计恰是产品设计过程中极为重要 的步骤。目前,由于经济全球化的发展,产品竞争愈演愈烈,产品具有市场竞争 力的关键因素是满足用户需求,对用户需求的正确分析往往会为设计指明方向。 概念设计阶段能够产生新的有市场竞争力的概念或工作原理,是产品创新设计的 核心。然而我国企业特别是机械行业,概念设计目前仍然处于经验设计阶段,影 响了产品的市场竞争力。推广应用较成熟的设计理论,提高产品的创新设计能力, 对我国的产业调整,特别是机械行业的结构调整具有重要的意义f 4 。 如何通过计算机技术及人工智能技术快速有效地收集用户的需求信息,并且 对用户需求进行分析,将用户需求转化产品概念设计要求从而设计出满足用户需 求的产品,已经成为产品设计中越来越引人关注的问题。一般来说,用户不同于 专业的开发人员,他们对设计领域内的术语不是很了解或根本不了解,他们仅仅 以自己的通俗语言表达自己对产品的要求。要让计算机理解这种要求,就必须利 用自然语言理解这种手段,让自然语言理解充当用户和产品设计、分析等系统之 间的智能接口,通过了解用户想要什么,从而指导设计人员的工作。 本文尝试将自然语言理解应用于产品设计中,通过对以自然语言形式表达的 用户需求进行理解和分析,并将分析结果转化成概念设计要求,为后续设计提供 支持。希望本文的工作能够对上面所提到的问题有所帮助。 1 2 自然语言理解概述 伴随着计算机的日益普及、互联网的迅猛发展,社会的信息化程度越来越高。 面对越来越丰富的信息资源,人们渴望能用本民族语言以十分自然的方式同计算 机进行交流,由计算机去处理各种信息,从而满足自身的需要。自然语言作为信 息的重要载体,作为人与机器沟通的最自然的方式,使得对自然语占的计算机理 解格外重要5 1 。 1 2 1 语言理解的定义 现在计算机的智能还远远没有达到能够像人一样理解自然语言的水平,而且 在可预见的将来也达不到这样的水平。因此,关于计算机对自然语言的理解一般 是从实用的角度进行评判的。迄今为止,对语言理解尚无统一的和权威的定义。 按照考察问题的角度不同丽有不同的解释。从微观上讲,语言理解是指从自然语 言到机器( 计算机系统) 内部之间的一种映射。从宏观上讲,语言理解是指机器 能够执行人类所期望的某些语言功能,这些功能包括:( 1 ) 回答有关提问;( 2 ) 提取材料摘要;( 3 ) 不同词语叙述;( 4 ) 不同语言翻译。实现这些功能则认为计 算机具备了理解自然语言的能力 6 1 。 第一章绪论 语言的理解是一个极为复杂的认知过程。自然语言理解是语言学、逻辑学、 生理学、计算机科学和数学等相关学科发展和结合而形成的一门学科,它能够理 解口头语言或书面语言。然而,对自然语占的理解却是一个十分艰巨的任务,要 建立一个理解片言断语的计算机系统,也是很不容易的。一个能够理解自然语言 的计算机系统就像一个人那样需要上下文知识以及根据这些知识和信息进行推理 的过程l 勤。 对自然语言的全面理解,表达了人们期望语言理解所能达到的水平,但限于 人们对自然界的认识水平,建立一个这样的计算机系统只能作为人们长期、艰巨 和富有挑战性的任务,在相当长的一段时间内不会取得成功。 然而自从自然语言理解这一学科在2 0 世纪4 0 年代末期诞生以来,自然语言 理解在各个独立的领域内取得了巨大的成功,人们逐渐认识到在领域内实现自然 语言理解是可行的。 纵观这些成功的自然语言理解系统,都是将应用范围确定为某一特定的领域, 具有很强的针对性;而且这些系统基本上都采用基于知识的方法建立,在领域内 的应用能够达到专家级水平。随着专家系统和知识工程等技术的曰益成熟,以及 人们对自然语言理解研究的逐渐深入,建立某一领域内基于知识的自然语言理解 系统是能够取得成功的、是可行的。 1 2 2 自然语言理解的发展 自然语言理解是研究计算机如何理解人类语言的学问。大约在电子计算机问 世之初,人们对如何让计算机理解自然语言的研究就开始了。2 0 世纪4 0 年代末 期就有学者提出用计算机进行自然语言翻译的构想,并于5 0 年代初开展了机器翻 译试验。第一代翻译系统以词汇转换为主,很少进行句法研究,还不能称作“理 解”。 到了6 0 年代,乔姆斯基的转换生成语法得到广泛的认可,对句子的分析就是 利用短语结构规则自顶向下或自底向上地生成句法树,从而得到句子的句法结构。 转换生成文法把机器翻译带入句法分析的时代,也使得对自然语言的理解上升到 新的水平。 由于认识到生成语法缺少表示语义知识的手段,不利于自然语言的理解,在 7 0 年代随着认知科学的兴盛,学者们纷纷从语义的角度出发,提出语义理论,在 自然语言理解中大量引进语义、语境及语用的分析技术。2 0 世纪6 0 年代末期, m r q u i l l i a n 提出了语义网络理论,用于描述概念之间的关系;c j f i l l m o r e 提出了 格语法,用语义格和深层格框描述句义;1 9 7 3 年,r o g e rs c h a n k 提出了概念依存 理论,描述旬义和言语义;1 9 7 5 年,m a r v i n m i n s k y 提出了框架理论,用于描述事 物或概念状态。这些理论经过各自的发展,逐渐开始趋于相互结合。 4 基于产品设计领域的名词短语语义分析 到了8 0 年代一批新的语法理论脱颖而出,具有代表性的有词汇功能语法 ( l f g ) 、功能合一语法( f u g ) 和广义短语结构语法( g p s g ) 等。这些基于规 则的分析方法虽然基本上掌握了单个句子的分析技术,但是很难覆盖全面的语言 现象,特别是对于整个段落或篇章的理解还无从下手。 9 0 年代,在自然语言理解领域中,出现了基于语料库的方法,对大规模真实 文本进行处理。这些方法包括统计的方法、基于实例的方法等。对语料库的研究 分成工具软件的开发、语料库的标注、基于语料库的语言分析方法等三个方面, 通过词法、句法、语义等多层次的3 n 7 - 从未经处理的生语料中获取各种语言知识, 然后利用知识对语言进行分析理解。传统的语言分析方法和语料库方法的结合是 当前语言处理发展的趋势。 1 2 3 自然语言理解的应用 语言文字是人类社会信息的主要载体。随着全社会信息化进程的迅速发展, 语言文字计算机处理的重要性与紧迫性日益显现出来。互联网的迅猛发展极大的 刺激了自然语言处理在网上的应用,自然语言理解技术正在得到迅速的发展。自 然语言理解的应用领域十分广泛,这些应用可分为基于文本( t e x t b a s e d ) 的应用 和基于会话( d i a l o g u e b a s e d ) 的应用两个方面口j 。 基于文本的应用主要处理书面文本,典型的应用包括信息检索、信息提取、 信息获取、机器翻译、自动文摘和自动校对等等。信息检索研究如何从大量的文 本数据中按主题搜索出相关文章。信息提取研究如何根据主题在文章中提取信息。 信息获取研究如何根据关键字或概念在文章中获取信息。机器翻译研究如何将一 种语言自动翻译成另一种语言。自动文摘研究如何从文章中概括出中心思想,做 出摘要。自动校对研究如何对中文文档进行语法、错别字等的自动检查改正。 基于会话的应用主要用于人机通讯,通常针对口语。典型应用包括人机交互、 问答系统、教学系统和通用问题解答系统。人机交互研究如何使用自然语言和计 算机进行交流。问答系统研究如何使用自然语言进行数据库查询。教学系统研究 如何通过人机会话,进行计算机教学。通用问题解答系统研究如何用语音合一通 用问题解答系统对话。 1 3 名词短语的研究概述 名词短语是以名词为中心组合起来的语言单位,名词又可看作是无组合的名 词短语。对名词短语的识别主要是在名词研究的基础上,对其组成结构的讨论。 名词是词汇王国里的“大哥大”,现代汉语各个词类中,“名词是个开放的类,词 典里大部分是名词。名词不但比任何别的词类都多,并且比别的词类加在一块儿 第一章绪论 还多。”( 赵元任1 9 8 2 ) 古往今来,有很多学者对名词进行了研究。例如,古罗马语法学家们就曾对 名词作了大量的研究,并把名词的地位看得和动词同等重要;中世纪思辨语法学 派和m o d t s t m e 学派( r o l z n s t1 9 8 7 ) 则在研究名词的基础上,根据亚里士多德“实 体第一性”的哲学理论而提出了动词在句法上依存于名词的观点。 此外,在汉语语法学史上有金兆榨( 1 9 8 3 ) 对名词进行了研究。继之,何容 ( 1 9 4 3 ) 、吕叔湘( 1 9 8 2 ) 和王力( 1 9 5 4 ) 三位分别引进了叶氏的品级理论,吕先 生更独辟路径,提出了汉语句法中的补词( 相当于格语法中的“格”) 体系( 王珏 1 9 8 5 ) 。近年来,对名词研究予以特别关心的有邢福义、邵敬敏两位先生。邢福义 先生( 1 9 9 2 ) 说:“两个三角的研究不应该是先入为主的。对于许多问题,应 该大胆地重新审视。比方,在汉语语法结构里,名词的地位究竟如何认识,如何 评价? 到目前为止,大家的共同认识是动词最为重要,因此都在研究动词。诚然, 就具体的句子说,动词是组织的核心,名词围绕着动词转。从这一点上看,动词 无疑是十分重要的。但是,全面地从总体上看,决定汉语语法格局面貌的,似乎 是名词,而不是动词。理由是:不同汉语的动词本身没有什么变化。而旬式的形 成主要决定于动词前后的名词。如动词走本身没有什么变化,它的后边如果 出现不同的名词人、路、汽车等,就会形成不同的格式( 走人、走路、走汽 车) ;走+ 人前边,出现不同的名词明天和桥上,也因此形成不同的格 式( 明天走人、桥上走人) 。汉语没有印欧语言那样的形态,汉语里名词对动词来 说也许可以看作是一种松散的外部形态。动词是句子的组织核心,而句法格局面 貌却是因名词这种外部形态来确定的。能不能提出个名词决定论? 这当然需 要进一步研究和论证。”邵敬敏先生( 1 9 9 4 ) 在讨论次范畴的分类时也讲到:“人 们通常把注意力集中在动词的次范畴小类上。这样做无疑是正确的,但是,问题 在于我们的眼光不能仅仅是局限于动词的次范畴,实际上,在动词小类不变的条 件下,还要考虑到同动词结合的其他词主要是名词的次范畴小类,它也可能影响 到格式的成立与否。”邢、邵两位先生的见解无疑地为现代汉语语法尤其是名词语 法的深入研究指出了新的方向。 名词短语大致分为偏正类和联合类,其组成结构相当复杂,对其进行完全、 全面的研究往往比较困难,需要大量的工作。很多学者从不同的侧重点对名词短 语进行了研究。 以偏正类名词短语为例,关于定语的性质和作用方面的研究有:新著国语文 法中认为对句子中的主语、宾语或补足语而言,定语就是它们的“形容性的附 加语”;暂拟汉语教学语法系统则认为对名词而言,定语是“修饰或者限制名 词的成分”;黄伯荣、廖序东主编的现代汉语中认为,兼对主语、宾语或其他 名词性中心语而言,“定语是主语、宾语或其他名词性中心语前面的附加成分:胡 6 基于产品设计领域的名词短语语义分析 裕树编的现代汉语增订本中认为定语是“名词性偏正词组的修饰语”。 对于定语的分类,纯语法学的研究最初按词性的不同将定语划分为名词性的 和形容词性的,进一步的分类最为细致的见于赵金铭“的”、“地”源流考一文 ( 语言教学语言与研究,1 9 9 7 年第四期) ,文中将“的”字前修饰语分成十种结 构。随着语言研究的逐步融入语义知识,语言学家们开始从语义的角度来研究定 语。如( 黎锦熙,1 9 5 8 ) 将“领位”相当于定语分为统摄性、修饰性、主语性( 附 宾语性) 三类;有将名词前的定语按语义关系分成领属性的、统一性的、一般性 的三类的( 丁声树,1 9 7 9 ) ;有分为领属、性状、范围、指量、特征等五大类别的 ( 林杏光,1 9 9 6 ) ;有分为领属、时地、指别、数量、行为、断事、涵义、性状等 八个类别的( 邢福义) ,等等。 对于动词作定语的情况,陈爱文( 1 9 8 6 :3 6 ) 认为“能作定语”是双音动词 的“可容许性能”;朱德熙( 1 9 8 5 ) 、陆俭明( 1 9 8 8 ) 、袁毓林( 1 9 9 5 ) 则认为:动 词一般不能直接作名词的定语;莫彭龄、丹青( 1 9 8 5 ) 统计得出动词作定语的出 现率是6 5 2 ( 包括动词+ 的作定语) ;胡明扬( 1 9 9 6 b ) 认为:如果把动词和动词 短语加“的”后作定语的情况排除,动词能直接作定语的出现率会更低,就可以 按一般和特殊的原则来处理。但是也有学者持相反观点,如邵敬敏( 1 9 9 5 ) 认为: 极大多数的双音动词都可以不同程度地直接修饰双音名词。 本文主要是用语义分析的方法,在初步界定名词短语范围的前提下,对名词 短语的组成结构进行分析,识别出中心名词及其修饰成分,并对基于名词间偏正 关系、同位关系及联合关系的名词短语进行语义理解。 1 4 本文的主要工作 针对产品设计计算机化对产品开发的早期设计规划的支持不够,对用户需求 分析和概念设计提供的支撑较少的问题,本文初步探讨了自然语言理解的语义分 析在产品设计中的应用。同时,基于概念在语言表达中的重要地位,我们对以自 然语言形式表达的用户需求中的名词短语进行了理解和分析,并将分析结果作为 计算机产品需求分析的初始条件,为后续的需求分析和产品设计提供支持。本文 完成的主要工作如下: 1 了解国内外自然语言理解领域的动态,分析基于知识的方法在自然语言理 解中的重要作用,并结合设计领域自然语言理解的特点,确定了在产品设 计领域内应用自然语言理解应该采用基于知识的方法。 2 通过对现有的几种语义分析方法进行讨论,并结合基于知识的自然语言理 解系统的实际情况,选择概念从属理论作为基于知识方法的重要补充,深 入讨论了其在基于知识系统的优点。 第一章绪论 3 应用概念从属理论建立了可以大大减小知识库的概念从属树,并在对概念 内涵和外延进行深入阐述的基础上,以基于知识的方法建立了名词和动态 名词模板,来表示概念和实例概念。 4 通过对名词短语组成结构及名词问关系的深入探讨,确定了名词短语语义 分析的重点为中心名词的识别和组成成员间关系的确定,并实现了基于名 词间偏正关系、同位关系及联合关系的名词短语自然语言理解。 5 在以上工作的基础上,编写了对语句中名词短语进行语义分析的规则,可 以实现对领域内汉语语句中名词短语的理解。 6 结合机械领域,通过对用户需求信息中名词短语的理解和分析,并结合系 统的其余模块,实现了语义分析在轴承设计需求分析原型系统中的应用。 总之,全文结合名词短语的语义分析在产品设计中的应用,从选择自然语言 理解的模型出发,讨论了概念的知识表示和概念间可形成的关系,探讨了对名词 短语进行语义分析的方法,并实现了基于名词间偏正关系、同位关系及联合关系 的名词短语自然语言理解。结合实际应用,取得了一定的成果,相信这一工作对 自然语言理解在各个领域中的应用都是有益的。自然语言理解一直是人工智能学 科内引人注目而又困难重重的一个核心研究课题。随着计算机技术和人工智能总 体技术的发展,自然语言理解不断会取得进步,前途是光明的。 基于产品设计领域的名词短语语义分析 第二章自然语言理解系统的语义知识表示 2 1 自然语言理解体系 所谓语言理解,特别是面向计算机进行的语言理解,如果不是全部,至少也是 在很大程度上,可以看作是关于语言成分与语言成分之间搭配( 组合) 的研究。 无论是范畴知识也好,规则知识也好,最终目标只有一个,那就是回答“x 跟y 能不能搭配”这样的问题。什么时候计算机能够轻松而正确的回答所有这样的问 题,什么时候计算机看上去就是理解自然语言了f l “。 一个成分跟另一个成分能否搭配,是由多种因素决定的。通常,我们把这些因 素称为句法因素、语音因素、语义因素、语用因素和常识因素等等。具体到两个 实际使用的语言成分能否搭配,可能是由这些诸多的因素中的一个在起作用,也 可能是若干个因素在起作用。实际上,能与不能的情况是不平衡的。两个成分要 能够搭配,需要这两个成分满足所有制约因素的要求,而只要有一个制约因素的 要求他们不能满足,就足以造成他们不能匹配。 人们能正确的判断成分间的搭配关系,是由于人们掌握以下几个层次的知识: 1 词法层( m o r p h o l o g i c a ll e v e l ) :研究词是如何由意义的基本单位一词素构 成的。 2 句法层( s y n t a c t i cl e v e l ) :研究词是如何组合成正确的句子的,词在句子 中的语法作用,以及哪些短语是其他短语的组成部分。 3 语义层( s e m a n t i cl e v e l ) :研究如何从一个句子中词的意义,以及这些词 在该句的语法结构中的作用来推导出该句的句义。语义分析是计算机理解 自然语言的基础。 4 语用层( p r a g m a t i cl e v e l ) :研究在不同的上下文环境中旬子的使用。 5 话语层( d i s c o u r s el e v e l ) :研究前句对当前词义或句义的影响。 要让目前的计算机像人一样掌握全套的这些关于语言的知识( 即在各个层次上 面描述成分间的所有搭配制约因素) ,难度太大。因此,在早期计算机语言理解的 研究中,主要是在句法层面描述语言成分问的搭配,尤其是对印欧语的理解,取 得了一定的成果。 但是,汉语与印欧语不同,关于成分闯的搭配,其句法制约因素少一些;相应 地,语义制约因素更复杂一些。因此,对汉语只进行句法层面的研究产生了许多 解决不了的问题。于是人们提出汉语应该走有自己特色的、语义语法的路线,合 理的做法应该是,依托那些比较死板的、看上去没有道理好讲的句法知识( 比如 第二章自然语言理解系统的语义知识表示 “数词跟量词搭配的语义知识”) ,同时引入语义知识( 这是跟计算机讲讲人的道 理,比如只能“吃面包”,不能“吃车辆”) 、语用知识,分层次,逐渐完成对句子 的理解。因而语言的分析和理解过程是一个层次化的过程,这个过程一般分为 如下所示的3 个层次:语法分析,语义分析和语用分析。 1 句法分析一主要是使用词法层和句法层的知识,完成对句子中分词、短语 层的划分,对短语和句子的句法结构进行分析。 2 语义分析一主要用语义层的知识赋予由句法分析所建立的结构以意义,即 在句法结构及任务领域内的物体间进行映射变换,完成对语句的理解。 3 语用分析一在段落、篇章层中用语用层及话语层的知识来确定语句真正的 含义,对表达的结构重新做出解释,从而完成对整个段落、篇章的理解。 这样实际上就是把语言成分的搭配能力放在了不同的层面上进行描述。根据 目标的要求,系统可以选择调用其中若干个或者全部层级的语言知识,这样一方 面便于知识的模块化,一方面也利于避免范畴间的相互干扰。同时,各层次间的 分界线是非常模糊的,并非是完全隔离的,它们有时串行进行,有时却并行进行。 若是串行进行,则下一个状态的形成借助于上一个状态的完成。 这其中语义分析愈来愈成为一个重要的研究内容。这是由于在语言自动理解 中,语义分析进行的好坏,直接关系到对自然语言进行理解的程度。自然语言的 模糊性和不精确性,计算机贫乏的语言知识,使得对语言的分析理解很困难。特 别对汉语这种缺乏形态特征的语言,仅有句法知识还不足以解决分析中遇到的各 种问题。对语言进行语义分析,找出词义、结构意义及其结合意义,从而使计算 机确定语言所表达的真正含义或概念,这无疑对语言的理解会有很大帮助;此外, 自然语言的一大特点就是充满了歧义。句法分析达不到令人满意的效果,也是由 于其不能很好的解决自然语言中的各种歧义现象。利用语义对自然语言进行语义 分析,有利于解决句法分析不能解决的歧义问题,从而更好的理解语言。 语义f 分析在语言的理解中主要有以下三个重要用途: 1 词义的消歧 汉语的同行歧义现象十分常见。一个词既使只有一个词类,也可以有不同 的义项,这时仅靠句法知识来解决就显得能力不足。词义本就属于语义的 范畴,词在与其它词搭配的过程中以及在相关的上下文环境中,总受到一 定的语义约束。因此,语义知识的一个重要应用就是解决词义消歧问题。 2 句法结构消歧 汉语句法成分的构成方式十分灵活,而又缺乏形态变化,这使得汉语的句 法结构分析十分困难,会产生很多错误的结果,而且句法分析得到的合法 的句法结构不一定有正确的逻辑意义。语义知识可以用来对句法结构进行 语义检验,排除意义不正确的句法结构。 基于产品设计领域的名词短语语义分析 3 语义关系的获取 对语言的理解不仅要确定言语中词的含义,还要确定词间的逻辑关系,这 样才能得到正确的言语义。在语义分析中用语义知识可以帮助我们获得语 言片断各成分之间的语义关系,有利于语言的理解。 因此,在本系统中我们依托较死板的语法知识,选用了以语义分析为主,语用 知识为辅的自然语言理解方法。但就目前的情况而言,语法分析相对成熟,语义 分析逐渐成为研究重点。而语用分析则是在篇章的范围内分析省略、指代和句子 的固有歧义等问题时才用到。故本文将研究重点集中在了自然语言理解的语义分 析上。 自然语言理解和人工智能的其它领域一样,面临的根本问题都是知识表示和知 识利用问题,而其核心则是语义知识表示和利用,同时,语义知识的表示也是语 义分析的中心课题。 2 2 现有的语义知识表示 所谓知识的表达方式实际上就是对知识的一种描述,或者说是一种约定,种 计算机可以接受的用于描述知识的数据结构。对知识进行表示的过程就是把知识 编码成某种数据结构的过程。知识的表达方式又称为知识表示技术,其表示形式 称为知识表示模式。 关于自然语言的语义知识表示理论,主要有语义网络( s n ) 、谓词逻辑( p l ) 、 格语法,概念从属理论等。这些方法各有优缺点,下面进一步进行讨论。 2 - 2 1 谓词逻辑1 6 1 用谓词逻辑来表达语义由来已久,目前用于表达自然语言语义的符号逻辑,多 为一阶谓词逻辑( f o p l ) 。它的优点在于: 1 比较灵活、精确地表达自然语言的意义。 2 简易自然,易于实现。 3 适用于事实的推理,句子意义的推导以及获取隐含的意义关系。 谓词逻辑将自然语言转换成用谓词、函数、变量、常量、量词、逻辑联词等组 成的符号结构。这些符号是表达语义的基本元素。使用谓词逻辑句法规则,可以 用它们组成有效的语义结构。如果采用相应的推理规则,对这些结构进行比较、 组合和转换操作,可以从已知的结构推导出新的结构。 逻辑式分为有效式和无效式。凡按一定规则构成的逻辑式为有效式,否则为无 效式。简单的逻辑式通过逻辑联词,可以组成复合式。 语义是根据真值表,通过“解释”得到演算,被赋以逻辑式的。用谓词逻辑表 第二章自然语言理解系统的语义知识表示 示的句子语义只有两个互补的值,常用布尔代数( 真或假) 来区分。谓词逻辑的 语义是基于领域d 的。d 是用于常量和函数定义的所有元素或对象的集合。 有了句法、真值表和领域,即可对逻辑式的语义进行演算,判断其真假。此外, 还可以对不同句子的某些语义关系做出判断。如:当两个逻辑式的语义解释一样 时,则它们是语义等价的;当两个逻辑式的语义解释式互为否定,则它们是语义 矛盾的;当一个逻辑式有两种以上的语义解释,则它是歧义的。 由于一阶谓词逻辑是一种形式语言,其根本目的在于把数学中的逻辑论证符号 化。虽然目前的数学水平比较高,但要完全用数学对世界万物进行描述,显然还 不够现实。 2 2 2 格语法【8 】 格语法是影响较大、应用较广的一种语义分析方法。格语法的基本观点是:任 何句子都具有一个深层的意义结构,它由动词及其相关的名词短语组成,这些名 词短语按其与动词的关系,在句中表示各自的作用( 即充当不同的格) 。格语法注 重的是各句法成分之间的语义关系问题,对于单词语义的表示,目前一般有两种 方法,其一是所谓的“义素”分析法,它是建立于意义是可分解的理论之上的语 义表示体系。另外一种方法是建立于“类属”词典之上。这种方法对语义知识的 表示有以下特点: 1 所表示的语义信息与领域无关,具有通用性; 2 这种表示所反映的是句子中语言单位所含概念之间的抽象关系,而不是句 子的具体含义; 3 这种表示的语义中心由动词体现。 这种方法的缺点是:“格”的概念有时不容易确定,每个人构造的格框架在名 称、种类和数目上都不一致;更令人遗憾的是这种方法是建立在“以动词为中心” 的基础上( 其前提是承认每个句子必定包含动词) ,由于汉语不是以动词为中心( 许 多汉语句子可以不包含动词,这是汉语的重要特点之一) ,所以这种方法尽管在西 方有很大影响,却难以满足汉语理解的要求。 2 2 3 语义网络【9 】 语义网络是由美国人工智能学家m r q i l l i a n 首先提出来的一种语义分析和表 示方法。它的基本原理是以概念为基点,按定的语义关系将不同的概念连接起 来,构成一种语义表达形式。这种形式可以用来分析并记忆句子所包含的语义关 系,并在需要时生成和输出有意义的语句,执行自然语言处理和理解的任务。 在语义网络中,基本元素是节点和弧。节点代表概念,它的值是词、词组及短 语。弧是有向的,用来表示节点之间的语义关系,这些关系包括格关系、旬态关 基于产品设计领域的名词短语语义分析 系、连接关系、属性关系、限制关系、集合关系、存在关系等。 语义网络表示由下列四个相关部分组成: 1 词法部分决定表示词汇表中允许有哪些符号,它涉及各个节点和弧线。 2 结构部分叙述符号排列的约束条件,指定各弧线连接的节点对。 3 过程部分说明访问过程,这些过程能用来建立和修正描述,以及回答相 关问题。 4 语义部分确定与描述相关的( 联想) 意义的方法,即确定有关节点的排 列及其占有物和对应弧线。 经过分析的语义关系,按一定的数据结构存放在存储器中。根据语义网络中的 信息,计算机可以完成各种语言信息处理任务,如问询、文摘生成、逻辑推理等。 语义网络的优点有: 1 能把实体的结构、属性与实体间的因果关系显式地和简明地表达出来,与 实体相关的事实、特征和关系可以通过相应的结点弧线推导出来。 2 由于与概念相关的属性和联系被组织在一个相应的结点中,因而使概念易 于受访和学习。 3 表现问题更加直观,更易于理解,适于知识工程师与领域专家沟通。语义 网络中的继承方式也符合人类的思维习惯。 然而语义网络也有其不可避免的特点: 1 语义网络结构的语义解释依赖于该结构的推理过程而没有结构的约定,因 而得到的推理不能保证十分正确。 2 结点间的联系可能是线状、树状或网状的,甚至是递归状的结构,使相应 的知识存储和检索可能需要比较复杂的过程。 3 结构庞大、复杂,系统开销大。 此外,目前还有其它一些语义分析的方法。其中一种是在a t n 句法分析网络【1 4 】 的弧上附加和语义有关的测试和操作,因而使a t n 具有一定的语义分析能力。这 种方法对于句子的语义解释依赖于具体应用场合,因此只适用于解决特定领域的 问题而不适于作为一般的语义知识表示。另一种方法是直接制定一套语义语法, 这种语法是一种扩展的上下文无关文法,它把大量的语义信息植入到句法描述中, 从而构成一套文法形式的语义规则。语义语法可以避免许多句法分析过程中可能 出现的歧义现象,并能排除一些无意义的句子,因而有很高的分析效率。其缺点 是语义规则与应用领域有关,一旦领域改变则所有语义规则几乎要完全重写,因 而也只适合于特定领域。 上面介绍的各种语义表示方法及相应的分析技术虽然各有特点,并且已经得到 了不同程度上的应用,但是都存在一个共同性问题,即当句子含义涉及到和上下 文有关或者和背景知识甚至联想知识有关时,这些方法就显得无能为力了,只能 第二章自然语言理解系统的语义知识表示 留待后面的语用分析过程去解决,换句话说,这些方法都是纯粹的语义分析方法 不能满足我们的需要。 2 3 概念从属理论 s c h a n k 提出的概念从属理论( c o n c e p t u a l d e p e n d e n c y t h e o r y ) ,是一种表达自然 语言句子意义的理论,对语义元素作了深层次的抽象,把它们归约成了若干个语 义基元。语义基元是意义的最小单位,因而是不可再分割的。凡意义相同的词或 句子,都可由相同的语义基元以及表示语义关系的有向弧来表示。它的基本思想 如下所示: 一、从语言心理学出发 1 人认识语言的过程,实际上是把一种语言映射到某种概念基的过程。概念 基中概念的数量不应该很多,其中最基础的是行为( a c t i o n ) ,按s h a n k 的 设想,称为原型行为( p r i m i t i v e a c t i o n s ) 。 2 从语言心理学出发,认为人对语言的理解,并不是先从语法和语义开始的。 不会是先学好了语法和语义再来理解一个句子。一个句子所包含的独立于 语言的东西,不是语法,语义,而是它的概念。 3 理解语言的过程,是一词一词理解的,而不是听完了整句,弄清了主语、 谓语、之后再理解,而是一面听一面理解的。听完了最后一个词,整 句也就理解了。 4 从单词到句子,反映了概念与概念之间的相互联系。 二、概念驱动的理论 1 以词的概念为基的理解系统,词汇只是概念的符号,从整体而言,在这样 的系统里,没有词的概念。最基础的概念集合组成概念基,概念基是以动 词为核心的。 2 一个词所能包含的信息是极其丰富的,包含词条信息、词法信息、句法信 息、语义信息和概念信息,甚至可预期上下文信息和篇章( 文本) 知识等 等。因此,这样的理论体系里,机器的理解就是利用这些信息启动实现的。 3 知识和处理知识的机构应该是相互独立的,以便于知识的积累和丰富系统 的处理能力。 2 3 1概念从属的知识表达【l o 】 一个句子概念从属的表达,并非建立在与句中单词相对应的原语之上,而是建 立在概念原语之上,这些概念原语合并起来,就构成了单词在任一特定语言中的 意义。语义网仅提供种结构,它以任意级别表达的信息都可放在这个结构里。 1 4 基于产品设计领域的名词短语语义分析 概念从属同时提供了用于表达特殊信息块的一种结构和一组特殊原语。 作为概念从属表达知识的一个简单的例子: 小王吃糖。 糖被小王吃了。 这两个句子的概念从属表达式都是是“小王一摄取一糖”。其中“一”表示从属方 向。 概念从属不仅提供了一种知识表达结构,而且还提供了一组能构造表达的结构 模块。这样的集合包含一组原语行为,用它们能构造对应于词语的高级行为。虽 然各种概念从属资源提供的原语行为集略有差别,但一般均有s e h a n k 于1 9 7 7 给 出的原语集: a t r a n s 抽象关系的转移。如:g i v e ( 给) p t r a n s 一对象物理位置的转移。如:g o ( 去) p r o p e l 对对象施加物理力量。如:p u s h ( 推) m o v e移动自己的某一部分。如:k i c k ( 踢) g r a s p行为者控制对象。如:t h r o w ( 抛) i n g e s t动物摄取对象。如:e a t ( 吃) e x p e l 动物体内排出某些东西。如:c r y ( 哭) m t r a n s思维信息的转移。如:t e l l ( 告诉) s p e a k 产生声音。如:s a y ( 说) m b l d依据原有信息建立新信息。如:d e c i d e ( 决定) a t t e n d将感官器官的注意力向着刺激。如:l i s t e n ( 昕) 虽然s c h a n k 给出的行为原语是用英语单词的形式表示,仔细研究下这些原 语,可以发现对汉语的理解同样也是适用的,毕竟语言本身所表达的概念的含义 是相同的,并不取决于语种的区别。概念从属理论本身就是一种不依赖于语言和 语法的理论,汉语的语言理解同样可以应用概念从属理论。 构造组合模块的次要集,是描述在一语句中的那些概念之间的可容许从属性的 集合。有四个原语概念类别,用之可构造从属性结构。它们是: a c t行为 p p对象( 图像发生器p i c t u r ep r o d u c e r ) a a行为修饰语( 行为的辅助设各a c t i o n a i d e r ) p a对象修饰语( 图像发生器的辅助设备p i c t u r e a i d e r ) 此外,从属结构自身可以是概念化了的,并可作为更大的从属结构的组分。概 念化了的从属关系对应于基础概念的语义关系。 2 3 2概念从属理论的优缺点 第二章自然语言理解系统的语义知识表示 在基于知识的自然语言理解系统中采用概念从属理论作为语义分析方法,具有 很多优点; 一、知识推理方便 在三个重
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2023年邢台辅警招聘考试真题附答案详解(轻巧夺冠)
- 2024年威海辅警协警招聘考试真题有完整答案详解
- 2024年安庆辅警招聘考试真题含答案详解(精练)
- 2023年鹤岗辅警招聘考试真题及一套答案详解
- 2024年佳木斯辅警招聘考试题库及完整答案详解
- 2023年黔南布依族苗族自治州辅警招聘考试题库及答案详解(考点梳理)
- 2023年萍乡辅警招聘考试真题含答案详解(综合卷)
- 2024年咸阳辅警协警招聘考试真题及答案详解(各地真题)
- 2024年三亚辅警招聘考试题库含答案详解(黄金题型)
- 2023年许昌辅警协警招聘考试真题含答案详解(基础题)
- 2025年公务员考试《行测》模拟题及答案(详细解析)
- 《计算机制图-中望CAD 2023》中职全套教学课件
- 视觉创意合同范本
- 福建省福州市部分学校2025届九年级化学第一学期期中监测试题含解析
- 幼儿园拍摄技巧培训
- 社区获得性肺炎教学课件
- 2024电子工业基础设施安装工程抗震技术规范
- 鱼养殖计划书
- 2023年石材检测报告
- 2023年大型集团企业IT信息化安全架构规划设计方案
- 河北省生态功能区划报告(技术报告)
评论
0/150
提交评论