(机械制造及其自动化专业论文)面向产品设计领域的汉语名词短语在篇章中的语义分析.pdf_第1页
(机械制造及其自动化专业论文)面向产品设计领域的汉语名词短语在篇章中的语义分析.pdf_第2页
(机械制造及其自动化专业论文)面向产品设计领域的汉语名词短语在篇章中的语义分析.pdf_第3页
(机械制造及其自动化专业论文)面向产品设计领域的汉语名词短语在篇章中的语义分析.pdf_第4页
(机械制造及其自动化专业论文)面向产品设计领域的汉语名词短语在篇章中的语义分析.pdf_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 本文将自然语言理解应用于产品设计中,对以自然语言形式表达的用户需求 中名词短语进行理解和分析,同时结合系统其余模块的运行,将最终的分析结果 转化成概念设计要求,为后续设计提供支持。 首先,根据设计领域自然语言理解的特点,确定应用于产品设计的自然语言 理解应该采用基于知识为主的方法。其次,通过对汉语语义特点的分析,选择概 念从属理论作为基于知识的方法的重要补充。然后,根据概念从属理论建立了概 念从属树来表示概念间的关系。在详细地分析了概念的内涵和外延的基础上,用 基于知识的方法建立了名词、动态名词、名词短语的模板。在分析了基于名词间 的偏正结构、联合结构、事件类名词的基础上,分析了它们之间的耦合类型和耦 合特点,并实现了名词短语之间的耦合关系的自然语言理解。分析和实现了篇章 中的名词聚类在名词短语语义理解中的消岐。再次,在以上工作的基础上,设计 出对复杂名词短语进行语义分析的程序,可以实现对领域内名词短语的理解。最 后,将自然语言理解的语义分析应用于凸轮机构设计需求分析原型系统,对其中 的名词短语进行识别,并结合系统其余模块的运行,经过初步调试,取得了一定 的成果。 关键词:自然语言理解语义分析概念从属产品设计名词短语 a b s l r a c t a b s t r a c t b a s e do nt h ea p p l i c a t i o no fn a t u r a ll a n g u a g eu n d e r s t a n d i n gt op r o d u c td e s i g n , t h e n o u np h r a s es u b o r d i n a t et ou s e rr e q u i r e m e n t s ,w h i c he x p r e s s e di nn a t u r a ll a n g u a g es t y l c , i su n d e r s t o o da n da n a l y z e d w i t ht h eo t h e rs y s t e mr u n n i n g , t h er e s u r sa r ec o n v e r s e d i n t ot h er e q u i r e m e n to fc o n c e p t u a ld e s i g nt os u p p o r tt h ef u t u r ed e s i g n h r s t l y ,m e t h o db a s e do nk n o w l e d g es h o u l dh ea d o p t e dt ot h en a t u r a ll a n g u a g e u n d e r s t a n d i n ga p p f i e dt op r o d u c td e s i g nd o m a i na c c o r d i n gt ot h ec h a r a c t e r i s t i co f n a t u r a ll a n g u a g eu n d e r s t a n d i n gi nd e s i g nd o m a i n s e c o n d l y , c o n c e p t u a ld e p e n d e n c y t h e o r yi sc h o s e na sa ni m p o r t a n tc o m p l e m e n t a r i t yt ot h em e t h o db a s e do nk n o w l e d g e , b yt h ea n a l y s i so fs e m a n t i ca n a l y s i so f t h ec h a r a c t e r i s t i co fc h i n e s e t h i r d l y , c o n c e p t u a l d e p e n d e n c yt r e e sa r cs e tu pt h a tb a s e do nt h ec o n c e p t u a ld e p e n d e n c yt h e o r yt od e n o t e t h er e l a t i o no fc o n c e p t s b ya n a l y s i so fd e t a i l so ft h ei n t e n s i o na n dt h ee x t e n s i o no f c o n c e p t s ,n o u n ,d y n a m i cn o u n , a n dn o u np h r a s et e m p l a t e sa r ee s t a b l i s h e d0 1 1m e t h o d b a s e do nk n o w l e d g e i ti sa n a l y s e dt h et y p ea n dc h a r a c t e r i s t i co fe a c hk i n do fc o u p l i n g r e l a t i o na m o n gt h ea t t r i b u t i v e c e n t e r e dr e l a t i o n ,c o o r d i n a t er e l a t i o na n de v e n tn o u nt h a t b a s e do nt h es e m a n t i ca n a l y s i so ft h e m i ti sa c e o m p f i s h e du n d e r s t a n d i n go ft h e c o u p l i n gr e l a t i o no f t h e m i ti sa c c o m p l i s h e da n a l y s i so ft h ee r a s i n gd i f f e r e n tm e a n i n g s o fs e m a n t i cu n d e r s t a n d i n go fn o u np h r a s ei nn o u n - c l u s t e r i n go fd i s c o u r s ea n a l y s i s f o r t h l y , s e m a n t i ca n a l y s i sp r o g r a mi sd e s i g n e dt ou n d e r s t a n dt h es e n t e n c eo nt h eb a s i s o ft h ed o n ew o r k , w h i c hc a nu n d e r s t a n dt h ec o m p l e xn o u np h r a s ei nc o r r e s p o n d i n g f i e l d s l a s t l y , s e m a n t i ca n a l y s i so fn a t u r a ll a n g u a g eu n d e r s t a n d i n g i s a p p l i e dt o r e q u i r e m e n ta n a l y s i sa r c h e t y p a ls y s t e mf o rt h ed e s i g no fc a mg e a r s t h en o u np h r a s ei n u s e rr e q u i r e m e n t si su n d e r s t o o da n da n a l y z e d w i t ho t h e rm o d e l sr u n n i n g ,t h es y s t e m l u n sw e l la f t e rd e b u g i n g k e yw o r d s :n a t u r a ll a n g u a g eu n d e r s t a n d i n g s e m a n t i ca n a l y s i s c o n c e p t u a l d e p e n d e n c yp r o d u c td e s i g n n o u np h r a s e 声明 西安电子科技大学 学位论文创新性声明 秉承学校严谨的学风和优良的科学道德,本人声明所呈交的论文是我个人在 导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标 注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的研究成 果也不包含为获得西安电子科技大学或其它教育机构的学位或证书而使用过的材 料。与我一同工作的同志对本研究所做的任何贡献均已在论文中做了明确的说明 并表示了谢意。 申请学位论文与资料若有不实之处,本人承担一切的法律责任。 本人签名:诬i 习堑 西安电子科技大学 关于论文使用授权的说明 本人完全了解西安电子科技大学有关保留和使用学位论文的规定,即:研究 生在校攻读学位期间论文工作的知识产权单位属西安电子科技大学。学校有权保 留送交论文的复印件,允许查阅和借阅论文;学校可以公布论文的全部或部分内 容,可以允许采用影印、缩印或其它复制手段保存论文。同时本人保证,毕业后 结合学位论文研究课题再撰写的文章一律署名单位为西安电子科技大学。( 保密的 论文在解密后遵守此规定) 本人签名: 导师签名: 煎f 虱堡 第一章绪论 第一章绪论 1 1 引言 创新设计是近几年兴起的一个热门概念,是目前设计领域的潮流,但对创新 设计的误解也是普遍存在,很多企业都仅仅是为了创新而创新1 1 1 。其实,决定一个 产品的创新的成败与否,是看这种创新是否具有市场的支持,是否与消费者的需 求产生共鸣。因此,我们的创新应该是取决于消费者未被满足的需求和愿望,而 非简单的主观的认为需要创造出一点新的东西出来。 产品设计是生产制造的基础,必须根据设计来生产产品,而产品总成本的7 5 以上以及所有的产品性能在产品设计阶段就已经确定,所以,一个产品设计的 好坏直接影响着企业的竞争能力【2 1 。产品设计是基于知识、基于信息的设计。产品 制造过程中主宰产品竞争力的决定因素是信息和知识要素的增值。因此设计过程 就是获取知识、获取信息和应用知识、利用信息的过程【3 】。如何快速把对用户需求 的深刻理解转化成可以决定产品属性的、可行的见解和思想以及如何快速进行设 计成果转化等都是迫切需要解决的问题。然而当前计算机系统对产品设计、制造 过程中所需知识、信息的获取、组织、传递及运用仍停留在低水平,这是制约产 品创新的瓶颈。 产品创新设计不是形而上学的空谈设计,也不应该是盲目的改造或创新,它 是要真正解决问题,满足用户需求和期望值的创造【4 j 。这就要求设计者不仅要有高 瞻远瞩的眼光,通过运用独特的思维和集体智慧,独具慧眼,分析潜在需求,科 学的预测未来市场需求和趋势,充分发挥设计者的创新能力,以前瞻性和独创性 的产品,创造和开发新的市场空间。产品创新设计的过程既复杂而又具有创新性, 但如同任何自然过程一样,产品创新设计过程也具有其特有的规律性,分析产品 设计的一般规律,并将其过程和结果规律化、数字化、模型化,并据此逐步开发 出智能化的、支持产品全生命周期的计算机产品设计系统,将极大的提高产品创 新设计的水平,提高我国科学技术的核心竞争力,从而促进人类社会的文明与进 步。 1 2 产品设计过程 产品设计是一个复杂的过程,不同的企业设计过程也不同。为了对这些不同 的设计过程进行描述,采用设计过程模型,该模型是设计过程的一种抽象【5 】o 产品 设计过程一般分为:需求分析、概念设计和详细设计三个阶段。将其分解为不同 2 面向产品设计领域的汉语名词短语在篇章中的语义分析 的阶段,具体如图1 1 所示。 ( 1 ) 需求分析可分解为了解用户需求和进行问题分析两个阶段。产品开发总是为 了满足一定要求而进行的。在了解用户需求后,进行问题分析,对待设计的 对象定义、确定各种约束、标准及可用资源等。 ( 2 ) 概念设计首先要确定待设计系统的功能,之后是确定实现该功能的效应,最 后确定工作原理。概念设计的核心是确定待设计产品新的、有市场竞争力的 工作原理。 ( 3 ) 技术设计是要完成产品的总体结构设计。如有几个可行方案,还需最后确定 一个方案。 ( 4 ) 详细设计是完成全部生产图样及技术文件。确定所有的未定参数,得到一个 精确无二义的产品实例模型。其中,每个设计阶段,又都经过综合、分析和 评价等的循环反复才完成的,且在一定的知识指导下进行的。当然,知识是 可变更的。 图1 1 产品设计过程流程图 从上面几个步骤可以看出,产品设计是经过多次综合、分析、选择才从最初 的设计说明最终得到设计概念( 即方案原理解) 的。 产品设计领域需要涉及到需求分析以及概念设计等,而用户的需求大多数是 用自然语言来描述的。随着产品设计的计算机化,其相应的需求分析以及概念设 计都需要自然语言理解才能够实现。自然语言理解在产品设计中的应用,主要在 于产品设计的前期。现在,特别是很多智能型的分析系统,为了方便用户的使用, 很多都已经开始考虑涉及自动进行用户需求分析、概念设计等,也就是应用自然 语言理解i o j 。 本文尝试将自然语言理解应用于产品设计中,通过对以自然语言形式表达的 用户需求进行理解和分析,并将分析结果转化成概念设计要求,为后续设计提供 支持。希望本文的工作能够对上面所提到的问题有所帮助。 第一章绪论 3 1 3 自然语言理解现状 自然语言是指人类语言集团的本族语,如汉语、英语等,它是相对于人造语 言而言的,如c 语言、j a v a 语言等计算机语言 7 1 。语言是思维的载体,是人际交 流的工具,人类历史上以语言文字形式记载和流传的知识占到知识总量的8 0 以 上。就计算机应用而言,有8 5 左右的应用都是用于语言文字的信息处理。在信 息化社会中,语言信息处理的技术水平和每年所处理的信息总量已成为衡量一个 国家现代化水平的重要标志之一【s j 。 自然语言理解作为语言信息处理技术的一个高层次的重要研究方向,一直是 人工智能领域的核心课题,也是困难问题之一,由于自然语言的多义性、上下文 有关性、模糊性、非系统性和环境密切相关性、涉及的知识面广等原因,使得很 多系统不得不采取回避的方法;另外,由于理解并非一个绝对的概念,它与所应 用的目标相关,如是用于回答问题、执行命令,还是用于机器翻译。因此,关于 自然语言理解,至今尚无一致的、各方可以接受的定义。从微观上讲,自然语言 理解是指从自然语言到机器内部的一个映射;从宏观上看,自然语言是指机器能 够执行人类所期望的某些语言功能。这些功能包括p 】: 回答问题:计算机能正确地回答用自然语言输入的有关问题; 文摘生成:机器能产生输入文本的摘要; 释义:机器能用不同的词语和句型来复述输入的自然语言信息; 翻译:机器能把一种语言翻译成另外一种语言。 自然语言有两种基本的形式:口语和书面语。书面语比口语结构性要强,并 且噪声也比较小。口语信息包括很多语义上不完整的子句,如果听众关于演讲主 题的主观知识不是很了解的话,听众有时可能无法理解这些口语信息。书面语理 解包括词法、语法和语义分析,而口语理解还需要加上语音分析。如果计算机能 够理解、处理自然语言,人一机之间的信息交流能够以人们所熟悉的本族语言来进 行,将是计算机技术的一项重大突破。另一方面,由于创造和使用自然语言是人 类高度智能的表现,因此对自然语言处理的研究也有助于揭开人类高度智能的奥 秘,深化对语言能力和思维本质的认识。自然语言理解这个研究方向在应用和理 论两个方面都具有重大的意义。 然而,自然语言理解之所以困难,主要因为以下三方面因素: 第一,目标表示的复杂性:如语义的概念依存网表示。从语句中提取这种表 示的关键字就已经相当复杂,同时还需要更多相关的客观世界的知识。 第二,映射的类型:对于源语言到目标语言表示的映射,一对一类型是最理 想的。但现实中,自然语言到目标语言表示的映射极难达到一对一的要求。 4面向产品设计领域的汉语名词短语在篇章中的语义分析 第三,成分间的交互程度:在语言中,每个语句都是由多个成分组成的,且 成分交互程度相当高,从而使得映射的复杂程度大大增加。 由于汉语没有形态变化,属于意合分析型语言,因此无法直接套用西方现有 的语法模式。正是由于汉语词性的分类及划分是个老大难问题,进而使得语法语 义的分析及生成也变得极其困难。 1 4 名词短语语义分析研究现状 众所周知,语音、语义、语法是语言的三个最主要的组成部分。然而,从语 言作为人类思维、交际的工具这一本质属性来看,语义无疑是这三个组成部分的 重一l ) j i o 。人们要完成交际、思维的任务,关键是要理解语义。“语义”是语言学的 一个重要术语,它一般指一个语言形式比如说词、短语、句子等所指的内容。汉 语的语义研究,长期以来局限与词汇学的范围,没有得到充分的发展,也未形成 独立的语义学说体系【1 1 】。传统的语义学是词义学,它以词为基本研究对象,揭示 词义的一般性质、表现形式以及演变发展规则,对词义的描述、解释是其重点。 短语是词与词按照一定的语法规则和意义关系组合起来的没有语调的语言单 位。名词短语是指由几个名词或名词及其修饰语构成的短语,它是以名词为中心 构成的从属向心结构【1 2 l 。名词短语的语义分析的目的是确定短语中各个名词与修 饰语之间的搭配关系是否合理并确定核心词。可以说,名词短语的语义分析是名 词的语义分析走向句子语义分析的桥梁,也是实现篇章分析的基础。 大多数情况下,短语都有一个确定的含义,这种短语叫单义短语,如偏正短 语“红色的气球”、联合短语“山与水”。在自然语言理解中,这种比较简单的名词 短语的语义分析已经比较成熟了。但是,有的短语同时具有两种甚至多种语义, 这种短语叫多义短语【1 3 】。从语义的角度看,这是两个或两个以上形式相同而语义 结构不同的语言单位在形式上的重合,是一种“同形异构”现象,即句法形式相 同而语义结构不同。构成多义现象的原因是多方面的,主要有两类:语音多义和 组合多义。在本文所阐述的领域内,主要研究组合多义。在组合多义中,结构关 系不同可以导致多义,如“学生家长”可以是偏正关系,也可以是联合关系。组 合的层次不同也能造成多义,如名词短语“爸爸和妈妈的同事”,可以理解成“同 事”是妈妈的,也可以理解成“同事”是爸爸和妈妈两个人的。在自然语言理解 中,我们把多义名词短语也叫名词短语之间的耦合。 目前,对于名词短语的耦合的处理的研究比较少,也没较好的处理方法,大 多数都是通过变换词语来消除歧义l “1 1 1 5 】,如“两个山村的孩子”可以变为“山村 的两个孩子”,表示孩子是两个;或变成“孩子是两个山村的”,表示山村是两个。 虽然这种方法能分化多义,但也只是起到提前预防作用。在自然语言理解领域内, 第一章绪论 我们从篇章的角度上对名词短语的耦合进行语义分析,取得了比较好的效果。因 为语义不仅是静态的、独立的语言基本单位的意义,也可以是与句法篇章相关的 语义关系,语义结构。 名词短语语义分析是篇章分析【1 6 】【1 j 7 l l l 8 l 的基础,篇章分析是短语语义分析的继 续和延伸,它突破了单句层次,在整个上下文中求解语义问题,从而确定语言所 表达的真正含义,篇章的理解是自然语言理解的最高境界。因此,篇章的理解在 一定程度上又反过来加深了对名词短语的语义分析,特别是对语义分析中歧义的 消除。名词聚类是篇章分析的核心之一,名词的聚类是依据概念间的属性关系、 抽象具体关系、整体部分关系等关系进行判定,我们依据这些知识对语义分析的 结果展开分析,从而确定语言所表达的真正含义。利用篇章中名词的聚类来实现 复杂名词短语的语义分析也是本文的重点之一,我们将在第三章分析。 1 5 本文的研究内容 本文通过对产品设计的过程进行研究,认识到机械产品设计计算机化对产品 开发的早期设计规划,尤其是设计初期的用户需求分析和产品概念设计的支撑较 少。针对这个问题,本文从汉语自然语言理解的语义分析角度,对其在产品设计 中的应用做了初步的探讨。通过对以自然语言形式表达的用户需求进行理解和分 析,并将分析结果转化成概念设计要求,为后续设计提供支持。本文完成的主要 工作如下: 1 了解国内外自然语言理解领域的动态,分析基于知识的方法1 1 9 2 0 i 在自然语 言理解中的重要作用,并结合设计领域自然语言理解的特点,确定了在产 品设计领域内应用自然语言理解应该采用基于知识的方法。 2 通过对汉语语义分析的特点的分析,并结合基于知识的自然语言理解系统 的实际情况,选择概念从属理论作为基于知识方法的重要补充,深入讨论 了其在基于知识系统的优点。 3 基于概念从属理论建立了概念从属树,这样可以大大减小知识库的容量, 并在对概念内涵和外延进行深入阐述的基础上,以基于知识的方法建立了 名词和动态名词模板,来表示概念和实例概念。 4 系统分析了名词短语构成方式,在分析了偏正结构、联合结构、事件类名 词短语的基础上,详细地分析以上名词短语之间的耦合关系,并实现了复 杂名词短语的耦合处理,分析和实现了篇章分析中的名词聚类对名词短语 语义分析的消岐作用。 5 设计了对语句中名词短语进行语义分析的规则,实现对领域内汉语语句中 复杂名词短语的语义理解。 6面向产品设计领域的汉语名词短语在篇章中的语义分析 6 结合机械领域,通过对用户需求信息中名词短语的理解和分析,并结合系 统的其余模块,实现了语义分析在凸轮机构设计需求分析原型系统中的应 用。 总之,本文从自然语言理解的模型出发,结合名词短语的语义分析在产品设 计中的应用,讨论了名词概念的知识表示和名词概念间可形成的关系,探讨了对 名词短语进行语义分析的方法,并实现了基于名词间的偏正关系、联合关系、事 件类名词以及名词短语之间的耦合的自然语言理解,分析并实现了名词聚类在名 词短语语义分析中的消岐作用,结合实际应用,取得了一定的成果,相信这一工 作对自然语言理解在各个领域中的应用有一定的推动作用。 第二章汉语语义分析方法及系统设计7 第二章汉语语义分析方法及系统设计 2 。1 汉语的自然语言理解的特点 随着科学技术的发展,人们越来越强烈地希望用自然语言( 即人们日常使用 的各种通俗语言) 同计算机交流。汉语的自然语言理解是计算机科学中的一个引 人入胜的、富有挑战性的课题。从计算机科学特别是从人工智能的观点看,汉语 理解的任务是建立一种计算机模型,这种计算机模型能够给出像人那样理解、分 析并回答汉语自然语言的结果。然而,汉副2 1 j 【冽是一种历史悠久的语言,它在语 法语义分析过程中存在着许多区别于英语及其它语种的独特之处,而有些特点使 得它特别不适合计算机来处理。要想处理好汉语的计算机理解,必须认清汉语的 特点,主要表现为以下几点: ( 1 ) 汉语句子的词不分写,在进行分析之前必须进行分词处理。在分词过程中 会遇到未登录词和切分歧异等困难。 ( 2 ) 汉语的多词性和多词义现象比西方语言严重得多。同时由于汉语词汇没有 形态变化的特征,因此解决此类问题要依靠上下文。 d ) 汉语句子中往往出现很多动词连用,而汉语动词又没有性、数、格、时态 的变化,主动词很难确定。 ( 4 ) 西方语言的谓语一般都是动词,而汉语的谓语可以是动词,也可以是形容 词和名词等。这就导致了某些西方语法语义理论不能直接应用于汉语分析 中。 ( 5 ) 汉语句子的组合歧异十分严重,这包括句法组合层次歧异,句法组合关系 歧异,语义组合层次歧异,语义组合关系歧异。在理解过程中要完全消除 这些歧异很困难。 汉语的这些特点也是造成汉语机器理解的难点。基于这些特点,我们对汉语 的机器理解实现不能象西方语言那样靠语法,而是应该走一条适合汉语理解的自 己的路。目前,对汉语的自然语言理解的方法使用最多的是基于语义分析的方法。 在我们所阐述的系统中,采用以语义分析为主,与语法分析相结合的方法。 2 2 语义分析的内容和作用 语义分析是语言分析的一个分支。所谓的语义分析,指的是根据句子的句法 分析和句中每个实词的词义推导出能够反映这个句子意义( 即语义) 的某种形式 化表示,目的是根据上下文辨识一个多义词在指定句子中的确切意义,然后根据 8 面向产品设计领域的汉语名词短语在篇章中的语义分析 句子的合法结构和各词的词义推导出这个句子的句义,并用形式化的方式表达出 来,从而使计算机能够根据这一表示进行推理。对句子进行正确的语义分析,一 直是从事自然语言理解研究的学者们追求的主要目标。 语义分析的作用【2 3 】【川,概括起来大致有如下三个方面: ( 1 ) 理清句子的语义结构关系; ( 2 ) 把句子的各个构成成分的意义组合成为一个完整的句子的意义,并把它映 现为一个由严格定义的形式语言来刻划的语义表达式( 简称为“意义的组 合和表达”1 ; ( 3 ) 说明句子中词语搭配上存在的各种语义限制条件。 语义分析是自然语言处理过程中的一个层次,是计算机理解语言的基础,因 而十分重要。从自然语言处理的应用来看,不管是信息获取、信息检索、机器翻 译、自动文摘,还是人机交互,都要先对语言进行理解,确定语言所要表达的正 确含义后,才能进行后续操作,得到结果。从自然语言处理的发展来看,正是由 于在实际应用中旬法分析达不到令人满意的效果,研究者们才纷纷转向语义研究, 提出各种语义学理论。 自然语言的一大特点就是充满歧义。句法分析达不到令人满意的理解效果, 由于其不能够很好地解决自然语言中的各种歧义现象,利用语义知识对自然语言 进行语义分析,有利于解决句法分析不能解决的歧义问题,从而更好地理解语言。 2 3 领域自然语言理解的知识表示方法 在自然语言理解中,基于领域可以克服全面自然语言理解存在的语句有多种 含义,难以理解的困难,大大减少系统的复杂性。另外,将静态知识填入事实库 进行合理的抽象,可以大大减小知识库的规模,降低了处理的难度。因此,我们 的系统采用基于领域和基于知识的处理方式,句子进入系统后将依次进行词法分 析、句法分析和语义分析。 自然语言理解的研究不但要运用语言学中的词汇、语法、句法、语用和语义 学知识,而且还要涉及到大量的客观世界的知识以及与其相关学科的知识。自然语 言处理和人工智能的其他领域( 如定理证明、问题解答、模式识别、机器博弈和机 器人科学等1 的根本问题都是知识表达和利用问题。说得全面一点就是如何去获取 各种不同的知识,并以一种计算机可以使用和处理的方法表达知识。实际上,一旦适 当的知识结构和表达理论充分建立了,那么自然语言处理的瓶颈问题也就消除了。 在本文所阐述的自然语言理解系统主要采用了以下两种知识表示的方法。 1 产生式表示法【冽 产生式知识表示法又称规则表示法。它的一般形式是:i f t h e n ( 或 第二章汉语语义分析方法及系统设计9 通过对汉语语义分析的特点的分析,选择概念从属理论作为基于知识方法 的重要补充,并对其优缺点进行了深入探讨; 根据概念从属理论建立了概念从属树来表示名词概念间的关系。在实现基 于名词间的偏正结构、联合结构、事件类名词等名词短语的自然语言理解 的基础上,详细分析了以上各类名词短语之间的耦合情况,设计出对语句 中名词短语耦合关系语义分析的规则,实现了领域内汉语语句中复杂名词 短语的理解; 根据名词短语耦合关系的特点,结合自然语言理解篇章分析中的名词聚 类,分析了名词聚类在复杂名词短语语义消岐中的作用,实现了复杂名词 短语在篇章中的语义分析; 将自然语言理解的语义分析应用于凸轮机构设计需求分析原型系统,对其 中的名词短语进行语义分析,并结合系统其余模块的运行,通过系统测试, 结果比较令人满意。 自然语言理解是一个十分庞大的系统工程,本文应用基于知识的方法和概念 从属理论对自然语言理解中名词短语的语义分析进行了研究,取得了一定的成果。 但由于这一问题涉及面很广,以及时间、条件和作者个人认识的限制,还有以下 几方面需要进一步完善: 目前本文在基于名词间的偏正关系、事件类、联合关系的名词短语语义分 析的基础上,对以上各类名词短语的耦合情况进行了详细的分析和研究, 取得了一定的成果。但对特别复杂的名词短语耦合情况的分析处理还有待 进一步研究探索。 现阶段进行的名词短语语义分析大多数仅限于对简单句的处理,通过名词 面向产品设计领域的汉语名词短语在篇章中的语义分析 聚类,可以在复合句、段落、篇章中实现了名词短语的语义分析,但还不 够完善,需进一步研究。 对名词短语在篇章中的省略、指代和固有歧义等问题还需要解决,目前对 篇章的理解已有一定的突破,相信随着篇章理解研究的深入,这些问题也 可以得到解决。 致谢 致谢 本论文是在导师赵克教授的悉心关怀、指导下完成的。在此论文完成之际, 谨向导师赵克教授致以深深的谢意。导师知识渊博,诲人不倦,给我在研究生期 间的学习与工作以极大的帮助和细心的指导,导师严谨的治学态度,科学的研究 方法,勤勉的工作作风和勇于开拓的精神是我永远学习的榜样。 感谢李凯、胡钢伟、许威、李亚涛、亿珍珍、丰博、程培涛等老师的帮助。 感谢4 0 8 教研室的易帅、陈余、韦卓、杨欢、万棋顺、常建鹏、翟磊、罗瑶、杨 小燕、张娜等同学在工作、学习和生活等方面的关心和帮助。他们的帮助让我感 到了同学友情的弥足珍贵。 感谢师兄弟们在共同参加的项目科研中,经常互相讨论,不断给我以启迪, 使我受益匪浅。在此向他们表示衷心的感谢。 感谢国内外在人工智能、自然语言理解等方面的工作和研究人员,正是他们 的勤奋工作,留下了许多的珍贵的资料。作者在研究生期间从他们的专著和论文 中得到了许多启发,在此向他们致以最崇高的敬意。 在4 0 8 工作、学习的日子是让人难以忘怀的,老师们兢兢业业的工作精神是 我学习的榜样,同学问的珍贵友情是我毕生最大的财富,在此,一并送上我对他 们的祝福。 最后,再次向在研究生期间关心和帮助过我的老师和同学们表示最衷心的感 谢! 参考文献 参考文献 1 徐彬,胡江华产品创新设计的市场化因素包装工程2 0 0 7 ,9 ,第9 期 2 顾佩华设计理论与方法学研究方面的最新进展机械与电子1 9 9 8 , 5 2 6 3 1 3 谢友柏现代设计与知识获取中国机械工程1 9 9 6 ,第7 卷,第6 期 4 廖乃微产品创新设计的若干思考中山大学学报论丛2 0 0 7 ,第2 7 卷,第 5 期 5 檀润华创新设计t r i z :发明问题解决理论北京:机械工业出版社,2 0 0 2 6 王知行,刘廷荣机械原理北京:高等教育出版社,2 0 0 0 7 郭艳华,周昌乐自然语言理解研究综述杭州电子工业学院学报2 0 0 0 ,2 , 第2 0 卷,第l 期 8 冯志伟国外自然语言理解系统简介 j 计算机科学1 9 8 4 ,2 9 王开铸自然语言理解一一计算机能思维吗7 哈尔滨:哈尔滨工业大学出版 社,1 9 9 6 1 0 李索论新世纪汉语语义研究的学术地位河北师范大学文学院1 9 9 9 ,1 , 第1 期 1 1 陈昌来现代汉语语义成分研究:历史现状思考青海师专学报( 社会 科学) 1 9 9 9 ,第1 期 1 2 陆炳甫核心推导语法上海教育出版社,1 9 9 3 1 3 兰宾汉汉语语法分析的理论与实践北京:中国社会科学出版社, 2 0 0 2 1 7 6 1 7 8 1 4 王锦、陈群秀现代汉语语义资源用于短语歧义模式消岐研究中文信息学 报2 0 0 7 ,9 ,第2 1 卷,第5 期 1 5 朱德熙汉语句法中的歧义现象 j 中国语文1 9 8 0 ,2 1 6 廖秋中篇章与语用和句法研究语言教学与研究1 9 9 1 ,4 1 7 黄国文语篇分析的理论与实践一广告语篇研究上海:上海外语教育出版 社,2 0 0 1 1 8 美 j a m e sa l e e n 著,刘群,张华平等译自然语言理解( 第二版) ,2 0 0 5 ,1 1 9 朱光菊,夏幼明框架知识表示及推理的研究与实践云南大学学报( 自然 科学版) ,2 0 0 6 ,2 8 ( s i ) 1 5 4 1 5 7 2 0 付炜基于框架网络结构的专家知识表示方法研究 j 计算机应用 2 0 0 2 2 1 付淮青现代汉语词汇 m 北京:北京大学出版社,1 9 8 5 2 3 4 2 2 刘顺现代汉语名词的多视角研究上海:学林出版社,2 0 0 3 面向产品设计领域的汉语名词短语在篇章中的语义分析 2 3 齐璇,马红妹,陈火旺汉语的语义分析研究2 0 0 1 ,第2 3 卷,第3 期 8 9 - - 9 2 2 4 姚天顺,朱靖波,张利等自然语言理解一一种让机器懂得人类语言的研究 北京:清华大学出版社,2 0 0 2 2 5 王永庆人工智能原理与方法西安:西安交通大学出版社,1 9 9 8 2 6 s c h a n kr c o n c e p t u a li n f o r m a t i o np r o c e s s i n g a m s t e r d a m :n o r t hh o l l a n dp u b c o ,1 9 7 5 2 7 黄曾阳h n c ( 概念层次网络) 理论北京:清华大学出版社,1 9 9 8 2 8 李柱国机械设计与理论北京:科学出版社,2 0 0 3 2 9 吴宗泽,王序云,高志机械设计北京:高等教育出版社,2 0 0 1 3 0 濮良贵,纪名刚,机械设计北京:高等教育出版社,2 0 0 1 3 1 彭文生,李志明,黄华梁机械设计北京:高等教育出版社,2 0 0 2 6 4 8 1 3 2 王中发实用机械设计北京:北京理工大学出版社,1 9 9 8 3 3 3 谢友柏制造产品的“创新”与我国现代设计网络中国机械工程1 9 9 8 , 第9 卷,第1 l 期 3 4 张亚非,范建华自然语言处理:方法与技术计算机应用与软件2 0 0 0 , 第4 期1 - 1 5 3 5 周经野基于自然语言计算模型的汉语理解系统软件学报,1 9 9 3 ,第4 卷 第6 期:4 卜4 6 3 6 侯广坤,邓卫字人工智能概论广州:中山大学出版社,1 9 9 3 3 7 陈力为,袁琦计算语言学进展与应用北京:清华大学出版社,1 9 9 5 3 8 宋春阳现代汉语名+ 名语义关系的识别及序位研究华东师范大学学报 ( 哲学社会科学版) 2 0 0 7 ,第3 9 卷,第3 期 e 3 9 p h i l i pj h a y e sa n dj a l m eg c a r b o n e u at u t o r i a lo nt e c h n i q u e sa n da p p l i c a t i o n f o rn a t u r a ll a n g u a g ep r o c e s s i n g c a r n e g i e m e l l o nu n i v e r s i t y ,o c t o b e r ,1 9 8 3 4 0 n i l s s o n n j 著a r t i f i c i a l i n t e l l i g e n c e :a n e w s y n t h e s i s 北京:机械工业出版 社,2 0 0 0 4 1 c h r i s t o p h e rm a n n i n g , h i n r i c h s c h u t z e f o u n d a t i o n so fs t a t i s t i c a ln a t u r a l l a n g u a g ep r o c e s s i n g m a :m 1 1 rp r e s s 1 9 9 9 4 2 j o s e p hg i a n a f a n og r a yr i l e y e x p e r ts y s t e mp r i n c i p l e sa n dp r o g r a m m i n g ( 专家 系统原理与编程) 北京:机械工业出版社,2 0 0 0 4 3 m i to p e nc o n r s e w a r e n a t u r a lla n g u

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论