综述样例参考.doc_第1页
综述样例参考.doc_第2页
综述样例参考.doc_第3页
综述样例参考.doc_第4页
综述样例参考.doc_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1.2相关问题的现状对“V+N”结构的研究概括起来主要有以下几个方面:语法单位定性问题,歧义产生的原因及消解手段的等。1.2.1“V+N”结构的定性问题研究不同音节构成的“V+N”结构,其语法单位的性质不相同。相同音节构成的“V+N”结构,不同学者也有不同主张。对于“V单+N单”结构许多学者也进行了研究,赵元任(1979)、任学良(1981)、陆俭明(1988)等主张此结构为动宾式复合词。陆俭明(1988)对名词性“来信”是词还是短语这一问题展开讨论,他分别从句法平面和词法角度来进行考察,认为“来信”“插图”“炒菜”等是偏正式复合名词。赵元任(1979)还把动宾式复合词分为动词、名词、形容词、副词和叹词。任学良(1981)则认为可以分为动词、名词、形容词、副词(努力、随手)和连词(因此,于是)等。对于“V双+N双” 的语法单位的性质,顾阳、沈阳(2001)则把这类结构看作是合成复合词,他们认为“这种复合词内部的动词性成分和其他名词性成分之间一定具有动作和论旨角色的关系,即合成复合词都应该分析为是通过论元结构中论元成分的位置变化构成的”。1P123我们讨论“V+N”结构,目的是找出不同句法结构中V、N的搭配规律,所以对于V+N的定性问题,我们有意识地淡化复合词和短语的界限。詹卫东(1996)也采取了类似的思想,提出词跟短语的形式界限在有些场合是可以模糊对待的,所以我们的研究对象不但包括了V+N复合词,还包括了V+N短语,我们通称其为V+N序列。1.2.2一般性歧义结构的研究对于歧义结构的研究既有从宏观进行研究的,也有从微观进行研究的。从宏观上来看如:冯志伟(1989)、詹卫东(2000);从微观来看,如杨泉,冯志伟(2005)、阎凡蕾(2005)、徐艳华,陈晓荷(2006)、姚纬(2007)等。冯志伟先生(1989)在研究汉语术语歧义问题时,提出“潜在歧义理论”(Potentional Ambiguity,简称PA论)。詹卫东(2000)在其博士论文对汉语短语结构的定界歧义做了全面考察,并对汉语短语结构定界歧义的不同类型进行了初步统计,将歧义格式分为真歧义格式、准歧义格式、伪歧义格式三种。杨泉,冯志伟(2005)以同类词短语(n+n、v+v、a+a 、n+ n+ n和v+ v+ v)为研究对象采用了基于ontology语义驱动的句法功能消歧方法。阎凡蕾(2005)利用知网语义知识提出了现代汉语中两个双音节动词连用的语义关系问题。徐艳华,陈晓荷(2006)以“V+V”结构序列为切入点,对其进行消歧研究。姚纬(2007)在潜在歧义理论的基础上,考察了例化后可能产生歧义“n+n+n”结构。1.2.3 “V+N”结构的歧义分析和消解研究 1.2.3.1 本体研究对于“V+N”结构序列多义性的研究最早有朱德熙先生提出。朱德熙先生在汉语句法中的歧义现象(1980)主张用“歧义格式”来概括语言中的同形歧义结构,期间涉及到的歧义格式就有“V+N”结构。后来冯志伟(1995,1996)等语言学家的研究也都涉及了“V+N”结构。但是,这些研究并没有全面深入,并未从中得出较普遍性的规律,因此,在“V+N”结构研究方面后人又做了进一步的探索。对于“V+N”结构产生歧义的原因及消解手段研究,以后的不同学者在不同理论背景支持下,取得了丰硕的成果,如:张国宪(1997)、邵敬敏(1998)。张国宪(1997)运用功能认知理论,分别从动词、名词、音律三个角度提出了制约“V双+N双”的理解因素2P176:一.名词的生命度、定指度、控制度、语义角色二.动词的及物性、动性强弱、语义制约三.结构节律的语法重音和音步张国宪认为具体名词在生命度上高于抽象名词时把不同名词的生命度列为以下等级序列:指人专有名词指物专有名词指人具体名词指物具体名词无生具体名词抽象名词。他认为这个等级序列可以解释人们对“动+名”短语的理解流向,即生命度从高到底的信息流向与结构类型的从动宾到偏正的认知流向相关联,生命度较高的充当宾语,而生命度较低的充当中心语。张国宪把相同的动词与不同名词组合产生不同结构关系的原因归结为名词生命度的差异,也欠稳妥。有一些高生命度的指人名词也常与及物动词构成偏正结构。如“搬运工人”是偏正结构,搬运行李则是动宾结构。可见即便动词相同时,名词的生命度仍不能看作决定因素,及物动词与生命度高的名词也有可能组成偏正短语。邵敬敏(1998)在结构主义理论的指导下,运用配价理论对各类“动+名”结构的语义选择进行了解释。他认为当V与N是配价组合时,“V+N”是动宾短语,如“学习汉语”等,当V与N是非价组合时,V+N是偏正短语,如“学习机会”等,还有一些是歧义结构,如:“学习文件”“研究课题”等。他还认为“学习等一大批双音节动词不仅可以表示动作,而且可以表示一种动作属性,关键是与之匹配的名词的类”。3p228配价理论对“V双+N双”结构的语义选择具有较强的解释力,但是仍有不少例外情况,如“进口汽车”“移动电话”等无论被理解为偏正结构,还是动宾结构,都是配价组合,且“N双”都是具体名词。另外,马庆株(1998)还对偏正结构“V双+N双”中名词中心语与动词定语之间的语义关系进行了详细的描述和分类。但他没有对这些粘合式体词性偏正结构的组合规律作进一步探讨。石定栩(2005)也指出动名结构可以表示动宾关系,也可以表示定中关系,所以不少动名结构具有歧义。“但具有特定句法地位的动词性成分和名词性成分组合时不会产生歧义。有歧义的动名结构受到语义、韵律、语用或其他因素的影响也可能失去部分意义,不再具有歧义” 4P1。同时作者也认为这些因素对动名结构的合法程度只有相对的影响力,并没有绝对的否决作用,对于歧义的消除也只有相对的影响力。1.2.3.2 面向中文信息处理的研究语言本体研究的工作者都已经注意到了“V+N”结构的歧义问题,并对其加以分析,也取得了不少的成果。但大多研究都是面向人而做的,而随着计算机的广泛普及,计算机语言学的兴起,给计算机制定一套识别和理解“V+N”结构类型和语义关系的形式规则就成了急需解决的问题。当前识别此类结构,一般采取以下的几类方法:一 基于语料库的规则处理方法。从语料库中,抽取所有的基本名词性短语规则(词性序列),采取最大匹配的策略进行识别。孙宏林(1997)根据从经过分词和词性标注的语料库中获取的14条规则,对什么条件v和后面的n可以捆绑在一起进行了研究。其研究侧重于确定任意上下文中的一个特定v+n序列是否为合法的语法形式。二 基于匹配的方法。利用机器词典中的一些特征属性来进行识别。如邱立坤(2005)从大规模标注语料库中获取实例,使用电子版现代汉语语法词典和现代汉语语义词典,探讨现代汉语中动名语串结构关系判定的问题。他考察了分别引入动词、名词次范畴,语义词典中对动词、名词的语义属性的描述,语法词典中对动词直接修饰名词与名词直接受动词修饰两种属性的描述,来对动名语串结构关系进行判定的效果。判定结果:以动词的后名属性与名词的前动属性相结合判定“V+N”语串为述宾结构的成功率为93.5%,再结合语义词典的描述信息判定则成功率提高到98.1%。但由于对定中式动名短语的判定正确率不足60%,结合起来的结果自然很不理想。单纯以语义词典的描述信息来判定“V+N”语串为定中结构的成功率为78.9%,这一结果也不十分理想。三 基于规则的方法。依据规则获取方式的不同,还可以分为以下两种方法: 人工书写规则的方法采取人工书写语法规则的方法,将规则应用到此类结构识别当中。傅承德(1993)讨论了通过动词次范畴与名词次范畴相结合,并辅以词汇驱动规则 一种分析语句的方法,根据机器词典提供的词汇信息来控制操作流程。来实现动名语串动宾与定中两种句法结构的自动识别的问题。它通过划分次范畴(动词分为及物动词与不及物动词,名词分为抽象名词与非抽象名词,单音节名词、双音节名词),然后将动词与名词的次范畴综合起来考虑,找出在搭配中结构关系不确定的情况,并采取词汇驱动规则来解决。由于该文仅考察了94个动词与106个名词,所以只能算是一项实验性的研究。詹卫东(2000)在其博士论文中介绍了np- vp!np(V+N结构的名词短语)的句法语义规则。借助语法信息词典制定了其内部组成成分的约束条件:“%vp. dingyu=是,%np. Zhxyu1=是,%np.内部结构=单词,%np.前动=是”5P40即:vp是能做定语的动词,np是中心语,且是其前可接动词的单个词语。只要符合此条件的就是名词短语。他并没有对能够组成偏正结构的名词动词进行具体分类,也没涉及其语义关系类型。李晋霞(2002)基于句法的角度,提出了面向计算机的动名语串结构关系识别策略。大致如下:(1)首先分出唯定中动词和唯动宾动词(唯定中动词是只能作定语而不能带宾语的动词,唯动宾动词则是不能作定语只能带宾语的动词),对于由此二类动词构成的“V双+N双”是采用“动词控制结构类型”的办法,(2)其它的动词称为定中、动宾两可动词,对于由这一类动词构成的动名语串,采用“名词控制结构类型”的办法,主要通过给出高频名词表(包括157个名词)的方式解决结构关系识别的问题,但此项研究对动词的研究过于概括。 机器学习自动获取规则的方法例如利用基于转换的、错误驱动的机器自学习方法,自动地从训练语料中抽取识别基本名词短语规则。如赵军、黄昌宁(1999)首先从语言信息处理的角度将用于基本名词短语识别的知识分为两部分,即表示基本名词短语句法组成的基本结构模板(静态知识)与表示基本名词短语出现的上下文环境特征的转换规则(动态知识)。然后在此基础上利用baseNP的基本结构模板(识别baseNP的静态知识),对文本进行baseNP的初始标注,抽取文本中所有符合这些结构模板的词语序列组成baseNP候选集。然后依次利用习得的转换规则(识别baseNP的动态知识)对初始标注结果进行修改,直至转换规则集中的所有规则都已用过。但此识别模型不适合考虑远距离依存现象,因此有必要在模型中加入词语搭配信息。上述文章其实无论采用何种方法,都是以其中一种为主,同时借助其它方法。但它们都是以句法分析为主,通过句法特点来找寻搭配规律或上下文特征来进行识别,较少涉及语义知识。其实借助语义知识来进行识别,效果会比单纯句法分析要好。张瑞霞等(2004)利用知网,以语义知识分析为主,提出了一种基于知识图的汉语基本名词短语分析模型。“即以知识图为知识表示方法,利用知网为语义知识资源,采用以语义为主、语法为辅的策略,先为短语中的每一个实词构造词图,然后合并词图而组成短语图,最后得到一个关于汉语基本名词短语的结构信息和语义信息的知识图。”6P47这种方法不仅分析了汉语基本名词短语的内部句法关系,而且还分析了汉语基本名词短语成分间的语义关系。这是一种不只是识别而且还分析短语内部结构关系的模型,作者分别用不含动词的500个汉语基本名词短语和含有动词的300个基本名词短语进行测试,前者的正确率为83.6%,后者的正确率为76.1%。由此可见,包含动词的基本名词短语的识别要比不含动词的识别要困难一些,主要原因在于,v+n序列内部的结构关系相对于n+n序列来说要复杂得多。由上我们看到,中文信息处理界对歧义结构的研究也取得了丰厚的成果,已有的研究在识别歧义结构类型的手段上多采用句法信息、语义信息、上下文信息相结合,在制定识别歧义结构类型的规则上,多是语法规则与统计规则相结合。但对于“V+N”结构序列而言,已有的研究还不够系统全面。相对来讲,对V双+N双结构识别较多,对其他音节构成类型的研究较少;对其句法关系研究较多,对语义关系研究较少;对结构识别研究多是借助句法知识,较少运用语义知识;面向人的研究较多,面向机器的研究较少,针对人的研究,多是来揭示歧义的原因,考察其类型等,但对于机器来说这些远不够,因此,我们还需要从共时的角度找到其形成的控制条件,告诉计算机,在什么情况下,哪些动词和哪些名词可以组合成、以及怎么组合成偏正和动宾结构。还有,如何从它的句法表现形式推导出其语义关系等。1.3研究对象本文对研究对象 “V+N”结构序列做了以下界定:(1) “V+N”结构序列必须是一个合法的语言单位。如:安理会第三次延长伊拉克执行石油换食品计划。此词序列中,V和N可以组合,但是二者语义不能搭配,不成一个合法的语言单位,所以不在研究范围内。(2) “V+N”结构序列必须是非嵌套式的语言单位,即N前无修饰成分。国务院十分关心西藏的灾情和救灾n工作n此序列中“灾情”前有修饰成分,这种情况不在研究范围之内。参考文献(一)专著部分: 1 陈昌来. 现代汉语动词的句法语义属性研究M. 上海:学林出版社. 20022 李临定. 现代汉语动词M. 北京:中国社会科学出版社. 19903 马庆株. 汉语动词和动词结构M. 北京:北京大学出版社. 20054 马庆株. 汉语语义语法范畴问题M.北京:北京语言文化大学出版社.1998(P75-P79)5 任学良. 汉语造词法M. 北京:中国社会科学出版社. 1981(P145-P155)6 邵敬敏. 汉语语法的立体研究M. 北京:商务印书馆. 2000(P3)7 王 珏. 现代汉语名词研究M. 上海:华东师范大学出版社. 20018 袁毓林. 汉语动词的配价研究M. 南昌:江西教育出版社. 19989 赵元任. 汉语口语语法M. 北京:商务印书馆.1979(P197-P199)(二)论文类1 陈一民. 歧义格式及其分类J. 湘潭师范学院学报(社会科学版),2004,(04)2 傅爱平. 黏合式名词短语结构关系的考察和分析J.中国语文,2004,(06)3 傅承德. 论现代汉语动名语串的句法结构和语义关系的自动识别A.语言研究1993,(01), (P32-P44)4 冯志伟. 汉语术语描述中的三种结构J.科技术语研究,2005,(03)5 冯志伟. 中文科技术语的结构描述及潜在歧义J.中文信息学报,1989,(02)6 郭继懋. 谈动宾语义关系分类的性质问题J.南开学报,1998,(6)7 顾 阳、沈 阳. 汉语合成复合词的构造过程J.中国语文,2001, (01) 8 胡凤国. 含事件类词语的汉语名词短语语义结构信息数据库的研制D. 中国社会科学院研究生院, 20039 李晋霞. 面向计算机的“V双+N双”结构类型研究A. 语言文字应用研究论文集()C, 2004 10 李晋霞. 现代汉语定中“V双+N双”结构研究D.中国社会科学院研究生院语言系, 200211 李子云. 动名组合序列的定中结构J. 安徽教育学院学报,1998,(04)12 廖艳君. 试论“V双+N双”式结构的成分配置J. 湖南大学学报(社会科学版),2002,(04)13 刘春卉. “动+名”偏正结构形成原因的考察D.广西师范大学,2002 14 刘春卉. 与偏正短语“V+N”相关的歧义结构J.阜阳师范学院学报(社会科学版),2006,(02)15 陆俭明. 名词性“来信”是词还是词组J.中国语文,1988,(05)16 林杏光. 词语搭配的性质与研究J. 汉语学习,1990,(01) 17 潘国英. “V的N”偏正短语中“V”与“N”搭配上的语义限制J. 湖州师范学院学报,2000,(05) 18 邱立坤. 现代汉语动名语串结构关系的判定A. 第六届汉语词汇语义学研讨会论文集 C, 200519 邵敬敏. 论汉语语法的语义双向选择性原则,中国语言学报(八),1997 商务印书馆.20 邵敬敏. 双音节V+N结构的配价分析A. 沈阳、郑定欧主编现代汉语配价语法研究, 北京:北京大学出版社, 1995 (P217-P230)21 石定栩. 动名结构歧义的产生与消除J. 语言教学与研究,2005,(03)22 寿永明. 动宾式名词的内部结构及语义模式J. 绍兴文理学院学报,2001,(04) 23 孙宏林. 从标注语料库中归纳语法规则:“V+N”序列实验分析A. 陈立为主编语言工程,北京:清华大学出版社。24 唐超群. 动宾式合成词研究J. 华中师范大学学报(人文社会科学版),1990,(02)25 王玲玲. 汉语述宾/偏正结构歧义研究D. 首都师范大学, 200526 王宗华. 面向计算机的N1+N2句法关系及语义

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论