




已阅读5页,还剩2页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
论语料库与英汉词典配例郭启新国外英语学习词典例证概况及其对语料库的应用国外的语文词典历来重视例证。捷克词典学家兹古斯塔(L.Zgusta)认为,词条内的例子应看做是“整个词条不可分割的部分”。他还说,绝对没有例子就会使得词典的质量严重降低(兹古斯塔,1983)。以历史原则编纂的OED (Oxford English Dictionary)搜罗了大量的用法实例自不待言。针对英语作为第二语言读者的英语学习词典尤其如此。以1995年英国出版的CEED (Chambers Essential English Dictionary)、COBUILD (Collins COBUILD English Dictionary,2nd ed.)、LDOCE (Longman Dictionary of Contemporary English,3rd ed.)、OALD (Oxford Advanced Learners Dictionary of Current English,5th ed.)和CIDE (Cambridge International Dictionary of English)这些英语学习词典为例,它们更是让例证唱重头戏。CEED利用BNC (即British National Corpus,1亿词) 的语料,收录释义约4.5万条、例证约5万条;COBUILD利用BE (即The Bank of English,2亿词,早期称Birmingham Collection of English Texts)的语料,收录释义7.5万余条、例证9.6万余条;LDOCE利用LLC (即Longman Lancaster Corpus,3000万词)和BNC的语料,收录释义8万余条,例证约5.6万条;OALD利用BNC和OAEC (即Oxford American English Corpus,4000万词)的语料,收录释义约6.5万条、例证8.6万余条;CIDE利用CLS (即Cambridge Language Survey,1亿词)的语料,收录释义约10万条、例证约10.7万条。(Bogaards,1996)就篇幅而言,这几部词典都是中型的。CEED不到1200页,OALD不到1400页;COBUILD最大,不到2000页。其共同的特点就是利用语料库收集非常丰富的例证。这些例证本都是来 源于现实生活的鲜活的应用实例,收入大规模的语料库之后,又经过词典编纂者和语言学家斟酌、筛选,有的还经过适当修改,对提高整个词典的质量、帮助学习者理解和应用英语起到了非常重要的作用。它们有的是老词典的新版,有的是全新的产品,足以代表20世纪80年代以来的最新趋势,那就是,计算机语料库(computerheld corpora)的系统开发为词典的编纂带来了革命性的变化,使得词典、尤其是英语作为外语的读者使用的词典的总体水平有了很大的提高。国内英汉语文词典例证概况及其对语料库的应用 国内英汉语文词典中好的不多,有例证的更少,但是例证正在受到越来越多的人的重视。新英汉词典收例较多。这些例证多为编者编撰的,摆脱不了出版年代的烙印,政治色彩过于浓厚。英华大词典例证较少,其中有些习语也只能算是较为常用的例证。英汉大词典可谓坊间最好,收例较多。这些例证主要来自英美的百余种工具书和原版参考资料,对用法和搭配等方面的信息收录得较为丰富。 英语对我们来说是外国语,我们编纂的英汉词典主要是为了适应中国人学习英语的需要。从这一点来说,我们编纂的英汉语文词典类似于前面列举的学习词典,但是又不完全相同。英汉大词典基本上代表了国内英汉语文词典、尤其是此类大中型词典的发展方向。其编者已开始自己动手,博采众长,建设第一手资料语库。这在我国英汉语言研究和词典编纂领域还是不多见的。 最近几年来,我国已有了个别的英汉方面的专科语料库。商务印书馆和南京大学合作开发的英汉语言资料库(CONULEXID)填补了英汉语文综合语料库这一方面的空白。该库收有约1500篇、350万字的文章体英语资料,皆摘选自英语国家的数百种当代书籍、报纸、杂志和其他原版参考资料,其中尽可能照顾到了文体、语域、地域、学科等方面的多样性,为进行英语语言研究和英汉词典编纂提供了极为有利的条件。目前正在编研中的综合英汉大词典及其精编本的配例在很大程度上都仰仗着这一宝库。该库经完善后必将成为保证这些词典和其他的英汉词典的配例质量的有力工具。英汉语文词典例证的功能、标准以及语料库的影响 在帮助读者理解词汇的意义方面,例证的作用当然比不上释义;但是例证和释义的共同作用就要比纯粹的释义大得多(Bogaards,1996)。例证在很大程度上决定着整个词典的质量,这一点正在受到越来越多的学者的注意。兹古斯塔在谈到例证的功能时说过,“例句的用途在于揭示词目在与其他词汇单位的组合中的功能”。他还说,“差不多任何事物都可以用例子说明,比方说,在上下文中不同的细微意义差别,含有词目的作品的作者范围,词的首次出现,使用范围,修饰语搭配,动词的典型宾语,状语搭配,同义词或近义词在用法上的不同,等等”。(兹古斯塔,1983)具体说来,我们可以把英汉词典、尤其是学习型的英汉词典中例证的功能至少归纳为以下几条。1.弥补释义的不足之处,或限定其过于宽泛的内涵。由于语言之间的内在差异,释义译文的中心词绝大多数都会在某一或某些方面与原语的词目不对等,比如概念意义基本相同而内涵意义和搭配意义等部分或者完全不同。所以读者往往对释义不太明了。例证在很大程度上就能弥补这一缺陷,帮助读者进一步理解词义。因为释义是抽象的、概括性的,而例证则是具体的、实际的。比如,英语中的fat可以用来修饰人或物,在词典中可译为“胖”或“肥”,但是汉语中则常用“胖”修饰人,用“肥”修饰物。反之,说人“肥”则语含不敬,说物“胖”则是拟人或滑稽用法。有了具体的例证就可以消除其歧义,有助于读者理解。例如,CONULEXID语料库有关fat一词的例句中有a fat woman/a fat face/a fat target/fat profits这样几个搭配,从中我们得知fat可以修饰人或物,可以修饰有形的或无形的事物,而通过翻译我们可以得知在这几种情况下它的汉语说法各不相同。又如,通过例证(1)我们可以得知give和take的意义是相对的;通过例证(2)我们可以得知single和married的意思基本相反。(1) I give you the book: you take the book.(2) Sally is not single: she is married.例证不能提出未包括在定义内的任何东西,也不可能全面提出已包括在定义内的所有的东西。但是,例证能够使释义得到更为深化、更为具体的表现。准确把握例证与释义的关系,往往可以使例证起到画龙点睛的作用。语言学习者当然希望全面了解词汇单位所有释义的所有方面,但是全面性的要求“在多数情况下是超出了词典编纂者的力所能及”。(兹古斯塔,1983) 但是有了大型语料库之后,随着语料的不断积累,词典编纂者向全面性的目标就迈进了几大步。2.为词汇单位补充上下文,交代特定的用法场景。 马林诺夫斯基(B.Malinowski)和弗思(J.R.Firth)认为,语言运作的环境对于描述语言是不可或缺的。布龙菲尔德(Bloomfield)也说,语言成分的意义可以用其使用环境来作出全面解释。(Palmer,1981) 恰如其分的语境对词汇单位的意义给予一定的提示,对读者的理解和应用可以起到事半功倍的效果。比如,通过例证(3)读者很容易推断出词组in fact的递进含义。例证(4)这样的句子会让读者猜到词组as a matter of fact表示转折的意思。又如,chair和sit、dog和bark、gap和fence/hedge/wall、teacher和student/course/school分别都是共现率很高的词汇,含有这些共现率高的词汇的例证对理解词义很有帮助。(3) He didnt show up at the meeting yesterday. In fact,he didnt come to the office.(4) A: So you saw Sam this morning. B: As a matter of fact,I havent.语料库对交代一定词汇单位的用法场景帮助很大而且做起来也很容易。在这样庞大的数据库中可以轻而易举地查询某种词汇单位出现的场景是电影、电视节目,还是学科论文,还是亲友之间的交谈。3.展示最常见的语法、用法、搭配和共现词。 在没有语料库的年代,词频统计这样的工作费时、费力,往往又不准确。有了语料库就大不相同了。比如BNC可以很快地告诉词典的编纂者,scotfree通常与go,get off或escape连用;patter about的主语通常是身材小或轻的人或动物。 语料库可以验证人们的直觉。比如,通常我们会认为give最常用的意思是“给”,keep最常用的意思是“保留”,see最常用的意思是“看见”。然而BE库告诉我们,它们最常用的表达法分别是give a talk,keep warm和I/you see之类的短语。还有,在BE库730万词汇的主库中,take aback有14个例句,而其中有12个是用的被动形式。另外,feel的主语中用得最多的是I而不是其他的词。因此,我们可以推断,假如有的词典在收录take aback时不加上“常用被动语态”之类的标注或收了主动语态的例句而没有被动语态的例句,或者其feel条下有很多例证而其中却没有以I作主语的,那么这样的词典就不够科学。4.交代难度较大的用法。 以前高中英语课本中有这样一个句子:Dusk found him crying in the street.这个句子充作例证放在dusk或find这两个词目之下都很好。这里是用的非生命事物dusk作主语,而谓语find又很少与非生命事物连用。可以这样用的词汇在英语中还有不少,对初学英语的中国人来说就很有难度。而学习词典就是要尽量在类似的情况下提供适当的例证,帮助学习者掌握有难度的用法。如果没有语料库,要编者去编撰类似的例句可不容易。5.传达社会和文化信息,丰富词典的内容。 语言是文化的载体,是文化的一面镜子。它的一项重要功能是存储功能(the cumulative function)。任何一种语言都会把操这种语言的民族世代积淀下来的文化信息固定为符号而贮存在各级语言单位里。比如,(5)、(6)、(7)这样的例证除了可以揭示keep、available和read等词的语言信息之外,还包含了一定的社会文化信息。(8)和(9)这样的例证除了表现try和fair等词的用法之外也反映了一定社会文化背景之下人们的价值取向。(5) Traffic in Britain keeps (to the) left.(6) Many of the old Beatles records are now available on CD.(7) I was waiting so long I could have read War and Peace.(8) If I cant succeed this time,Ill try again. (9) All is fair in love and war.“要驾驭一门外语,学习者一定得经历从语言能力(linguistic competence)的成熟到社交语言能力(sociolinguistic competence)的成熟,最终到文化能力(cultural competence)的成熟这一必经的过程,缺一不可。”(张柏然,1992)富有社会和文化信息的例证可以较为充分且有效地揭示贮存在各级语言单位中的社会文化信息,具有较强的实用性。词典的编纂者应尽量从语料库中甄选能够兼顾语言和文化信息的例证,以期促成学习者迅速完成从掌握语言能力到社交语言能力和文化能力的飞跃。6.展现语用学研究成果,兼顾“正确性”和“得体性”。 语言是人际交流的工具,只有在交际(即语言应用)的过程中才能充分体现它的功能,它的最本质的功能就是交际功能(the communicative function)。语用学告诉我们,语言行为(即言语)受制于发话人与受话人的关系、交际的环境和语境、交际的功能和结果等。“一句完全合乎语法的话,用于不恰当的场合,说得不合说话人的身份,或者违反当时当地的社会风俗习惯,就达不到交际的目的,有时甚至造成意想不到的后果。”(邓炎昌,1989) 有一则幽默这样说明女人与外交家的区别。女人所说的“不”的意思是“或许”,“或许”的意思是“是”。外交家所说的“是”的意思是“或许”,“或许”的意思是“不”。直接说“是”的不是女人,直接说“不”的不是外交家。这里就包含了丰富的语用学常识:即身份不同的人的“所说”和“所指”大不相同。 充分了解语用学知识,尽量避免语言文化交流方面的误解、误用甚至是矛盾或笑话,对外语学习者非常重要。在词典中,除去释义中的评论和用法等专栏中的说明之外,运用例证是传达语用知识的重要手段。例证中的短语和单个的句子难以构成言语情景,本身所包含的语用信息不够清晰,除非加上注释。例如,How often do you have it?和How often do you try for a baby?都是医生、朋友等委婉地询问受话人多长时间行一次“房事”的说法,但是前者用以询问男子,后者用以询问女子。这些语用信息没有注释就无法传达。相对来说,对话形式的例证较能简洁而清楚地传达语用信息。比如,在下列各组对话中,字面意义不变的一句话可以表达各不相同的语用信息:(10) A: Its cold here. B: Shall I close the window?(11) A: Its cold here. B: Okay,lets go in.(12) A: Its cold there? B: Its cold here.(13) A: Let me have your coat. B: Its cold here.Its cold here.这一句话的语法意义平淡无奇。但是它在对话(10)中相当于一种委婉的请求,在对话(11)中则相当于一个建议,在(12)中相当于一个确定的回答,在(13)中却是一次间接的拒绝。其他的,如用Good morning!可以在早上问安和道别,也属于这种情况。另外,各种礼貌用语(如恭维话、致谢语等)都有一定的社会文化背景,要在跨文化交流过程中正确使用礼貌用语往往需要有一定的语用学知识才行。美国英语以及其他国家的英语与英国英语之间的差异也属于语用学研究的范畴。 传统的词典中语用信息要么没有,要么很少。即便是已有的语用信息,除了依靠有限的参考资料之外,也多半是靠一定的词典编纂者有限的常识和记忆去推断,舛误和不确之处往往难免。容纳了上百万词汇的语料库是成千上万的语言使用者对词汇单位的用法的活生生的证明,可以根据需要查询一定语言表达方式的使用者的性别、年龄甚至身份、地位,而这些查询所能提供的数据是任何编纂者个人的头脑无法提供的。 总之,例证功能有很多,它们都是不可能单独出现的。它们互相交叉,相辅相成。语料库则为词典编纂者提供了翔实而充足的资料、科学而多样的选择。释义好比是词典的骨架,例证好比是词典的血肉,而语料库就好比是供养这些血肉的营养源泉。释义和例证紧密结合、互相促进,这样的词典才最有生命力。 词典需要很多例证。若是采取闭门造车的办法,使用编纂者撰写的例证(invented examples 或 lexicographer examples,如新英汉词典中所收的基本上都是),至少有两个难以克服的弊端。一来编纂者单单为了说明某个义项而造句会留下斧凿或拼凑的痕迹,二来由于特定的编纂者所掌握的知识都有一定的限度,往往撰写的例证会倾向于多属于其本人熟悉的学科领域。与此相对的是真实例证(authentic examples,就是所谓书证或兹古斯塔所谓“摘引例句”,如OED所收的就是),但是这样的例证有时显得冗长,有时会含有与大部分读者无关、有时会影响其理解或使用语言的特殊成分。利用来源于语料库的例证,再加以适度的修改,可以在很大程度上于真实例证和编者杜撰例证之间权衡利弊、取长补短。 词典中的例证如果编得巧妙的话,要有“很强的孳生能力”(兹古斯塔,1983),也就是说,要典型、自然,以便让词典的使用者能够依此类推、举一反三。何谓典型?何谓自然?这些似乎都难以界定。但是有了语料库就好做多了。根据语料实例的统计,出现次数多、使用者多的、使用地域广的表达方法就是相对典型和自然的。在下面的句子中,mouse与ran是一对共现率很高的词,但是mouse与clock的共现率就很低,这个句子就不典型。(14) The mouse ran up the clock.在学习型词典中,例证应该通俗易懂。LDOCE和LDCE限制释义用词汇(defining vocabulary)的做法很值得我们借鉴。我们也应该适当限制例证用词,以利于读者的理解。在计算机和语料库的帮助之下,还可以通过词频统计等手段,尽可能多地使用高频词汇、避免生僻词汇。 比如,在CONULEXID语料库对所收录的74000多英语词汇、总量220万单词所做的词频统计中,the,of,and,to,a,in,is,that,it,as,for,was,he,with,on 都出现了1.4万次以上,这15个词占库中所有单词的27%以上;want,love,cannot,whether,city,give,face等都出现了600次以上,fellow,game,Henry,Indian,technology等都出现了200次以上。有了这样的数据,我们就知道哪些词汇是最常用的,从而有效地限制例证的总词汇量。有的学习词典例证中使用了诸如parquet,plight,relish,shrapnel之类使用频率很低的词汇,似乎不妥。充分而正确地利用语料库 语料库的建设费时费力,且有一个不断升级、不断完善的过程,但是一旦建成便会受益无穷。语料库例证的取舍是一个重要问题。有的语料可能含有现行的词典没有收录的词条、义项或用法。这就可能证明有新词、新义、新用法,有可能代表语言发展的方向。一旦这样的证据积累到一定的程度,就应该在词典中表现出来。比如,笔者在CONULEXID语料库中查到这样两个句子:(15) Local leaders in the Russian Far East,fed up with Moscows insatiable appetite to tax and with the centers incessant meddling in the politics and commerce of the region,are in revolt.(16) They pointed to the $20,000,000 New York State bonds and the $800,000,000 New York City bonds as being within the power of Congress to tax if the amendment were adopted.由此我们推断tax一词可以用作不及物动词,而现有的英语词典中似乎都没有收录这种用法。 又如,再看下列出自CONULEXID的句子。我们知道,take long 的意思是“花很长时间”,但是take 和long两个单词的含义该如何确定?现行的词典一般都把long 解释为名词“很长时间”。这样一来,例句(17)很好解释,但是例句(18)、(19)、(20)足以证明long 用在take后是个副词,take的含义该如何界定?根据这些例句我们似乎可以推断take一词有不及物动词“持续”或“花费时间”的意义。而这一释义我们在现行的词典中找不到。(17) The fish didnt take long either.(18) It took longer than they expected,for the choice was enormous.(19) Why does that painting of the Last Supper,the dukes gift to the friars,take so long?(20) How long would it take to swim across the river?当然,语料库中的材料要确保正确。比较有把握的做法是,对语料库中出现的、现行的词典没有收录的词条、义项或用法等要通过核实方可使用,语料库的建设也要有一定的规模。这样才能保证在最大的程度上减少或消灭错误。参考文献Bogaards,Paul. “Dictionaries for Learners of English.” International Journal of Lexicography. Vol.9,No.4,December 1996. Oxford University Press.Herbst,Thomas. “On the Way to the Perfect Learners Dictionary.” International Journal of Lexicography Vol.9,No.4,December 1996. Oxford University Press.Palmer,F. R. Semantics. Cambridge University Press,1981.Sinclair,J. Corpus,Concordance,Collocation. Shanghai Foreign Language Education Press,1991.Sinclair,J.,ed. Looking up: an account of the COBUILD project. William Collins Sons & Co Ltd.,1987.邓炎昌、刘润清著,语言与文化,北京:外语教学与研究出版社,1989。何自然,语用学与英语学习,上海:上海外语教育出版社,1997。黄源深,“一部实用性强的大型词典”,辞书研究1989年第4期。贾玉新,跨文化交际学,上海:上海外语教育出版社,1997。刘涌泉、乔毅,应用语言学,上海:上海外语教育出版社
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 多重耐药菌医院感染预防与控制管理规定试题含答案
- 2025年无人机巡检技术创新在农业生态环境监测中的应用报告
- 2025年5G技术赋能智慧交通发展
- 林业碳汇计量监测技术创新创业项目商业计划书
- 无线充电公共设施布局创新创业项目商业计划书
- 森林景观提升技术创新创业项目商业计划书
- 2025年无人机配送网络路径优化技术创新报告
- 数字化建筑艺术跨界合作创新创业项目商业计划书
- 2025年5G技术的智能工厂应用案例
- 2025年文化遗产数字化保护技术创新在文化遗产数字化展示中的应用可行性研究报告
- 2025兵团连队职工考试试题及答案解析
- 2025-2026学年接力版(2024)小学英语四年级上册(全册)教学设计(附目录)
- 医院病区突然停电应急处置
- 滕州市2025年(中小学、幼儿园)教师招聘试题及答案
- 2025年检验科生物安全考核试题(附答案)
- 无人机高精度航拍-洞察及研究
- 摄影后期教学课件
- 教育直播平台直播教学与2025年教育信息化政策解读报告
- 桥隧工程培训频课件
- 苹果协会管理办法
- 道路工程质量控制要点
评论
0/150
提交评论