语料库与外语学习.ppt_第1页
语料库与外语学习.ppt_第2页
语料库与外语学习.ppt_第3页
语料库与外语学习.ppt_第4页
语料库与外语学习.ppt_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于语料库的词汇学习 (方法与资源 ),内容提纲,语料库概念简介(3-5) 国内外主要语料库(6,7) 语料库在外语教学与学习中的应用(8-29) 免费在线语料库简介(COCA, BNC, Lextutor)(30-37) 软件工具(38-43) 资源分享,What is a corpus?,Corpus = “a body of naturally occurring text” The texts were not produced without the creator knowing that they would be used for linguistic analysis Newspapers, magazine articles, short stories, academic journals, etc Good genre balance (spoken, fiction, magazines, newspaper, academic) Current: not 100-year-old novels,3,Large: at least 100 million words More words than you would see / hear in a whole lifetime Annotated: tagged for part of speech and lemma (e.g. the beat, they beat, and beat as) 语料(corpus)是指收集的未经组织和加工过的语言材料和素材。 戴炜栋,1999 语料(corpus)又称为素材,是自然发生的语言材料(包括书面语和口语)的集合。可以用来作为描述一种语言的出发点或用于证实有关一种语言的假设的手段。 陈建生,1989,语料库按照特定目的与方法建立起来的存储语言材 料的“仓库”。 语料库是按照一定的语言原则,运用随机抽样方法,收集自然出现的连续的语言,运用文本或话语片段而建成的具有一定容量的大型电子文本库。从其本质上来说,语料库实际上是通过对自然语言运用的随机抽样,以一定大小的语言样本代表某一研究中所确定的语言运用总体。 杨惠中,2002,国外主要的语料库,Brown (1963 64) 布朗大学当代美国英语标准语料 库( The Brown University Corpus of Present Day American English) 。含100 万1961 年前后的书面 英语。由Francis 与Kucera 主持完成。 COBUILDJohn Sinclair 主持,迄今最大的语料库之一; 含的语料超过5 亿词。 COCA 美国当代英语语料库,收词四亿多,1990-2010 BNC英语国家语料库,收词一亿多,牛津大学/朗文/ 钱伯斯-哈洛普出版公司。 ICE国际英语语料库

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论