美国当代英语语料库(COCA)使用介绍.ppt_第1页
美国当代英语语料库(COCA)使用介绍.ppt_第2页
美国当代英语语料库(COCA)使用介绍.ppt_第3页
美国当代英语语料库(COCA)使用介绍.ppt_第4页
美国当代英语语料库(COCA)使用介绍.ppt_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

美国当代英语语料库(COCA)使用说明,/coca,一、COCA语料库简介,COCA简介 COCA:美国当代英语语料库(Corpus of Contemporary American English)是由美国杨伯翰大学(Brigham Young University)的Mark Davies 教授开发的美国最新当代英语语料库,是当今世界上最大的英语平衡语料库。,COCA语料库简介,涵盖美国这一时期的口语(spoken)、小说(fiction)、流行杂志(pop magzine)、报纸(newspaper)和学术期刊(academic)五大类型的语料库,并且在这五个类型方面基本呈均匀平衡分布。,COCA界面简介,主要包括三大功能区: 显示及查询条件界定区,包括:显示方式区,字串查询区,语料库分类区,查询结果排列方式区。 查询结果数据显示区 例句显示区,COCA界面简介,显示方式区: 1.LIST列表显示 2.CHART图表显示,可以显示在各语料库类型中的使用频率和各时间段内的使用情况。 3.ConcordancesKey word in context (KWIC),上下文关键词显示 4.COMPARE单词比较显示,比较两个不同词或短语的搭配情况。,COCA界面简介,字串查询区: WORDS:输入字符串。 POS LIST:词性列表,COCA界面简介,语料库分类区(五大类型语料库共包括42个子语料库)。 功能:此区可以对查询的字符串限定语料类型(Genre)和时段(Year) ,并且可以明确到查询某一个子语料库,时段也可以查询任何一年的某个字词的使用情况。,COCA界面简介,语料库分类区(五大类型语料库共包括42个子语料库)。,COCA界面简介,语料库分类区(五大类型语料库共包括42个子语料库)。,COCA主要搜索功能(一),搜索words、phrases、lemmas(单词的所有形式)、wildcards(通配符)和其他更加复杂的字词。,蓝色名词 紫色动词 绿色形容词 棕色副词 灰色代词 黄色介词,Concordances显示方式,COCA主要搜索功能,例:输入词组“excuse+名词” 得到的结果都是excuse后面跟的名词短。检索表达式为:white n*。,图2.1.2-2,White+名词的短语,规则:名词: n*;动词: v*; 形容词: j*; 副词: r*;代词:p*;连词:c*,POS LIST 词性列表,noun.ALL=名词 noun.SG=单数名词 noun.PL=复数名词 noun.CMN=普通名词 noun.+PROP=专有名词 noun.-PROP=非专有名词,POS LIST,POS LIST,verb base=动词原形 verb.INF=动词不定式 verb MODAL=情态动词 verb 3SG=动词第三人称单数 verb ED=过去式 verb EN=过去分词 verb ING=现在分词 verb.LEX=lexical verb实意动词 verb.BE=系动词 verb.DO=do verb.HAVE=have,pron.INDF 不定代词 pron.PERS 人称代词 pron.WH 疑问代词 pron.REFL 反身代词 adj.CMP 形容词比较级 (comparative) adj.SPRL 形容词最高级 (superlative) adv.particle 副词小品词 adv.WH 疑问副词,POS LIST,det.GEN 类指限定词 det.POS 物主限定词 num.CARD 基数词 num.ORD 序数词 conj.CRD 并列连词 conj.SUB 从属连词 Interj. 叹词 PUNC 标点,POS LIST,词性列表的使用,某个词前或者后面特定词性的若干搭配词,如confidence前的形容词,例:输入lemmas(即一个单词的单复数、时态等所有形式)。若要得到get这个单词的所有形式,可以如下图所示。,COCA主要搜索功能,规则:若要得到某个单词的所有单复数和时态形式,那么就要在输入时,在这个单词外加 。,EXAMPLE,例:输入通配符(wildcards),输入un*ly,结果如图。,? 代替一个字母 * 代替任意数量字母,EXAMPLE,例:输入某种词性且部分带有某些字母的命令,如要得到以un-开头、-ed结尾的所有形容词的所有形式,以及得到动词+任何词+ground的所有词组。,规则: 若要得到某种词性且词中带有部分带有某些字母的形式时,如要得到以un-开头、-ed结尾的所有形容词的所有形式,那么输入: un*ed.j*; 若要得到动词+任何词+ground的所有词组,那么输入: v* * ground即可。 前者用来研究词汇,后者用来查询特定词性的搭配。,un-开头、-ed结尾的所有形容词,动词+任何词+ground的所有词组,搜索搭配词和出现的频率 如“go后跟的形容词”,COCA主要搜索功能(二),规则:在collocates里输入n* 后选择4,表示在thick4后面(4跨距范围内)出现的任何名词,如:跟在 “名词smile前面的形容词”,规则:在words里输入: smile.n*,表示作为名词的smile。,搜索在子语料库内(或之间)出现的频率(或比较)(不同语域中的用法) Dwell是个文

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论