语料库课程(一)笔记解析教学课件_第1页
语料库课程(一)笔记解析教学课件_第2页
语料库课程(一)笔记解析教学课件_第3页
语料库课程(一)笔记解析教学课件_第4页
语料库课程(一)笔记解析教学课件_第5页
已阅读5页,还剩122页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

语料库在外语教学研究中的应用研修班●●●8.1-83●●●●8.1上午(一)梁茂成基本概念真正的研究要用语料库来验证结果Ts①Text(readable)②Type类符③Token形符(语料库容量)c's①concordance索引②collocation(词汇层面的搭配)③colligation(类联接)④context为什么要研究语料库语言学1)使语言学研究更具科学性2)可验证,不是玩具3)大数据,更具说服力4)enablesyoutolookatalotoflanguageatonce8.1上午(二)李文中Brown-Raw语料库范例◆span跨距(KWC,一般左5右5)◆检索→排序(sort),以necessarily为例,观察得出结论:经常与not连用Whyconcordancing上下看强形式搭配,左右看综合分析用法基本概念type(独特词形),token,KW/SW/Nodeword(一个span可视作一个minitextco|locates(观察从collocation>colligation→semanticmeaning)cotext,context,co-occurrence(同现),recurrence(复现Wordsclusteraspeopledoeg.Search:noattempt用法Regex:\bno\blsattempts?(ed/ing)\b观察collocationandco-occurrence作业:hair:单数与复数的隐喻bodymetaphor8.1上午(三)许家金●P。werConc设计原则mostpowerful◆leasteffort◆doingmorewithless基本操作N-gramlist:n词词表●Hits:相当于Token概念tems:相当于Type概念size:包括单词、符号、数字●Filtermode:过滤掉不需要的<byvalue>:data+min10,即过滤掉频率<10的词<byRegex>:ns+CS+表示介词+连词exclude表排除不勾选表示选中Savedistribution”保存分布信息,即按文本单独保存。8.1下午(一)李文中1.标注信息的添加与使用eg.用PowerConc检索data≯|eaner→>secl◆问题:男生与女生在口语中使用情态动词有无差异step1打开Sub-corpuscreator,导入seccel(只能导入单个文件夹),显示文本文件,勾选casesensitive(区分大小写),filecontains“T1=”,获得男生/女生文本,保存生成子库step2用PowerConc对两个子库进行比较2趋势small&specificcontrastivestudies3建库准备建库原则,文本收集,文本分类,文本处理,标记(外部信息),标注(annotatingnotes,语言学标注)e.g.<Year>1990</Year><Sex>Male</sex>8.1下午(二)许家金语料库采集与整理1.基本要素①Textformat:.tt②Filename:short&alphanumeric(字母数字组合,不超过8词,不用汉字,不出现空格)③encodingANSI:英

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论