语料库简单DIY第三讲_第1页
语料库简单DIY第三讲_第2页
语料库简单DIY第三讲_第3页
语料库简单DIY第三讲_第4页
语料库简单DIY第三讲_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1如有帮助欢迎下载支持a.用语料库软件处理语料数据,这是一种从感性思维到理性思维的语料库简MonoConcPro2.2主讲叶城日本国立广岛大学综合科学研究中心计算机辅助语言教学博士一年联系方式:QQE-mail:2如有帮助欢迎下载支持首先我们来简单回顾一下上一讲我们所学的内容。如果有WordList,也就是我们所说的词频功能。需要掌握一种查询检索软件,我们就可以掌握几乎所有的语料库软问,学习这些软件觉得太复杂,有没有更加简单的方式来掌握语料3如有帮助欢迎下载支持语料库软件高级搜索的建立--MonoConcPro2.2 -u.ac.jp/whistle/corpus/MoconcPro2.2.rar Concordance语料检索索引的建立4如有帮助欢迎下载支持Concordance--这东西是干吗的啊?语料检索索引?这是什么其实,语料检索索引,是我们语料库使用的核心,是使用语料朋友,赶紧去看上一讲的帖子去。5如有帮助欢迎下载支持然后,我们可以看到软件中出现了功能选项的那一行菜Search这个时候就会出现以下的画面来输入指定查询的字母,数字,单词,短语,句子等信息的对话框来输入指定查询的字母,数字,单词,短语,句子等信息的对话框。6如有帮助欢迎下载支持7如有帮助欢迎下载支持也就是the所在的文章中的句子,或者句子片断。我们点击每一个含有the的句子,就可以在窗口中看到原文。红色和深红色字体是8如有帮助欢迎下载支持熟悉和亲切。这就是我们使用语料库检索工具熟悉和亲切。这就是我们使用语料库检索工具的关键所在---就是为9如有帮助欢迎下载支持一个应用程序的指定入口点。在JAVA环境下,也使用类似的KWIC功能,来显示网页的LINK。总之,这个模式应用的范围非常广,如比如要比较两个特定的语言环境下的the的用法,如果是上下罗列,支持掉这些字母标记,我们只需要在刚才的右键菜单中选择该怎么处理呢?不难,选择你不要的句子,然后选择功能菜单中的就可以选择多个句子了,然后再使用DeleteItem(s)功能去删除就支持支持是语料库中的语料就不再那么复杂繁琐,相反变得异常容易研究了足够了。那么,这个Sort排序功能到底是什么东西那么让笔者兴首先我们还是回到Search之后的画面以说出了具备指定的单词以外,没有什么规律可言。因此,我们对支持112ndLeft(以被检索单词the往左数第二个单词为基准)221stLeft(以被检索单词the往左数第一个单词为基准)33SearchTerm(以被检索单词the本身为基准)441stRight(以被检索单词the往右数第一个单词为基准)552ndRight(以被检索单词the往右数第二个单词为基准)661stRight,1stLeft(以被检索单词the往左数第一个单词+thethe+被检索单词the往右数第一单词+“,”的结构为基准)thethe往右数第一个单词+tstthethe+被检索单词the往左数第一单词+“,”的结构为基准)99AdvancedSort(建立高级,自定义Sort排序关系)支持1~5的排序功能,都是为了检索在1~5的排序功能,都是为了检索在the来排序。简单来说,这句话就是要把the左边的第一个单词进单单词的左右位置都会出现一子吧。后试试看。我们选择Sort菜单中的SearchTerm,然后在出现的子菜单中,选择菜单中,选择词词the本身为基准+以被检索的单词the往左数第一个单词为基准准行排列。但是因为我们的排序要求,需要变成计算机语言,所以我点击完之后,然后我们就看到了下面这张图。支持个字母的顺序进行排列了。这时候我们仔细观察,就发现在the的前面会出现很多前面会出现很多and,at,by,from,but,for等等频率极高的单支持支持是的,我们就看到了,软件是的,我们就看到了,软件自动将the右边的第右边的第一个单词按照字母全全是名词,显示了其强大的定冠词作用!-----------------------------------------课间休息----------------------------------------------------起码也得有个原因吧~?于是乎,我又爬起来,面对台下依旧茫然的学生们,继续开始了我们的亡命之旅。支持上在Concordance的检索结果中,所有的单词都是这样被系统默认ht朋友们一边听我关于Sort排序功能的介绍的同时,也请一边使用着这个功能。在使用中,我们很惊奇地发现,在Sort排序下20如有帮助欢迎下载支持选择2ndLeft+NoSecondSort和选择2ndLeft+SearchTerm和选择SearchTerm+2ndLeft三者的排序条件是一样的,其实都是把the往左数第二个单词按照字母表的顺序进行想得够周到吧。21如有帮助欢迎下载支持选择2ndLeft+1stRight,这个排序条件是说我们以22如有帮助欢迎下载支持恩~排序结果我们看到上图就明白了,这样的排序,方便我们查询固定搭配,词性变化等。如果有这方面研究意向的朋友,是不是发现MonoConcPro的功能异常强大啊?其他的一些排序条件和搭配,就23如有帮助欢迎下载支持24如有帮助欢迎下载支持刚才那些什么排序,什么检索,是不是把朋友们都搞得糊是我们上一次讲座讲到的Frequency功能。不过,这次我们直接选择CollocateFrequency然后我们就可以看到下面这张图。2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论