基于学习者语料库的过渡语错误分析.pdf_第1页
基于学习者语料库的过渡语错误分析.pdf_第2页
基于学习者语料库的过渡语错误分析.pdf_第3页
基于学习者语料库的过渡语错误分析.pdf_第4页
免费预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2008年4月 第25卷 第2期 西南科技大学学报 哲学社会科学版 Journal of SouthwestUniversity of Science and Technology Apr 2008 Vol 25 No 2 收稿日期 2007 11 23 作者简介 许智坚 1957 男 副教授 研究方向 语料库语言学 英语教学法 基于学习者语料库的过渡语错误分析 许智坚 龙岩学院外国语学院 福建龙岩 364000 摘要 语料库产生之前 由于缺乏大量有代表性的语料 对学习者过渡语的错误分析往往局限于定性分析 对学习 者错误的识别方法仅仅停留在教师的主观观察和内省阶段 缺乏对错误出现的频率 分布特点及错误的严重性等方 面的客观信息 语料库语言学的发展 计算机错误赋码和分析工具的开发使学习者错误分析由过去的主观的定性 分析转为数据驱动的定性定量结合型分析 其方法更为客观 全面 科学 关键词 学习者语料库 过渡语 错误分析 对比分析 中图分类号 G642 421 文献标识码 A 文章编号 1672 4860 2008 02 0075 05 Learner Corpus2based Interlanguage Error Analysis XU Zhi2jian School of Foreign Languages Longyan University Longyan 364000 Fujian China Abstract Before the emerging of corpus2based analysis mostof the error analysiswere restricted to qual2 itative analysis because of lacking abundance of representative corpora materials The method of identif2 ying learners errorswas remained in the teacher s introspection of subjective observation which could not provide external infor mation as the frequency of errors the features of distributing and the ponderance of errors W ith the development of corpus linguistics and computerized error tagging technology learner error analysis has been shifted from subjective qualitative analysis to data2driven quantitative and qualita2 tive comprehensive analysis The methodology of analysis has become more objective universal and scien2 tific Key words Learner corpus Interlanguage Error analysis Contrastive analysis 一 引言 语料库 corpus 是指按照一定的语言学原则 为某一具体目标收集自然出现的连续的语言运用文 本或话语片段而建成的有一定容量的语言数据库 随着计算机处理速度的提高以及存储能力的扩大 语料库建设呈现多元化发展 用于学习者语言运用 分析的学习者语料库 learner corpus 的建设及其相 关研究得以迅速发展 学习者语料库与一般语料库 不同 它是指经过计算机处理的外语学习者的语言 产出的文本数据库 1 记录的是学习者的过渡语 interlanguage 学习者语料库借助计算机硕大的 存储空间 强大快速的处理能力和语言处理技术对 语料进行自动词性赋码 错误赋码 语义赋码 话语 赋码和句法标注 为深入研究学习者过渡语的语音 词汇 语法 语篇 语用 交际能力的发展提供充分的 数据和实证 在语料库产生之前 对学习者语言材料的错误 分析 error analysis 简称 EA 只能是定性而非定量 的 基于学习者语料库的错误分析是一种强有力的 研究手段 它使用较为全面而有代表性的大型语料 库或是研究者根据研究目的而建立的小型语料库 以计算机检索工具作为辅助手段 能够快速准确地 获取有关错误的出现频率 种类和语境等方面的信 息 为更充分地描写学习者过渡语的特点提供了大 量的例证语料 二 错误分析理论 众所周知 学习者在第二语言习得过程中出现 错误是自然的 不可避免的 教师的任务就是对学 习者在语言学习中出现的错误进行客观 全面的分 析 找出学习者出错的原因 从而指导教学 以达到 学生少出错 不出错的目的 Corder认为 学习者的 错误分析有以下三个作用 第一 通过对学习者的错 误进行系统分析 教师可以发现学习者的语言水平 在多大程度上接近目标语 哪些方面还需努力 第 二 研究者可以了解学习者在学习过程中所使用的 学习策略和步骤 获得学习者如何学习或习得语言 的证据 第三 犯错误是学习者为了习得而使用的一 种学习手段 它是学习者用来检验其对所学语言的 本质的假设的一种方法 2 Leech 1998 认为 建 立学习者语料库的目的是 1 比较学习者语料库 和以目标语为母语的语料库 看有哪些语言特征是 使用过度的 overused 或是使用不足的 under2 used 2 学习者的母语在多大程度上影响了他们 使用目标语的行为 3 学习者的目标语在哪些方 面达到或未达到目标语说话人的言语行为 4 学 习者有哪些主要方面未能符合目标语说话人的言语 行为而需要特别的帮助 3 在学习者语料库产生 之前 由于缺乏大量有代表性的语料 对过渡语的分 析往往局限于定性分析 对学习者错误的识别和分 析仅仅停留在教师的主观观察和内省阶段 缺乏对 错误出现频率 分布特点及错误的严重性等方面的 客观信息 语料库语言学的发展和计算机错误赋码 与检索 分析工具的开发使对大量的学习者语言运 用材料进行量化分析成为可能 对学习者的错误分 析由过去的 主观分析 和 定性分析 为主逐渐向 数据驱动型分析 和 定性定量结合型分析 转变 学习者错误分析基于学习者过渡语分析理论和 过渡语对比分析理论 过渡语 interlanguage 是指 第二语言习得中学习者自己构建的一种母语和目标 语之间的过渡性语言 过渡的构建是一种自然语言 的生成 是一个错误尝试的过程 有一定的规律性 是可预测的 基于语料库的学习者过渡语对比 Contrastive Interlanguage Analysis 简称CI A 是由 Granger在20世纪90年代倡导的 她认为 利用学 习者语料库进行研究的方法通常有两种 过渡语对 比分析和计算机辅助错误分析 Computer aided ErrorAnalysis 简称CEA 4 11 14 前者是指在英 语母语者 native speaker 简称 NS 的输出和非英语 母语者 non native speaker 简称NNS 的输出之 间 或不同第一语言背景的非英语母语者之间进行 定性或定量的对比分析 NNS VS NNS 而后者是 以过渡语中的错误为对象 在计算机辅助条件下分 析带有上下文的错误 contextualized errors 为教师 和教材编写者提供更多有价值的信息 进而促进外 语教学 因此 CI A和CEA比起传统的CA Cont2 rastive Analysis 和EA 不仅因为机辅的数据库容量 大 赋码更标准 而且还因为计算机可以显示过渡语 或错误的上下文 从而使前者更具有客观性 语料 库语言学的发展和学习者语料库的建立 过渡语研 究与外语教学研究有了新的资源和途径 采用过渡 语对比研究的方法 研究者可多层面 多维度 深入 系统地概括和描述学习者语言的特征与发展模式 使得学习者的错误分析更具实证性 Granger 1996 认为基于学习者语料库的错误 分析可分为两种 一是对学习者语料库中的错误进 行分析和归类 二是将本族语语料库和学习者语料 库进行对比 找出两者间差别再进行分析 5 过渡 语对比作为基于语料库研究的先进方法之一 可用 作不同水平的学习者语料比较 如学习者口语与笔 语语料的比较 不同母语背景的学习者语料比较以 及同英语本族语语料的比较 国内外已建成的语料 库如 中国学习者英语语料库 简称CLEC 桂诗 春 杨惠中 中国学生英语口笔语语料库 简称 S WECCL 文秋芳等 以及比利时Louvain大学建 立的涵盖了20余个国家英语学习者语料的 国际 英语学习者语料库 简称ICLE Granger 等等 研究者可以利用这些学习者语料库 把中国学习者 的语音 语调 表达法等与其他母语国家或英语母语 国家人士的语言特征进行比较 分别从中获取一些 典型的语言信息 通过对比和分析比较发现学习者 过渡语的非母语特性 即偏离 包括误用 多用 少用 和回避等 典型 可靠的目标语信息对大纲设计 教 材编写等有很重要的意义 但教学水平的提高则需 要了解学习者的语言使用情况 因为后者能告诉我 们学习者会产生哪些偏离 即他们的困难就在这些 方面 6 67 西南科技大学学报 哲学社会科学版 第25卷 三 过渡语语料库的构建 过渡语语料库的构建是错误分析的基础 没有 足够的 有代表性的语料就不能对学习者过渡语进 行科学的分析 用于学习者错误分析的语料库是一 种特殊的语料库 研究者可以通过专门研究机构建 立的语料库 如CLEC S WECCL等语料库对中国学 习者的错误进行分析 也可以选择ICLE等语料库 进行过渡语对比分析 当然还可以按个人的研究需 要建立小型的专门用途语料库 基于学习者语料库 的错误分析首先要收集足够的过渡语语料 选择或 自建一个适合的语料库 然后对语料中的错误进行 标注和赋码 以便于检索和进行错误分析 或与其它 学习者语料库进行对比分析 1 语料库的建立与语料的收集 选定或建立一个学习者语料库是利用语料库进 行学习者过渡语错误分析的第一步 无论是利用市 面上已有的语料库还是自建语料库 需要考虑的因 素包括语料类型 口语还是书面语 语料性质信度 真实信息或虚构 语料目的 用于论证 描述还是 提供信息 语料收集的渠道和方式 原文输入或是 转写 等 就学习者语料库而言 其建库目的是收 集用来描述学习者语言的数据 以揭示学习者在语 言运用中出现的过渡语 僵化 错误模式或跨语言的 差异等现象 4 10 11 因此 选择的语料必须能反映 学生真实的学习情况 2 错误标注与赋码 为了方便语料的检索和错误分析 对收集的语 料的每个段落 句子都要进行文头标记 对学习者 的拼写错误和口语发音错误 还要用特殊的符号进 行手工标注 赋码 tagging 是对文本中每一个词形 包括标点符号 赋予相应的词类码 词类赋码是自 然语言处理中最基本的一步 没有任何标注或赋码 的语料 raw corpus 只能用作词频统计 单词检索等 基本层次上的分析 如果要进行错误分析 就必须 对语料进行错误赋码 error tagging 把语料有关 的错误类型信息以一系列编码形式标注出来 在进 行错误赋码前需要设计错误标注体系 赋码方案制定后就可能对语料进行人工赋码或 利用计算机对语料进行自动赋码 英国兰卡斯特大 学研发CLAWS自动赋码器是目前普遍使用了赋码 工具 英国国家语料 British National Corpus 简称 BNC 采用它作为词性赋码工具 其赋码准确率达到 99 7 以上 Leech 1993 认为 赋码可将语料所有的解释性 尤其是语言学上的 信息以编码形式附着或穿插 到现有语料中 4 16 使原始语料库成为能提供丰富 信息的标注语料库 annotated tagged corpus 赋码 越详细 研究者从中获得的信息也就越多 而用于 学习者错误分析的学习者语料库在标注方面要求更 高 应在采用传统词性标注或句法标注等方法的基 础上补充新型标注方法 用于揭示如过渡语 学习者 错误等学习者语言中不同寻常的特性 四 基于语料库的错误分析方法 二语习得研究对错误有三种划分法 一是按照 语言类别分类 即根据语言单位的错误特征 词汇 句法错误等 来分类 二是针对错误表层结构的表 层策略分类法 surface strategy taxonomy 即把所犯 的错误分成遗漏 多余添加或结构混乱等 7 三是 根据学习者所犯错误的系统性 systematicity 进行 分类的方法 即将错误分成学习者不知道某项语法 规则存在的前系统错误 presystematic errors 学习 者学错某项语法规则的系统错误 systematic errors 和学习者知道但不能稳定使用某项语法规则的后系 统错误 postsystematic error 8 学习者语料库的错 误分析大多按照第一种语言类别来分类 以保证分 析的可靠性和一致性 如Louvain大学开发的计算 机辅助错误分析系统 the Computer aided Error A2 nalysis 简称CEA 将错误分为9个类型 形式 语 法 词汇语法 词汇 语域 缀词 缺词 词序以及文 体 每一类型错误下又可分为多个子类型错误 如 GVT grammatical verb tense 表示语法的动词时态 错误 GVAUX表示语法的助动词错误 9 基于学习者语料库的错误分析可采用以下几种 方法 1 词频统计分析 词频统计 word frequency count 是把语料库中 出现的所有类符 type 统计列表 词表提供以下几 种信息 类符总数 每个类符的频数 每个类符的频 率 通过词频统计 可以发现学习者的各种词类的 词汇使用频率 从而分析词类使用是否恰当或词汇 语法错用的概率 从而分析这些错误出现的原因 是 受母语影响 还是因教师在教学上的错误所导致的 77第2期 许智坚 基于学习者语料库的过渡语错误分析 词频统计也可以对错误赋码的语法词汇成份进行统 计 以发现学习者较容易出错的类型 如Granger 在对母语为法语的英语中级学习者和高级学习者两 个子语料库 每个语料库7万5千词 均标注了错误 赋码 的学习者在写作中的语法错误进行词频统计 分析和比较 见表1 发现学习者的语法错误中助 动词错误最多 317 个 时态错误居二 248 但通 过对中级学习者和高级学习者自身的纵向比较 发 现与进步率较高的助动词方面 67 相比 学生在 时态方面的进步率最低 35 这一分析结果在语 言教学上应引起该老师群体的足够重视 9 2 词语 词组语境共现检索 词语索引的基本意义是把搜索词或词组按字母 或频率顺序排列与其所在语境一同展示 通过检索 分析 教师可以了解学习者对复杂的名词短语结构 动词形式 介词搭配 从句等语言项目的使用情况 可以分析学习者的语言形式错误和语用错误 词 法 句法 篇章结构等不同层次 这种基于学习者 语料库的错误分析方法有助于分析学习者所犯的错 误是否具有一定的规律性 是偶然的错误还是规律 性的错误 如果错误具有一定的规律性 那么造成 这些规律性错误的深层原因又是什么 教师可以利 用这样的信息将学生的错误进行系统的分类 并对 教学的重点进行相关调整 以下是从CLEC中检索的学习者错误使用 at2 tention 类联的部分例证索引行 10 47 h water People has paid more and moreatten2 tion todealwith it Scientists y the developing countries paid moreattention todevelop economic in the pas ries in theworld have switched theirattention to2 develop their economics F in a haste state he can t pay all hisattention todo the things carefully ly In additional people paid moreattention to2 do excise In a conclusi 3 过渡语对比分析 CI A是语料库语言学与第二语言习得研究结合 后新生的研究领域 基于语言项目在语料库中的概 率信息等量化数据 多纬度 多层面地对比分析至少 两个语言使用者群体的言语行为 从而概括和描述 学习者过渡语的特征 模式及其发展规律 剖析和诊 断过渡语的错误及其原因所在 11 如将中国学习 者语料库与英语母语者的语料库或其他类型非英语 母语者的学习者语料库对比 找到自己学生在词汇 短语和结构方面滥用或少用的现象 并将分析结果 及时反馈到课堂教学中 调整侧重点或加强对某一 语言点 如词汇搭配 的解释等等 以促进以学习者 为中心或有学习者意识的教学 还是以名词 attention 的使用情况为例 以下 是分别从中国学习者语料库CLEC和英国本族语语 料库BROWN中检索出的该词在各类联接上的使用 情况 见表2 表1 语法错误分类表 9 193 错误类型 3检索错误数中级者错误数高级者错误数进步率 GVAUX3172397867 GVT2481509835 GVNP91573440 GVN72541866 GVM2921862 GVV1713469 GV错误总数77453424055 表2 名词 attention 在各类联接上的使用分布情况 10 47 类联接 CLEC BROWN 频数百分比频数百分比 vN53 686235 63 vN to n ing10879 414928 16 vN prep n ing96 6295 17 vN inf139 5600 Others10 745431 03 Total136100174100 87 西南科技大学学报 哲学社会科学版 第25卷 从表2不难看出 中国学习者过度使用了 v N to n ing 这一类联接 而对 v N 和 其它 偏少 使用 v N inf 项还曝露出中国学习者错用情况还 比较严重 此外 随着语料库语言学研究的进一步深入 不 少学者还利用先进的概率统计方法和工具 如SPSS 等 从 语言失误 母语负迁移 错误类比 过度概括 以及 教学问题 等方面对语料库进行 多维度的分析 以找出学习者错误的原因 限于篇 幅 这里就不赘述了 五 结束语 近年来 从事第二语言习得的专家学者对各类 学习者错误进行研究和分析 并取得了一定的成果 二语习得研究最重要的数据来源是学习者在语言学 习各个阶段所产生的学习者语言 学习者的这种介 于母语和目标语之间的过渡语让研究者有可能洞悉 无法直接观察到的语言习得过程 语料库语言学的 发展为学习者错误研究开辟了一条新的途径 对学 习者的错误分析从内省的主观的定性分析转为以数 据驱动的定性定量综合分析 通过对学习者语料库 中收集到的过渡语进行描述和分析 不仅可为研究 者提供学习者如何学习第二语言或外语的重要信 息 还可为语言教学提供有关学习者语言运用和典 型困难的可靠信息 从而提高语言教学的效率 由 于利用语料库进行学习者的错误分析需要借助计算 机进行 建立一个语料库又非常费时费力 一般教师 往往望而怯步 但随着语料库语言学研究的深入 计 算机应用的进一步普及以及语料库赋码 分析手段 的更加智能化 我们相信将会有越来越多的普通教 师利用语料库研究这一先进的手段对学习者错误进 行更为客观 全面 科学的分析 从而促进我国的外 语教学 注释 根据Granger的错误分类 GV 语法动词 类错误还可分 为 GVAUX 助动词错误 GVT 时态错误 GVNF 动 词不定式错误 GVN 动词的一致性错误 GVM 词法 错误 和GVV 语态错误 参考文献 1 Leech C Preface In S Granger ed Learner English on Computer C London Addison Wesley Longman Limited 1998 3 2 Corder S P The Signi

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论