语言测试学第二组_第1页
语言测试学第二组_第2页
语言测试学第二组_第3页
语言测试学第二组_第4页
语言测试学第二组_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

语言测试学第二组概说语言测试语言测试的总体设计语言测试的质量评估目录第2页,共31页,2024年2月25日,星期天测量,测试,评价语言测试的主要类型语言测试的作用,发展,第一部分总体概况概说语言测试第3页,共31页,2024年2月25日,星期天调研方法

测量,测试,评价第一部分测量(measurement)就是按照一定的规则给事物的属性指派数字或符号的过程。事物及属性。这是测量的对象及其属性。指派数字或符号。即用数字或符号来代表某一事物或事物的某一属性的量。法则。法则是指测量所依据的规则和方法,这是测量的关键。第4页,共31页,2024年2月25日,星期天调研方法

第一部分测量,测试,评价测试包括以下三个基本要素:行为样本:所谓行为样本,是指对语言能力表现行为的有效的抽样。客观的测量:所谓客观的测量是指测量的标准是否符合实际。标准化的测量:是指在测试题目的编制、测试的实施、计分以及对分数的解释等方面有一套严密的系统的程序。2.测试(Test)又称测验。不同的心理学家对此下的定义不同。Anastasi(1982)认为,测试实际上是对行为样本所做的客观的标准化的测量。这是公认的最有权威的定义。第5页,共31页,2024年2月25日,星期天调研方法

第一部分测量,测试,评价3.Weiss(1972)认为,评价(evaluation)是指为作出某种决策而收集资料,并对资料进行分析,作出解释的系统过程。与测量、测试相比较,评价的含义更广、综合性更强。并非所有的测量都是测试,并非所有的测试都属于评价,而且并非所有的评价活动都涉及到测试或测量。第6页,共31页,2024年2月25日,星期天调研方法

第一部分水平测试proficiencytest成绩测试achievementtest,也叫学业测试。

分班测试placementtest潜能测试aptitudetest(能力倾向)诊断测试diagnostictest以测试用途为标准的分类:语言测试的主要类型第7页,共31页,2024年2月25日,星期天调研方法

第一部分按学习阶段来分:分班测试(placementtest)随堂测试(classroomtest)期中测试(mid-termtest)期末测试(end-of-termtest)按考试方式来分:分离式测试(discrete-pointtest):把知识和能力分解为若干小的单位,如集中考查语言的某一方面,或考查学生单方面的技能。综合性测试(integrativetest):听写、完形填空、写作、翻译。语言测试的主要类型第8页,共31页,2024年2月25日,星期天调研方法

第一部分语言测试的主要类型按对考试分数的解释来分:常模参照性测试(norm-referencedtest)标准参照性测试(criterion-referencedtest)按试卷的评阅方式来分:主观性测试(subjectivetest):作文、口试、简述、翻译等。客观性测试(objectivetest):选择、判断、配对题等。第9页,共31页,2024年2月25日,星期天调研方法

第一部分(1)一般作用:评价学习者的学业成就和语言水平。评估教学的实际效果。为选拔人才提供依据。为改进教学中的问题提供反馈。(2)对于各种有关人的语言能力的假说,需要实证性数据的证实,语言测试在这方面可以为语言研究(语言教学研究)提供信息,发挥重要作用。(3)语言测试研究能够为第二语言习得研究提供更为可靠而有效的方法和手段。语言测试的作用:语言测试的作用,发展第10页,共31页,2024年2月25日,星期天调研方法

第一部分语言测试的作用,发展(1)传统时期或前科学时期(20世纪初-50年代初):依靠直觉判断。作文、口试、翻译等方法。(2)心理测量-结构主义时期或科学时期(50年代末60年代初-70年代):以结构主义语言学、行为主义心理学、心理测量学为基础,RobertLado《语言测试——外语测验的开发与使用》(1961)为标志。主要是分立式测试。(3)心理语言学社会语言学时期或后现代时期(70年代-80年代初):注意功能性社会性和语言应用。综合式测试,出现完型填空(ClozeTest)等形式。(4)交际法语言测试时期(80年代初至今):ACTFL和欧洲《功能意念大纲》、《交际大纲》为基础。Bachman的“语言交际能力模型”。语言测试主要发展阶段:第11页,共31页,2024年2月25日,星期天

外语测试的发展LanguageTeachingMovement

语言教学的发展LanguageTestingMovement 语言测试的发展LinguisticBasis语言能力观Prescientific前科学时期

Abilitytotranslate翻译能力1960s-1970s:Audiolingual+Structuralist专门人士—学生,听说+结构训练

Psychometric-structuralist心理测量-结构主义语言学时期Ability=Component+skills语言知识+语言技能1980s-1990s:Communicativelanguageteaching普及,交际教学

Communicative 交际语言测试时期Abilitytocommunicate交际能力:功能、意念、任务21th:Educationforinterculturalcitizenship???Integrative-sociolinguisticTask-basedlanguageassessment基于任务的测试时期-1950s:Grammartranslation精英,语法翻译

第12页,共31页,2024年2月25日,星期天调研方法

第一部分(1)中国是最早使用考试(西周)。(2)科举是一个标准化程度很高的测试体系。(3)70年代末受TOEFL等影响开始第二语言测试,出现“英语水平考试(EPT)”“大学英语考试(CET)”。(4)对外汉语教学界“汉语水平考试(HSK)”影响广泛。中国的语言测试:语言测试的作用,发展第13页,共31页,2024年2月25日,星期天语言测试的作用,发展哲学观:分析转向综合语言观:形式、知识转向内容、运用测试方式:个别技能转向多项技能题型:客观题转向主观题从只注重测试结果转向注重考试过程从间接测试到直接测试语言测试以人为本语言测试发展趋势第14页,共31页,2024年2月25日,星期天第二部分1、确定考试类别2、确定考试内容3、确定考试题型4、确定试卷结构5、制定考试细目表6、命题及编辑试卷

——编写试卷语言测试的总体设计第15页,共31页,2024年2月25日,星期天第二部分考试目的不同,试卷的内容、要求也不一样。1、确定考试类别2、确定考试内容3、确定考试题型(1)根据测试目的选择题型(2)纵横结合,确定题型是否有效(3)考虑被试的能力范围(1)多项选择题(2)是非题、判断题(3)配对题语言测试的总体设计第二部分语言测试的总体设计第二部分语言测试的总体设计第二部分语言测试的总体设计第二部分语言测试的总体设计第二部分语言测试的总体设计第16页,共31页,2024年2月25日,星期天4、确定试卷结构首先,要确定试卷各部分的比例;其次,是研究每一部分有多少题目才能保证测试起码的效度;第三,题目数确定了,还要看时间是否够。第二部分语言测试的总体设计第17页,共31页,2024年2月25日,星期天5、制定考试细目表知识理解应用分析综合总计比重时间(分)语法10102012.520词汇202012.560阅读404025综合填空202012.520听力353521.930写作252515.630总计3075102025160100160第18页,共31页,2024年2月25日,星期天6、命题及编辑试卷整个命题过程包括选材、编写试题、审题等环节。命题原则:先出容易的题,后出现较难的题目;题型相同的题应放在一起;客观题在前,主观题在后。规模大、影响大的测试在正式实施前还要进行试测,以验证试卷有没有缺失,要不要作一些改动等。命题要求:效度、信度,注意试题的难度和区分度等。第二部分语言测试的总体设计第19页,共31页,2024年2月25日,星期天第二部分语言测试的总体设计1.区分度:指一个题目对于鉴别被试的水平所起的作用有多大。(1)区分度指数(极端分组法):27%D=(高分组答对此题人数-低分组答对此题人数)/高分组或低分组人数。例题:P326-327。D在-1―+1之间,一般要求在0.3左右。特点:简便;不够精确题目分析的方法第20页,共31页,2024年2月25日,星期天难度的形成知识的综合程度试题的呈现形式试题提问的思维跨度有用信息的提取难度第二部分语言测试的总体设计第21页,共31页,2024年2月25日,星期天试题的难易度第二部分语言测试的总体设计2.难易度:指某个题目的答对率,即答对某题目的被试占全部参加测试的被试的比例。

p=答对此题人数/总人数,范围应在0.2-0.8之间。

平均难易度(一个测试的各个题目的难易度相加,再除以题目的数量),宜在0.5左右。

特别要求:被试的同质性第22页,共31页,2024年2月25日,星期天题目分析报表题目编号:IT98CR-107标准答案:A题目质量:不合格题目正文107.大学生们十分感动。A.激动B.感激C.震动D.感慨一年级组考生数:173难易度:0.1053区分度:0.0180选项人数平均分数双列相关点双列相关

A2620.810.02760.0180B9521.82-0.2921-0.2324C1916.260.41800.2493D3219.220.15280.1050E117.500.19070.0048报告人:XX考试中心报告日期:1998年X月X日题目的修改第23页,共31页,2024年2月25日,星期天题目的修改题目分析报表题目编号:IT01CR1-107标准答案:A题目质量:合格题目正文107.大学生们十分感动。A.震撼B.可怜C.努力D.骄傲一年级组考生数:138难易度:0.5036区分度:0.3976选项人数平均分数双列相关点双列相关

A7021.630.49830.3976B518.600.07770.0317C3417.350.30690.2243D2817.360.28190.1976E117.000.67100.1648报告人:XX考试中心报告日期:2002年X月X日第24页,共31页,2024年2月25日,星期天用语表达:注意准确规范试卷格式:注意整齐美观试题内容:注意科学无误知识点覆盖面广、重点突出难度、比例和区分度适宜设计的题目是否如实地反映出考试细目表中的内容和要求?题目的要求是否明白无误?试题前后是否有提示?题目的难度是否适中?题目的覆盖面是否够广?第二部分语言测试的总体设计第25页,共31页,2024年2月25日,星期天第三部分语言测试质量评估第三部分语言测试质量评估第三部分1.信度2.效度3.真实性4.互动性

5.可行性

6.后效作用第26页,共31页,2024年2月25日,星期天语言测试质量评估第三部分1.信度信度(reliability)指同一个卷面和难易程度相同的试题用于水平基本相同的测试对象,测试结果是否基本相同。阅卷员信度,阅卷员自身信度2.效度效度(validity)指测试的有效程度,也就是测试的内容和方法是否达到了测试目的。要求:该测的当测,不该测的尽量不涉及;是否有缺漏或出现偏题、怪题;代表性、准确度和覆盖面如何。类型:构念效度、内容效度、表面效度、预测效度,方法效度第27页,共31页,2024年2月25日,星期天语言测试质量评估第三部分3.真实性

语言测试的真实性指目标语言使用任务特征(targetlanguageusetask)与测试任务特征(testtask)的一致程度。目标语言使用任务指通过测试所要预测的被试者在将来工作中为达到一定目的在特定场合用所学语言所进行的一系列活动。测试任务指能够考察、预测、判断被试者在将来工作中目标语言使用能力的最佳测试方式。第28页,共31页,2024年2月25日,星期天语言测试质量评估第三部分交互性指被试者在完成一件测试任务(testtask)时所涉及到的个人特征类型(individualcharacteristics)及程度。与语言测试最有关的个人特征主要有:语言能力(languageability其中包括语言知识languageknowledge、策略能力strategiccompetence或称元认知策略metacognitivestrategies)话题知识(topicalknowledge)情感图式(a

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论