




全文预览已结束
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
计算机应用技术论文:自适应性英语测试研究难点所在摘要:自适应性测试从提出发展至今,虽然已经取得一定的成果,但是影响自适应测试普及的瓶颈依然存在。本文在简要介绍自适应测试理论的基础上,以英语水平测试为例,分析了自适应测试中的多个难点,并指出自适应测试研究发展的长期性和复杂性。关键词:自适应性 测试项目反应理论 英语水平测试 难点 引言随着计算机技术在各类考试中的应用,自适应测试日益成为人们关注和研究的课题。自适应测试全称为计算机化自适应测试(Computerized Adaptive TestingCAT)1,是以项目反应理论为核心,主要用于解决计算机化测试中如何客观公正地评价每一位受试者真实水平的一种较为科学的评估方式。一、自适应性测试的理论基础最早的自适应性测试可以追溯到比奈测验,在比奈测验中呈现给受试者的下一个测验项目是根据他对前一个项目的反应决定的,即对各种不同能力水平的被试(testee)给予难度合适的测试项目2。随着计算机技术的发展,后来出现了计算机辅助测试。这种机辅测试仍以经典测试理论为依据,多为纸笔测试形式的电子版,除了测试媒介的改变外,并无实质性进步。直到70年代末80年代初项目反应理论(Item Response Theory(IRT)与计算机技术相结合,出现了基于计算机的自适应测试,才充分发挥了计算机优势,使测试的实施更加有效,测量也更加准确。项目反应理论的实质是一条项目特性曲线,并以多种数学表达式来描述其所包含的两个方面的参数:测验项目的特征参数和考生的特征参数,又称能力参数。在测试中,系统经过分析被试者回答问题的情况,再通过题目特征函数的运算来推测受试者的能力。与其他测试理论相比,项目反应理论的创新点在于其以四个强假设为基础:1、能力单维性假设。即测试中某一能力变量的测量独立于其他能力变量,在分析时可置于一个分析量表中,因而不同被试者的同一能力变量之间可以相互比较。2、局部独立性假设。即受试者对于每个测试项目的回答或反应在统计上是独立的,测试题目之间不存在相互影响。3、试题特征曲线假设。这一假设通常用一个单调上升的函数来表示被试者对于某一道试题的正确反应的概率。目前最常见的模型为在二值评分方面常用的单参数、两参数和三参数的Logistic模型3。4、速度无关性假设。通常自适应测试都含有一个隐含的假设:进行测验时,受试者不被规定在一段时间内完成测试,即完成测试的时间具充分性。被试者有足够的时间完成测试,如若答错试题,则原因就是能力不够。二、自适应性英语水平测试的优势自适应性测试作为一种先进的测试方法,已经应用于多种学科的考试之中,其中以英语水平的测试最为常见。较之于传统的纸笔考试,自适应性英语测试有着明显的优势:1、试题参数如难度,鉴别度和猜测度不会因为试题样本的不同而异,能够更客观、精准地反映考生的实际水平。2、大规模英语水平测试采用自适应模式,考试时间及地点没有硬性规定,学生可以在任意时间登录系统完成测试,从而根据自己的学习状况进行自测。3、选择在考生能力水平附近的试题进行测试,能够节省测试时间,更加准确地测量出考生的英语水平。三、自适应性英语水平测试研究难点1、受试者是否能适应机考模式因被试者计算机水平的差异及受测时的焦虑程度不同,自适应性英语水平测试中公平性往往受到质疑。譬如,被试者对计算机操作不够熟知,或受计算机屏幕尺寸的限制,每页显示文本有限,长篇阅读文章会加重考生认知记忆负担而影响考试发挥。2、试题材料如何赋值在自适应英语水平测试中,对语言材料进行赋值,试题参数在确定难度等级时的权重,以及不同任务类型是否会带来不同难度结果等等,这些都是难以解决的问题。以听力为例,词汇难度、语速、语音、句子结构、谈话主题、体裁等都会影响材料的难度,而题项所考察的微技能和任务类型也会影响试题的难度。对测试材料难度等级的各个因数值的确定以及不同微技能和任务类型对测试难度的影响都需要通过试验才能获得。3、组卷公平性以及试题库更新因自适应测试采用自动抽题模式,考生在测试中所抽题目各不相同。而考生对于试题题材的背景知识了解存在差异,测试时的发挥就可能会受到影响。试题库的更新也是需要解决的问题之一。如果系统内的试题不能及时更新,则重复使用同一系统测试的学生可能会抽到以往测试过的题目,影响测试的精准度。结语将以项目反应理论为基础的自适应性测试应用于英语水平测试中,是现今英语水平测试发展的主流方向。然而,建立自适应性英语测试系统仍存在如试题难度赋值等难以解决的问题,有待更进一步的研究。参考文献:1李卫东、黄河笑、郭俊文:I
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 船厂工艺科管理办法
- 专项奖励考核管理办法
- 荒芜地平整管理办法
- 评估科注销管理办法
- 管理费报销管理办法
- 设计部应急管理办法
- 《药品监控管理办法》
- 计划单收发管理办法
- 舞蹈队训练管理办法
- 西藏无菌采样管理办法
- 《港珠澳大桥的影响实证分析10000字(论文)》
- 食品安全 课件 高中主题班会
- YS/T 320-2007锌精矿
- YS/T 226.12-2009硒化学分析方法第12部分:硒量的测定硫代硫酸钠容量法
- GB/T 24218.3-2010纺织品非织造布试验方法第3部分:断裂强力和断裂伸长率的测定(条样法)
- GB/T 10799-2008硬质泡沫塑料开孔和闭孔体积百分率的测定
- 系统工程原理 - 国防科技大学信息系统与管理学院
- 博微配电网工程设计软件
- 当代世界社会主义现状课件
- 《给排水科学与工程概论》全套教学课件
- 电工考核评分表(月度)
评论
0/150
提交评论