




已阅读5页,还剩2页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
效度论文关于基于计算机的语言测试其效度验证论文范文参考资料 摘要:随着计算机技术与认知科学、语言学以及测量学等结合在一起,对成绩报道与分析、试题设计编写、评分、任务呈现、评估与语言测试管理等产生了异常重要的影响。具备高真实性的测试题型以及计算机自动评分系统和测试技术的应用,是测试结果可靠性和测试概念代表性得到了提升。所以,建立在计算机基础之上的语言测试也开始受到管理者和语言测试开发人员的青睐。文中就基于计算机的语言测试进行了大致论述,并就其效度进行了验证,以期为我国语言测试的进步提供可供参考的意见和倡议。 关键词:计算机;语言测试;效度验证 1007-9599 (xx) 06-0000-02 1基于计算机语言测试发展状况 在语言评估和测试方面,计算机技术所引起的转变主要体现在如下两点:使测量准确度以及管理实施效率得到了提升。建立在计算机基础之上的语言测试的发展状况大致可以归为如下几点: (1)初期计算机化的语言测试。在计算机技术限制作用下,语言测试初期主要是运用计算机的管理语言进行测试又或者将传统笔试试题搬至计算机上。它的特点在于,只转变了测试方式,而在测试构念和任务方面与笔试并无实质性的差别。 (2)适应性的计算机语言测试。测量学以及计算机技术的进步使得新一代的语言测试技术开始出现。此种测试形式相比于传统的笔试具有非常多的优势,例如,它能起到反馈的作用,在测试中加强了人性化和个性化,同时也提升了安全性。它为受试者所提供的任务和题目在受试者能力范围之内,可以使他们提升兴趣,进而将他们将自己的最佳水平发挥出来,从而使受试者语言能力的测量更加准确。 (3)自动评分系统。现如今,自动评分系统所应用的范围主要是写作部分。尽管作文评分系统受到学者和专家的质疑,但在学生自我评估以及高风险考试中依旧得到了广泛的应用。由于自动评分系统可以节省时间、人力和物力等相关资源,并且相较于人工评分其客观性和准确性还要更高一些。 自作文评分系统出现以来,新自动评分系统也开始不断涌现。现如今,最常使用的评分技术包括多层面的语言识别技术、潜在语义的分析技术以及文本范畴技术。尽管上述几种技术各自特点不同,但它们也有共同之处,那便是在对进行过人工评分的样板分析基础上,将可参照语言特点找出,然后用以对其他作文进行评分。 2基于计算机语言测试效度验证 2.1语言测试效度在理论方面的发展状况 自二十世纪 _以来,效度验证使语言评估与测试的主要研究的重点,效度理论演变过程大致可以分为如下几个阶段:(1) _至七十年代。“一项测试有无测量出它所需测量东西”使效度测试的经典定义。语言测试中两项非常重要的质量标准便是信度和效度。评分稳定性即为信度,它也是效度得到保证的前提。人们关注的效度内容主要包括如下几种:构念效度、小标关联效度以及内容效度。(2)八十年代。人们开始意识到,假设的检验过程便是校验。美国心理测量学家和教育家M在效度研究方面做出了很大的贡献,他提出了“整体效度观”。整体效度观的主要内容包括:将效度涵盖的范围由分数扩展到了社会后果、使用和相关性、价值作用上;对构念的中心地位进行了确立,使构念效度的概念认识得到了增强;对校验对象加以明确,对象并非测试本身而是测试分数的使用和解释。M通过“分层效度框架”表达了自己对效度思想的认识,并将之称为“渐进矩阵”。虽然此模式的可操作性不是很强,但是它所具备的理论作用却是非常大的。(3)九十年代至今。作为语言测试发展中的重要转折点,美国心理学会所编制而成的“教育与心理测验标准”以及效度思想在语言测试领域中引入成为此次转折点的重要标志。在整个九十年代,绝大部分的语言测试都是在效度框架的指导下进行的。M对效度进行了定义“理论依据和经验证据在某种程度上对建立在测试分数又或其他评估形式所采取的行动或作出的判断是否适当和充分对这一理由进行综合性的评判便是效度”。语言测试界开始接受这一新概念,但在九十年代之后消毒管却产生了非常大的转变。 2.2建立在计算机基础之上的语言测试效度验证 CBLT与别的语言测试相同,它也必须通过效度验证,在充足的试验和理论证据的支撑下才能证明其具备准确性和有效性。某些学者表示,CBLT能使测试效度提升,它最主要的优势表现在如下方面:自动评分系统;建立在认知理论基础上的CBLT设计;计算机的适应测试技术;新题型。 (1)CBLT能使效度得到提升。一来,新题型可以使后果效度和测试准确性得到提升。二来,计算机适应性的测试技术能对被试者进行恰当测量,从而使测量准确性得到提升。三来,建立在认知理论基础之上的CBLT设计能使效度得到提升。四来,自动评分系统相较于人工评分系统显得更加的客观和准确。 (2)CBLT也可能是效度降低。一是,测试构念的代表性降低。在对适应性题目进行选择之时,需确保计算机程序在测量准确度、题目呈现形式、内容覆盖面等方面保持平衡。某些时候,为对题目出现的频率进行制约,难免会使内容代表性就降低。再加上,受试者可能在完成任务或题目的过程中采取与构念没有关系的相关技能,从而对构念效度产生影响。二是,引入无关概念的因素,进而对测量准确性产生影响。受试者计算机技能差异以及计算机配置差异等无关构念的因素都会对受试者的测试结果产生影响。某些受试者由于对此种测试不熟悉而使测试的焦虑程度增加,进而对他们发挥自身的语言能力使非常不利的。三是,产生一些不好的后果。由于CBLT成本相较于传统笔试要高许多,如此一来便会使被试者的测试费用增高。使用真实性任务能使测试任务数得到极大程度的缩减,如此一来便可能对教学活动和备考产生影响。除此之外,有些应试技巧对语言能力发展是不利的。四是,自动评分系统还有待完善。虽然作文评分系统会按照人工评分方式来对评分程序加以设计,进而使评分客观性和效率得到提升,但由于人们在语言工作机制认识的不足,再加上计算机自身技术的局限性,使得某些评分人员可以掌握的语言能力计算机还不能达到。所以,计算机在进行评分解释之时有可能产生偏差。 (3)建立在计算机基础之上的语言测试效度验证的策略。语言测试的效度理论认为,整个测试的开发以及实施与使用中都会贯穿有效度验证。所以,在实施测试以前,需有制备一项完善的效验计划,并在计划中表明每个阶段所需提供的实验和理论证据。Weir在零五年的时候提出了建立在证据基础之上的效度验证理论,他认为效度证据应当从五个方面去收集:环境效度;效标关联效度;基于构念的效度;后果效度;评分效度。由于效度验证证据具有多样性的特征,因此就需要收集证据的方式也是多样的,M就为之提供了六种方式:内容分析、维度分析、任务或题目的实验分析、测试行为与分数之间的关系、测试行为差异、测试后果。 除此之外,最常用的定量和定性研究方式包括:结构方程建模、模型拟合分析、口头自陈、回归分析、元分析、因子分析、逻辑分析等。 3结束语 综上所述,尽管CBLT取得了一定的成就,但其所面对的挑战仍旧是巨大的。除开实施技术水平和测试开发方面需要提升,最为迫切的任务便是效度验证。最近几年,国内外很多学者都开始关注计算机式的语言测试,与此同时,语言测试在计算机的适应性方卖弄也取得了一定的成就。但相较于许多欧美国家,我国的CBLT技术仍旧处在发展的初期。推广和开发CBLT应在心理测量以及教育等理论的指导下进行。对于文中所
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 设备检修安全管理制度
- 设备等级评估管理制度
- 2025年中国家庭影院立体声接收器行业市场全景分析及前景机遇研判报告
- 设计成果运用管理制度
- 评估公司价格管理制度
- 诊所医疗软件管理制度
- 诊所财务制度管理制度
- 贝壳门店分级管理制度
- 财务集中中心管理制度
- 账务实物分开管理制度
- 学校公共设施设备的管理制度
- 商混站(商品混凝土公司)安全风险分级管控和隐患排查治理双体系方案全套资料汇编完整版
- 北京师范大学《数字图像处理》2023-2024学年期末试卷
- GB/T 16288-2024塑料制品的标志
- 高三一轮复习训练 湖泊专题
- 医院培训课件:《肩周炎》
- 安全生产月关爱生命注意安全
- 2024年中国家用水处理机市场调查研究报告
- 2024年版《输变电工程标准工艺应用图册》
- 2024年海南省中考数学试卷真题及答案详解(精校打印)
- 三菱FX3u-PLC应用实例教程全套课件配套课件完整版电子教案
评论
0/150
提交评论