第二章-测量信度与随机误差控制.ppt

上传人：1*** IP属地：浙江上传时间：2020-04-17 格式：PPT 页数：61 大小：1.11MB 积分：20 举报 版权申诉

免费预览已结束，剩余56页可下载查看

 下载本文档

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第二章测量信度与随机误差控制江西师范大学心理与教育统计测量中心学习目标 1 什么是信度信度与测量随机误差的关系 2 信度的统计定义 3 描述信度的指标有哪些 4 分析测验信度应注意哪些问题 5 信度的标准与作用 6 经典测量理论信度系数的估计方法 7 提高测量信度的主要方法有哪些第一节信度概述解答本章学习目标中的第1 5个目标一信度与测量误差 1 经典测量理论的假设式中 X为观察分数 T为一般真分数 E为随机误差分数 V为目标真分数 I为非目标真分数系统误差第一节信度的概述一信度与测量误差 2 信度的定义测量追求的初步目标 T占X的比例越大越好测量追求的终极目标 V占X的比例越大越好第一节信度的概述当T占X的比例很大时那么测值就会是稳定的一般来说稳定的测值是可靠的可信的因此信度可被认为是测量结果的稳定性程度一信度与测量误差 2 信度的定义第一节信度的概述信度 reliability 是指在不同时间使用同一测验或者使用两个不同项目的等值测验抑或在其他不同的测试条件下对同一组被试实施两次或多次测试所得分数的一致性测验信度表示测验分数中个体差异可归因于所测特质中真实差异的程度以及可归因于随机误差的程度二信度的统计定义 1 经典测量理论假设的推论第一节信度的概述二信度的统计定义 2 信度的统计定义定义1 信度是被试团体真分数方差与实得分数方差之比定义2 信度是被试团体真分数与实得分数相关系数的平方定义3 信度是一个测验X A卷与它的任意一个平行测验 B卷的相关系数第一节信度的概述三描述信度的指标 1 经典测量理论的信度系数信度系数是表示测量结果的稳定性程度的指标记为第一节信度的概述信度系数的值域 0 1 没有百分之百可靠的测量因此 rXX 1只是理论上的值实际当中是不会存在的相关系数的值域是 1 1 信度系数的值域 0 1 为什么三描述信度的指标 1 经典测量理论的信度系数 1 重测信度 test retestcoefficients 是指用同一个量表对同一组被试施测两次所得结果的一致性程度其大小等于同一组被试在两次测验上所得分数的相关系数 2 复本信度 alternative formcoefficients 是指两个平行的测验测量同一批被试所得结果的一致性程度其大小等于同一批被试在两个复本测验上所得分数的相关系数 3 内部一致性系数 internalconsistencycoefficients 也叫同质性信度 homogeneityreliability 是指测验内部所有题目间的一致性程度主要的计算方法有KR20公式 KR21公式克龙巴赫系数以及荷伊特信度等第一节信度的概述三描述信度的指标 2 经典测量理论的测量标准误测量标准误差 standarderrorofmeasurement 是测量误差的假设分布的标准差用下列公式能够容易地计算测量标准误差第一节信度的概述式中 SDt表示测验分数的标准差 rXX表示信度系数四分析测验信度应注意的问题 1 针对测验类型选用恰当指标 1 传统的信度概念适合于常模参照测验这种测验的主要目的是为了区分个体在特定特征上所表现出的差异性个体在测验分数中表现出的差异范围越大该测验的信度也就越高第一节信度的概述四分析测验信度应注意的问题 1 针对测验类型选用恰当指标 2 标准参照测验内容参照或领域参照测验的目标是要确定被试是否达到或未达到某个标准从而将个体分到不同的组别达标和未达标这种情况下传统的重测信度复本信度以及内部一致性系数就不再适用标准参照测验可根据具体情况分别采用如下指标适用于简单的掌握与否的两分决策即所有的分类误差都被认为同样严重而不管它们离开临界分数的距离在这种情况下可以使用平行型式进行再测以便得出在两次测验上得到相同决策的个体的百分比进一步可算得分类一致性系数 coefficientofagreement 第一节信度的概述四分析测验信度应注意的问题 1 针对测验类型选用恰当指标不仅仅关心对掌握者和未掌握者的质的区分同时也在分数连续体上描述了关于掌握和未掌握的量的差异这类信度主要采用K2 X T 指标第一节信度的概述式中分别为被试总体在测验上的真分数方差和观测分数方差分别为真分数和观测分数的平均值 ng为测验题目数 c是以做对题目百分比表示的区分标准四分析测验信度应注意的问题 1 针对测验类型选用恰当指标 K2 X T 值越大说明观测分与区分标准分数划界分数之间的差异代表真分数的对应差异量的可能性越大因而观测分与划界分数的差异就越能反映真实能力上的差异换言之测验就更可信就单个测验的结果而言 K2 X T 的计算公式如下第一节信度的概述式中是由库德理查德KR20公式求出的信度系数其余符号意义同前四分析测验信度应注意的问题 1 针对测验类型选用恰当指标 3 在纯速度测验 speedtest 中个体差异完全取决于速度此时就无法恰当地解释施测一次测验的信度系数如果条件许可可采用重测法或是复本法这是比较合适的分半法也可以使用但是此时的分半是按时间分半而不是按照项目来分半也就是两半分数必须根据分别规定时间的两个半测验例如可以把奇偶项目分别印制在两张卷上每组项目的用时为全测验的一半这种方法等于在同一时间实施了两个等值测验第一节信度的概述四分析测验信度应注意的问题 1 针对测验类型选用恰当指标还有一种替代实施两个半测验的方法就是把总时间四等分算出每段时间的分数这种方法简便易行施测时每当主试发出事先安排的信号就要测验参加进在他们正在做的项目上打个记号然后把第一段和第四段时间内答对的项目数相加得出一个半测验分数把第二段和第三段时间内答对的项目数相加得出另一个半测验分数四段时间如此相加往往可以平衡练习疲劳和其他因素的累积效应特别是当项目难度水平前后一致而不是逐渐增加时这种方法尤其令人满意第一节信度的概述四分析测验信度应注意的问题 2 信度的报告 1 任何一个信度系数是针对引起测验误差的特定因素而言的有多少种影响测验分数的条件就有多少种测验信度因此报告信度时应该详细说明测试样本的特性和所报告的信度类型在信度报告时只是报告信度系数而缺乏说明估算系数的方法细节推导系数时所用的被试群体的特征以及获取数据当时的施测条件等等这种信度报告是不合格的第一节信度的概述四分析测验信度应注意的问题 2 信度的报告 2 没有一个单一的最优的方法来量化信度没有一个单独的指数能恰当地表达所有的相关事实没有一个单独的研究方法在所有的情形下都是最佳选择且测验编制者也不应局限于将某一种方法运用到任何一种测量手段上去所以测验编制者在报告测验信度时可以从多方面予以报告第一节信度的概述四分析测验信度应注意的问题 2 信度的报告 3 提供详细的信度分析报告让了解相关知识的人能够对结果进行评定并能够重复信度分析的过程例如简单说一句某测验的信度是0 92 是不能接受的较恰当的说法是某测验的信度系数为0 92 该数值是通过计算一份能力测验间隔两周两次测试成绩的相关系数得出的数据来源是从某市随机抽取的500名小学5年级的学生施测第一节信度的概述五信度的标准与作用 1 信度是评价测验质量的重要指标之一注表中数据来源 LewisR Aiken Psychologicaltestingandassessment eighthedition AllynandBacon Inc 1994 第一节信度的概述五信度的标准与作用 2 信度是测量过程中所存在的随机误差大小的反映第一节信度的概述例如我们已知高考文科试卷的总信度rXX 0 965 文科考生总分的标准差为53 42 那么文科考试成绩的标准误为 3 信度可以用来解释个人测验分数的意义测量标准误如果某生的考试成绩为495分在置信度为0 95时其真分数的置信区间为五信度的标准与作用 4 信度可以帮助进行不同测验分数的比较第一节信度的概述考察两个分数的差异是否可靠是否真有差异的问题比如某人的物理成绩是否真的优于化学某人的数学技能本学期是否真有进步某人在韦氏智力量表上操作智商与言语智商的差异是否真有显著意义等当两测验的方差相等时差异分数的信度系数可用如下公式求出式中 rXXdiff是差异分数的信度系数 rXX和rYY是两个测验各自的信度系数 rXY是两测验间的相关系数五信度的标准与作用 4 信度可以帮助进行不同测验分数的比较第一节信度的概述差异分数的测量标准误可用如下公式求出式中 SEdiff是差异分数的测量标准误 rXX和rYY是两个测验各自的信度系数 SD是两测验间使用的相同的标准差在比较分数之前必须将两个测验分数转为具有相同量表的标准分数五信度的标准与作用 4 信度可以帮助进行不同测验分数的比较第一节信度的概述例如在韦氏成人智力量表中言语和操作分测验的信度为0 97和0 93 而它们的智商的平均数为100 标准差为15 故言语和操作智商差数的标准误为因为4 74 1 96 9 29 因此言语和操作智商相差10分时在0 05水平上我们说存在显著差异若要在0 01水平上作出差异显著的结论就要相差13分第二节信度的种类与评估方法详细介绍第一节中提出的各种信度估计方法的计算一重测信度 1 含义同一个测量工具在两个不同时间对同一组被试施测所得结果的一致性程度重测信度主要考察了一个测量工具是否能够保证在不同时间测量结果的一致性他反映了测量工具的结果受到时间间隔因素影响的大小一般来说重测的时间间隔越短那么各种施测情境的变化就越小重测信度系数就会越大重测信度系数较大时说明该测量工具前后两次的测量结果比较一致结果具有较好的跨时间上的稳定性第二节测验信度的种类与评估方法一重测信度 2 评估方法重测信度的大小可以通过计算测量工具的重测系数 test retestcoefficient 或叫稳定性系数 coefficientofstability 来标志具体来说就是求取同一组被试在两个不同时间施测同一个测量工具所得结果分数的相关系数第二节测验信度的种类与评估方法一重测信度 3 应用条件测量工具所测量的个体心理特质在时间上应该是相对稳定的测量工具所测量的个体心理特质应该不存在明显的练习效应和遗忘效应在两次施测间隔期间不应该进行专门的训练和培训以保证重测信度反映的是随机因素的影响效应第二节测验信度的种类与评估方法一重测信度 4 使用重测信度时需要注意的问题两次施测时间间隔的长短会影响重测信度系数估计值的大小因此在报告重测信度系数时应该报告间隔的时间长度应该根据已有的相关研究结论考虑所测心理特质本身的稳定性程度以确定前后两次施测时间的间隔究竟应该多长比较合适时不应该随便选择间隔时间的长短第二节测验信度的种类与评估方法二复本信度 1 含义两个平行的测验复本测验测量同一批被试所得结果的一致性程度复本信度反映了由于题目的不同以及时间间隔所导致的测量误差平行测验或复本测验指的是两个在题目内容数量形式难度区分度指导语时限以及所用的例题公式和测验等其他方面都相同或相似的测验也就是用不同的题目测量同样的内容而且其测验结果的平均值和标准差都相同的两个测验第二节测验信度的种类与评估方法二复本信度 2 评估方法复本信度的估计过程就是计算同一批被试在两个平行的复本测验上所得分数的相关系数也叫作等价系数 coefficientofequivalence 测试设计同时测试和延时测试同时测试是在同一个时间段内进行测试而延时测试则是在两个时间段进行测试同时测试可能会存在作答疲劳的效应而延时测试则可能会存在学习或培训效应第二节测验信度的种类与评估方法二复本信度 3 应用条件要构造出两份或两份以上真正平行的测验计算复本信度需要对同一批被试测试两份平行测验这就需要掌握一个合理的时间安排应该尽量在测试结果报告中详尽地说明两次测试的时间间隔测试顺序安排测试过程中被试的有关测验经历等第二节测验信度的种类与评估方法三内部一致性信度 1 含义内部一致性信度主要评价了测验各随机组成部分之间是否测量了相同的心理特质因此它反映的是题目内容的抽样一致性程度具体估计方法主要包括分半信度评估法库德理查森信度评估法克龙巴赫Alpha系数评估法与重测信度和复本信度不同在估计测验的内部一致性信度时只要用同一个测验对一批被试测试一次第二节测验信度的种类与评估方法三内部一致性信度 2 分半信度含义我们总是可以把一个测验的所有题目随机地划分成对半的两个部分然后估计所有被试在这两个部分题目上得分的一致性程度这样得到的测验一致性估计称为分半信度分半信度评价了测验两个随机组成部分的题目是否测量了相同的心理特质第二节测验信度的种类与评估方法三内部一致性信度 2 分半信度评估方法计算出被试在测验两个随机组成部分的题目上得分之间的相关系数由于在用分半测验得分计算相关系数时测验题量被缩短信度系数需要通过以下这个公式对分半相关系数进行矫正而得到为两个分半测验之间的相关系数为完整长度测验的信度系数估计值第二节测验信度的种类与评估方法三内部一致性信度 2 分半信度评估方法另外一个估计分半信度系数的方法是Rulon公式他只需要计算所有被试在两部分测验上得分之差的方差以及总分方差式中为完整测验的信度估计值为被试在两部分测验上得分之差的方差为完整测验总分方差 Rulon公式中分子方差反映了由于题目不同等条件带来的误差方差他与总方差之比反映了误差方差在总方差中所占的比例第二节测验信度的种类与评估方法三内部一致性信度 2 分半信度使用时需注意的问题在估计测验的分半信度时虽然要求把一个测验的所有题目随机地划分成对半的两个部分但是在实践中对测验分半时为了尽量减少无关因素的影响通常需要考虑题型题分题目测试先后顺序等因素的平衡问题比如按照题目顺序奇偶分半就是一个经常选择的方法第二节测验信度的种类与评估方法三内部一致性信度 3 库德理查森信度含义在估计分半信度时把一个测验的题目分成两半的方式是非常多的而每种分半方式得到的信度估计值总会存在一些差异但我们无法知道究竟哪种分半结果所得到的信度估计值是最合适的估计所有可能的分半信度系数的平均数作为完整测验的内部一致性最佳估计值第二节测验信度的种类与评估方法三内部一致性信度 3 库德理查森信度评估方法所有分半信度系数的平均数的估计方法第二节测验信度的种类与评估方法三内部一致性信度 3 库德理查森信度使用条件Kuder Richardson信度系数的估计只能针对1 0记分题型对于其他题型需要使用更加一般化的估计方法 K R21公式假设测验中所有项目的难度是相同的 Kuder Richardson信度反映的是项目间一致性程度他会严重地受到测验所测行为特质的同质性程度的影响第二节测验信度的种类与评估方法三内部一致性信度 4 Cronbach sAlpha系数含义是一种比Kuder Richardson方法更加一般化的信度估计方法它可以针对各种记分方式的题型进行估计第二节测验信度的种类与评估方法三内部一致性信度 4 Cronbach sAlpha系数评估方法第二节测验信度的种类与评估方法公式中 k是测验题目个数是被试在题目i上得分的方差是被试测验总分方差三内部一致性信度 4 Cronbach sAlpha系数使用条件可以估计各种记分方式的测验内部一致性信度系数是更一般化的测验内部一致性信度系数估计方法第二节测验信度的种类与评估方法四评分者信度 1 含义在评价通过主观评分方式得到的分数时我们必须了解不同的评分者在评价被试作答反应时给的分数值的一致性程度信度一般的客观型题目在评分时很少出现误差然而对于诸如作文测验语言类测验以及其他的评价性测验如人格特质评级投射测验评分等这些测验类型的评分过程就显得非常主观第二节测验信度的种类与评估方法四评分者信度 2 评估方法两个评分者时计算这两个评分者评定分数之间的相关系数多个评价者评价同一批被试计算和谐系数第二节测验信度的种类与评估方法五信度系数及其估计方法小结 1 测试次数和测试卷份数与信度系数估计方法第二节测验信度的种类与评估方法五信度系数及其估计方法小结 2 各种信度估计方法的误差方差来源第二节测验信度的种类与评估方法第三节测量的随机误差控制一影响测量信度的因素第三节测量的随机误差控制二提高测验信度的常用方法第三节测量的随机误差控制第四节评分者信度及评分误差的控制一评分误差存在的严重性严重到什么程度历史教授的答案被评阅为不及格高考作文一幅漫画的启示 67位评阅者 6至25分都有

人人文库> 全部分类> 行业资料 > 信息产业

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

第二章-测量信度与随机误差控制.ppt

文档简介

温馨提示

最新文档

评论

第二章-测量信度与随机误差控制.ppt

文档简介

温馨提示

最新文档

评论

相关文档