版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、会计学1 测量信与随机误差控制测量信与随机误差控制PPT课件课件 2021-8-82 第1页/共54页 2021-8-83 第2页/共54页 2021-8-84 ETX TVI XVIE 式中,式中,X为观察分数,为观察分数,T为一般真分数为一般真分数 ,E为随机误差分数,为随机误差分数,V为目标真分数,为目标真分数, I为非目标真分数(系统误为非目标真分数(系统误 差)。差)。 第一节第一节 信度的概述信度的概述 第3页/共54页 2021-8-85 测量追求的初步目标:测量追求的初步目标:T占占X的比例越的比例越 大越好。大越好。 测量追求的终极目标:测量追求的终极目标:V占占X的比例越的
2、比例越 大越好。大越好。 第一节第一节 信度的概述信度的概述 T XVIE 第4页/共54页 2021-8-86 第5页/共54页 2021-8-87 第一节第一节 信度的概述信度的概述 v信度(信度(reliability)是指在不同时间,使)是指在不同时间,使 用同一测验,或者使用两个不同项目的用同一测验,或者使用两个不同项目的 等值测验,或在其他不同的测试条件下等值测验,或在其他不同的测试条件下 ,对同一组被试实施两次或多次测试所,对同一组被试实施两次或多次测试所 得分数的一致性。得分数的一致性。 第6页/共54页 2021-8-88 第7页/共54页 2021-8-89 1.经典测量理
3、论假设的推论经典测量理论假设的推论 ETX IVT EIVX 222 ETX 222 IVT 2222 EIVX 2 T 第一节第一节 信度的概述信度的概述 第8页/共54页 2021-8-810 2.信度的统计定义信度的统计定义 定义定义1:信度是被试团体真分数方差与实得:信度是被试团体真分数方差与实得 分数方差之比分数方差之比 2 T 2 E 2 X 2 T 2 E 2 X 2 2 T XX X r 定义定义2:信度是被试团体真分数与实得分数相关系数的平:信度是被试团体真分数与实得分数相关系数的平 方方 定义定义3:信度是一个测验:信度是一个测验X(A卷)与它的任意一个平行测验卷)与它的任
4、意一个平行测验 (B卷)的相关系数卷)的相关系数 2 TXXX r XXXX r 第一节第一节 信度的概述信度的概述 第9页/共54页 2021-8-811 1.经典测量理论的信度系数经典测量理论的信度系数 信度系数是表示测量结果的稳定性程度的指标。记为:信度系数是表示测量结果的稳定性程度的指标。记为: 第一节第一节 信度的概述信度的概述 XX r 信度系数的值域:信度系数的值域:0,1 没有百分之百可靠的测量,因此,没有百分之百可靠的测量,因此,rXX=1只是理论上的值只是理论上的值 ,实际当中是不会存在的。,实际当中是不会存在的。 ?相关系数的值域是相关系数的值域是-1,+1 ,信度系数,
5、信度系数 的值域:的值域:0,1,为什么?,为什么? 第10页/共54页 2021-8-812 第一节第一节 信度的概述信度的概述 例如,我们已知高考文科试卷的总信度例如,我们已知高考文科试卷的总信度rXX =0.965,文科考生总分的标准差为,文科考生总分的标准差为53.42,那么,文科考试成绩的标准误为:那么,文科考试成绩的标准误为: 3.信度可以用来解释个人测验分数的意义信度可以用来解释个人测验分数的意义测量标准误。测量标准误。 153.421 0.9659.99 tXX SEMSDr 如果某生的考试成绩为如果某生的考试成绩为495分,在置信度为分,在置信度为0.95时,其真分数的置信区
6、间为:时,其真分数的置信区间为: 495 1.96 9.99,495 1.96 9.99475,515 第11页/共54页 2021-8-813 第一节第一节 信度的概述信度的概述 考察两个分数的差异是否可靠,是否真有差异的问题。比如,某人的物理成绩是否真的考察两个分数的差异是否可靠,是否真有差异的问题。比如,某人的物理成绩是否真的 优于化学?某人的数学技能本学期是否真有进步?某人在韦氏智力量表上操作智商与言优于化学?某人的数学技能本学期是否真有进步?某人在韦氏智力量表上操作智商与言 语智商的差异是否真有显著意义等。语智商的差异是否真有显著意义等。 第12页/共54页 2021-8-814 第
7、一节第一节 信度的概述信度的概述 差异分数的测量标准误可用如下公式求出:差异分数的测量标准误可用如下公式求出: 式中,式中,SEdiff是差异分数的测量标准误;是差异分数的测量标准误;rXX和和rYY是两是两 个测验各自的信度系数;个测验各自的信度系数;SD是两测验间使用的相同是两测验间使用的相同 的标准差。在比较分数之前,必须将两个测验分数转的标准差。在比较分数之前,必须将两个测验分数转 为具有相同量表的标准分数为具有相同量表的标准分数。 2 diffxxyy SESDrr 第13页/共54页 2021-8-815 第一节第一节 信度的概述信度的概述 例如,在韦氏成人智力量表中,言语和操作分
8、测验的信度为例如,在韦氏成人智力量表中,言语和操作分测验的信度为 0.97和和 0.93,而它们的智商的平均数为,而它们的智商的平均数为100,标准差为标准差为15,故言语和操作智商差故言语和操作智商差 数的标准误为:数的标准误为: 因为因为4.741.969.29,因此,言语和操作智商相差因此,言语和操作智商相差10分时,在分时,在0.05水水 平上,我们说存在显著差异。若要在平上,我们说存在显著差异。若要在0.01水平上作出差异显著的结论,水平上作出差异显著的结论, 就要相差就要相差13分。分。 21520.970.934.74 diffxxyy SESDrr 测验分数的比较与平均数差异显
9、著性检验是一回事吗?测验分数的比较与平均数差异显著性检验是一回事吗? 第14页/共54页 2021-8-816 第15页/共54页 2021-8-817 详细介绍第一节中提出的各种信度估计方法的计算详细介绍第一节中提出的各种信度估计方法的计算 。 第16页/共54页 2021-8-818 1.含义含义 同一个测量工具在两个不同时间对同一组被试施测所得结果的同一个测量工具在两个不同时间对同一组被试施测所得结果的 一致性程度。一致性程度。 重测信度主要考察了一个测量工具是否能够保证在不同时间测重测信度主要考察了一个测量工具是否能够保证在不同时间测 量结果的一致性,他反映了测量工具的结果受到时间间隔
10、因素量结果的一致性,他反映了测量工具的结果受到时间间隔因素 影响的大小。影响的大小。 一般来说,重测的时间间隔越短,那么各种施测情境的变化就一般来说,重测的时间间隔越短,那么各种施测情境的变化就 越小,重测信度系数就会越大。越小,重测信度系数就会越大。 重测信度系数较大时,说明该测量工具前、后两次的测量结果重测信度系数较大时,说明该测量工具前、后两次的测量结果 比较一致。结果具有较好的跨时间上的稳定性。比较一致。结果具有较好的跨时间上的稳定性。 第二节第二节 测验信度的种类与评估方法测验信度的种类与评估方法 第17页/共54页 2021-8-819 2.评估方法评估方法 重测信度的大小可以通过
11、计算测量工具的重测系重测信度的大小可以通过计算测量工具的重测系 数(数(test-retest coefficient)或叫稳定性系数()或叫稳定性系数( coefficient of stability)来标志。具体来说,就是)来标志。具体来说,就是 求取同一组被试在两个不同时间施测同一个测量求取同一组被试在两个不同时间施测同一个测量 工具所得结果分数的相关系数。工具所得结果分数的相关系数。 第二节第二节 测验信度的种类与评估方法测验信度的种类与评估方法 第18页/共54页 2021-8-820 3.应用条件应用条件 测量工具所测量的个体心理特质在时间上应该是相对稳测量工具所测量的个体心理特
12、质在时间上应该是相对稳 定的。定的。 测量工具所测量的个体心理特质应该不存在明显的练习测量工具所测量的个体心理特质应该不存在明显的练习 效应和遗忘效应。效应和遗忘效应。 在两次施测间隔期间不应该进行专门的训练和培训,以在两次施测间隔期间不应该进行专门的训练和培训,以 保证重测信度反映的是随机因素的影响效应。保证重测信度反映的是随机因素的影响效应。 第二节第二节 测验信度的种类与评估方法测验信度的种类与评估方法 第19页/共54页 2021-8-821 4.使用重测信度时需要注意的问题使用重测信度时需要注意的问题 两次施测时间间隔的长短会影响重测信度系数估计值的两次施测时间间隔的长短会影响重测信
13、度系数估计值的 大小,因此,在报告重测信度系数时应该报告间隔的时大小,因此,在报告重测信度系数时应该报告间隔的时 间长度。间长度。 应该根据已有的相关研究结论考虑所测心理特质本身的应该根据已有的相关研究结论考虑所测心理特质本身的 稳定性程度,以确定前后两次施测时间的间隔究竟应该稳定性程度,以确定前后两次施测时间的间隔究竟应该 多长比较合适时,不应该随便选择间隔时间的长短。多长比较合适时,不应该随便选择间隔时间的长短。 第二节第二节 测验信度的种类与评估方法测验信度的种类与评估方法 第20页/共54页 2021-8-822 第21页/共54页 2021-8-823 被 试 1234 567 89
14、10 第 一 次 7 6 5 0 80 6 5 90 48 5 5 8 1 3 2 76 第 二 次 8 0 5 3 90 7 8 86 70 4 8 7 6 3 0 55 第22页/共54页 2021-8-824 第23页/共54页 2021-8-825 1.含义含义 两个平行的测验(复本测验)测量同一批被试所得结果的一致两个平行的测验(复本测验)测量同一批被试所得结果的一致 性程度。性程度。 复本信度反映了由于题目的不同以及时间间隔所导致的测量误复本信度反映了由于题目的不同以及时间间隔所导致的测量误 差。差。 平行测验或复本测验指的是两个在题目内容、数量、形式、难平行测验或复本测验指的是两
15、个在题目内容、数量、形式、难 度、区分度、指导语、时限以及所用的例题、公式和测验等其度、区分度、指导语、时限以及所用的例题、公式和测验等其 他方面都相同或相似的测验。也就是用不同的题目测量同样的他方面都相同或相似的测验。也就是用不同的题目测量同样的 内容而且其测验结果的平均值和标准差都相同的两个测验。内容而且其测验结果的平均值和标准差都相同的两个测验。 第二节第二节 测验信度的种类与评估方法测验信度的种类与评估方法 第24页/共54页 2021-8-826 2.评估方法评估方法 复本信度的估计过程就是计算同一批被试在两个平行的复本复本信度的估计过程就是计算同一批被试在两个平行的复本 测验上所得
16、分数的相关系数,也叫作等值系数(测验上所得分数的相关系数,也叫作等值系数(coefficient of equivalence)。)。 测试设计:同时测试和延时测试。测试设计:同时测试和延时测试。 同时测试是在同一个时间段内进行测试,而延时测试则是在同时测试是在同一个时间段内进行测试,而延时测试则是在 两个时间段进行测试,同时测试可能会存在作答疲劳的效应两个时间段进行测试,同时测试可能会存在作答疲劳的效应 ,而延时测试则可能会存在学习或培训效应。又称稳定性等,而延时测试则可能会存在学习或培训效应。又称稳定性等 值系数值系数 第二节第二节 测验信度的种类与评估方法测验信度的种类与评估方法 第25
17、页/共54页 2021-8-827 3.应用条件应用条件 要构造出两份或两份以上真正平行的测验要构造出两份或两份以上真正平行的测验; 计算复本信度需要对同一批被试测试两份平行测验,这计算复本信度需要对同一批被试测试两份平行测验,这 就需要掌握一个合理的时间安排。就需要掌握一个合理的时间安排。 应该尽量在测试结果报告中,详尽地说明两次测试的时应该尽量在测试结果报告中,详尽地说明两次测试的时 间间隔、测试顺序安排、测试过程中被试的有关测验经间间隔、测试顺序安排、测试过程中被试的有关测验经 历等。历等。 第二节第二节 测验信度的种类与评估方法测验信度的种类与评估方法 第26页/共54页 2021-8
18、-828 1.含义含义 内部一致性信度主要评价了测验各随机组成部分之间内部一致性信度主要评价了测验各随机组成部分之间 是否测量了相同的心理特质,因此,它反映的是题目是否测量了相同的心理特质,因此,它反映的是题目 内容的抽样一致性程度。内容的抽样一致性程度。 具体估计方法主要包括分半信度评估法、库德具体估计方法主要包括分半信度评估法、库德-理查理查 森信度评估法、克龙巴赫森信度评估法、克龙巴赫Alpha系数评估法。系数评估法。 与重测信度和复本信度不同,在估计测验的内部一致与重测信度和复本信度不同,在估计测验的内部一致 性信度时,只要用同一个测验对一批被试测试一次。性信度时,只要用同一个测验对一
19、批被试测试一次。 第二节第二节 测验信度的种类与评估方法测验信度的种类与评估方法 第27页/共54页 2021-8-829 2.分半信度分半信度 含义含义 我们总是可以把一个测验的所有题目随我们总是可以把一个测验的所有题目随 机地划分成对半的两个部分,然后估计机地划分成对半的两个部分,然后估计 所有被试在这两个部分题目上得分的一所有被试在这两个部分题目上得分的一 致性程度,这样得到的测验一致性估计致性程度,这样得到的测验一致性估计 称为分半信度。称为分半信度。 分半信度评价了测验两个随机组成部分分半信度评价了测验两个随机组成部分 的题目是否测量了相同的心理特质。的题目是否测量了相同的心理特质。
20、 第二节第二节 测验信度的种类与评估方法测验信度的种类与评估方法 第28页/共54页 2021-8-830 2.分半信度分半信度 评估方法评估方法 计算出被试在测验两个随机组成部计算出被试在测验两个随机组成部 分的题目上得分之间的相关系数。分的题目上得分之间的相关系数。 由于在用分半测验得分计算相关系由于在用分半测验得分计算相关系 数时,测验题量被缩短,信度系数数时,测验题量被缩短,信度系数 需要通过以下这个公式对分半相关需要通过以下这个公式对分半相关 系数进行矫正而得到。系数进行矫正而得到。 为两个分半测验之间的相关系数为两个分半测验之间的相关系数 , 为完整长度测验的信度系数估为完整长度测
21、验的信度系数估 计值。计值。 第二节第二节 测验信度的种类与评估方法测验信度的种类与评估方法 hh hh xx r r r 1 2 第29页/共54页 2021-8-831 第30页/共54页 2021-8-832 2.分半信度分半信度 评估方法评估方法 另外一个估计分半信度系数的方法是另外一个估计分半信度系数的方法是Rulon公式,他只公式,他只 需要计算所有被试在两部分测验上得分之差的方差以及需要计算所有被试在两部分测验上得分之差的方差以及 总分方差:总分方差: 式中,式中, 为完整测验的信度估计值,为完整测验的信度估计值, 为被试在两部分测验上为被试在两部分测验上 得分之差的方差,得分之
22、差的方差, 为完整测验总分方差。为完整测验总分方差。 Rulon公式中分子方差反映了由于题目不同等条件带来的误公式中分子方差反映了由于题目不同等条件带来的误 差方差,他与总方差之比反映了误差方差在总方差中所占的差方差,他与总方差之比反映了误差方差在总方差中所占的 比例。比例。 第二节第二节 测验信度的种类与评估方法测验信度的种类与评估方法 xx r 2 2 1 d xx x S r S 2 d S 2 x S 第31页/共54页 2021-8-833 2.分半信度分半信度 使用时需注意的问题使用时需注意的问题 在估计测验的分半信度时,虽然要求把一个测验的所有题在估计测验的分半信度时,虽然要求把
23、一个测验的所有题 目随机地划分成对半的两个部分,但是在实践中对测验分目随机地划分成对半的两个部分,但是在实践中对测验分 半时,为了尽量减少无关因素的影响,通常需要考虑题型半时,为了尽量减少无关因素的影响,通常需要考虑题型 、题分、题目测试先后顺序等因素的平衡问题,比如按照、题分、题目测试先后顺序等因素的平衡问题,比如按照 题目顺序奇偶分半就是一个经常选择的方法。分半信度通题目顺序奇偶分半就是一个经常选择的方法。分半信度通 常是在只能施测一次或没有复本的情况下使用。其中使用常是在只能施测一次或没有复本的情况下使用。其中使用 斯皮尔曼斯皮尔曼布朗公式时要求全体被试在两半测验分数的变布朗公式时要求全
24、体被试在两半测验分数的变 异数相等。当测验无法分成对等的两半时,无法使用。异数相等。当测验无法分成对等的两半时,无法使用。 第二节第二节 测验信度的种类与评估方法测验信度的种类与评估方法 第32页/共54页 2021-8-834 3.库德库德-理查森信度理查森信度 含义含义 在估计分半信度时,把一个测验的题目分成两半的方在估计分半信度时,把一个测验的题目分成两半的方 式是非常多的。而每种分半方式得到的信度估计值总式是非常多的。而每种分半方式得到的信度估计值总 会存在一些差异,但我们无法知道究竟哪种分半结果会存在一些差异,但我们无法知道究竟哪种分半结果 所得到的信度估计值是最合适的。所得到的信度
25、估计值是最合适的。 估计所有可能的分半信度系数的平均数,作为完整测估计所有可能的分半信度系数的平均数,作为完整测 验的内部一致性最佳估计值。验的内部一致性最佳估计值。 第二节第二节 测验信度的种类与评估方法测验信度的种类与评估方法 第33页/共54页 2021-8-835 3.库德库德-理查森信度理查森信度 评估方法:评估方法:所有分半信度系数的平均数的所有分半信度系数的平均数的 估计方法。估计方法。 第二节第二节 测验信度的种类与评估方法测验信度的种类与评估方法 1 2 (1) 1 20 1 k ii i xx pp k rKR ks 2 () 1 - 21 1 xx kX kX rK R
26、kks 第34页/共54页 2021-8-836 3.库德库德-理查森信度理查森信度 使用条件使用条件 Kuder-Richardson信度系数的估计只能针对信度系数的估计只能针对1、0 记分题型,对于其他题型需要使用更加一般化的记分题型,对于其他题型需要使用更加一般化的 估计方法。估计方法。 K-R 21公式假设测验中所有项目的难度是相同的公式假设测验中所有项目的难度是相同的 。 Kuder-Richardson信度反映的是项目间一致性程信度反映的是项目间一致性程 度,他会严重地受到测验所测行为特质的同质性度,他会严重地受到测验所测行为特质的同质性 程度的影响。程度的影响。 第二节第二节 测
27、验信度的种类与评估方法测验信度的种类与评估方法 第35页/共54页 2021-8-837 4. Cronbachs Alpha系数系数 含义含义 是一种比是一种比Kuder-Richardson方法更加一方法更加一 般化的信度估计方法,它可以针对各种般化的信度估计方法,它可以针对各种 记分方式的题型进行估计。记分方式的题型进行估计。 第二节第二节 测验信度的种类与评估方法测验信度的种类与评估方法 第36页/共54页 2021-8-838 4. Cronbachs Alpha系数系数 评估方法评估方法 第二节第二节 测验信度的种类与评估方法测验信度的种类与评估方法 2 1 2 1 1 t k i
28、 i s s k k 公式中,公式中,k是测验题目个数,是测验题目个数, 是被试在题是被试在题 目目i上得分的方差,上得分的方差, 是被试测验总分方差是被试测验总分方差 。 2 i S 2 t S 第37页/共54页 2021-8-839 4. Cronbachs Alpha系数系数 使用条件使用条件 可以估计各种记分方式的测验内部一致性可以估计各种记分方式的测验内部一致性 信度系数,是更一般化的测验内部一致性信度系数,是更一般化的测验内部一致性 信度系数估计方法。信度系数估计方法。 第二节第二节 测验信度的种类与评估方法测验信度的种类与评估方法 第38页/共54页 2021-8-840 第3
29、9页/共54页 2021-8-841 1.含义含义 在评价通过主观评分方式得到的分数时,我们必须了在评价通过主观评分方式得到的分数时,我们必须了 解不同的评分者在评价被试作答反应时给的分数值的解不同的评分者在评价被试作答反应时给的分数值的 一致性程度(信度)一致性程度(信度) 。 一般的客观型题目在评分时很少出现误差,然而,对一般的客观型题目在评分时很少出现误差,然而,对 于诸如作文测验、语言类测验、以及其他的评价性测于诸如作文测验、语言类测验、以及其他的评价性测 验(如人格特质评级、投射测验评分等),这些测验验(如人格特质评级、投射测验评分等),这些测验 类型的评分过程就显得非常主观。类型的
30、评分过程就显得非常主观。 第二节第二节 测验信度的种类与评估方法测验信度的种类与评估方法 第40页/共54页 2021-8-842 2.评估方法评估方法 两个评分者时:计算这两个评分者评两个评分者时:计算这两个评分者评 定分数之间的相关系数。定分数之间的相关系数。 多个评价者评价同一批被试:计算和多个评价者评价同一批被试:计算和 谐系数。谐系数。 第二节第二节 测验信度的种类与评估方法测验信度的种类与评估方法 第41页/共54页 2021-8-843 第42页/共54页 2021-8-844 1.测试次数和测试卷份数与信度系数估计方法测试次数和测试卷份数与信度系数估计方法 第二节第二节 测验信度的种类与评估方法测验信度的种类与评估方法 测试次数测试次数 测试卷份数测试卷份数 1份份 2份份 1次次 分半信度分半信度 Kuder-Richardson信度信度 Alpha系数系数 复本信度(同时测试)复本信度(同时测
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中医等级考试试卷及答案
- 高二历史考试试卷及答案
- 2026八年级下语文文言文人物分析方法
- 2026 统编版三年级讲评课教学课件
- 胃镜护士试题答案及答案
- 企业结售汇制度
- 人力资源制度
- 环保局制定考核奖惩制度
- 学校预防溺水奖惩制度
- 幼儿园教职工奖惩制度细则
- 人教版新教材小学二年级《数学》上册新教材解读课件
- 新工科大学英语 课件 Unit 1 Future by design;Unit 2 Living smarter,living better
- 拖欠农民工工资培训课件
- 乡风文明建设课件
- 毕业设计(论文)-水下4自由度抓取机械臂设计-scara机器人
- 金融风控模型建设及管理规范
- 《陶瓷工艺概览:课件中的釉料组成与特性》
- 任务一淘米(教学课件)一年级下册劳动技术(人美版)
- 2025年初级会计师考试真题试题及答案
- 2024人教版七年级下册生物期末复习必背知识点提纲
- GB/T 10810.2-2025眼镜镜片第2部分:渐变焦
评论
0/150
提交评论