心理测量的信度1ppt课件_第1页
心理测量的信度1ppt课件_第2页
心理测量的信度1ppt课件_第3页
心理测量的信度1ppt课件_第4页
心理测量的信度1ppt课件_第5页
已阅读5页,还剩69页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第五章 心思丈量的信度 n第一节 什么是信度 n第二节 估计信度的方法 n第三节 影响信度系数的要素 n一、信度的意义n二、信度系数的作用 n backn一、信度的意义n信度即检验的可靠性,指的是丈量的一致性程度。 n信度受随机误差的影响,随机误差越大,信度越低。 n在丈量学中,信度被定义为:一组丈量分数的真变异数与总变异数实得变异数的比率。即n 公式51n式中 代表信度系数, 代表真分数的变异数, 代表实得分数的变异数,即总变异数。XTxxSSr22xxrTS2XS2n根据公式51,信度还可以表示为:n 公式52 XExxSSr221 n这个定义有两点要留意:n1信度是一组丈量分数的特性,不

2、是某个丈量分数的特性。是对一个人丈量多次或对一个群体进展丈量得到一组丈量分数的特性n2真分数的变异数不能直接丈量,因此信度是一个实际上想象的概念,只能根据一组实得分数进展估计。 n对于信度系数,还应该留意以下几点:n1在不同的情况下,对于不同的样本,采用不同的方法会得到不同的信度系数,因此一个检验能够不止一个信度系数。n2信度系数只是对丈量分数不一致程度的估计,并没有指出不一致的缘由。n3获得较高的信度系数并不是心思丈量有效的充分条件,只是一个必要条件。 backn1.评价检验n信度系数是衡量检验好坏的一个重要的技术目的。 n普通才干与学绩检验的信度系数为0.90以上,有的可以到达0.95;规

3、范智力检验的信度系数应到达0.85以上,个性和兴趣检验的信度系数可稍低,普通应到达0.700.80,也有人以为兴趣、性格、价值观等人格检验的信度系数,通常在0.800.85或更高些。当信度系数小于0.70时,不能用检验来对个人进展评价,也不能用来进展团体间的比较;当信度系数大于0.70时,可用来进展团体间的比较;大于0.85时,可以用来鉴别个人。 n2.用来估计个人的检验分数真分数n由于误差的存在,一个人经过丈量得到的分数很难等于真分数。实际上,我们可以对一个人施测无数次,然后求得所得分数的平均数和规范差。在这个假设的分布里,平均数就是这个人的真分数,规范差那么为误差大小的目的。 Xn在实践任

4、务中,我们用一组被试人数足够多两次施测的结果来替代对同一个人反复施测,以估计丈量误差的变异数。此时,个人在两次检验中的分数差别就是丈量误差。据此可制成误差分数的分布。这个分布的规范差误差分布的规范差我们称之为丈量的规范误,是表示丈量误差的大小的目的,其计算公式为:n 公式54n式中SE表示丈量的规范误,即误差分布的规范差;Sx表示一次丈量分数的规范差;rxx表示信度系数。xxxrSSE1n我们可以用丈量的规范误来估计个人检验的真分数的大小。 n假设选用95的可靠性程度置信程度,即显著性程度a值为.05,真分数有95的能够落入X SE ,即X 1.96 SE的范围之内,也可以写成X1.96SE

5、T X1.96 SE,SE那么用公式54代入。或有5的能够落入这范围之外。这实践上也阐明了再测时分数改动的能够范围。 2Zn例1,知WISC-R的规范差为15,信度系数为0.95,对一名12岁的儿童实施该检验后,IQ为110,那么他的真分数在95的可靠度要求下,变动范围应是多大? n留意几点:n1SE对真分数做的是区间估计,不能够由此得到一个确切的点。这就是说,检验分数不是一个定点,而是具有一定的分布范围。因此,两次检验分数之间存在差别是很正常的。n2置信程度确定后,估计的精度主要取决于SE,SE越小,范围越小,估计就越准确,反之也然。n3真分数不能等同于真正才干或心思特质,真分数中包括了系统

6、误差。 n3.用来对两种检验分数进展比较n来自不同检验的原始分数是无法直接进展比较的,只需将它们转换成一样尺度的规范分数才干进展比较。n如,某班期末考试,小明的数学成果是80分,语文成果是70分。另外,知小明所在班级的数学平均成果是70分,规范差是10分,语文平均成果是60分,规范差是7分 。n我们可以用“差别的规范误来检验差别的显著性。n差别的规范误的公式为:n 公式55n 为差别的规范误,S为一样尺度的规范分数的规范差,Z分数为1,T分数为10。 、 分别为两个检验的信度系数。n先将原始分数化成规范分数,然后将两个规范分数的差别与1.96SEd0.05显著性程度进展比较,假设其绝对值大于此

7、值,那么差别显著,否那么差别不显著。yyxxdrrSSESESE22221dSEyyrxxrn例2,某校五年级进展了两次数学检验,小张第一次考了85分,此次数学检验年级平均分是77分,规范差是8分,此次检验的信度系数是0.84;第二次考了95分,此次数学检验年级平均分是81分,规范差是10分,此次检验的信度系数是0.91;问小张这两次数学检验的成果能否有显著差别? n backn一、再测信度n二、复本信度n三、等值稳定性系数n四、内部一致性系数 n五、评分者信度 n总结n练习n backn再测信度(Test-Retest Reliability) ,也叫重测信度,也叫稳定性系数。用同一个检验,

8、对同一组被试前后施测两次,对两次检验分数求相关,其相关系数就叫再测信度。其计算公式皮尔逊积差相关公式的变式为:n 公式56n式中X1、X2为同一被试的两次检验分数, 、 为全体被试两次检验的平均数,S1、S2为两次检验的规范差,N为被试人数。n再测法的方式是:施测 适当时距 再施测212121SSXXNXXrxx1X2Xn例2:假设有一份客观幸福感调查表,先后两次施测于10名学生,时间间隔为半年,结果如表所示,求该检验的重测信度。为了便于了解和计算,本章估计信度的例子都是小样组,实践运用时应采用大样组。n表51 某幸福感调查表的两次测试结果n 检验被试12345678910X1 1615131

9、3111010987X21616141211911867n计算再测信度必需留意几个问题:n1所丈量的特性必需是稳定的。当然绝对的稳定是不能够的,但应该是比较稳定的。n2遗忘和练习的效果根本上相互抵消。n在做第一次检验时,被试能够会获得某种技巧,但只需间隔时间适度,这种练习的效果会根本上被遗忘掉。n再测信度要思索时间间隔的问题。究竟多长适宜呢?普通来说,无论对于那种被试,初测与再测的间隔最好不要超越六个月。 n3再测法适用于速度检验而不适用于难度检验。 n4应留意提高被试者的积极性。 back n复 本 信 度 A l t e r n a t e F o r m Reliability,也称等值

10、性系数Coefficient of Equivalencen用两个平行等值的检验对同一组被试施测,得到两组检验分数,求这两组检验分数的相关系数,这就是复本信度。由于这反响了两个检验的等值程度,因此又称等值性系数。计算方法与再测法是一样的。n复本信度的方式是:复本A 最短时距 复本B n例3:假设用A、B两型发明力复本检验对初中一年级10个学生施测。结果见表52。请同窗们本人计算。n表52 某发明力复本检验测试结果 检验被试12345678910X1 20191918171614131210X22020181615171211139n复本信度运用时应留意以下几点:n1复本信度的关键在于两个量表必

11、需等值,即必需具有一样的难度、区分度、长度、题型等。 n2两次检验的时距应尽能够短促,以便防止知识的积累、练习效应等要素的影响。 n3由于量表的两个复份在许多方面近似,所以信度系数有稍稍偏高的倾向。 n4被试易出现疲劳、失去积极性等反响,还会出现迁移。这些称为顺序效应,为了抵消顺序效应,可随机分配一半被试先做复本A再做复本,另一半被试先做复本再做复本A,以平衡顺序效应。n5复本法只能减少而不能完全排除练习和记忆的影响。n6对于许多检验来说,建立复本是相当困难的。 backn三、等值稳定性系数n等值稳定性系数是用两个平行的等值的检验,间隔适当时距施测于同一组被试得到两组检验分数,求这两组检验分数

12、的相关,其相关系数就是等值稳定性系数。n等值稳定性系数的方式是:n检验A 适当时距 检验Bn计算方法同稳定性系数和等值性系数。n等值稳定性系数也是采用复本对被试施测,但等值性系数的检验要求两次检验的时间间隔尽能够短,而计算等值稳定性系数的两次检验却要求有一个适当的时距。 n优点:n1因两次测试有适当的时间间隔,减少了复本法中的练习、疲劳效应。n2只需时间间隔适当,可用于计算稳定性不高的心思特质的检验的信度。n留意:n等值稳定性信度系数的值普通要比等值性系数和稳定性系数要低。n等值稳定性系数是检验信度的最严厉的调查,得到的是信度系数的下限。n backn利用一次检验所获得的资料来计算信度系数。这

13、样计算出来的信度系数反响的是检验内部的一致性,即检验工程的同质性,叫做内部一致性系数或同质性系数。n一分半法分半信度 n二其它计算内部一致性系数的方法 n n back n分半信度Split-half reliability:分半信度就是将检验标题分成等值的两半,分半求出量表标题的总分,再计算两部分总分的相关系数。 n分半的方法很多,常见的方法是把一个量表按标题番号分为两半,一半是奇数题,另一半数偶数题。求出每个人的奇数题的总得分和偶数题的总得分,然后求出奇数题总得分和偶数题总得分的相关系数,最后对相关系数进展校正。 n校正公式有:n1斯皮尔曼布朗Spearman-Brown公式n公式57n

14、式中, 是两半检验分数的相关系数,为整个检验的信度估计值。 hhhhxxrrr12hhrxxrn 采用斯皮尔曼布朗Spearman-Brown公式进展校正时,假定两半检验等值,亦即两半检验具有一样的平均数和规范差。当假定不能满足时,可以采用下面两个公式来估计信度。n弗朗那根公式:n 公式58n式中, 、 分别为两半检验分数的变异数, 为检验总分的变异数。r为信度值。 xbaSSSr22212aS2bS2xS2n卢伦公式:n 公式59n式中, 为两半检验分数之差的变异数, 为检验总分的变异数。r为信度值。 xdSSr221 dS2xS2n例4:有一个由100题构成的量表施测于10个高三学生。检验

15、一次后,应试者即毕业离校。如今怎样评介检验结果的信度? n1计算出每个应试者的奇数题总分X1和偶数题总分X2,见表53。n 得分被试12345678910X1 38373841403638394035X237373639393438393936n采用分半信度应留意以下几个问题:n1假设用分半法时,以按奇数题和偶数题分半为宜。n2在运用斯皮尔曼布朗公式时要求全体被试在两半检验上的得分的变异数相等。当一个检验不宜分成对等的两半时分半信度不宜采用。n2当试卷中存在任选题时,不宜采用分半法。速度检验也不宜采用分半法。由于速度检验中试题的难度低,被试得分的多少主要是看答题的多少,分半法易使得分一样,从而

16、夸张分半法的信度估计。n3如遇到有牵连的工程或一组处理同一问题的工程时,这些工程应放在同一半,否那么会高估信度的值。n4将一个检验分成两半的方法很多如,按题号的奇偶性分半、按标题的难度分半、按标题的内容分半等,因此,一个检验可以有多个分半信度值。提供分半信度值时,要阐明分半的方法。n backn分半法实践上是对检验内部一致性的一个粗略估计。但对于同一个检验分半的方法是很多的,而且用不同的分半方法求出的分半信度都不一样,因此分半信度不是最好的内部一致性的估计。为了弥补分半法的缺乏,可以采用其它的方法。 n1.库德理查逊公式KR20公式n库德Kuder、理查逊Richardson针对分半法的缺乏,

17、提出以工程统计量为转移,利用工程统计量来计算信度。称为K-R20公式。n 公式510n式中k表示构成检验的标题数,pi为经过第i题的人数比例,qi为未经过第i题的人数比例, 为检验总分的变异数。 xiikRSqpKKr22011xS2n例5:有一种包含6个问题的检验,10个应试者的得分如表54答对得1分,答错得0分,试估计应试者反响的一致性程度。 n2. 库德理查逊另一公式KR21公式n当检验工程难度接近时可以采用库德理查逊提出的简便公式,称为KR21公式。nKR21公式为:n 公式511n式中k表示构成检验的标题数, 为检验总分的平均数, 为检验总分的变异数。xxkRSKXKXKSr2221

18、) 1()(xS2Xn3.克伦巴赫Cronbach的系数n库德理查逊公式只适用于两级记分的检验,而对多级记分的检验,那么可以采用克伦巴赫Cronbach的系数,克伦巴赫的系数对两级记分的检验也是适用的。其计算公式为:n 公式511n式中,K为检验的标题数, 为某一检验标题分数的变异数, 为检验总分的变异数。xiSSKK2211iS2xS2n例6:有一种包含6个论文式标题的检验,对5个应试者施行,得分见下表55,试求该检验的信度。 n表 5-5 被试在检验上的得分n 题号被试ABCDE17118111126978936106894811683571181111671181111n五、评分者信度S

19、corer Reliabilityn评分者信度:随机抽取部分试卷,由两个或多个评分者独立按评分规范打分,然后求其间的相关,所得的相关系数即为评分者信度。 n评分者信度的计算:n1.评分者为两个人时n假设是延续变量的评分,且分布是正态那么计算皮尔逊积差相关系数可用计算机直接计算。n假设是等级评定或虽是等距或等比的数据但分布非正态,那么计算斯皮尔曼等级相关。n斯皮尔曼等级相关公式:n 公式512n式中D为各对偶等级之差, 是各D平方之和,N为等级数目。) 1(6122NNDrR2Dn当有一样的等级出现时,计算斯皮尔曼等级相关的公式为:n 公式513n , ;n , n式中,N为成对数据数目,n为相

20、等等级数目。 222222yxDyxrRCxCNNx123212) 1(2nnCxyCNNy123212) 1(2nnCyn例7:甲乙两位教师评阅10份试卷,他们对每一试卷各自所评的分数列入下表56,问这两位教师评分的一致性如何?n表 56 两位教师对10份试卷的评分试卷得分名次甲评分乙评分甲评分乙评分A9493B9092C8692D8670E7282F7076G6865H6676I6468J6160n2.2.评分者为多个时评分者为多个时n采 用 肯 德 尔 调 和 系 数 采 用 肯 德 尔 调 和 系 数 K e n d a l l K e n d a l l coefficient of

21、 concordancecoefficient of concordance来估计来估计信度系数信度系数n 公 式 公 式 5 51414n式中,式中,W W为调和系数,为调和系数,K K为评分者人数,为评分者人数,N N为被评对象数,为被评对象数,RiRi为每一对象被评的等为每一对象被评的等级之和。级之和。NNKNRRWii3222121n出现一样等级时采用下面的公式:n 公式515n式中,W为调和系数,K为评分者人数,N为被评对象数,Ri为每一对象被评的等级之和,n为一样等级数目。TKNNKNRRWii)(1213222123nnTn例8:六位教师各自评阅一样的五篇作文,每位教师给每一篇作

22、文都评了等级共五等,并列入下表57。求六位教师所评等级的一致性程度。n表5-7评分者K6试卷编号N=512345A35241B35241C34152D35142E35241F35241RiRi2n例9:三位教师评阅四份试卷,所评等级列入下表58。他们所评的等级的一致性程度怎样?评卷教师K3作文编号N41234张3142王2141李2232Rin3.肯德尔调和系数W的检验n1当3 N 7时,查心思与教育统计学的附表10,肯德尔W系数显著性临界n值表,用 值查表。n2当N 7,将所得W值代入下式n 公式516n n查卡方分布表。 backNRRSii22WNK) 1(21 Ndfn总结:n再测信度

23、:估计信度中跨时间的一致性n复本信度:估计检验跨方式的一致性n等值稳定性系数:估计检验跨时间和方式的一致性n内部一致性系数:估计检验跨工程或两个分半检验之间的一致性n评分者信度:估计检验跨评分者的一致性n各种方法具有不同的意义,每一种信度系数不能替代其他的信度系数,所以编制或运用检验时,应该尽能够搜集各种信度证据。 back n一、分数分布范围的影响n 相关系数受分数分布范围的影响,图51阐明了分数范围对相关系数的影响。第一次检验验测次二第n其分数范围越广,信度系数就越大。反之也然。 n上述关系也可从公式n中看出,一个检验的误差变异主要来自主试、施测环境、评分的客观性、被试等要素,当除被试外的

24、另一些要素固定后,受测团体越是异质,所得分数变异越大,信度系数越大。因此,信度系数与团体的异质性有关。 221xExxSSrn由于信度系数与被试团体的异质性有关,因此,假设一本检验手册中,所报告的信度系数是从全体中、小学生的样本中得到的,我们不能以为把该检验用于小学五年级的团体时也能得到同样高的信度。当一个检验用于比常模更同质的团体时,要重新确定丈量的信度。 n团体异质性不同,分数的规范差亦不同。当将检验用于规范差不同的团体时,可用下面的公式克莱公式推算出新的信度系数:n 公式517n式中S0为信度系数知的分布的规范差,Sn为信度系数未知的分布的规范差,r00为原团体的信度,rnn为异质程度不

25、同的团体的信度。20020)1 (1nnnSrSrn例10:一记忆力检验实施于某市全体初中生,其分数的规范差为10,信度系数为0.90,假设将该检验施测于初二年级,其分数的规范差为6。求初二年级的信度系数的估计值。n由于信度系数与被试样本的异质程度有关,因此,在编制检验时,应把常模团体按年龄、性别、文化程度、职业、喜好等分为更为同质的亚团体,并分别报告每个亚团体的信度系数,这样检验才干适用于各种团体。 n二、检验长度的影响n检验的长度,即标题的数量,也是影响信度系数的一个要素。普通说来,在一个检验中添加同质的标题,可以使信度提高。由于添加检验的长度可以加大分数的范围。对此问题可以这样了解:n1

26、标题数量多,在每个标题上的随机误差相互抵消。n2检验标题数量增多,可以改良工程取样的代表性,从而能更好地反响受测者的真实程度。 n添加检验长度的效果可以用斯皮尔曼布朗公式的通式来计算:n 公式518n式中K为改动后的长度与原来长度之比,为原检验的信度, 为检验长度是原来的K倍时的信度估计。xxxxKKrKKrr) 1(1xxrKKrn例11:有一个包括10个标题的检验,信度为0.50,假设把检验添加到50个标题,其信度将添加到多少? n用同样方法可以算出标题数量继续添加时相关系数的值见表59n表59 标题数量对相关系数的影响标题数量1050100200300400500相关系数0 . 500 . 830 .910.950.9680.9760.980n由表5-9可以看出,添加标题数量可以提高信度,但并非多多益善。检验过长是得不偿失的:1检验过长,编制检验要浪费较多的时间和精神,施测时浪费受测者的时间和精神,破费大。2检验过长会引起被试的疲劳和反感,从而降低可靠性。为了节省时间和精神,有时还需求将过长的检验适当缩短,而不使其对信度有大的损害

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论