心理测量学5 第五节 测验的信度_第1页
心理测量学5 第五节 测验的信度_第2页
心理测量学5 第五节 测验的信度_第3页
心理测量学5 第五节 测验的信度_第4页
心理测量学5 第五节 测验的信度_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五节测验的信度

第一单元信度的概念第二单元信度评估的方法

第三单元

信度的作用

第四单元

影响信度系数的因素

复习题一、信度的定义信度即测验的可靠性,指的是测量的一致性程度。

信度受随机误差的影响,随机误差越大,信度越低。

信度是一组测量分数的特性,不是某个测量分数的特性。是对一个人测量多次或对一个群体进行测量得到一组测量分数的特性。二、信度的指标1、信度系数与信度指数信度指数:信度系数的平方根。2、测量标准误

式中SE表示测量的标准误,Sx表示一次测量分数的标准差;rxx表示信度系数。标准误与信度互为消长。back1.评价测验信度系数是衡量测验好坏的一个重要的技术指标。

一般能力与学绩测验的信度系数为0.90以上,有的可以达到0.95;标准智力测验的信度系数应达到0.85以上;兴趣、性格、价值观等人格测验的信度系数,通常在0.80~0.85。

当r<0.70时,不能用于对个人作出评价,也不能做团体比较;当0.70<r<0.85时,可用于团体比较当r>0.85时,可用来对个人作出评价2.用来估计个人的测验分数利用测量的标准误,可以解释个人分数的意义。体现在:估计真实分数的范围,了解实得分数再测时可能的变化情形。计算公式为:X-1.96SE

T

X+1.96SE(.05)X-2.58SE

T

X+2.58SE(.01)

式中SE表示测量的标准误,Sx表示一次测量分数的标准差;rxx表示信度系数。例1,已知WISC-R的标准差为15,信度系数为0.95,对一名12岁的儿童实施该测验后,IQ为110,那么他的真分数在95%的可靠度要求下,变动范围应是多大?

解:SE=15*(1-0.95)1/2=3.35110-1.96*3.35=103.4110+1.96*3.35=116.6有95%的把握可以断定真分数在103.4和116.6之间。注意几点:(1)SE对真分数做的是区间估计,不可能由此得到一个确切的点。这就是说,测验分数不是一个定点,而是具有一定的分布范围。因此,两次测验分数之间存在差异是很正常的。(2)置信水平确定后,估计的精度主要取决于SE,SE越小,范围越小,估计就越精确,反之也然。(3)真分数不能等同于真正能力或心理特质,真分数中包括了系统误差。

3.用来对两种测验分数进行比较来自不同测验的原始分数是无法直接进行比较的,只有将它们转换成相同尺度的标准分数才能进行比较。如,某班期末考试,小明的数学成绩是80分,语文成绩是70分。我们可以用“差异的标准误”来检验差异的显著性。差异的标准误的公式为:

为差异的标准误,S为相同尺度的标准分数的标准差,Z分数为1,T分数为10。、分别为两个测验的信度系数。先将原始分数化成标准分数,然后将两个标准分数的差异与1.96SEd(0.05显著性水平)进行比较,如果其绝对值大于此值,则差异显著,否则差异不显著。back一、再测信度二、复本信度三、等值稳定性系数四、内部一致性系数

五、评分者信度

总结

back再测信度(Test-RetestReliability),也叫重测信度,也叫稳定性系数。用同一个测验,在同样条件下,对同一组受测者前后施测两次,对两次测验分数求相关,其相关系数就叫再测信度。其计算公式为:

式中X1、X2为同一受测者的两次测验分数,、为全体受测者两次测验的平均数,S1、S2为两次测验的标准差,N为受测者人数。再测法的模式是:施测适当时距再施测例:假设有一份主观幸福感调查表,先后两次施测于10名学生,时间间隔为半年,结果如表所示,求该测验的重测信度某幸福感调查表的两次测试结果

测验受测者12345678910X1

16151313111010987X21616141211911867计算再测信度必须注意几个问题:(1)所测量的特性必须是稳定的。当然绝对的稳定是不可能的,但应该是比较稳定的。(2)遗忘和练习的效果基本上相互抵消。在做第一次测验时,受测者可能会获得某种技巧,但只要间隔时间适度,这种练习的效果会基本上被遗忘掉。再测信度要考虑时间间隔的问题。到底多长合适呢?对于年幼儿童,两次施测的时间间隔应比年纪较大的受测者短些,这是因为在个体发展的早期变化较快。一般来说,无论对于那种受测者,初测与再测的间隔最好不要超过六个月,一般是两周到四周为宜。

(3)应注意提高受测者的积极性。

back

复本信度(AlternateFormReliability),也称等值性系数(CoefficientofEquivalence)用两个平行(等值)的测验对同一群体施测,得到两组测验分数,求这两组测验分数的相关系数,这就是复本信度。因为这反应了两个测验的等值程度,因此又称等值性系数。计算方法与再测法是一样的。复本信度的模式是:复本A最短时距复本B

例:假设用A、B两型创造力复本测验对初中一年级10个学生施测。结果见表5-2。某创造力复本测验测试结果

测验受测者12345678910XA

20191918171614131210XB2020181615171211139复本信度应用时应注意以下几点:(1)复本信度的关键在于两个量表必须等值,即必须具有相同的难度、区分度、长度、题型等。对于许多测验来说,建立复本是相当困难的,如人格、动机等,则不易找到等值的测题。

(2)由于量表的两个复本在许多方面近似,复本法只能减少而不能完全排除练习和记忆的影响。(3)两次测验的时距应尽可能短促,以便避免知识的积累、练习效应等因素的影响。(4)受测者易出现疲劳、失去积极性等反应。还会出现迁移,称为顺序效应,为了抵消顺序效应,可随机分配一半受测者先做复本A再做复本B,另一半受测者先做复本B再做复本A,以平衡顺序效应。

back三、等值稳定性系数等值稳定性系数是用两个平行的(等值的)测验,间隔适当时距施测于同一群体得到两组测验分数,求这两组测验分数的相关,其相关系数就是等值稳定性系数。等值稳定性系数的模式是:测验A适当时距测验B计算方法同稳定性系数和等值性系数。等值稳定性系数也是采用复本对受测者施测,但等值性系数的测验要求两次测验的时间间隔尽可能短,而计算等值稳定性系数的两次测验却要求有一个适当的时距。

注意:等值稳定性信度系数的值一般要比等值性系数和稳定性系数要低。因为,时间因素会引起我们所要测量的心理特质的变化以及测题的取样不同会影响两次测验分数的一致性。

等值稳定性系数是测验信度的最严格的考察,得到的是信度系数的下限。

back利用一次测验所获得的资料来计算信度系数。这样计算出来的信度系数反应的是测验内部的一致性,即测验项目的同质性,叫做内部一致性系数或同质性系数。(一)分半法(分半信度)

(二)同质性信度

back

分半信度:采用分半法估计所得的信度系数。只需实施一次测验。常见的方法是把一个测验按题目编号分为两半,一半是奇数题,另一半是偶数题。求出每位受测者奇数题得分和偶数题得分,然后求出这两半得分的相关系数,这个相关系数就代表了两半测验内容取样的一致程度,因而叫做内部一致性信度系数。这个系数往往低估整个测验的信度,还需利用一些公式对相关系数进行校正,借以估计整个测验的信度。

采用分半信度应注意以下几个问题:(1)若用分半法时,以按奇数题和偶数题分半为宜。(2)当试卷中存在任选题时,不宜采用分半法。速度测验也不宜采用分半法。因为速度测验中试题的难度低,受测者得分的多少主要是看答题的多少,分半法易使得分相同,从而夸大分半法的信度估计。(3)如遇到有牵连的项目或一组解决同一问题的项目时,这些项目应放在同一半,否

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论