北京大学心理测量串讲笔记(三)_第1页
北京大学心理测量串讲笔记(三)_第2页
北京大学心理测量串讲笔记(三)_第3页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、北京大学心理测量串讲笔记三第 5 章信度1、信度是指:测量结果的可靠性和一致性。因为心理测验 通常测量人的行为,行为会由于各种各样的原因,因时、因事、因地 而产生变动,这些因素有些是偶然的,有些是固有的,人在完成心理 测验时的行为也会受上述因素的影响,从而使测验结果与真实结果不 完全一致,所以我们要用信度来衡量测验的可靠性和一致性。2、信度的操作化定义:1误差理论认为: 一个人的测验分数 X 是由真实分数 T 和误差E两局部构成的,公式是 X = T + E. 2因此信度就被定义为:一组测量分数的真实方差与实 得方差的比,或者是指真实方差占总方差的百分比。公式为: rxx = 1 SE 2SX

2、 23根据统计学理论,真实方差与实得方差的比是一个相 关系数的平方,所以我们把这种相关系数的平方叫做信度系数。 4计算公式为: rxx = ST2 SX23、由于误差的来源信度的可分为:这种分类是基于信度的 传统定义 - 真分数理论。1重测信度:考虑的误差来源是时间取样。2复本信度:考虑的误差来源是内容取样。3分半信度:它考虑的误差来源也是内容取样,它与复 本信度的差异是:分半信度考查一个测验内容的两半题目测量的是否 是同一个心理特点行为。 4同质性信度内部一致性系数 :考虑的是测验内容是 否异质。5评分者信度:考虑的误差来源是评分者间的差异。4、信度的表示方法:1信度系数和信度指数:1 信度

3、系数: rxx = rx2T = S2T S22 信度指数: rXT = ST SX2测量标准误: SE = SX 1 rxx5、信度的意义:1信度系数可以解释为样本测验分数的总方差中有多少 比例是真分数方差,也就是测验的总变异中真分数造成的变异占百分 之几。它直接告诉我们测量的误差有多大。2测量的标准误可以告诉我们有多大可能性真实分数在 某一分数范围内,并且可以预测实得分数再测时可能的变化情况。6、信度的作用:1解释预测个人分数的意义。2解释真实分数与实得分数间的关系,明确告诉我们测 验误差大小。3新编的测验信度应高于原有的同类测验或相似测验。4下结论说某测验比拟可靠,必须是依据情境的,经多

4、 次证实的。 5 它是确定测验好坏的一个指标。一般的原那么是:1当rxx v 0.70时,测验不能用于对个人作出评价或预测,而且不能做团体间比拟。2当0.70 Wrxx v 0.85时,可用于团体比拟。3当rxx >0.85时,才可以用来鉴别或预测个人成绩或作用7、重测信度:有时也叫稳定性,主要针对时间变量。1 重测信度采集数据得方法是:对同一组被试间隔一定 的时间重复测试一次。 4重测信度的计算方法是积差相关法,因而 rxx 就是皮 尔逊的积差相关系数。7重测信度的时间间隔选择依测验性质和目的而定,如 果测验是用于长期预测,那么测量间隔长一些。对儿童的智力测验一般 是两周到四周为宜。对

5、成年人,间隔可到半年,很少超过 6 个月。13使用重测信度应注意:不是所有测验都可以计算重测 信度。并且重测信度只是反映了随机误差的影响,而不是反映被试心 理特点的长期变化。8、复本信度:又叫等值性系数。1 数据采集方法是:给被试施测两个内容等值但题目不 同的测验,求两组数值的相关。计算方法常见的也是积差相关法。2复本信度的上下反映了两个互为复本的测验等价的程度,而不是反映一个测验本身受随机误差影响的大小。复本信度的高 低关键取决于复本测验的选择,因而施题目取样问题,或者说是测验 的内容取样问题。3复本信度优于重测信度的地方是:防止了重测带来的 记忆效应和练习效应;可用于长期追踪研究前后测量;

6、减少了作弊的 可能性。4复本信度的缺点:有些测验的复本很难找到;有些测 验因正迁移效应使测验性质改变; 如测量的内容很容易受练习的影响, 复本信度也无法去除这种练习效应。5重测复本信度,即再不同的时间里施测两个等值的测 验复本,得到的相关就是重测复本信度, 也叫稳定等值系数。 它比 单一的重测信度或复本信度都要严格、全面一些。9、斯皮尔曼 -布朗公式: rnn = nrtt 1 + n13 、1rtt , 14 、rnn 是校正以后的相关系数, 15 、rtt 是实得的相关系数, 16、n 为rnn对应的测验长度与rtt对应的测验长度之比。分半时,17、n二 NN2= 2 N 为测验全长, 1

7、8、所以分半法信度的校正公 式是: rxx = 2 rnn 1 + rhh 其中 rhh 为两半测验的相关系数。1 卢伦公式: rxx = 1 Sd2 Sx2 其中 Sd2 是两半测验 分数之差的方差, Sx2 为总方差。2从理论上分析,分半信度反映的实际上是两半测验能 够测量相同内容或心理特点的程度。10、内部一致性信度同质性信度 :同质性是指测验的所 有题目间性质的一致性,即测的是同一种心理特质或行为。同质性是测量单一特质的必要条件。这里讲的同质性是指测验题目得分反映的 心理特质一致,同质性的判别标准是:题目间呈高正相关,如果相关 很低或是呈负相关,那么题目为异质。1库德和里查德森提出的

8、K-R20 公式只适合预测题目是二分法计分的。克伦巴赫a系数适合于非二分法计分的测验的内部一 致性信度估计法。2从同质性信度的含义我们不难看出,分半信度是求测 验两半之间的一致性或同质性,而同质性是求所有题目间的一致性。 因此分半信度实际上是同质性信度的一种,可以作为测验同质性评价 的粗略估计指标。因为可以根据测验得分来推论或验证某种概念或理 论构思,因此同质性信度也是一种构思效度,或叫结构效度,它实际 上介于信度与效度之间。11、评分者信度:有些心理测验的得分不是根据客观的计分 系统计分的,是由评分者来给被试打分,因此,这样的测验的可靠性 如何取决于评分者评分的一致性和稳定性如何。评分者信度

9、因评分者人数不同而估计方法不一样。如果是两 个评分者,独立对被试的反响评分,那么可以用积差相关来计算,或用 斯皮尔曼等级相关法计算。 如果评分者在三人以上, 而且是等级评分, 那么可以用“肯德尔和谐系数 W 来求评分者信度。12 、以测量标准误表示信度的好处是:1信度的单位与测验分数的单位相同,因此解释个人分数时非常直接,能直接指出允许测验分数变化的范围。2测验同质与否并不影响测量标准误的大小。测量标准 误的缺乏之处时:无法比拟不同测验间的信度上下。比拟不同测验的 信度用信度系数 rxx 解释个人分数时用测量标准误 SE。13 、常见的影响信度的因素有:样本特征、测验的长度、测 验的难度、测量

10、的时间间隔等。14 、我们做信度考验时,常常选取一个与常模样本性质相同 的样本施测,根据被试得分求出信度系数。1样本团体得分分布的影响:求信度的样本团体得分分 布如果比拟窄小的话信度就低。2样本团体异质性的影响:样本团体异质的话,测验分 数的分布就比同质样本的要广,分数的离差就大,样本的方差就大, 信度就高。实际上,高信度可能是假性高信度,是由样本团体的异质 造成的。但如果常模总体要求各种各样的人,那么异质的信度样本求得 的信度就是真信度。这时,相反的情况就需要校正信度。3样本团体平均能力水平的影响。由于信度也会因样本 间团体平均能力水平的不同而不同,因此在求信度时,一定要注意信 度样本与常模

11、总体间是否一致。15 、测验的长度:在其他条件均等的情况下,测验越长,信 度越高。原因在于:1测验越长,即题目越多,测验的内容取样就越有可能有代表性。2测验越长,被试的猜想因素影响就越小。16 、测验的难度:难度对信度的影响之存在于某些测验中, 如智力测验、成就测验、能力倾向测验、教育测验等。测验的难度对 信度有间接影响,因为如果测验过难,被试的得分会集中在低分区。 过于容易,分数那么集中在高分区。两种情况都使信度样本的得分范围 变窄,变异量降低,从而低估测验信度。17 、测验的时间间隔:这一因素之对重测信度和不同时测量 时的复本信度有影响,对其余的信度来说不存在时间间隔问题。第 6 章效度1

12、、效度是指:测验能测量到所要测量的对象的程度。这一 定义包含着两层含义:测验测量什么?测验对测量目标的测量精确度 和真实性是多少?2、效度的公式为: rxy = SV2 SX2 它是与测量目标有关的 真实分数方差与总方差的比率。其中 rxy 是常用的效度表示法; SV2 是“有关的真实方差,也就是由测验所要测量的心理变量引起的方差, 也叫有效方差; SX2 是总方差。3、信度和效度的差异是:两者所涉及的误差不同:信度仅 考虑偶然的随机误差占测验总变异的比例,效度那么还包括与测验无关 的但稳定的测量误差。1信度是效度的必要而非充分条件。2效度是受信度制约的。4、效度的性质:效度的真实含义是指测验

13、结果的效度,也就是测验结果的准确程度1效度具有相对性。2效度具有连续性。测验的有效性只有程度上的差异。3效度也不是直接就可以测量到的,它是从已有的证据 推理而来的。5、效度的种类:内容效度、构思效度和效标关联效度。6、效标关联效度是指: 测验总分数与外在标 20 、准效标 之间的相关程度,反映的是用测验预测个体在某种情境下行为的表现 如何的有效性程度。由于外在标准成了考察测验有效性的参照标准, 因此简称为效标。7、阿斯丁把效标分为两个层次:一是理论描述水平的“观 念效标,二是操作定义水平的“效标测量 。1观念效标是效标的理论定义,效标测量是效标的操作 定义,效标测量必须能真正反映观念效标。2效

14、标测量的一个重要特征是客观性。为此因做到:1 防止偏见影响效标测量,特别是以等级评定为效标 4 测量 时,评分者的主观偏见会有很大影响。2 防止效标污染,即指个人的效标因评定者知道个体的测验 分数也叫预测源分数而受到影响。8、常用的效标:学业成就、临床诊断、实际工作表现、特 殊训练成绩、效标团体比拟、先前有效的测验、等级评定。9、同时效度:它的效标资料是和测验分数差不多同时搜集的。一般情况下,它可以代替预测效度。10 、预测效度的效标是经过一段时间以后才获得的,预测效 度反映的是从测验分数预测任何效标情境或一段时间后被试的行为表 现的程度。11 、构思效度就是:心理测验对某一理论概念或特质测量

15、的 程度。因此,研究构思效度就是要搞清楚: 测验测量的是什么构思 概 念或特质?测验分数的变异中有多少来自于测验的理论构思?构思 效度是没有单一指标的,它是由各方面证据累积起来作出评价的。12 、确定构思效度的根本步骤:建立理论框架、根据理论框 架推演出有关测验成绩的假设、用逻辑或实证的方法来证明假设。13 、确定构思效度的方法: 测验内部的方法、 测验间的方法、 效标效度的研究、实验和观察法验证。1测验内方法:这类方法是通过研究测验内部结构来界 定理论构思,从而为构思效度提供证据。2确定方法是:分析测验的内容效度和测验的内部一致性分析。测验的内部一致性可以由分半信度、a系数、 KR20或KR

16、21等指标来衡量,它们考察的是测验题目是否同质,分测验与总测验是 否一致或同质,这些都可以证明测验所测量的构思是否合理,因而构 成了证实构思效度上下的证据。3有时分析被试对题目的反响特点也可以作为构思效度 的证据。4测验间的方法:通过分析几个测验间的相关关系,找 出其共同之处,进行推断这些测验测量的特质是什么,也可以确定这 些测验构思效度如何。 最简单的方法是计算两种测验之间得分的相关。 区分效度是构思效度的又一个证据。因素分析法也是建立构思效度的 常用方法。5实验法和观察法证实:观察实验前和实验后分数的差 异也是验证构思效度的方法之一。14 、内容效度是指:测验题目对有关内容或行为总体取样的

17、 适当性程度。 因为这种效度主要是考察测验的内容, 因此叫内容效度。1要想使测验的内容效度高,必须又两个条件:内容的 范围或行为总体必须界定名确;测验题目应该是所界定的内容范围的 代表性样本。2内容效度确实定方法:专家判断、经验判断、统计分 析法。15 、外表效度是指:一个测验看起来好象是测量所要测的东 西的程度。换句话说,当那些未经过训练的被试或测验应用者认为某 测验是有效的测验时,该测验就有外表效度。16 、效度的指标是指:效标关联效度和构思效度的的指标。 效度指标一般有:效度系数、统计推断参数、预期表等。17 、效度系数:它是最常用的效度指标,尤其是效标关联效 度。它是以皮尔逊积差相关系

18、数来表示的。效度系数的实际意义常以 决定性系数来表示, 表达式是 rx2y ,效度系数的平方就是决定性系数, 测验正确预测或解释的效标的方差占总方差的比例。18 、效度的其他指标:一些描述不同团体的差异的统计指标(参数)也可以作为效度的指标,比方:t考验、F考验、重叠百分比 等。19、效度的影响因素:测验本身的因素、测验施测的样本的 性质、效标的性质等。(1)对于测验本身因素又可分为:测验题目的质量、测验 的长度、测验实施中的干扰、被试的因素等。( 2)样本的性质:1 影响之一是:不同的团体对同一测验的反响可能会不一样, 因被试的背景不同,对测验的题目可能采取完全不同的方法来答复。2、响之二是:同一个测验,效

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论