心理测量学14效度(一)_第1页
心理测量学14效度(一)_第2页
心理测量学14效度(一)_第3页
心理测量学14效度(一)_第4页
心理测量学14效度(一)_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第十四讲第十四讲 效度(一)效度(一)主讲教师: 魏然本讲的主要内容n效度的概述效度的概述n内容效度内容效度n结构效度结构效度n准则关联效度准则关联效度一、效度的概述(一)效度的定义(一)效度的定义n操作性定义效度(validity)就是测验测到它打算测的东西的程度,或者说,是根据测验分数所作出的推论的恰当性程度。n理论定义因为总方差(即实得分数的方差St2 )可以分为测量特性引起的方差(Sco2)、系统误差引起的方差(Ssp2)、误差方差(Se2)三个部分,因此效度是总方差中由所测量的特性造成的变差所占的百分比22atSSlV如何理解效度的这个定义?n测量工具的正确性,或者说测验的效度,总是

2、针对着要解决的问题来说的,亦即针对打算作出的应用来建立的,因此不能把效度绝对化。n要确定测验在解决某方面问题时的效度,不能凭主观意愿,而要靠收集的客观事实材料和证据来证明。这种收集大量资料和证据来检验测验效度的工作,叫做效度验证(效度验证(validation) 效度是测验客观上的正确性程度,应该由实际资效度是测验客观上的正确性程度,应该由实际资料本身来证明。但是,测验编制者与开发者的效度料本身来证明。但是,测验编制者与开发者的效度研究报告,即使是科学的、恰当的,也只能为测验研究报告,即使是科学的、恰当的,也只能为测验使用者提供某些事实与概念,测验能否有效被使用,使用者提供某些事实与概念,测验

3、能否有效被使用,取决于使用者本人。取决于使用者本人。(二)效度的种类(二)效度的种类 关于效度种类划分的历史背景关于效度种类划分的历史背景n直到20世纪50年代初,关于效度的理论都是相当混乱的。很长时间内,人们把效度理论等同于预测理论。n美国心理学协会1954年给出效度的第一个形式化定义,从而使效度理论逐步和预测理论相分离。n由于各方的争议,在效度的第一个形式化定义的基础上,美国心理学协会在20世纪70年代又对效度及其种类重申并补充。 “效度就是由测验分数或其他评估形式所作出的推论的恰当性”(Validity refers to the appropriateness of inference

4、s from test scores or the forms of assessment)。根据这一标准可以把效度区分为三种类型:n内容效度(内容效度(content validity)是用表明测验内容多么好(代表性)来进行评估的。而测验所包含的,是应予抽取的情境类别和题材资料。n结构效度(结构效度(construct validity)是用考查测验测量的是什么心理特性来评估的,亦即要确定某种概念或结构说明测验成绩的程度。n效标关联(预测)效度(效标关联(预测)效度(criterion-related predictive validation)把测验分数或由它们所作出的预测,跟外部变量【效

5、标】(external variable criterion)作比较;而这种外部变量【效标】,被认为提供了问题中的行为或特点的直接测量。 一般认为,在讨论效度问题时,把对测验的一般认为,在讨论效度问题时,把对测验的解释或推论区分成如下两类是有帮助的:解释或推论区分成如下两类是有帮助的:n这种解释或推论,是对测量之外的其他成绩的推测,这种预测的正确程度,取决于效标关联效度的证据。n这是对被测的人的性质,即他的行为属于何种行为领域(behavioral domain)的推论。要考察测验项目实际上代表行为领域的程度,这种代表性又可进一步区分为样本(sample)和标志(sign)。 如果测验项目从其

6、中抽取出来的全域,能清楚地被界定,我们就说测验是样本(样本(sample)。 如果测验项目从其中抽取出来的全域,不能清楚地被界定,我们就说测验是标志(标志(sign)。 样本描述(describe)领域而标志解释(explain)领域。那些起样本作用的测验,要求有高的内容效度;那些起标志作用的测验,要求有高的结构效度。(三)效度与信度的关系n高信度是高效度的必要条件,而非充分高信度是高效度的必要条件,而非充分条件条件 也即是说,效度高,信度一定高;信度高,效度不一定高。n信度系数的平方根是效度系数的最高限度信度系数的平方根是效度系数的最高限度 测验的准则关联效度与测验本身的信度和准则测量的信度

7、有关,若这两个信度较低,则效度系数会降低,从而低估测验的真实效度,因而要用减弱矫正法进行校正。即下式:r rc c是指校正后的真实的效度系数,是指校正后的真实的效度系数,r rxyxy是实际测得的是实际测得的效度系效度系数数,r rxxxx指测验的指测验的信度系数信度系数,r ryyyy是指准则测量的是指准则测量的信度系数信度系数。因为因为r r11,由上式可以得出:,由上式可以得出:取准则测量的最大信度值,则:取准则测量的最大信度值,则:信度系数的平方根又称为信度指数(标),即信度系数的平方根又称为信度指数(标),即效度系数的效度系数的最高限度是信度指数。最高限度是信度指数。yyxxxycr

8、rrrxxxyrr二、内容效度n(一)含义(一)含义内容效度的研究目的是要评估测题是否充分代表了所要测量的内容范围,即测验题目对有关内容或行为范围取样的适当性,它所关注的是测验的内容方面。例如,家长带孩子去作智力测验,例如,家长带孩子去作智力测验,他们关心的是这个测验是不是真的能够测他们关心的是这个测验是不是真的能够测查智力。查智力。(二)验证和提高内容效度的方法(二)验证和提高内容效度的方法n专家评定n评分者信度n克朗巴赫的量化方法(即计算同一组被试在两个独立取自同样内容范围的测验上的得分相关)n在编制测验以前,严格编写双向细目表双向细目表n在编制测验时,考虑国家、种族、性别差异对内容效度的

9、影响。n它是一个二维的表格,其行和列分别表示所要测它是一个二维的表格,其行和列分别表示所要测量的学习结果以及教材的内容,而行与列交叉的量的学习结果以及教材的内容,而行与列交叉的数据表明对某一内容达到某种结果所占的权重。数据表明对某一内容达到某种结果所占的权重。编制时,要先列出教材的重点内容和所要达到的编制时,要先列出教材的重点内容和所要达到的学习结果,再根据各个部分的相对重要性决定它学习结果,再根据各个部分的相对重要性决定它们的权重。们的权重。(三)内容效度与表面效度的区别(三)内容效度与表面效度的区别n表面效度是指测验使用者或被试的主观认识上觉得有效的程度。严格的说,表面效度不算效度。n表面

10、效度由于会影响到被试的合作态度,进而可能影响到测验的内容效度,因此在不同的测验类型中,还是应该予以重视,并加以调整。三、结构效度三、结构效度n(一)含义(一)含义 结构(construct)是指用来解释人类行为的理论框架或心理特质,它是心理学中抽象的假设性的概念、特性或变量。例如智力、动机、创造性。 结构效度就是测验能够说明心理学上的理论结构或特质的程度。(二)验证结构效度的方法n所谓结构效度的验证,就是要考察一个测验测量到其所拟测量的结构与特质的程度。n步骤首先要求对所研究结构或特质进行界定(建立理论框架),说明该结构或特质的心理学意义,它与其他结构或特质之间的关系。依据理论框架,提出各种可

11、能的有关的假设。检验假设是否成立(这是最关键的一步)。(三)搜集结构效度资料的方法n测验内方法测验内方法通过研究测验内部构造(如测验的内容、对测题反应的过程,以及项目间或分测验间的关系)来分析测验的结构效度。它主要包括内容效度、内容效度、被试解答测题时的反应过程和测验的同被试解答测题时的反应过程和测验的同质性质性三个方面。n测验间的方法测验间的方法这一方法的特点是同时考虑几个测验间的相互关联,考察这些测验是否在测量同一心理结构。测验间的方法有许多种,如相容效度、会聚效度、区分效度及因素分析。 相容效度(相容效度(congruent validitycongruent validity)即测量相

12、同)即测量相同结构的各测验之间的相关程度应该很高,如新编制结构的各测验之间的相关程度应该很高,如新编制的和已知的测验之间的相关。的和已知的测验之间的相关。 会聚效度(会聚效度(convergent validityconvergent validity)即求同效度,)即求同效度,用不同方法测量具有同一特质的两个测验的相关,用不同方法测量具有同一特质的两个测验的相关,程度应该很高程度应该很高。 区分效度(区分效度(discriminant validitydiscriminant validity)即求异效)即求异效度,用相同方法测量具有不同特质的两个测验的相度,用相同方法测量具有不同特质的两个

13、测验的相关,关,程度应该很低。程度应该很低。n不同类型信度的特点不同类型信度的特点测验可以具有多种类型的信度,由于测验所测特质或结构的不同,这些信度的取值也应该表现出不同的特点。例如,焦虑的重测信度值应该比分半信度值低。n准则关联效度的研究准则关联效度的研究准则的性质和种类可以作为测验所欲测量的结构的指标。n发展水平的变化发展水平的变化智力测验的效度验证要注意智力的年龄差异和发展水平的变化。n实验操作实验操作根据不同测验具有不同的特性,可以预期经过某种实验处理之后发生的变化,以此推测测量某个心理结构的测验的结构效度。四、准则关联效度n(一)含义(一)含义其实质是检验测验分数与准则之间的相关和一

14、致性,也即是说利用测验分数来推断准则的取值能够有多准确。n测验分数是用于推测的实际根据,因此测验称之为预测变量预测变量n准则分数是用于提供标准的东西,并且是被预测的目标,因此被称之为准则变量准则变量(二)准则的测量的注意事项(二)准则的测量的注意事项n必须要对准则下操作性定义必须要对准则下操作性定义。例如,评价创造力水平的高低,实际可测量的是问题解决的行为。n准则必须满足以下特点准则必须满足以下特点:准则应该能够代表理论上测验有效性的主要方面,跟所研究的问题真正相关;准则测量本身必须跟准则有较高的相关性;准则测量必须测量误差小,具有高信度。n在准则测量中必须避免效标污染。在准则测量中必须避免效

15、标污染。即由于评定者事先知道被试测验的原分数而使被试的准则分数受到影响的情况(例如先入为主的情况)。n当准则测量是评定等级时,需要对各个等级当准则测量是评定等级时,需要对各个等级进行详细的说明。进行详细的说明。例如品德操行的评定分为优、良、中、差几个等级。n优秀的准则测量必须方法简单、实用、省钱优秀的准则测量必须方法简单、实用、省钱(三)准则关联效度的估计方法(三)准则关联效度的估计方法n主要有效度系数、组的分类和取舍正确性等。n效度系数效度系数指测验分数和准则分数之间的相关系数。计算的步骤包括:选择适当的测验团体施测;针对该团体收集适当的准则资料;求测验分数与准则分数的相关系数n积矩相关系数当预测分数和准则分数都是连续变量的时候,可采用此方法。利用原始分数计算利用原始分数计算利用离差计算利用离差计算利用利用Z分数计算分数计算n二列相关当X与Y两个常态连续变量中有一个变量由于某些理由被人为地分为两个类别,例如成功、失败,而另一个变量为连续变量的时候,计算出的相关系数为二列相关。在效度系数的计算中,通常是把准则变量分在效度系数的计算中,通常是把准则变量分为两类,而预测变量仍为连续变量。为两类,而预测变量仍为连续变量。二列相关的计算公式二列相关的计算公式PSPS:Y Y是指是指p p的常态曲线下纵轴的高度,可通过查表得出。的常态曲线下纵轴的高度,可通过

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论