第五章测量效度_第1页
第五章测量效度_第2页
第五章测量效度_第3页
第五章测量效度_第4页
第五章测量效度_第5页
已阅读5页,还剩64页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第五章 测量效度 n第一节 效度概述 n第二节 效度的估计 n第三节 提高测量效度的方法 第一节第一节 效度的概述效度的概述n一、效度所要回答的问题 n二、效度的含义二、效度的含义n三、效度和信度的关系三、效度和信度的关系n四、效度验证与效度概化四、效度验证与效度概化 一、效度所要回答的问题 n (1)一个测验测量了什么特性?n (2)它对所要测量的特性测得有多准?n二、效度的含义二、效度的含义n 效度是指测量的有效性,一个测验实际所能效度是指测量的有效性,一个测验实际所能测出其所要测量的心理特质的程度。测出其所要测量的心理特质的程度。 222xvxySSr效度效度与测验目的有关的与测验目的有

2、关的有效有效SV2和实得和实得SX2 的比值的比值 效度检验的实质效度检验的实质实际的测量结果实际的测量结果测量目标测量目标 两两 者者 关关 系系注意:1.效度是一个相对的概念。具有连续性。 针对某种特定的测量目的针对某种特定的测量目的 只有程度上的差异只有程度上的差异2.效度是测量的随机误差和系统误差的综合反映。3.判断一个测量是否有效要从多方面搜集证据。n三、信度与效度的关系n1.信度是效度的必要而非充分条件n n n n ST2n SV2SI2SE2Sx2 下面哪种情况不可能存在?下面哪种情况不可能存在?l高信度,高效度高信度,高效度l高信度,低效度高信度,低效度l低信度,高效度低信度

3、,高效度l低信度,低效度低信度,低效度ST2SX2ST2SX2ST2rxy rxx rxy rxx rxy rxx SX2n2.效度受信度的制约,信度系数规定了效度系数的上限。n根据信度和效度的定义( )可以得到,n n n XTxxSSr22222xvxySSr222xvxySSr22222xIxxxITSSrSSSxxxyrr四、效度验证与效度概化效度验证:收集大量资料和证据来检验效度的工作过程。效度概化:是指在某一种情境中所做的效度研究能否推广到其他情景。效度概化方法-交叉效度评定、元分析交叉效度评定、元分析第二节第二节 效度的估计效度的估计 1974年美国心理学会在年美国心理学会在教育

4、心理测验值标准教育心理测验值标准中将效中将效 度分为三大类:度分为三大类:n 1内容效度(内容效度(Content Validity)n 内容效度指测验实际测到的内容效度指测验实际测到的内容内容与所要测量的与所要测量的内容内容之间的之间的吻合程度。吻合程度。n 2实证效度实证效度(Criterion related Validity)n 实证效度是指一个测验对处于特定情景中的个体的行为进实证效度是指一个测验对处于特定情景中的个体的行为进行估计的有效性行估计的有效性n 3结构效度结构效度(Construct Validity)n 结构效度是指测验对于被称作构想的某一理论概念或特质结构效度是指测验

5、对于被称作构想的某一理论概念或特质测量的程度。测量的程度。一、内容效度(一)含义n 内容效度内容效度是指一个测验实际测到的内容与所要测是指一个测验实际测到的内容与所要测量的内容之间的吻合程度。量的内容之间的吻合程度。 n一个测验要有内容效度必须具备两个条件:n1.1.要有定义得完好的内容范围要有定义得完好的内容范围 n20以内的加减法 n中小学生的心理健康的特点和表现。 n2.2.测验项目应是已界定的内容范围的代表性样本测验项目应是已界定的内容范围的代表性样本 n如果把所有的内容视为一个总体,那么测验项目可以视为一个样本,这个样本要具有代表性,这个样本能够代表总体的程度就是内容效度。内容效度与

6、表面效度的区别内容效度与表面效度的区别n1)表面效度是由)表面效度是由外行外行对测验做表面上的检查确定对测验做表面上的检查确定的,而内容效度是由够资格的判断者(的,而内容效度是由够资格的判断者(专家专家)详尽)详尽地、系统地对测验评价而建立的。地、系统地对测验评价而建立的。n 例如,例如,MMPIMMPI中有这样的题目:中有这样的题目:“我的喉我的喉咙里总好象有一块东西堵着似的。咙里总好象有一块东西堵着似的。”n2)表面效度不是效度的)表面效度不是效度的客观指标,但能对受测者客观指标,但能对受测者的动机产生影响,因而也会影响的动机产生影响,因而也会影响到效度。到效度。n 最高行为测验要求有最高

7、行为测验要求有较高较高的表面效度,典型的表面效度,典型行为测验却要求行为测验却要求较低较低的表面效度。的表面效度。(二)估计方法 1.专家判断法 2.统计法 n复本法 (克龙巴赫法)n再测法 n内容效度比 专家评定法专家评定法n这是一种定性分析的方法,由专家对测验项目与所涉及的内容范围进行符合性判断。n我们以教育测验为例来说明应遵循的程序。n1.1.确定所要测量的全部内容范围。比如要考察某一学确定所要测量的全部内容范围。比如要考察某一学科测验是否有效度,就要根据教材和教学大纲列出这科测验是否有效度,就要根据教材和教学大纲列出这门课程的全部知识点。门课程的全部知识点。n2.2.根据教育目标的要求

8、,将测验目的具体化为不同层根据教育目标的要求,将测验目的具体化为不同层次的测验目标。教育测验目标一般采用布鲁姆教育目次的测验目标。教育测验目标一般采用布鲁姆教育目标分类学中的分类标准,将测验目标分成识记、理解、标分类学中的分类标准,将测验目标分成识记、理解、应用、分析、综合、评价六个层次。按不同层次的测应用、分析、综合、评价六个层次。按不同层次的测验目标对知识点进行分类。验目标对知识点进行分类。n3.确定每一层次目标在整个测验项目中所占的比重。n4.编制测验双向细目表。n5.请专家对双向细目表以及测题是否符合双向细目表的内容要求、测题的形式是否合适等进行评定。n6.对测题进行必要的修改,直至多

9、数专家对测验的内容效度感到满意为止。最后,报告专家评定的情况,这个评定结果可以作为内容效度。n无良好的数量指标描述这种符合性的程度;无良好的数量指标描述这种符合性的程度;n不同专家对同一测验内容效度的判断可能不一不同专家对同一测验内容效度的判断可能不一致;致;n不同专家对内容范围会有不同的理解不同专家对内容范围会有不同的理解 局限局限克伦巴赫法克伦巴赫法n克伦巴赫认为,内容效度可由一组被试在取自同样内容范围的两个测验复本上得分的相关来作数量上的估计。当相关高时,可以推论测验具有较高的内容效度。n缺点:如果相关低,至少一个测验缺乏内容效度,但不能确定哪个测验缺乏内容效度。n如果相关高,也可能两个

10、测验存在相同的偏差,两者效度都不高。n再测法再测法n在教学或训练之前施测某一测验,经过一段时间的学习或训练后再次施测,如果后测的成绩显著高于前测,则可以认为测验能很好地反应学习或训练的效果,测验具有较高的内容效度。前测前测 后测后测n 被试经过预测知识的教学被试经过预测知识的教学n内容效度比n让本专业的专家对取样的代表性进行分析,评价某一测验项目是否具有代表性,统计出专家中认为某一项目能代表所要测量的内容范围的人数,再用公式计算出内容效度之比 n式中CVR表示内容效度比,ni表示专家中认为某项目具有代表性的人数,N表示参加评定的专家的总人数。n根据内容效度比,删除内容效度比低的项目。计算全部项

11、目的内容效度比的平均数,作为内容效度的指标。22NNnCVRi(三)应用和评价n 内容效度适合于测验所要测量的内容总体能够明确界定的情况。因此尤其适合对成就测成就测验验的效度的考察。n 内容效度对各种用于人员选拔和安置的职人员选拔和安置的职业测验业测验也是适用的。职业测验关心的是被试是否具有从事某项职业的知识、技能等,那么要明确某项职业所需的全部知识和技能,再对这些知识和技能进行取样,取出一个有代表性的样本。n 内容效度不不适合用于能力倾向测验和人格能力倾向测验和人格测验测验。n缺点:缺乏理想的数量指标,因而妨碍了信息交流和各测验的相互比较。二、实证效度(效标关联效度)n(一)效标关联效度的含

12、义、种类及作用的含义、种类及作用n 定义:定义:是指一个测验对处于特定情景中的个是指一个测验对处于特定情景中的个体的行为进行估计的有效性。以体的行为进行估计的有效性。以实践的效果实践的效果作为检验标准作为检验标准n被估计的行为是检验测验效度的标准,简称被估计的行为是检验测验效度的标准,简称效标。效标。n 根据效标资料搜集的时间差异,实证效根据效标资料搜集的时间差异,实证效度可以分成度可以分成同时效度同时效度和和预测效度预测效度两种。有人两种。有人把二种效度都称为预测效度,并把测验称作把二种效度都称为预测效度,并把测验称作预测源预测源。n (二)效标(二)效标n 效标效标就是衡量一个测验是否有效

13、的外在就是衡量一个测验是否有效的外在标准,它是标准,它是独立于测验独立于测验并可以从并可以从实践实践中直接中直接获得的我们所感兴趣的行为。获得的我们所感兴趣的行为。n如,我们可以用飞行员的工作表现作为验证如,我们可以用飞行员的工作表现作为验证飞行员选拔测验的效标飞行员选拔测验的效标n用于心理病理测量的人格量表可以用医生的用于心理病理测量的人格量表可以用医生的临床诊断结果作为效标临床诊断结果作为效标效标污染n 效标污染效标污染是指由于评定者知道是指由于评定者知道被试测验的原分数而使被试的效标被试测验的原分数而使被试的效标分数受到影响的情况。分数受到影响的情况。n 最好的预防方法是不让评分者看到原

14、来测验的分数,保证效标分数和原测验分数的独立性。观念效标与效标测量观念效标与效标测量l阿斯丁把效标分为两个层次:一是理论描阿斯丁把效标分为两个层次:一是理论描述水平的述水平的“观念效标观念效标”,二是操作定义水,二是操作定义水平的平的“效标测量效标测量”。理论定义与操作定义。理论定义与操作定义。l所谓观念效标所谓观念效标指从概念上确定所要选择指从概念上确定所要选择的测验效标是什么。的测验效标是什么。 。l常用的观念效标有:实际工作表现、学业常用的观念效标有:实际工作表现、学业成就、临床诊断、行为的等级评定、专门成就、临床诊断、行为的等级评定、专门的训练成绩、对团体的区分能力以及其他的训练成绩、

15、对团体的区分能力以及其他现成的有效测验,等等。现成的有效测验,等等。 l效标测量,指将观念效标进行量化操作。一种效标测量,指将观念效标进行量化操作。一种观念效标可以有多种不同的效标测量。观念效标可以有多种不同的效标测量。l如实际工作表现的效标测量可以采用的数量指如实际工作表现的效标测量可以采用的数量指标有:产品数量和质量、销售额、收入、职位、标有:产品数量和质量、销售额、收入、职位、薪水提高的幅度、领导评定、同事评定等等。薪水提高的幅度、领导评定、同事评定等等。l又如,学业成就的效标测量可以采用的数量指又如,学业成就的效标测量可以采用的数量指标:单元考试成绩、期中期末的考试成绩、老标:单元考试

16、成绩、期中期末的考试成绩、老师评价、同伴评定、获奖情况、发表作品情况师评价、同伴评定、获奖情况、发表作品情况等等。等等。n好的效标测量应符合以下几个条件:好的效标测量应符合以下几个条件:(1 1)有效性有效性n效标测量与观念效标必须是高度一致的。效标测量与观念效标必须是高度一致的。 (2 2)可靠性可靠性n效标测量必须正确可靠。也就是说要具有较高的信效标测量必须正确可靠。也就是说要具有较高的信度。度。 (3 3)客观性客观性n效标测量必须客观,避免偏见。如,当效标测量是效标测量必须客观,避免偏见。如,当效标测量是主观评定时,一定要尽量避免主观偏见。主观评定时,一定要尽量避免主观偏见。(4 4)

17、实用性实用性n在保证有效性的前提下,效标测量必须尽可能简单、在保证有效性的前提下,效标测量必须尽可能简单、省时、花费少。省时、花费少。(三)实证效度的确定(三)实证效度的确定步骤步骤:n明确观念效标;明确观念效标;n确定效标测量;确定效标测量;n考查测验分数与效标测量的关系。考查测验分数与效标测量的关系。(四)确定方法(四)确定方法 一般可以通过统计分析得到一个数量指标,因此有人一般可以通过统计分析得到一个数量指标,因此有人将它称为统计效度。将它称为统计效度。n常用的估计方法有相关法、区分法、命中率法等。常用的估计方法有相关法、区分法、命中率法等。1.相关法相关法 最常用最常用的计算效标关联效

18、度的方法,测验分数与效的计算效标关联效度的方法,测验分数与效标间的相关系数称为效度系数。标间的相关系数称为效度系数。测验分数与效标分数的测验分数与效标分数的数据性质不同,计算相关系数的方法不同数据性质不同,计算相关系数的方法不同。 n n 如:如:假设有假设有1010名男性经职业兴趣测验而被名男性经职业兴趣测验而被选定作为推销员,其测验分数下表第一行,选定作为推销员,其测验分数下表第一行,而第二行是经过若干年后他们某段时间内销而第二行是经过若干年后他们某段时间内销售金额总量售金额总量( (以万元为单位以万元为单位) )。现问该测验的。现问该测验的效度如何效度如何? ? 如,对某个群体进行心理病

19、理方面的人格 测验,以是否患精神疾病为效标。n如,对初中生进行学习能力测验,以是否考上重点中学为效标。总结:总结:n 相关系数的平方相关系数的平方表示一个变量的变异数由表示一个变量的变异数由另一个变量的变异数决定的百分比(另一个变量的变异数决定的百分比(决定系决定系数数)。因此,当)。因此,当r rxyxy= 0= 05050时,我们可以说效时,我们可以说效标分数中有标分数中有2525(0(050502 2=0=025)25)的变异数是来的变异数是来自预测源分数的变异,或者说有自预测源分数的变异,或者说有2525的变异数的变异数为两个测量所共同拥有。假如效标中有一半的为两个测量所共同拥有。假如

20、效标中有一半的变异数能由预测源分数的变异来解释,则效度变异数能由预测源分数的变异来解释,则效度系数必须为系数必须为n0 07171。以相关法求效度的优点是:以相关法求效度的优点是:n(1)(1)提供了一个统计指标以总结预测源与效标间的提供了一个统计指标以总结预测源与效标间的关系;关系;n(2)(2)可利用回归方程式来预测每个人的期望效标成可利用回归方程式来预测每个人的期望效标成绩;绩;n(3)(3)效度系数(相关系数)为大家广泛使用,便于效度系数(相关系数)为大家广泛使用,便于比较研究。比较研究。2 2、区分法、区分法n 看预测源的分数是否可区分由效标测量所定义的看预测源的分数是否可区分由效标

21、测量所定义的团体。团体。n 例:例:某工厂通过测验录用了一批工人,过一段时某工厂通过测验录用了一批工人,过一段时间后,根据工作成绩(如产品的数量、质量)将他们间后,根据工作成绩(如产品的数量、质量)将他们分成成功的和失败的两组,然后回过头来检查他们的分成成功的和失败的两组,然后回过头来检查他们的测验分数。测验分数。n 假如:成功组有假如:成功组有6060人,失败组有人,失败组有4040人;成功组的人;成功组的平均数为平均数为6.056.05,标准差为,标准差为2.022.02;失败组的平均数为;失败组的平均数为4.254.25,标准差为,标准差为1.31.3。3命中率法命中率法n含义:含义:依

22、据测验分数对被试作出的分类与根据依据测验分数对被试作出的分类与根据被试的实际工作表现所做出的分类的一致性程被试的实际工作表现所做出的分类的一致性程度。(度。(取舍正确率取舍正确率)n用途用途n人才选拔人才选拔n方法方法n正确决策的结果正确决策的结果 n正确接受正确接受n正确拒绝正确拒绝 预测源与效预测源与效标都是二分标都是二分的的总命中率总命中率关心录取者中合格的人数与淘汰者中不关心录取者中合格的人数与淘汰者中不合格的人数的比率。合格的人数的比率。正命中率正命中率只关心录取者中有多少合格的人,不关只关心录取者中有多少合格的人,不关心淘汰者是否有合格的人。心淘汰者是否有合格的人。n以取舍正确性作

23、为测验效度的指标,以取舍正确性作为测验效度的指标,主要优点主要优点:与实际生活联系更紧;与实际生活联系更紧;计算方法简单并容易为一般人所理解。计算方法简单并容易为一般人所理解。缺点:缺点:它对分数刚刚低于临界分数的人不公平。它对分数刚刚低于临界分数的人不公平。三、构想效度三、构想效度(一)含义 n 构想效度(construct validity),又称构念效度、结构效度。构想:心理学理论中所构想:心理学理论中所涉及到的抽象而假设性的概念或特质涉及到的抽象而假设性的概念或特质,如智力、焦虑等,它们往往用某种操作定义来定义、可以用测验来测量。n 构想效度是指一个测验实际测到所要测量构想效度是指一个

24、测验实际测到所要测量的理论结构和特质的程度,或者说测验分数能的理论结构和特质的程度,或者说测验分数能够说明某一理论概念或特质的程度。够说明某一理论概念或特质的程度。(二)验证构想效度的方法(二)验证构想效度的方法 假设我们要检验一个假设我们要检验一个智力智力测验的结构效度测验的结构效度1、寻找测验依据的理论定义。、寻找测验依据的理论定义。n 智力代表了一个人获得、保持知识的能力,推智力代表了一个人获得、保持知识的能力,推理能力,及适应环境的能力。理能力,及适应环境的能力。2、根据理论定义提出假设。根据理论定义提出假设。n 智力不同于后天获得的知识,因此与遗传因素智力不同于后天获得的知识,因此与

25、遗传因素有关,切更为稳定;智力会随着人的生理变化而发有关,切更为稳定;智力会随着人的生理变化而发展变化;智力会影响人的学习成绩和事业成功。展变化;智力会影响人的学习成绩和事业成功。3、搜集资料,验证假设。搜集资料,验证假设。 计算同卵双生子、异卵双生子、其他同胞、非计算同卵双生子、异卵双生子、其他同胞、非同胞间的智商的相关,看相关系数是否依次降低;同胞间的智商的相关,看相关系数是否依次降低; 看智商与学业成绩间是否有高相关;看智商与学业成绩间是否有高相关; 智力是否随着年龄的增长而逐渐提高,在某一智力是否随着年龄的增长而逐渐提高,在某一阶段又是相对稳定的。阶段又是相对稳定的。(三)估计方法(三

26、)估计方法n1.测验内方法 n 内容效度 n分析被试解答测题时的反应过程 n 测验的同质性内部一致性系数 n2.测验间方法 n相容效度(congruent validity) n区分效度(discriminant validity)n因素分析(factorial validity) n3.效标关联法 n4.多种特质多种方法矩阵法1 1、测验内部寻找证据法、测验内部寻找证据法n(1)确定)确定内容效度内容效度作为结构效度的证据作为结构效度的证据 n(2)分析被试的答题过程)分析被试的答题过程n 例如,例如,人格测验中有这样一个题目:人格测验中有这样一个题目:“我喜欢在别我喜欢在别人面前说另一个人

27、的缺点。人面前说另一个人的缺点。”一个被试回答一个被试回答“否否”,问他,问他是怎么考虑的,他说:是怎么考虑的,他说:“一个人如果喜欢在别人面前说另一个人如果喜欢在别人面前说另一个人的缺点,那他就是个小人。一个人的缺点,那他就是个小人。”n(3)考察测验的同质性)考察测验的同质性2 2、测验之间寻找证据法、测验之间寻找证据法(1)相容效度)相容效度(2)区分效度区分效度(3)因素分析因素分析 此方法特点是同此方法特点是同时考虑几个测验间的时考虑几个测验间的相互关联,考察这些相互关联,考察这些测验是否在测量同一测验是否在测量同一心理结构。心理结构。相容效度相容效度求一个新编测验与某个已知的能有效

28、测量相同求一个新编测验与某个已知的能有效测量相同特质的旧测验间的相关。特质的旧测验间的相关。n斯坦福比奈量表、韦氏智力测验是世人公认有效的智力测验,后人编的智力测验大多与此量表作比较,如果相关高,便说明新编测验有效。n区分效度区分效度(discriminant validity)n 一个有效的测验不仅应与其他测同一构想的测验有关,而且还必须与测量不同构想的测验无关。用此种方法确定的效度称区分效度。n低相关?n高相关? 因素分析因素分析n 19041904年,英国心理学家斯皮尔曼发表专题论文年,英国心理学家斯皮尔曼发表专题论文客观决定和测量一般智力客观决定和测量一般智力,用因素分析的技术研,用因

29、素分析的技术研究智力结构,并提出智力的二因素论,这也标志着因究智力结构,并提出智力的二因素论,这也标志着因素分析方法的诞生。素分析方法的诞生。n 运用这一方法心理学家们先后提出了多种智力理运用这一方法心理学家们先后提出了多种智力理论。如:桑代克的多因素论,瑟斯顿群因素论和吉尔论。如:桑代克的多因素论,瑟斯顿群因素论和吉尔福特智力理论等等。福特智力理论等等。n 将为数众多的观测变量缩减为少数将为数众多的观测变量缩减为少数“潜变量潜变量”(又称因素),用最少的因(又称因素),用最少的因素概括和解释大量的观测数据,从而达素概括和解释大量的观测数据,从而达到简化观测数据、建立简单结构的目的。到简化观测

30、数据、建立简单结构的目的。n观测变量与因素间的相关,即变量在因观测变量与因素间的相关,即变量在因素上的贡献量(负荷),称为因素效度。素上的贡献量(负荷),称为因素效度。表 因素的特征值、方差贡献率及累计方差贡献率 碎石图29272523211917151311975311086420注意:做因素分析的要求高萨奇(1983年):施测的样本量与测验的变量数目比例不小于5:1, 1025倍最好,510令人满意。总样本量不少于100.3.效标关联法n 测验分数与效标行为的一致性有助于证明测验确实测量了某种构想。n 根据效标选取不同的被试,组成对照组,然后比较两组被试的测验成绩,看测验分数能否将它们区分

31、开来。n如,两组被试,神经症被试和正常人n情绪顺应测验4.多种特质多种方法矩阵法n坎贝尔和费司克(坎贝尔和费司克(1959)n实质上是相容效度法和区分效度法的综合运用n原理是若用多种极不相同的方法测量同一种特质相关很高,则说明测量效度较高(相容效度即属此类)。(四)应用和评价1.构想效度的主要缺点是:n有些构想概念模糊,缺乏一致的定义。2.其贡献在于把着眼点放在其贡献在于把着眼点放在提出假设、检验假设提出假设、检验假设上,因此使心理测验不再只是作实际决定的辅助工具,上,因此使心理测验不再只是作实际决定的辅助工具,同时还成为发展心理学理论的重要工具,从而使测验同时还成为发展心理学理论的重要工具,

32、从而使测验有了更广阔的发展前景。有了更广阔的发展前景。3.应用 主要用于智力测验、人格测验等四、三种效度的比较 第三节 提高效度的方法n一、影响测验效度的因素n(一)测验的构成n测验的长度会影响测验的信度,同时也会影响测验的效度。测验长度与效度的关系可以用下式表示:n n式中是 测验增长为原来的n倍的效度系数,n为倍数, 为原测验效度系数, 为原测验信度。 xxxxxyynxnrrnnrr1ynxrxyrxxrn例:一测验的信度系数为0.50,效度系数为0.40,现将测验的长度应增长为原来的倍,问新测验的效度应为多少?(二)测验的实施过程(三)被试 (四)效标因素 1.1.效标测量的可靠性效标

33、测量的可靠性 效标分数往往存在稳定性的问题,即在不同时间和效标分数往往存在稳定性的问题,即在不同时间和 情境中测量,同一个人的效标分数会有相当大的波动。情境中测量,同一个人的效标分数会有相当大的波动。 2.2.效标和测验分数的关系类型效标和测验分数的关系类型(五)信度(五)信度(六)干涉变量(六)干涉变量n二、提高效度的方法 n精心编制测验n妥善组织测验n创设优质的应试情境n选好正确的校标三、效度系数的解释三、效度系数的解释 1.效度系数的大小效度系数的大小n智力测验分数与教师对学生的等级评定之间的智力测验分数与教师对学生的等级评定之间的效度系数一般在效度系数一般在0.300.300.500.

34、50的范围内。的范围内。n相同科目的标准测验成绩与教师对学生名次的相同科目的标准测验成绩与教师对学生名次的排列之间的相关系数一般应达到排列之间的相关系数一般应达到0.600.600.700.70之之间间,这是因为在测验的内容方面,标准测验常,这是因为在测验的内容方面,标准测验常与教师评价基本一致,所以相关较高。与教师评价基本一致,所以相关较高。n两种不同的智力测验或标准测验之间的相关系两种不同的智力测验或标准测验之间的相关系数应达到数应达到0.600.600.800.80,才能认为符合要求。,才能认为符合要求。n2.对效度系数随时间而产生的变化进行解释时应当心n一、单选题一、单选题n1计算两种

35、测验之间得分的相关,其中一种测验是待研究效度的,另计算两种测验之间得分的相关,其中一种测验是待研究效度的,另一种是已有效度证据的成熟的测验,但两者测量的是同一种心理特质,一种是已有效度证据的成熟的测验,但两者测量的是同一种心理特质,假如相关高,说明新测验所测量的特质确实是老测验所反映的特质或假如相关高,说明新测验所测量的特质确实是老测验所反映的特质或行为。这种方法叫(行为。这种方法叫( )。)。n A区分效度区分效度 B逻辑效度逻辑效度n C相容效度相容效度 D构想效度构想效度n n2在心理测验中,效度是指一个心理测验的(在心理测验中,效度是指一个心理测验的( )。n A稳定性稳定性 B准确性

36、准确性 C可信度可信度 D区分性区分性n3效度系数的实际意义常常以决定系数来表示,如测验的效度系数是效度系数的实际意义常常以决定系数来表示,如测验的效度系数是 0.80,则测验可以正确预测或解释的效标的方差可占效标总方差的,则测验可以正确预测或解释的效标的方差可占效标总方差的( )。)。n A36% B46% C56% D64%n4如果研究表明,高考分数与大学学习成绩有高度的正相关,这表明,如果研究表明,高考分数与大学学习成绩有高度的正相关,这表明,对于大学学习而言,高考分数有较高的(对于大学学习而言,高考分数有较高的( )。)。n A表面效度表面效度 B区分度区分度 C构想效度构想效度 D预

37、测效度预测效度n 5如果一个测验在测验使用者、测验人员和受试者看来是有效的,如果一个测验在测验使用者、测验人员和受试者看来是有效的,那么,此测验具有较高的(那么,此测验具有较高的( )。)。n A表面效度表面效度 B内容效度内容效度n C构想效度构想效度 D效标关联效度效标关联效度6一所全国重点高中某年级有一所全国重点高中某年级有 500 名最有才华的学生,当他们毕名最有才华的学生,当他们毕业时,有研究发现他们的高考成绩与在校时各门功课总平均成绩业时,有研究发现他们的高考成绩与在校时各门功课总平均成绩的相关只的相关只 0.15,解释这个相关的最好理由是(,解释这个相关的最好理由是( )。)。

38、A预测源的全距限制(这个样本的高考分数都很高)预测源的全距限制(这个样本的高考分数都很高) B预测源的信度低(高考是不可靠的,削弱了相关)预测源的信度低(高考是不可靠的,削弱了相关) C抽样误差变异(实际得到的相关低只是一种偶然性)抽样误差变异(实际得到的相关低只是一种偶然性)nD平时考试的信度低平时考试的信度低n 7从信度和效度的关系看,信度高是效度高的(从信度和效度的关系看,信度高是效度高的( )。)。n A充分条件充分条件 B必要条件必要条件 n C既非充分与非必要条件既非充分与非必要条件 D充要条件充要条件n 8在测验理论中,效度被定义为一组测量中,与测量目在测验理论中,效度被定义为一组测量中,与测量目标有关的真实方差(或称有效方差)与什么方差之比标有关的真实方差(或称有效方差)与什么方差之比( )。)。n A误差误差 B系统误差系统误差n C随机误差随机误差 D观察分数观察分数10检验测验分数能否有效地区分由效标所定义的团体检验测验分数能否有效地区分由效标所定义的团体的一种方法是(的一种方法是( )。)。n A相关法相关法B区分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论