心理咨询测验的信度_第1页
心理咨询测验的信度_第2页
心理咨询测验的信度_第3页
心理咨询测验的信度_第4页
心理咨询测验的信度_第5页
已阅读5页,还剩107页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 测验的信度 第三节 陈 蕾 信 度 p 信度的概念信度的概念 p 信度评估的方法信度评估的方法 p 信度与测验分数的解释信度与测验分数的解释 p 影响信度的因素影响信度的因素 p 信度的特殊问题信度的特殊问题 第一单元 信度的概念 v 信度:指测量结果的一致性程度。 v 信度:指同一被试者在不同时间内用同一测验(或用另 一套相等的测验)重复测量,所得结果的一致性程度。 v 误差:在测量中与目的无关的变因所产生的不准确或不 一致的效应; 随机误差:产生的效应是随机的; 系统误差:产生的效应是恒定的; 第一单元 信度的概念 v 信度只受随机误差的影响。 x = t + e 测量实际 所得分数 测

2、量中不存在随机 误差时的分数 误差分数 第一单元 信度的概念 sss etx 222 集中趋势的度量:平均数 7 7 8 8 8 9 9 4 5 7 8 9 11 12 1 4 7 8 9 12 15 x 离中趋势的度量:方差、标准差 n xx s i 2 )( n xx s i 2 2 )( 第一单元 信度的概念 sss etx 222 s s s s r x e x t xx2 2 2 2 1 信度的定义: 第一单元 信度的概念 s s s s r x e x t xx2 2 2 2 1 信度系数 s s r x t xt 信度指数 信度指数的平方就是信度系数。 信 度 p 信度的概念信度

3、的概念 p 信度的评估方法信度的评估方法 p 信度与测验分数的解释信度与测验分数的解释 p 影响信度的因素影响信度的因素 p 信度的特殊问题信度的特殊问题 第二单元 信度评估的方法 v 重测信度(稳定性系数)重测信度(稳定性系数) 使用同一测验,在同样条件下对同一组被试者前后施两次, 求两次得分间的相关系数。 测验再测验 一段时距 时距:两到四周,最好不超过六个月; 第二单元 信度评估的方法 v 复本信度(等值性系数)复本信度(等值性系数) 以两个等值但题目不同的测验来测量同一群体,然后求得 被试者在两个测验上得分的相关系数。 测验a测验b 最短时距 v 重测复本信度(稳定与等值性系数)重测复

4、本信度(稳定与等值性系数) 测验a 一段时距 测验b 第二单元 信度评估的方法 v 内部一致性信度内部一致性信度 反映的是题目之间的关系,表示测验能够测量相同内容或 特质的程度。 分半信度分半信度 反映了两半测验(奇偶)内容取样的一致性程度。 r r r hh hh xx 1 2 同质性信度同质性信度 反映了测验内部所有项目间的一致性程度。 第二单元 信度评估的方法 v 评分者信度评分者信度 由两位评分者按评分标准分别给分,然后再根据每份测验 卷的两个分数计算相关。 一般要求在成对的受过训练的评分者之间平均一般要求在成对的受过训练的评分者之间平均 一致性达到一致性达到0.90以上,才认为评分是

5、客观的。以上,才认为评分是客观的。 信度系数类型信度系数类型 评估内容评估内容 误差来源误差来源 重测信度重测信度 (稳定性系数)(稳定性系数) 测验跨时间的一致性测验跨时间的一致性 时间取样时间取样 复本信度复本信度 (等值性系数)(等值性系数) 测验跨形式的一致性测验跨形式的一致性 内容取样内容取样 重测复本信度重测复本信度 (稳定与等值系数)(稳定与等值系数) 测验跨时间和形式的一测验跨时间和形式的一 致性致性 时间与内容取样时间与内容取样 分半信度分半信度 两半测验的一致性两半测验的一致性 内容取样内容取样 内部一致内部一致 性信度性信度 同质性信度同质性信度 测验跨项目的一致性测验跨

6、项目的一致性 题目是否同质题目是否同质 评分者信度评分者信度 测验跨评分者的一致性测验跨评分者的一致性 评分者间的差异评分者间的差异 v不同的信度反映了测量误差的不同来源。 信 度 p 信度的概念信度的概念 p 信度评估的方法信度评估的方法 p 信度与测验分数的解释信度与测验分数的解释 p 影响信度的因素影响信度的因素 p 信度的特殊问题信度的特殊问题 第三单元 信度与测验分数的解释 v 解释真分数造成的变异的比例 v 确定信度可接受的水平 70. 0 xx r 测验不能用于对个人做评价和预测, 也不能用于团体间比较; 85. 07 . 0 xx r可以用于团体间比较; 85. 0 xx r

7、可以用来对个人做出评价和预测; 信 度 p 信度的概念信度的概念 p 信度评估的方法信度评估的方法 p 信度与测验分数的解释信度与测验分数的解释 p 影响信度的因素影响信度的因素 p 信度的特殊问题信度的特殊问题 第四单元 影响信度的因素 样本团体的异质性 样本团体的平均能力水平 v 样本特征 获得信度的取样团体较为异质,会高估测验的信度,相 反则会低估测验的信度。 第四单元 影响信度的因素 测验越长,题目的取样或内容取样就越有代表性; 测验越长,被试猜测因素的影响越小; 增加测验长度的效果应遵循报酬递减规律; v 测验的长度 )1 ( )1 ( kkxx xxkk rr rr k 一个包括一

8、个包括4040个题目的测验信度为个题目的测验信度为0.800.80,欲将,欲将 信度提高到信度提高到0.900.90,通过斯皮尔曼布朗公式,通过斯皮尔曼布朗公式 的导出公式计算出至少应增加()个题数。的导出公式计算出至少应增加()个题数。 (a a)4040 (b b)6060 (c c)100 100 (d d)5050 第四单元 影响信度的因素 v时间间隔 v 测验难度 五择一题,0.70;四择一题,0.74;三择一题,0.77;是 非题,0.85。 以再测法或复本法求信度,两次测验间隔时间越短,其 信度系数越大;间隔时间越长,信度系数越小。 信 度 p 信度的概念信度的概念 p 信度评估

9、的方法信度评估的方法 p 信度与测验分数的解释信度与测验分数的解释 p 影响信度的因素影响信度的因素 p 信度的特殊问题信度的特殊问题 第五单元 信度的特殊问题 v分测验的信度 v 速度测验的信度 对答题速度的一致性作出估计; 分测验的分数几乎肯定不如合成分数可靠。 在测量理论中,信度被定义为:一组测量分在测量理论中,信度被定义为:一组测量分 数的真分数方差与总方差的比率,即()。数的真分数方差与总方差的比率,即()。 (a a) (b b) (c c) (d d)k kn/nn/n x = t + e sss etx 222 s s s s r x e x t xx2 2 2 2 1 信度只

10、受()的影响。信度只受()的影响。 (a a)系统误差)系统误差 (b b)随机误差)随机误差 (c c)恒定效应)恒定效应 (d d)概化理论)概化理论 用重测法估计信度,最适应的时距随测验的用重测法估计信度,最适应的时距随测验的 目的、性质和被试者的特点而异,一般是以目的、性质和被试者的特点而异,一般是以 ()周较宜,间隔时间最好不超过()个月。()周较宜,间隔时间最好不超过()个月。 (a a)1 12 2;4 4 (b b)2 24 4;6 6 (c c)4 46 6;8 8 (d d)6 68 8;1010 复本信度又称等值性系数。它是以两个等值复本信度又称等值性系数。它是以两个等值

11、 但题目不同的测验来测量同一群体,然后求但题目不同的测验来测量同一群体,然后求 得被试在两个测验上得分的相关系数。复本得被试在两个测验上得分的相关系数。复本 信度反应的是测验在()上的等值性。信度反应的是测验在()上的等值性。 (a a)时间)时间 (b b)题目)题目 (c c)评分)评分 (d d)内容)内容 分半信度代表了(分半信度代表了( )内容取样的一致程度。)内容取样的一致程度。 (a a)原测验)原测验 (b b)所有条目之间)所有条目之间 (c c)题目与分测验之间)题目与分测验之间 (d d)两半测验)两半测验 斯皮尔曼布朗公式斯皮尔曼布朗公式 中中 为为 ()的相关系数,(

12、)的相关系数, 为测验在原长度时的为测验在原长度时的 相关系数。相关系数。 (a a)全测验)全测验 (b b)原测验)原测验 (c c)一半分数)一半分数 (d d)全部分数)全部分数 r r r hh hh xx 1 2 hh r xx r 同质性信度代表测验内部(同质性信度代表测验内部( )间的一致性。)间的一致性。 (a a)两半测验)两半测验 (b b)所有题目)所有题目 (c c)题目与分测验)题目与分测验 (d d)分测验)分测验 一般要求在成对的受过训练的评分者之间一一般要求在成对的受过训练的评分者之间一 致性达到(致性达到( )以上,才认为评分是客观的。)以上,才认为评分是客

13、观的。 (a a)0.700.70 (b b)0.800.80 (c c)0.900.90 (d d)1.001.00 确定可以接受的信度水平的一般原则是,当确定可以接受的信度水平的一般原则是,当 ()时,测验不能用于对个人做出评价或预()时,测验不能用于对个人做出评价或预 测,而且不能做团体比较。测,而且不能做团体比较。 (a a) (b b) (c c) (d d) 70. 0 xx r 85.07.0 xx r 85.0 xx r 00.1 xx r 一般而言,若获得信度的取样团体较为异质一般而言,若获得信度的取样团体较为异质 的话,往往会()测验的信度。的话,往往会()测验的信度。 (

14、a a)高估)高估 (b b)低估)低估 (c c)忽略)忽略 (d d)不清楚)不清楚 对于不同平均能力水平的团体,题目的()对于不同平均能力水平的团体,题目的() 会影响测验的信度。会影响测验的信度。 (a a)难度)难度 (b b)区分度)区分度 (c c)信度)信度 (d d)效度)效度 洛德提出在学绩测验中,为了保证其可靠性,洛德提出在学绩测验中,为了保证其可靠性, 各类选择题德理想平均难度为:各类选择题德理想平均难度为:五择一题,五择一题, 0.70;四择一题,;四择一题,0.74;三择一题,;三择一题,0.77;二;二 择一题,()。择一题,()。 (a a)0.780.78 (

15、b b)0.790.79 (c c)0.850.85 (d d)0.900.90 以再测法或复本法求信度,两次测验相隔时以再测法或复本法求信度,两次测验相隔时 间越短,其信度系数越间越短,其信度系数越()。()。 (a a)大)大 (b b)低)低 (c c)小)小 (d d)不变)不变 估计信度的方法一般有估计信度的方法一般有()。()。 (a a)重测信度)重测信度 (b b)复本信度)复本信度 (c c)内部一致性信度)内部一致性信度 (d d)评分者信度)评分者信度 使用同一测验,在同样条件下对同一组被试使用同一测验,在同样条件下对同一组被试 前后施测两次测验,求两次得分间的相关系前后

16、施测两次测验,求两次得分间的相关系 数,叫数,叫(),又称()。(),又称()。 (a a)复本信度)复本信度 (b b)重测信度)重测信度 (c c)稳定性系数)稳定性系数 (d d)分半信度)分半信度 如果复本信度考虑到两个复本实施的时间间如果复本信度考虑到两个复本实施的时间间 隔,并且两个复本的施测相隔一段时间,则隔,并且两个复本的施测相隔一段时间,则 称()称()。 (a a)重测复本信)重测复本信度度 (b b)重测信)重测信度度 (c c)复本信度)复本信度 (d d)稳定与等值系数)稳定与等值系数 复本信度的缺点有()复本信度的缺点有()。 (a a)如果测量的行为易受练习的影响

17、,则复本信度)如果测量的行为易受练习的影响,则复本信度 只能减少而不能完全消除这种影响只能减少而不能完全消除这种影响 (b b)由于第二个测验只改变了题目的内容,已经掌)由于第二个测验只改变了题目的内容,已经掌 握的解题原则可以很容易地迁移到同类问题握的解题原则可以很容易地迁移到同类问题 (c c)能够避免重测信度的一些问题,如记忆效果、)能够避免重测信度的一些问题,如记忆效果、 学习效应等学习效应等 (d d)对许多测验来说建立复本是困难)对许多测验来说建立复本是困难的的 下列描述正确的是()下列描述正确的是()。 (a a)随机抽取若干份问卷,由两位评分者按评分标)随机抽取若干份问卷,由两

18、位评分者按评分标 准给分,然后再根据每份测验卷的两个分数计算相准给分,然后再根据每份测验卷的两个分数计算相 关,即得评分者信度关,即得评分者信度 (b b)所有题目看起来好像测量同一特质,但相关很)所有题目看起来好像测量同一特质,但相关很 低或成为负相关时,则测验为异质的低或成为负相关时,则测验为异质的 (c c)人的多数心理特征如智力、性格、兴趣等,具)人的多数心理特征如智力、性格、兴趣等,具 有相对稳定性,间隔一段时间,不会有太大变化有相对稳定性,间隔一段时间,不会有太大变化 (d d)不同的信度反映了误差的不同来源)不同的信度反映了误差的不同来源 为信度系数。下列()情况属于极端情为信度

19、系数。下列()情况属于极端情 况况。 (a a) (b b) (c c) (d d) xx r 90. 0 xx r 80. 0 xx r 00. 1 xx r 0 xx r 一般来说,在一个测验中增加同质的题目,一般来说,在一个测验中增加同质的题目, 可以使信度提高可以使信度提高。下列描述正确的是()。下列描述正确的是()。 (a a)测验越长,测验的测题取样或内容取样越有代)测验越长,测验的测题取样或内容取样越有代 表性表性 (b b)测验越长,被试者受猜测因素的影响越小)测验越长,被试者受猜测因素的影响越小 (c c)测验越长,越遵循报酬递增原则)测验越长,越遵循报酬递增原则 (d d)

20、测验太长,有时反而会引起被试者的疲劳和反)测验太长,有时反而会引起被试者的疲劳和反 感而降低可靠性感而降低可靠性 测验的效度 第四节 陈 蕾 第一单元 效度的概念 低信度、低效度 高信度、低效度 高信度、高效度 效 度 p 效度的概念效度的概念 p 效度评估的方法效度评估的方法 p 影响效度的因素影响效度的因素 第一单元 效度的概念 1、测验测量到它所要测量的东西了吗? 2、测验对它所测量的东西测量到什么程度? v 效度:对一个测验对其所要测量的特性测量到什 么程度的估计。 v 效度:指所测量的与所要测量的心理特点之间的 符合程度,也就是指一个测验的准确性。 第一单元 效度的概念 sss et

21、x 222 222 ivt sss 2222 eivx ssss 第一单元 效度的概念 2222 eivx ssss 总方差总方差 与测量目的有与测量目的有 关的真实方差关的真实方差 无关而稳定无关而稳定 的方差的方差 无关而不稳无关而不稳 定的方差定的方差 第一单元 效度的概念 v效度:在一组测量中,与测量目的有关的真实方差 (或有效方差)与总方差的比率。 2 2 2 x v xy s s r xy r 效度系数 效度既受随机误差的影响,也受系统误差的影响。效度既受随机误差的影响,也受系统误差的影响。 sx2 sv2 si2 se2 st2 第一单元 效度的概念 v效度与信度的关系 信度是效

22、度的必要非充分条件 效度受信度的制约 第一单元 效度的概念 v 效度的性质: 效度是针对测验结果的 效度具有连续性 效度具有相对性 评鉴测验的效度时,必须考虑其目的与功能。 效 度 p 效度的概念效度的概念 p 效度评估的方法效度评估的方法 p 影响效度的因素影响效度的因素 第二单元 效度评估的方法 v 内容效度 v 评估方法 是指测验题目对有关内容或行为取样的适应性,从而确定 测验是否是所欲测量的行为领域的代表性样本。 (逻辑效度) 专家判断法 统计分析法 评分者一致性 复本法 再测法 经验推测法 第二单元 效度评估的方法 v 内容效度的特性: v 表面效度: 受内容范围的定义的影响。 由外

23、行对测验作表面上的检查确定的。 判断者 题目与测量目的的关系 测验 内容效度 专家 有逻辑的微妙关系 所有测验都要求较 高的内容效度 最高行为测验要求 较高的表面效度 表面效度 外行 明显直接的关系 典型行为测验要求 较低的表面效度 第二单元 效度评估的方法 v 效标效度 反映的是测验预测个体在某种情境下行为表现的有效性程度。 被预测的行为是检验效度的标准,简称效标效标。 (实证效度) 测验分数与效 标资料的获得 逻辑差异 作用 同时效度 同时 与诊断现状的测验有 关 以测验来取代效标 预测效度 间隔一段时间 与预测未来结果的测 验有关 以测验来预测效标 第二单元 效度评估的方法 v 效标的必

24、备条件 效标必须能真正反应测验的目的; 效标必须有较高的信度,稳定可靠; 效标可以客观地加以测量; 效标测量的方法简单,省时省力,经济实用; 第二单元 效度评估的方法 v 效标效度的评估方法 相关法 区分法 命中率法 积差相关 点二列相关 贾斯朋多系列相关 二列相关 当测验用来 做取舍依据时,用其正确决定 的比列作为效度指标的一种方法; v 命中率法 dcba cb p ct 失误命中 命中 )总命中率( ba b p cp 测验成功的人 测验与效标皆成功的人 )正命中率( 效标成绩 测验预测 失败() 成功() 成功() (a)失误 (b)命中 失败() (c)命中 (d)失误 临界临界 分

25、数分数 合格标准合格标准 第二单元 效度评估的方法 v 构想效度(构思效度、结构效度) 构想效度就是测验对某一理论构想或特质测量的程度。 涉及心理学的理论概念问题; 测验能够测量到理论上构想或特质的程度; 测验结果能否正是或解释某一理论的构想,解释的程度 如何; 第二单元 效度评估的方法 v构想效度的评估方法 对测验本身的分析(测验内方法) 内容效度 内部一致性指标(内部一致性信度) 被试对题目的反应特点 测验间相互比较(测验间方法) 相容效度 区分效度 因素分析法 第二单元 效度评估的方法 v构想效度的评估方法 效标效度的研究证明 效标 心理特质的发展变化 实验法和观察法证实 效 度 p 效

26、度的概念效度的概念 p 效度评估的方法效度评估的方法 p 影响效度的因素影响效度的因素 第三单元 影响效度的因素 v测验本身的因素 测验材料必须对整个内容有代表性; 测题设计时应尽量避免引起误差的题型; 测题的难度要适中,就有较高的区分度; 测题的长度要适当,即要有一定的测题量; 测题的排列按先易后难的顺序; v测验实施中的干扰因素 主试的影响因素 被试的影响因素 第三单元 影响效度的因素 v样本团体的性质 样本团体的异质性 样本团体越同质,分数分布的范围越小,测验的效度就 越低;样本团体越异质,分数分布的范围越大,测验效度就 越高。 2 22 2 1 x ei v s ss s 第三单元 影

27、响效度的因素 v样本团体的性质 干涉变量 使得测验对于不同团体具有不同的预测能力的特征。 差异分数d 对照组法 分组预测 吉赛利(e.e.ghiselli) ()是指在不同时间内用同一测验(或用另()是指在不同时间内用同一测验(或用另 一套相等测验)重复测量同一被试,所得的一套相等测验)重复测量同一被试,所得的 一致性程度。一致性程度。 (a a)信度)信度 (b b)效度)效度 (c c)难度)难度 (d d)区分)区分度度 在心理测验中,效度是指测验所测量的与所在心理测验中,效度是指测验所测量的与所 要测量的心理特点之间的符合程度,或者简要测量的心理特点之间的符合程度,或者简 单地说是指一

28、个测验的()。单地说是指一个测验的()。 (a a)稳定性)稳定性 (b b)准确性)准确性 (c c)可信度)可信度 (d d)区分性)区分性 在测量理论中,效度被定义为在一组测量中,在测量理论中,效度被定义为在一组测量中, 与目标有关的真实方差与()方差的比率。与目标有关的真实方差与()方差的比率。 (a a)误差)误差 (b b)系统误差)系统误差 (c c)随机误差)随机误差 (d d)总)总 ()指的是测验题目对有关内容或行为取样()指的是测验题目对有关内容或行为取样 的适用性,从而确定测验是否是所预测量的的适用性,从而确定测验是否是所预测量的 行为领域的代表性取样。行为领域的代表性

29、取样。 (a a)内容效度)内容效度 (b b)构想效度)构想效度 (c c)效标效度)效标效度 (d d)区分效度)区分效度 专家判断法,就是请有关专家对测验题目与专家判断法,就是请有关专家对测验题目与 原定内容的符合性做出判断,看测验的题目原定内容的符合性做出判断,看测验的题目 是否代表规定的内容。如果专家认为测验题是否代表规定的内容。如果专家认为测验题 目恰当地代表了所测内容,则测验具有内容目恰当地代表了所测内容,则测验具有内容 效度。因此,内容效度有时又称()。效度。因此,内容效度有时又称()。 (a a)构想效度)构想效度 (b b)效标效度)效标效度 (c c)区分效度)区分效度

30、(d d)逻辑效)逻辑效度度 编制测验时,效度是重要的要考虑的特性。编制测验时,效度是重要的要考虑的特性。 如果是编制最高行为测验,除了内容效度,如果是编制最高行为测验,除了内容效度, 也要求有()。也要求有()。 (a a)较高的表面效度)较高的表面效度 (b b)较好的专家判断)较好的专家判断 (c c)较好的外行判断)较好的外行判断 (d d)主观性)主观性 计算两种测验之间得分的相关,其中一种测计算两种测验之间得分的相关,其中一种测 验是待研究效度的,另一种是已有效度证据验是待研究效度的,另一种是已有效度证据 的成熟测验,但两者测量的是同一特质,假的成熟测验,但两者测量的是同一特质,假

31、 如相关高,说明新测验所测量的特质确实是如相关高,说明新测验所测量的特质确实是 老测验所反映的特质或行为。这种方法叫老测验所反映的特质或行为。这种方法叫 ()。()。 (a a)区分效度)区分效度 (b b)逻辑效度)逻辑效度 (c c)相容效度)相容效度 (d d)构想)构想效度效度 ( )是检测测验分数能否有效地区分由效标)是检测测验分数能否有效地区分由效标 所定义的团体的一种方法。所定义的团体的一种方法。 (a a)相关法)相关法 (b b)区分法)区分法 (c c)命中率法)命中率法 (d d)失误法)失误法 如果其他条件相同,样本越同质,分数分布如果其他条件相同,样本越同质,分数分布

32、 范围越小,测验效度就越()。范围越小,测验效度就越()。 (a a)高)高 (b b)低)低 (c c)大)大 (d d)接近)接近1 1 效标测量本身的可靠性如何也是值得考虑的效标测量本身的可靠性如何也是值得考虑的 一个问题。效标测量的可靠性即效标测量的一个问题。效标测量的可靠性即效标测量的 ()。()。 (a a)区分度)区分度 (b b)常模)常模 (c c)信度)信度 (d d)效度)效度 信度与效度的关系可表述为()。信度与效度的关系可表述为()。 (a a)信度是效度的必要而充分条件)信度是效度的必要而充分条件 (b b)信度是效度的充分条件)信度是效度的充分条件 (c c)信度

33、是效度的必要而非充分条件)信度是效度的必要而非充分条件 (d d)效度受信度的制约)效度受信度的制约 美国心理学会在美国心理学会在19741974年发行的年发行的教育与心理教育与心理 测量之标准测量之标准一书中将效度分为几个大类:一书中将效度分为几个大类: 即()即() (a a)内容效度)内容效度 (b b)构想效度)构想效度 (c c)效标效度)效标效度 (d d)区分效度)区分效度 内容效度的评估方法有()内容效度的评估方法有() (a a)专家判断法)专家判断法 (b b)双向细目表法)双向细目表法 (c c)统计分析)统计分析法法 (d d)经验推测法)经验推测法 除了描述性语言外,

34、内容效度的确定也可采除了描述性语言外,内容效度的确定也可采 取一些统计分析方法,如()。取一些统计分析方法,如()。 (a a)计算两个评分者的一致性)计算两个评分者的一致性 (b b)复本相关)复本相关 (c c)专家推测)专家推测 (d d)再测法)再测法 构想效度是()。构想效度是()。 (a a)构思效度)构思效度 (b b)主要涉及的是心理学的理论概念问题)主要涉及的是心理学的理论概念问题 (c c)指测验能够测量到理论上的构想或特质)指测验能够测量到理论上的构想或特质 的程度的程度 (d d)测验的结果是否能证实或解释某一理论)测验的结果是否能证实或解释某一理论 的假设、术语或构想

35、,解释的程度如何的假设、术语或构想,解释的程度如何 构想效度的估计方法包括()。构想效度的估计方法包括()。 (a a)对测验本身的分析)对测验本身的分析 (b b)测验间的相互比较)测验间的相互比较 (c c)效标效度的研究证明)效标效度的研究证明 (d d)实验法和观察法证实)实验法和观察法证实 可以作为构想效度证据的有()。可以作为构想效度证据的有()。 (a a)测验的内容效度)测验的内容效度 (b b)测验的内部一致性指标)测验的内部一致性指标 (c c)分析几个测验间的相互关系)分析几个测验间的相互关系 (d d)分析被试者对题目的反应特点)分析被试者对题目的反应特点 可以作为构想

36、效度的测验间比较的有()。可以作为构想效度的测验间比较的有()。 (a a)内容效度)内容效度 (b b)相容效度)相容效度 (c c)区分效度)区分效度 (d d)因素分析法)因素分析法 效标效度反映的是测验预测个体在某种情境效标效度反映的是测验预测个体在某种情境 下行为表现的有效性程度。它可以分为()。下行为表现的有效性程度。它可以分为()。 (a a)相容效度)相容效度 (b b)区分效度)区分效度 (c c)同时效度)同时效度 (d d)预测效)预测效度度 效标效度的主要评估方法有()。效标效度的主要评估方法有()。 (a a)命中率法)命中率法 (b b)区分)区分法法 (c c)失

37、误法)失误法 (d d)相关法)相关法 相关法求效标效度的计算方法有()。相关法求效标效度的计算方法有()。 (a a)积差相关法)积差相关法 (b b)点二列相关法)点二列相关法 (c c)二列相关法)二列相关法 (d d)贾斯朋多系列相关)贾斯朋多系列相关 在命中率法中,命中的情况是指()。在命中率法中,命中的情况是指()。 (a a)预测成功实际也成功)预测成功实际也成功 (b b)预测成功但实际上失败)预测成功但实际上失败 (c c)预测失败而实际上成功)预测失败而实际上成功 (d d)预测失败实际也失败)预测失败实际也失败 测验实施中的干扰因素包括()。测验实施中的干扰因素包括()。

38、 (a a)主试者的影响因素)主试者的影响因素 (b b)测验情境)测验情境 (c c)其他干扰因素)其他干扰因素 (d d)被试者的影响因素)被试者的影响因素 项目分析 第五节 陈 蕾 项目分析 定性分析 定量分析 难 度 区分度 第一单元 项目的难度 p值越大,难度越低;p值越小,难度越高。 %100 n r p 项目的项目的 难度难度 通过或答对该通过或答对该 项目的人数项目的人数 全体被试全体被试 者人数者人数 在在200200个学生中,答对某项目的人数为个学生中,答对某项目的人数为120120人,人, 则该项目的难度为()。则该项目的难度为()。 (a a)0.10.1 (b b)0

39、.20.2 (c c)0.40.4 (d d)0.60.6 第一单元 项目的难度 项目的项目的 难度难度 全体被试者在该全体被试者在该 题上的平均分题上的平均分 该题的该题的 满分满分 %100 max x x p 数学测验的第数学测验的第7 7题满分为题满分为1515分,该题考生的平分,该题考生的平 均得分为均得分为9.69.6分,则该题的难度为()。分,则该题的难度为()。 (a a)0.640.64 (b b)0.550.55 (c c)0.430.43 (d d)0.210.21 第一单元 项目的难度 项目的项目的 难度难度 高分组的高分组的 通过率通过率 低分组的低分组的 通过率通过

40、率 2 lh pp p 总成绩最高的27为高分组,总成绩最低的27为低分组。 在在370370名被试者中,选为高分组和低分组各有名被试者中,选为高分组和低分组各有 100100人,其中高分组有人,其中高分组有7070人答对第一题,低分人答对第一题,低分 组有组有4040人答对第一题,则第一题的难度为人答对第一题,则第一题的难度为 ()。()。 (a a)0.350.35 (b b)0.450.45 (c c)0.550.55 (d d)0.650.65 第一单元 项目的难度 校正后的校正后的 通过率通过率 实际得到实际得到 的通过率的通过率 备选答案备选答案 数目数目 1 1 k kp c p

41、 第一单元 项目的难度 项目的难度水平多合适取决于测验的目的、性质以及 项目的形式。 v项目的难度水平 对常模参照测验来讲,p值越接近于0.50越好,试题的平 均难度接近0.50,各个题目的难度在0.50 0.20之间; 对选拔或诊断测验来讲,应该较多地选择难度接近录取 率的项目; 对标准参照测验来讲,可以不考虑难度; 第一单元 项目的难度 测验的难度水平直接依赖于组成测验项目的难度。 v测验的难度水平 对常模参照测验来讲,分数分布以常态最好; 对选拔测验来讲,正偏态的分数分布比较适合; 对标准参照测验来讲,可以允许出现偏态分布; 第二单元 项目的区分度 指测验项目对被试的心理特性的区分能力,

42、取值范围 在1至+1之间。 v项目区分度(鉴别力) lh ppd 高分组的高分组的 通过率通过率 低分组的低分组的 通过率通过率 鉴别鉴别 指数指数 鉴别指数(d) 项目评价 0.40 以上 0.300.39 0.200.29 0.19 以下 很好 良好,修正后会更佳 尚可,但需修改 差,必须淘汰 伊贝尔(l.ebel) 鉴别指数与评价标准 第二单元 项目的区分度 v相关法 以某一项目分数与效标成绩或测验总分的相关作 为该项目区分度的指标。相关越高,项目区分功能越 好。 积差相关; 二列相关; 点二列相关; 相关法 v区分度与难度的关系 项 目 通 过 率 d 的 最 大 值 1 . 0 0 0 . 9 0 0

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论