北京大学心理测量课件_第1页
北京大学心理测量课件_第2页
北京大学心理测量课件_第3页
北京大学心理测量课件_第4页
北京大学心理测量课件_第5页
已阅读5页,还剩212页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2021-6-30 心理测量心理测量 2021-6-30 心理测量的基本理论心理测量的基本理论 心理测量的理论基础心理测量的理论基础 2021-6-30 心理测量的基本概念心理测量的基本概念 心理测量:依据一定的心理学和教育学心理测量:依据一定的心理学和教育学 理论,使用测验对人的心理特质进行定理论,使用测验对人的心理特质进行定 量描述的过程。量描述的过程。 2021-6-30 心理测量的特征分类心理测量的特征分类 按测验功能:智力测验、能力测验、人格测验、成就测验。按测验功能:智力测验、能力测验、人格测验、成就测验。 按测验对象:个别测验、团体测验。按测验对象:个别测验、团体测验。 按测验方

2、式:纸笔测验、口头测验、电脑测验、操作测验。按测验方式:纸笔测验、口头测验、电脑测验、操作测验。 按测验目的:描述性测验、诊断性测验、预示性测验。按测验目的:描述性测验、诊断性测验、预示性测验。 按测验难度:速度测验、难度测验。按测验难度:速度测验、难度测验。 按测验要求:最高作为测验、典型作为测验。按测验要求:最高作为测验、典型作为测验。 按测验性质:构造性测验、投射性测验。按测验性质:构造性测验、投射性测验。 按测验解释:常模参照测验、标准参照测验。按测验解释:常模参照测验、标准参照测验。 按测验应用:教育测验、职业测验、临床测验按测验应用:教育测验、职业测验、临床测验 2021-6-30

3、 经典测量理论经典测量理论 心理特质:表现在一个人身上所特有的相对稳心理特质:表现在一个人身上所特有的相对稳 定的行为方式。定的行为方式。 心理特质具有内部性、一致性、抽象性、稳定心理特质具有内部性、一致性、抽象性、稳定 性、层次性、可预测性等特点。性、层次性、可预测性等特点。 CTT的心理特质可测性假设:心理特质是一种的心理特质可测性假设:心理特质是一种 客观存在,凡客观存在的事物都有其数量,凡客观存在,凡客观存在的事物都有其数量,凡 有数量的东西都可以测量。有数量的东西都可以测量。 2021-6-30 真分数真分数 T分数:测量没有误差时所得到的真值。分数:测量没有误差时所得到的真值。 C

4、TT的真分数理论模型:的真分数理论模型:X = T + E,观,观 测分数是真分数和测量误差的和。测分数是真分数和测量误差的和。 对于同一被试用平行的测验反复多次测对于同一被试用平行的测验反复多次测 验,观察分数的平均值会接近真分数。验,观察分数的平均值会接近真分数。 2021-6-30 SX2 = ST2 + SE2,实得分数的变异等与,实得分数的变异等与 真分数的变异加上误差的变异。真分数的变异加上误差的变异。 ST2 = SV2 + SI2,真分数的变异包括与,真分数的变异包括与 测量目的有关的变异(有效变异)和与测量目的有关的变异(有效变异)和与 测量目的无关的变异(无效变异)两部测量

5、目的无关的变异(无效变异)两部 分。分。 所以,所以,SX2 = SV2 + SI2 + SE2 2021-6-30 历年真题历年真题 真分数模型真分数模型X = T + E中,中,E表示的是表示的是 (B) (2007,全国统考),全国统考) A. 系统误差系统误差 B. 随机误差随机误差 C. 抽样误差抽样误差 D. 标准误差标准误差 2021-6-30 测量的信度测量的信度 信度(信度(reliability):测量结果的稳定性):测量结果的稳定性 程度。程度。 定义定义1:一组测量分数的真分数的变异数:一组测量分数的真分数的变异数 与实得分数得变异数的比率与实得分数得变异数的比率 定义

6、定义2:一组测量分数的真分数的变异数:一组测量分数的真分数的变异数 与实得分数相关系数的平方与实得分数相关系数的平方 定义定义3:一个测验与任一个平行测验的相:一个测验与任一个平行测验的相 关系数关系数 2 2 X T xx S S r 2 TXxx r XXxx r 2021-6-30 信度的作用信度的作用 1、评价测验的好坏,反映随机误差的大小。、评价测验的好坏,反映随机误差的大小。 注:系统误差与信度无关。注:系统误差与信度无关。 2、解释个人测验的分数,、解释个人测验的分数,X 1.96SE T X + 1.96SE,标准误,标准误SE = ,Sx:所得分:所得分 数标准差,数标准差,

7、rxx:测验信度。:测验信度。 3、比较两种测验,差异的标准误、比较两种测验,差异的标准误SEd = S: 相同尺度标准分数的标准差,相同尺度标准分数的标准差,rxx, rYY:两个测:两个测 验的信度。验的信度。 xxx rS1 xxxx rrS2 2021-6-30 信度系数的估计信度系数的估计 重测信度:同一个测验对同一组被试施重测信度:同一个测验对同一组被试施 测两次,两次测验分数的相关系数。测两次,两次测验分数的相关系数。 前提:测量的心理特质必须稳定,遗忘前提:测量的心理特质必须稳定,遗忘 与练习效果基本抵消,两次施测间隔期与练习效果基本抵消,两次施测间隔期 间被试没有更多的学习或

8、训练。间被试没有更多的学习或训练。 优缺点:能提供测验结果是否随时间变优缺点:能提供测验结果是否随时间变 化,预测被试将来行为的依据。容易受化,预测被试将来行为的依据。容易受 练习、记忆的影响。练习、记忆的影响。 2021-6-30 副本信度:同一组被试在两个平行测验上得分副本信度:同一组被试在两个平行测验上得分 的相关系数。的相关系数。 同时施测:等值性系数同时施测:等值性系数 前后施测:稳定性与等值性系数前后施测:稳定性与等值性系数 前提:两份测验在题目内容、数量、形式、难前提:两份测验在题目内容、数量、形式、难 度、区分度、指导语、完成时间等相似。在时度、区分度、指导语、完成时间等相似。

9、在时 间、成本上要有条件做两个测验。间、成本上要有条件做两个测验。 优缺点:只能减少而不能完全排除练习、记忆优缺点:只能减少而不能完全排除练习、记忆 的影响。平行测验难找。的影响。平行测验难找。 2021-6-30 分半信度:将一个测验分成相等的两半,分半信度:将一个测验分成相等的两半, 被试在这两半测验得分的相关系数。被试在这两半测验得分的相关系数。 计算时注意校正:计算时注意校正: 2021-6-30 两半方差同质:两半方差同质: 斯皮尔曼斯皮尔曼-布朗公式:布朗公式:r = 2rhh / (1 + rhh), rhh:两半分数间的相关系数。:两半分数间的相关系数。 2021-6-30 两

10、半方差不同质:两半方差不同质: 弗朗那根弗朗那根 (Flanagan)公式:公式: 卢仑卢仑 (Rulon)公式:公式: Sa2、Sb2:两半测验的 方差,Sd2:两测验分数 差的方差 2021-6-30 前提:一次施测,没有副本,测验可分前提:一次施测,没有副本,测验可分 成两半。成两半。 特点:同一测验可以有多个分半信度值。特点:同一测验可以有多个分半信度值。 2021-6-30 同质性信度:测验内部所有题目的一致同质性信度:测验内部所有题目的一致 性程度。性程度。 2021-6-30 评分者信度:多个评分者给同一批被试评分者信度:多个评分者给同一批被试 评分的一致性程度。评分的一致性程度

11、。 肯德尔和谐系数肯德尔和谐系数 2021-6-30 信度的影响因素信度的影响因素 被试越异质,信度越高被试越异质,信度越高 rn = ro:原被试信度,:原被试信度,So2:原被试方差,:原被试方差,Sn2: 新被试方差新被试方差 2 2 )1 ( 1 n oo S rS 2021-6-30 信度的影响因素信度的影响因素 条目数适当增加,信度提高条目数适当增加,信度提高 rkk = K:测验改变后长度与原长度之比,:测验改变后长度与原长度之比,rxx: 原测验信度,原测验信度,rkk:新测验信度:新测验信度 xx xx rK Kr ) 1(1 2021-6-30 团体平均水平太高或太低,信度

12、降低团体平均水平太高或太低,信度降低 主试不按规定施测,评分标准不一,信主试不按规定施测,评分标准不一,信 度降低度降低 测试情境测试情境 测验条目越多,信度越高,时间过长,测验条目越多,信度越高,时间过长, 信度降低,难度过大或过易,信度降低信度降低,难度过大或过易,信度降低 两次测验间隔时间越短,信度越高两次测验间隔时间越短,信度越高 2021-6-30 信度改进信度改进 适当增加测验长度适当增加测验长度 难度接近正态分布,控制在中等水平难度接近正态分布,控制在中等水平 提高项目区分度提高项目区分度 选取恰当的被试团体选取恰当的被试团体 主试、评分者、场地主试、评分者、场地 2021-6-

13、30 历年真题历年真题 (华东师大(华东师大2002)某测验的被试为)某测验的被试为25 年级的小学生,已知信度是年级的小学生,已知信度是0.85,标准差,标准差 为为10,现欲知道仅用于,现欲知道仅用于4年级时信度是多年级时信度是多 少,少,4年级的标准差是年级的标准差是5。 2021-6-30 历年真题历年真题 (华南师大(华南师大2001)已知某量表的分半信)已知某量表的分半信 度为度为0.63,请算出原长度的信度系数。,请算出原长度的信度系数。 解:解:rkk = = 1.26 / 1.63 = 0.77 63. 0) 12(1 63. 02 2021-6-30 历年真题历年真题 将测

14、验对等分半后,两半测验得分的相关系数为将测验对等分半后,两半测验得分的相关系数为0.60, 校正后该测验的分半信度是(校正后该测验的分半信度是(B)()(2007,全国统考),全国统考) A. 0.70 B. 0.75 C. 0.80 D. 0.85 什么是测验的信度?影响信度的主要因素有哪些?什么是测验的信度?影响信度的主要因素有哪些? (2007,全国统考),全国统考) 答:(答:(1)信度是测量结果的稳定性或一致性程度。)信度是测量结果的稳定性或一致性程度。 (2)影响因素:被试、主试、施测情境、测量工具、)影响因素:被试、主试、施测情境、测量工具、 施测时间间隔、评分计分施测时间间隔、

15、评分计分 2021-6-30 测量的效度测量的效度 指一个测验或量表实际能测出其所要测指一个测验或量表实际能测出其所要测 的心理特质的程度。的心理特质的程度。 效度系数效度系数r = Sv2 / Sx2,Sv:有效方差,:有效方差,SX: 总方差。总方差。 2021-6-30 效度是个相对的概念效度是个相对的概念 效度是测量的系统误差和随机误差的综效度是测量的系统误差和随机误差的综 合反映合反映 判断效度要从多方面判断效度要从多方面 2021-6-30 内容效度内容效度 测验内容对要测量的内容取样的适当程测验内容对要测量的内容取样的适当程 度。度。 适用于成就测验和某些职业测验,不适适用于成就

16、测验和某些职业测验,不适 用于能力测验、人格测验用于能力测验、人格测验 好的内容效度需要具备的条件:好的内容效度需要具备的条件: 确定好内容的范围确定好内容的范围 确定好题目所测的内容确定好题目所测的内容 2021-6-30 内容效度的确定内容效度的确定 专家判断法专家判断法 复本法复本法 再测法再测法 经验法经验法 2021-6-30 注:要避免与表面效度相混淆。其实,注:要避免与表面效度相混淆。其实, 表面效度不能算是一种效度,它不反映表面效度不能算是一种效度,它不反映 测验实际测量的东西。它是外行人对某测验实际测量的东西。它是外行人对某 个测验从表面上看好像是测某种心理特个测验从表面上看

17、好像是测某种心理特 质的一种现象。当外行人认为某个测验质的一种现象。当外行人认为某个测验 能有效地测得某种心理特质时能有效地测得某种心理特质时 ,该测验,该测验 就被认就被认 为有较高的表面效度。一般来说,为有较高的表面效度。一般来说, 最佳行为测验往往表面效度高,其他测最佳行为测验往往表面效度高,其他测 验则希望表面效度低。验则希望表面效度低。 2021-6-30 结构效度结构效度 又称构想效度。指一个测验实际测到所又称构想效度。指一个测验实际测到所 要测量的理论结构和特质的程度,或者要测量的理论结构和特质的程度,或者 说它是指测验分数能够说明心理学理论说它是指测验分数能够说明心理学理论 的

18、某种结构或特质的程度。适用于能力的某种结构或特质的程度。适用于能力 测验、人格测验。测验、人格测验。 主要取决于理论,没有单一的数量指标主要取决于理论,没有单一的数量指标 2021-6-30 结构效度的确定结构效度的确定 测验内法:确定测验内容效度,分析被试对项测验内法:确定测验内容效度,分析被试对项 目的反应过程,考察测验的同质性。目的反应过程,考察测验的同质性。 测验间法:测验间法: 相容效度:被试在新旧两个同类测验上分数的相容效度:被试在新旧两个同类测验上分数的 相关较高。相关较高。 区分效度:与测验不同构想的测验分数相关较区分效度:与测验不同构想的测验分数相关较 低。低。 因素效度:对

19、一组测验进行因素分析,找每个因素效度:对一组测验进行因素分析,找每个 测验和公共因素的相关。测验和公共因素的相关。 2021-6-30 效标关联法:根据测验得分分成高分组低分组,效标关联法:根据测验得分分成高分组低分组, 考察在特质上是否有差异。考察在特质上是否有差异。 多特质多特质-多方法矩阵法:多方法矩阵法: 相容效度和区分效度法的综合运用,其原理是相容效度和区分效度法的综合运用,其原理是 若用多种极不相同的方法测量同一种特质相关若用多种极不相同的方法测量同一种特质相关 很高很高 (用极为相似的方法测量不同特质相关很用极为相似的方法测量不同特质相关很 低低),则说明测量效度较高。,则说明测

20、量效度较高。 实验操作法实验操作法 2021-6-30 实证效度实证效度 又称效标效度。指一个测验对处于特定情境中又称效标效度。指一个测验对处于特定情境中 的个体的行为进行估计的有效性。的个体的行为进行估计的有效性。 效标:被预测的行为是衡量测验是否有效的标效标:被预测的行为是衡量测验是否有效的标 准。准。 同时效度:效标资料和测验分数同时收集同时效度:效标资料和测验分数同时收集 预测效度:效标资料在测验分数收集后过一段预测效度:效标资料在测验分数收集后过一段 时间才能收集到。时间才能收集到。 好的效标:真实反映观念效标的重要侧面,稳好的效标:真实反映观念效标的重要侧面,稳 定可靠,客观,简单

21、成本低。定可靠,客观,简单成本低。 2021-6-30 实证效度的确定实证效度的确定 相关法相关法 分组法分组法 命中率法命中率法 功利率法功利率法 2021-6-30 总命中率:总命中率:(B + C) / (A + B + C + D) 正命中率:正命中率:B / (A + B) 2021-6-30 历年真题历年真题 以学习成绩为效标,得到某一智力测验以学习成绩为效标,得到某一智力测验 的效标关联效度为的效标关联效度为0.80。将此测验用于预。将此测验用于预 测时,其测验结果可解释学习成绩变异测时,其测验结果可解释学习成绩变异 的(的(C)()(2007,全国统考),全国统考) A. 16

22、% B. 20% C. 64% D. 80% 2021-6-30 效度的影响因素效度的影响因素 测验的构成:测验的构成: 条目质量条目质量 条目数量:条目数量:r = n:测验增长倍数,:测验增长倍数,rxy:原测验效度,:原测验效度,rxx: 原测验信度原测验信度 )1 ( xxxx xy nrrn nr 2021-6-30 测验的实施测验的实施 被试:被试: 身心状态身心状态 样本特点样本特点 效标:是否线性效标:是否线性 信度信度 2021-6-30 提高效度的方法提高效度的方法 精心编制测验量表,避免出现较大的系精心编制测验量表,避免出现较大的系 统误差。统误差。 妥善组织测验,控制随

23、机误差。妥善组织测验,控制随机误差。 创设标准的应试情境,让每个被试都能创设标准的应试情境,让每个被试都能 发挥正常的水平。发挥正常的水平。 选好正确的效标、定好恰当的效标测量,选好正确的效标、定好恰当的效标测量, 正确地使用有关公式。正确地使用有关公式。 2021-6-30 信度与效度的关系信度与效度的关系 信度高是效度高的必要而不充分条件信度高是效度高的必要而不充分条件 效度受信度制约效度受信度制约rXY2 rXX 例:(华东师大例:(华东师大2002)效度与信度的关)效度与信度的关 系系 2021-6-30 心理测量的误差心理测量的误差 测量误差指的是在测量过程中由那些与测量误差指的是在

24、测量过程中由那些与 测量目的无关的变化因素所产生的一种测量目的无关的变化因素所产生的一种 不准确或不一致的测量效应。不准确或不一致的测量效应。 2021-6-30 2021-6-30 系统误差:由与测量目的无关的因素引系统误差:由与测量目的无关的因素引 起的一种恒定而有规律的误差。只影响起的一种恒定而有规律的误差。只影响 准确性。准确性。 随机误差:由与测量目的无关的、偶然随机误差:由与测量目的无关的、偶然 因素引起的、而又不易控制的误差。影因素引起的、而又不易控制的误差。影 响准确性和一致性响准确性和一致性 2021-6-30 测量的随机误差来源及控制测量的随机误差来源及控制 测验项目测验项

25、目 施测环境施测环境 被试被试 2021-6-30 测量的系统误差来源及控制测量的系统误差来源及控制 测验项目测验项目 施测环境施测环境 被试被试 2021-6-30 测量误差的估计测量误差的估计 2021-6-30 心理测验的项目分析心理测验的项目分析 2021-6-30 题目的难度题目的难度 项目的难易程度项目的难易程度 二分法记分项目:通过率,二分法记分项目:通过率,P = R / N,R:通:通 过该项目人数,过该项目人数,N:总人数。:总人数。 极端分组法:当被试人数较多时,则可以先将极端分组法:当被试人数较多时,则可以先将 被试依照测验总分从高到低排列,分成三组,被试依照测验总分从

26、高到低排列,分成三组, 总分最高的总分最高的27%被试称为高分组被试称为高分组 (NH),总分最总分最 低的低的27%被试为低分组被试为低分组 (NL),分别计算高分组,分别计算高分组 和低分组的通过率,然后求项目的难度。和低分组的通过率,然后求项目的难度。 P = (PH + PL) / 2 2021-6-30 非二分法记分项目:非二分法记分项目: 2021-6-30 难度的确定:取决于测验的目的和测验难度的确定:取决于测验的目的和测验 性质性质 难度的等距变换:将难度的等距变换:将P值化为值化为Z分数(查分数(查 表),表), = 13 + 4 * Z () 难度影响测验分数的分布形态,离

27、散程难度影响测验分数的分布形态,离散程 度度 2021-6-30 历年真题历年真题 某项测验中,绝大部分题目的难度值某项测验中,绝大部分题目的难度值P较较 大,那么被试的分数(大,那么被试的分数(A, B, D)()(2007, 全国统考)全国统考) A. 集中在高分端集中在高分端 B. 平均数小于中数平均数小于中数 C. 中数大于众数中数大于众数 D. 分布呈现负偏态分布呈现负偏态 2021-6-30 题目的区分度题目的区分度 指测验项目对被试心理品质水平差异的区分能指测验项目对被试心理品质水平差异的区分能 力。效标分数多用测验总分(内部效标)力。效标分数多用测验总分(内部效标) 项目鉴别指

28、数:项目鉴别指数:D = PH - PL D越高越好。越高越好。0.40以上很好,以上很好,0.30-0.39良好,良好, 0.20-0.29尚可,尚可,0.19及以下差及以下差 极端组划分:一般极端组划分:一般27%,分布比正态平坦:可,分布比正态平坦:可 以升高到以升高到33%,如果样本量少,如果样本量少(100),可以,可以 50% 2021-6-30 例:(华南师大例:(华南师大2001)已知某测题高分)已知某测题高分 组通过人数是组通过人数是70,低分组通过人数,低分组通过人数38 ,其鉴别指数是多少?该鉴别指数能,其鉴别指数是多少?该鉴别指数能 否被接受?否被接受? 解:解:D =

29、 PH - PL = 0.70 0.38 = 0.32,鉴,鉴 别指数良好别指数良好 2021-6-30 相关法相关法 项目分数与效标分数或总分的相关项目分数与效标分数或总分的相关 相关越高,区分度越高相关越高,区分度越高 点二列相关:点二列相关:rpb = 二列相关:二列相关:rb = 相关:相关:r = 积差相关积差相关 pq s XX x qp y pq s XX x qp )()()(dcdbcaba bcad 2021-6-30 不同计算方法,区分度不同,各项目要不同计算方法,区分度不同,各项目要 采取同一计算方法采取同一计算方法 样本容量大小影响相关法区分度大小,样本容量大小影响相

30、关法区分度大小, 因此需要检验显著性因此需要检验显著性 分组标准影响鉴别值分组标准影响鉴别值 被试样本同质性越高,区分度越小被试样本同质性越高,区分度越小 2021-6-30 题目的综合分析和筛选题目的综合分析和筛选 区分度与难度的关系:区分度与难度的关系: 难度越接近难度越接近0.50,项目潜在的区分度越大,项目潜在的区分度越大, 而难度越接近而难度越接近1.00或或0时,项目的潜在区时,项目的潜在区 分度越小。分度越小。 使项目的难度分布广一些,梯度大一些,使项目的难度分布广一些,梯度大一些, 使整个测验的难度分布呈正态分布,且使整个测验的难度分布呈正态分布,且 平均水平保持在平均水平保持

31、在0.50左右。左右。 2021-6-30 心理测验编制的基本程序心理测验编制的基本程序 确定测验目的确定测验目的 测量对象:测什么人测量对象:测什么人 测量目标:测什么特质测量目标:测什么特质 测验用途:为什么测测验用途:为什么测 2021-6-30 拟定编制计划拟定编制计划 全面、有代表性全面、有代表性 各个内容的权重各个内容的权重 二向细目表二向细目表 2021-6-30 设计测试项目设计测试项目 搜集有关资料搜集有关资料 选择项目形式选择项目形式 编写和修订条目编写和修订条目 2021-6-30 搜集有关资料搜集有关资料 丰富性丰富性 普遍性普遍性 趣味性趣味性 2021-6-30 选

32、择项目形式选择项目形式 使被试容易明了测验做法,做测验时不使被试容易明了测验做法,做测验时不 会弄错会弄错 做法简明省时做法简明省时 计分省时省力,经济计分省时省力,经济 2021-6-30 编写和修订条目编写和修订条目 代表性代表性 条目范围与编制计划项目范围一致条目范围与编制计划项目范围一致 有一定难度分布有一定难度分布 精炼明了精炼明了 初编题量要多于最终题量初编题量要多于最终题量 测验项目说明要简明测验项目说明要简明 2021-6-30 预测试和分析预测试和分析 试测试测 对象、情境、时限、被试反应对象、情境、时限、被试反应 项目分析项目分析 难度、区分度等难度、区分度等 2021-6

33、-30 合成测验合成测验 项目选择项目选择 项目编排项目编排 编造复本编造复本 2021-6-30 项目选择项目选择 区分度大区分度大 难度视测验目的而定难度视测验目的而定 2021-6-30 项目编排项目编排 并列直进并列直进 整个测验按照测验项目材料性质归为若整个测验按照测验项目材料性质归为若 干分测验,同一分测验难度由易到难。干分测验,同一分测验难度由易到难。 混合螺旋混合螺旋 先将各类测验项目按照难度分成若干层先将各类测验项目按照难度分成若干层 次,再把不同性质测验项目组合,交叉次,再把不同性质测验项目组合,交叉 排列,难度由易到难。排列,难度由易到难。 2021-6-30 编造复本编

34、造复本 测量同种特质测量同种特质 题目不重复题目不重复 题型、题量、难度分布相等题型、题量、难度分布相等 2021-6-30 测验使用的标准化测验使用的标准化 施测过程施测过程 评分计分评分计分 分数解释分数解释 2021-6-30 施测过程施测过程 情境情境 指导语指导语 时限时限 2021-6-30 评分计分评分计分 记录反应情况记录反应情况 有计分键有计分键 对反应分类对反应分类 2021-6-30 分数解释分数解释 2021-6-30 鉴定测验鉴定测验 信度信度 效度效度 2021-6-30 编写测验手册编写测验手册 目的、功用目的、功用 理论背景、选择项目的依据理论背景、选择项目的依

35、据 测验实施方法、时限、注意事项测验实施方法、时限、注意事项 标准答案、计分方法,常模等解释资料标准答案、计分方法,常模等解释资料 信效度信效度 常模、解释常模、解释 2021-6-30 测验目标与命题双向细目表测验目标与命题双向细目表 明确测量目标明确测量目标 ,也就是明确测量什么心,也就是明确测量什么心 理功能,是测能力、人格,还是测学业理功能,是测能力、人格,还是测学业 成绩。不仅如此,还要进一步把目标具成绩。不仅如此,还要进一步把目标具 体化。例:瑟斯顿的智力体化。例:瑟斯顿的智力7因素理论因素理论 2021-6-30 命题双向细目表:内容命题双向细目表:内容x完成目标完成目标 202

36、1-6-30 题目编制技术题目编制技术 搜集有关资料(丰富、普遍性)搜集有关资料(丰富、普遍性) 选择项目形式(使被试容易明了测验做法,做测验时选择项目形式(使被试容易明了测验做法,做测验时 不会弄错,做法简明省时,计分省时省力,经济)不会弄错,做法简明省时,计分省时省力,经济) 编写和修订条目(代表性,条目范围与编制计划项目编写和修订条目(代表性,条目范围与编制计划项目 范围一致,有一定难度分布,精炼明了,初编题量要范围一致,有一定难度分布,精炼明了,初编题量要 多于最终题量,测验项目说明要简明)多于最终题量,测验项目说明要简明) 预测试和分析预测试和分析 试测试测 项目分析项目分析 202

37、1-6-30 心理测验的施测心理测验的施测 1、测验的设计、测验的设计 所选测验必须适合测量的目的所选测验必须适合测量的目的 所选测验必须符合心理测量学的要求所选测验必须符合心理测量学的要求 2021-6-30 施测的程序和步骤施测的程序和步骤 施测前准备:施测前准备: 准备好测验材料准备好测验材料 熟练掌握施测手续熟练掌握施测手续 熟记测验指导语并能用口语清楚而流利地说出来熟记测验指导语并能用口语清楚而流利地说出来 指导语指导语 测验情境测验情境 测验焦虑测验焦虑 与受测者建立良好的协调关系与受测者建立良好的协调关系 评分技术评分技术 2021-6-30 测验分数的解释测验分数的解释 叙述的

38、解释叙述的解释 溯因的解释溯因的解释 预测的解释预测的解释 评价的解释评价的解释 2021-6-30 报告测验分数报告测验分数 用当事人所理解的语言用当事人所理解的语言 保证当事人知道这个测验测量什么或预测什么保证当事人知道这个测验测量什么或预测什么 让当事人知道常模是什么团体让当事人知道常模是什么团体 让当事人知道分数只是一个估计让当事人知道分数只是一个估计 让当事人知道如何运用分数让当事人知道如何运用分数 考虑测验分数对当事人的影响考虑测验分数对当事人的影响 结果向无关人员保密结果向无关人员保密 对低分者解释要谨慎小心对低分者解释要谨慎小心 报告测验分数应设法了解当事人的心理感受报告测验分

39、数应设法了解当事人的心理感受 2021-6-30 测验常模测验常模 常模:常模团体的分数分布。常模:常模团体的分数分布。 确定有关的比较团体确定有关的比较团体 获得该团体成员的测验分数获得该团体成员的测验分数 把原始分数转化为量表,该量表能把个把原始分数转化为量表,该量表能把个 人分数表示成在这个团体内的相对位置。人分数表示成在这个团体内的相对位置。 2021-6-30 常模团体常模团体 群体的构成必须明确界定群体的构成必须明确界定 标准化样本必须是所要测量群体的一个标准化样本必须是所要测量群体的一个 代表性取样代表性取样 取样过程必须详尽描述取样过程必须详尽描述 样本大小适当样本大小适当 注

40、意常模的时间性注意常模的时间性 一般常模和特殊常模相结合一般常模和特殊常模相结合 2021-6-30 分数转换与合成分数转换与合成 原始分数:被试反应计算出来的测验分原始分数:被试反应计算出来的测验分 数。数。 导出分数:在原始分数转换的基础上,导出分数:在原始分数转换的基础上, 按照一定规则,经过统计处理后获得的按照一定规则,经过统计处理后获得的 具有一定参考点和单位,可以相互比较具有一定参考点和单位,可以相互比较 的分数的分数 分数转换:按某种规则将原始分数转化分数转换:按某种规则将原始分数转化 为导出分数的过程为导出分数的过程 2021-6-30 百分等级分数:百分等级分数:PR = 1

41、00 (100R - 50) / N R:排名顺序的序号,:排名顺序的序号,N为被试总人数。为被试总人数。 具有可比性,易于计算、解释方便,不受具有可比性,易于计算、解释方便,不受 总体分布正态性影响,单位不等,只有顺总体分布正态性影响,单位不等,只有顺 序性,不能推断差异程度。序性,不能推断差异程度。 2021-6-30 标准分数:标准分数:Z = Z分数分布与原始形态相同,经常有负数、分数分布与原始形态相同,经常有负数、 小数点、单位过大。小数点、单位过大。 正态化的正态化的Z分数:将对应百分等级看作正分数:将对应百分等级看作正 态分布曲线下的面积,求态分布曲线下的面积,求Z值。值。 S

42、XX 2021-6-30 T分数:分数:T = 10Z + 50 2021-6-30 历年真题历年真题 将将Z分数转换成分数转换成T分数时,需要进行(分数时,需要进行(C) (2007,全国统考),全国统考) A. 正态化转换正态化转换 B. 非正态化转换非正态化转换 C. 线性转换线性转换 D.非线性转换非线性转换 2021-6-30 标准分数变式:标准分数变式:Z = AZ + B 等单位、便于进一步分析,正态分布下等单位、便于进一步分析,正态分布下 可以将导出分数和百分等级相互换算,可以将导出分数和百分等级相互换算, 可以将几个测验上的分数直接比较,分可以将几个测验上的分数直接比较,分

43、数过于抽象,不易理解,非正态分布变数过于抽象,不易理解,非正态分布变 式得到的分数不可相互比较。式得到的分数不可相互比较。 2021-6-30 标准九分数:正态分布曲线横轴分标准九分数:正态分布曲线横轴分9段。段。 2021-6-30 各各 种种 导导 出出 分分 数数 的的 关关 系系 2021-6-30 分数合成分数合成 几个分数或几个预测源组合起来,以获几个分数或几个预测源组合起来,以获 得一个合成分数或作总的预测。得一个合成分数或作总的预测。 项目的组合,分测验的组合,测验或预项目的组合,分测验的组合,测验或预 测源的组合测源的组合 用什么方法,什么形式,多少种及何种用什么方法,什么形

44、式,多少种及何种 测验来合成分数?测验来合成分数? 2021-6-30 临床诊断:直觉合成临床诊断:直觉合成 高度综合性高度综合性 灵活针对性灵活针对性 主观加权主观加权 没有精确的数量指标没有精确的数量指标 2021-6-30 加权求和:加权求和: XC = X1 +X2 +Xn ZC = Z1 +Z2 +Zn ZC = W1Z1 +W2Z2 +WnZn 2021-6-30 多重回归:多重回归: = a + b1x1 + b2x2 + + bnxn 线性,连续变量,预测源和效标能同时线性,连续变量,预测源和效标能同时 获得获得 Y 2021-6-30 多重划分:在各个特质上都确定一个标多重划

45、分:在各个特质上都确定一个标 准,从而把成绩划分为合格与不合格两准,从而把成绩划分为合格与不合格两 类。所有测验都合格才算合格。类。所有测验都合格才算合格。 最有效的预测源放在最前面。最有效的预测源放在最前面。 2021-6-30 常模的编制常模的编制 确定有关的比较团体。确定有关的比较团体。 获得该团体成员的测验分数。获得该团体成员的测验分数。 把原始分数转化为量表分数。把原始分数转化为量表分数。 2021-6-30 几种常用的常模几种常用的常模 发展量表发展量表 心理年龄心理年龄 一组可区分不同年龄组的题目一组可区分不同年龄组的题目 一个常模团体一个常模团体 常模表常模表 易于理解和解释易

46、于理解和解释 可以和同年龄团体直接比较可以和同年龄团体直接比较 2021-6-30 年级当量年级当量 10个月间隔个月间隔 只适用于一般课程,在各年级间有系统只适用于一般课程,在各年级间有系统 改变改变 解释比较困难解释比较困难 常被误用为标准常被误用为标准 2021-6-30 商数商数 教育商数教育商数 EQ = (教育年龄教育年龄(EA)/ 实际年龄实际年龄(CA)*100 有时意义不明确有时意义不明确(EQ=0) 课程开设课程开设 2021-6-30 成就商数成就商数AQ AQ = (EQ / IQ) *100 可以评价学生,也可以评价老师可以评价学生,也可以评价老师 智商和学业成就中等

47、程度相关智商和学业成就中等程度相关 2021-6-30 百分等级,百分等级,Z分数等分数等 2021-6-30 标准参照测验标准参照测验 标准参照测验:又称目标参照测验,当标准参照测验:又称目标参照测验,当 一个测验是以某一明确界定的内容范围一个测验是以某一明确界定的内容范围 为基础编制而成,并且其分数是参照该为基础编制而成,并且其分数是参照该 内容范围所要求的绝对标准进行解释。内容范围所要求的绝对标准进行解释。 作用:了解个体在所规定的测量内容上作用:了解个体在所规定的测量内容上 的行为水平,因此其出发点是个体本身的行为水平,因此其出发点是个体本身 的绝对水平,而不再是个体间的水平差的绝对水

48、平,而不再是个体间的水平差 异。异。 2021-6-30 标准参照测验的题目分析标准参照测验的题目分析 内容范围的确定:双向细目表内容范围的确定:双向细目表 内容效度分析:专家评定内容效度分析:专家评定 难度、区分度分析:预测试难度、区分度分析:预测试 前测前测-后测后测 已接受教学组已接受教学组-未接受教学组未接受教学组 对照组对照组 2021-6-30 难度分析:通过率,大多数情况下作为区分度难度分析:通过率,大多数情况下作为区分度 分析的基础分析的基础 区分度分析:区分度分析: 难度差值难度差值 掌握组掌握组-未掌握组鉴别指数未掌握组鉴别指数D = PA PB 个人获得指数个人获得指数D

49、IG:前测中错误回答某项:前测中错误回答某项 目而在后测中能够正确回答的被试人数比例目而在后测中能够正确回答的被试人数比例 相关系数相关系数 2021-6-30 标准参照测验的信度与效度标准参照测验的信度与效度 分类一致性信度:考察被试在同一测验的两次施测中分类一致性信度:考察被试在同一测验的两次施测中 或两个复本的施测中是否被分在同一类中。或两个复本的施测中是否被分在同一类中。 P0 = (A + D) / (A + B + C + D) 2021-6-30 分数分界点的科学确定是评估测验分类分数分界点的科学确定是评估测验分类 一致性的前提,报告标准参照测验的分一致性的前提,报告标准参照测验

50、的分 类一致性信度时,必须同时提供测验的类一致性信度时,必须同时提供测验的 分数分界点,以及测验长度等资料。分数分界点,以及测验长度等资料。 2021-6-30 方差分析法:荷伊特信度方差分析法:荷伊特信度 MS人:被试均方,人:被试均方,MS人、题:交互作人、题:交互作 用用 2021-6-30 内容效度内容效度 命题细目表命题细目表 专家评定专家评定 效标关联效度效标关联效度 决策效度(预测源测验,效标测验)决策效度(预测源测验,效标测验) 结构效度目前关注不多结构效度目前关注不多 2021-6-30 标准参照测验的分数解释标准参照测验的分数解释 如何确定分界点:如何确定分界点: 专家判定

51、法专家判定法 Nedelsky方法:由专家来判断处于临界水平的被试方法:由专家来判断处于临界水平的被试 在每一题上有能力排除的错误选择项,从而计算其正在每一题上有能力排除的错误选择项,从而计算其正 确回答的可能性,再求出每一题上正确回答的可能性确回答的可能性,再求出每一题上正确回答的可能性 之和,即为测验分数分界点。之和,即为测验分数分界点。 Angoff方法:由专家直接判断处于临界水平的被试方法:由专家直接判断处于临界水平的被试 在某测验的每一题目正确作答的可能性在某测验的每一题目正确作答的可能性(记为记为Pi),设每设每 一题的满分为一题的满分为Fi,则该测验的分数分界点,则该测验的分数分

52、界点 = FiPi Angoff方法在实际运用中较多。方法在实际运用中较多。 2021-6-30 效标组预测法效标组预测法 临界组法:由专家判定和选择一组正临界组法:由专家判定和选择一组正 处于临界水平的被试,将测验施测于该处于临界水平的被试,将测验施测于该 组被试,计算他们在测验上的平均成绩。组被试,计算他们在测验上的平均成绩。 (抽象、主观)(抽象、主观) 对照组法:掌握组和非掌握组原始分对照组法:掌握组和非掌握组原始分 数分布曲线的交叉点。数分布曲线的交叉点。 2021-6-30 心理测验理论的新发展心理测验理论的新发展 项目反映理论项目反映理论 概化理论概化理论 2021-6-30 经

53、典测验理论的局限经典测验理论的局限 信度估计精度不高(真分数方差和误差信度估计精度不高(真分数方差和误差 分数方差不可知,严格平行测验不存在)分数方差不可知,严格平行测验不存在) 误差指标笼统单一误差指标笼统单一SE = 各种参数估计对样本依赖太大各种参数估计对样本依赖太大 指标之间配套较差(试题难度、被试水指标之间配套较差(试题难度、被试水 平参照系不同)平参照系不同) xxx rS1 2021-6-30 项目反应理论项目反应理论 潜在特质理论:心理特质的物理、生理潜在特质理论:心理特质的物理、生理 属性不明,只能借助可观察的间接变量属性不明,只能借助可观察的间接变量 来鉴别、定义、探查。来

54、鉴别、定义、探查。 潜在特质空间:对于某一特殊行为的发潜在特质空间:对于某一特殊行为的发 展起作用的所有潜在特质的集合。展起作用的所有潜在特质的集合。 心理测量学者首先关心的是查明潜在特心理测量学者首先关心的是查明潜在特 质空间的维度,查明各维特质在决定人质空间的维度,查明各维特质在决定人 的行为时所作的贡献的大小。的行为时所作的贡献的大小。 2021-6-30 题目题目总分回归与项目特征曲线总分回归与项目特征曲线 人们提出用能稳定反映被试水平的潜在人们提出用能稳定反映被试水平的潜在 特质变量替代卷面总分作为回归曲线的特质变量替代卷面总分作为回归曲线的 自变量,这自变量,这 样的回归曲线被称作

55、为项目样的回归曲线被称作为项目 特征曲线特征曲线(Item Characteristic Curve,简,简 称为称为ICC),记作为,记作为P()。)。 项目特征曲线是一条中心对称的项目特征曲线是一条中心对称的S型曲线。型曲线。 2021-6-30 拟合:拟合: 项目特征函数:正态卵形曲线,项目特征函数:正态卵形曲线,Logistic 函数。函数。 2021-6-30 决定决定S型曲线走向有三个参数:型曲线走向有三个参数:a、b、c 的范围从负无穷到正无穷,的范围从负无穷到正无穷,P()渐进于渐进于1,习惯,习惯 上上采用标准采用标准Z分数形式。分数形式。 c:伪机遇水平参数,相当于:伪机遇

56、水平参数,相当于CTT里的猜测参数里的猜测参数 b:题目难度,:题目难度,P() = 0.5(1 + c),b值增大,曲线值增大,曲线 向右平移向右平移 a:题目区分度,陡峭参数,是曲线拐点处切线:题目区分度,陡峭参数,是曲线拐点处切线 斜率的函数值。若记过拐点的切线夹角为斜率的函数值。若记过拐点的切线夹角为A,则,则 a = tgA2 2021-6-30 模型参数估计:多用计算机模型参数估计:多用计算机 2021-6-30 优点:优点: 题目参数跨群体不变(建设题库)题目参数跨群体不变(建设题库) 潜在特质量表的可选择性(测验等值)潜在特质量表的可选择性(测验等值) 参数设计科学参数设计科学

57、 引进了具有可加性的信息函数引进了具有可加性的信息函数 应用:题库建设,编制常模参照性测验,应用:题库建设,编制常模参照性测验, 标准参照性测验,计算机自适应测验标准参照性测验,计算机自适应测验 2021-6-30 概化理论概化理论 分数方差测量学:测验误差的来源多种多样,分数方差测量学:测验误差的来源多种多样, 各种误差在误差总量中所占的比也不相同。各种误差在误差总量中所占的比也不相同。 测验情境关系:在不同的测验情境关系下,测测验情境关系:在不同的测验情境关系下,测 量误差的结构不同,误差量也不同。由此测验量误差的结构不同,误差量也不同。由此测验 编制者可以通过改变测验情境关系达到改善测编

58、制者可以通过改变测验情境关系达到改善测 量,降低测量误差的目的。概化理论认为,研量,降低测量误差的目的。概化理论认为,研 究测量必须先研究测验情境关系。究测量必须先研究测验情境关系。 2021-6-30 测验情境关系是由一个测量目标和若干测验情境关系是由一个测量目标和若干 个测量侧面构成的。个测量侧面构成的。 测量目标:测量者希望通过测量用测量测量目标:测量者希望通过测量用测量 数据描绘的那些实体。数据描绘的那些实体。 测量侧面:除了测量目标方差,其余的测量侧面:除了测量目标方差,其余的 都是误差方差,这些误差的来源都称作都是误差方差,这些误差的来源都称作 为测量侧面。为测量侧面。 2021-

59、6-30 任何测量都是依赖于特定的测验情境关任何测量都是依赖于特定的测验情境关 系的,测验情境关系中的测量目标、测系的,测验情境关系中的测量目标、测 量侧面、测量侧面的水平都是会变化的,量侧面、测量侧面的水平都是会变化的, 它们的变化会引起测验误差的来源、测它们的变化会引起测验误差的来源、测 验误差的大小、真分数的种类以及测验验误差的大小、真分数的种类以及测验 信度的变化,同时测验分数的解释范围信度的变化,同时测验分数的解释范围 也发生变化。也发生变化。 2021-6-30 测验施测之前必须进行测验设计。目标测验施测之前必须进行测验设计。目标 的界定,测量侧面的选择,各侧面水平的界定,测量侧面

60、的选择,各侧面水平 的界定。的界定。 2021-6-30 数据采集方法数据采集方法 交叉采集:所有测量目标在所有测量侧面的所有水平交叉采集:所有测量目标在所有测量侧面的所有水平 上均被测量,信息最丰富。上均被测量,信息最丰富。 嵌套采集:某个侧面的各个水平分别被包含在另一个嵌套采集:某个侧面的各个水平分别被包含在另一个 侧面的各个水平之中,最简单。侧面的各个水平之中,最简单。 混合采集:兼有两种方法混合采集:兼有两种方法 测量的侧面越多,测量的水平数越多,对测验的分析测量的侧面越多,测量的水平数越多,对测验的分析 越完善,但是后续统计分析越困难越完善,但是后续统计分析越困难 2021-6-30

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论