心理测量学(基础知识)PPT课件.ppt

上传人：优*** IP属地：广东上传时间：2020-01-07 格式：PPT 页数：149 大小：3.44MB 积分：88 举报 版权申诉

已阅读5页，还剩144页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1 心理测量学基础知识部分心理咨询师培训课程 1 7 2020 2 上篇什么是心理测量学心理测量起于行为主义盛行的时代人的心理在相当程度上被看成是与一般动物的心理活动有同样的本质所以是可以操控和测量的但是我们今天看到隐秘深邃有限而又无限社会文化使得人类个体的行为远离动物行为的刻板模式更具有随机性而似乎不可确定还是可以测量的吗是的可以言必由衷行必有因言与行提供了人类心灵评估的标尺基于此心理测量依然成为当代心理学工作者的有效技术了返回首页 1 7 2020 3 目录第一节概述第二节心理测验的常模第三节心理测验的信度第四节心理测验的效度第五节心理测验的项目分析第六节心理测验的编制程序第七节心理测验的使用退出 1 7 2020 4 第一节心理测量学概述心理测量学是心理学的基本方法学课程之一它主要讨论如何借助于标准化的心理测量工具心理测验对个体的心理特征或心理状态进行评估并将其数量化的过程因此它基本的和重点的内容在于心理测验的编制方法质量评估实际应用和结果解释以及经典测验的介绍和使用 1 7 2020 5 一心理测量的涵义要素与量表 1 心理测量及其构成元素事物总在不断地运动变化而其运动变化表现为多种属性在质或量上的改变这些可变的事物的属性叫变量利用一定的规则方法或工具使事物的属性数量化即确定一系列事物的属性值就叫测量其构成元素有事物即事物的属性规则数字规则则是指这一过程具有科学依据确定的程序和量化的标准数字一般具有同一性或区分性等级性或位次性等距性可加性当被测量的变量是反映心理活动的属性或特征时这种测量就叫心理测量如记忆力测量气质类型测量焦虑水平测量等 P348 1 7 2020 6 2 心理测量的基本要素测量有两个基本要素参照点和单位其中参照点是测量过程计算量的起点包括绝对和相对参照点绝对参照点就是绝对零点相对参照点则根据情境来人为规定也叫相对零点单位是测量中的等值单元它必须具备两个条件有确定的意义有相同的价值就心理测量来说第一测量中几乎没有绝对零点大多是以相对零点来计算的第二测量中很少有相等单位所以在对测量值进行解释时更多看其相对意义或将测量结果等值转换形成相等单位当然心理测量常以行为测量来完成而行为测量中是可以有绝对零点和相等单位的如学习能力无绝对零点但考试成绩有零分 P349 1 7 2020 7 3 测量量表及其种类如将事物某一属性的可能取值全部列出并按其相对位置排列就构成了一个测量标尺这一标尺就叫测量量表 measurescale 按照测量量表是否具有绝对零点相等单位以及测量所得数值的对比关系我们可以将测量量表划分为四种 1 命名量表也叫称名量表 2 顺序量表也叫等级量表 3 等距量表 4 等比量表这里需要注意 1 各种量表值的意义 2 各种量表的量化水平 3 各种量表测量值允许的运算加减乘除 4 心理测量大多是在顺序量表上进行的 P349 1 7 2020 8 能够用来完成心理测量的标准化工具或程序叫心理测验也叫心理量表定义心理学家依据一定心理学理论和系统观察取样而精心编制的一系列刺激项目及其标准化形式就叫心理测验心理测量就是心理测验的使用过程它是收集个体对这一系列刺激项目的反应资料进而对其心理特征能力及其他心理结构进行评定的过程所以从某种意义上说心理测量就是从人的众多相关行为中进行取样然后由这一行为样本推断其心理品质或心理状态二心理测验的基本概念 1 什么叫做心理测验 P350 1 7 2020 9 为理解心理测验再强调三点第一心理测验所提供的是一系列刺激项目借此收集被试对这些刺激的反应资料所以心理测验实际上是进行行为取样的过程为使收集来的行为资料意义较确定测验项目应具体直接语义单一尽量不使用含糊抽象和有较大不确定性的问题第二测验不需要涉及某类行为的所有方面而要有所选择即要进行行为取样选取那些能有效反映所想要测量的心理特征或倾向第三测验应是标准化的即其编制施用评分和结果解释都必须按照系统程序和科学化的规则来进行 P350 1 7 2020 10 心理测验的三要素第一行为样组心理测量是通过个体一组相关的行为测量间接完成的所以其成功与否或准确性高低取决于心理测验中的行为取样的有效性第二标准化心理测量更看重个体间测量结果的比较关系为了使得测量结果具有可比性心理测验必须标准化第三客观性客观性是指测量结果较少受到主观的其他偶然因素影响而获得可靠结果进行良好的行为取样和进行标准化都是为了保证测量结果的客观性 P350 1 7 2020 11 心理测验的特点决定了心理测量的性质第一因为心理测验提供的是一个刺激序列使用测验所获得的是人对这一刺激系列的反应资料然后再推断其内在的心理特质所以心理测量具有间接性第二针对测验的刺激项目我们获得的主要是被试对刺激的反应倾向或反应强度不具有绝对零点和绝对意义只具有相对意义所以心理测量具有相对性第三测验中的项目选择施测程序结果的分析与解释均是经过标准化的这决定了心理测量具有相对的可靠性即具有客观性 P351 1 7 2020 12 2 心理测验的分类按测验的功能或目标不同智力测验特殊能力测验人格测验按测验材料的性质不同文字测验操作测验按测验材料的严谨程度不同客观测验投射测验按测验的方式不同个别测验团体测验按测验对被试要求的不同最高作为测验典型行为测验按测验的目的不同描述性测验诊断性测验预测性测验 P353 1 7 2020 13 三如何看待心理测验第一万能论心理测验测验完美无缺可以解决一切问题第二无用论侵犯隐私违背民主原则种族歧视宿命论等第三心理测验就是智力测验心理测验智力测验智商遗传决定论错误看法 P351 1 7 2020 14 正确看法第一心理测验是心理学研究和实际工作中的有效工具可以帮助人们收集有关人的心理特征心理状态的资料获得对人的心理活动规律性的认知和进行科学决策第二心理测验作为研究方法和测量工具尚不完善其使用中会带来系统的和随机的误差所以可信但不能全信可靠但不是绝对可靠的无用论和万能论都是错误的第三心理测验不等于智力测验更不能说成是遗传决定论 P351 1 7 2020 15 四心理测验在心理咨询中的应用 1 心理测验与心理咨询的关系心理测验对心理咨询的影响 1 提供关于个体心理特质心理状态心理发展的客观资料为教育心理咨询发展预测咨询职业指导提供依据 2 作为诊断甄别与疗效评估的工具使心理咨询具有更高的操作性针对性和有效性 3 巧妙使用可以作为心理咨询与治疗的手段之一达到意想不到的效果心理咨询对心理测验的影响 1 心理咨询与治疗实践的需要直接刺激和推动了心理测验的发展 2 心理咨询与治疗过程获得的资料丰富和推动了心理学理论和测验技术的完善与发展 P355 1 7 2020 16 2 我国心理咨询中运用较多的心理测验 1 智力测验比奈智力测验韦克斯勒智力测验瑞文标准推理测验等测查智力发展水平或进行智障诊断 2 人格测验艾森克人格问卷 EPQ 卡特尔16种人格因素问卷 16PF 明尼苏达多项人格调查表 MMPI 等这些测验可以达到了解诊断和预测的目的 3 心理评定量表精神病评定量表躁狂状态评定量表抑郁量表恐怖量表等这些测验主要用来进行临床诊断和疗效评估 P355 1 7 2020 17 五心理测验的发展简史 1 现代心理测验的开始 1 英国的高尔顿 F Galton 受达尔文进化论的影响最早关注个体气质特点与智能差异即个性差异为了研究差异的遗传性设计了差异测量的方法这可被看作是心理测验的开端高尔顿提出相关的概念并由他的学生皮尔逊 K Pearson 发展出积差相关为心理测验奠定了统计学基础使心理测验的信度效度评估和进行因素分析成为可能其实际测量集中在1884后的6年波林在测验领域 19世纪80年代是高尔顿的10年 90年代是卡特尔的10年 20世纪头10年则是比内的10年 P357 1 7 2020 18 2 心理测验的概念和标准化思想的提出美国著名心理学家卡特尔 JamesM Cattell 于1890年在心理杂志上发表心理测验与测量首次正式提出心理测验 mentaltest 的概念并强调了心理测验标准化制订常模的重要性 P357 1 7 2020 19 3 世界上第一个正式的心理测验 1904年法国公共教育部成立了一个专门研究学习落后儿童教育方法的委员会比奈 A Binet 成为该委员会成员他开始着手制订有效方法来甄别学校中那些学习成绩差者哪些是由于智力落后造成的在西蒙 T Simon 医生协助下比奈于次年发表诊断异常儿童智力的新方法公布一个由30个项目组成的粗略量表这就是第一个正式的智力测验被称为比奈西蒙智力测验比内在1908年发表修订版测验时第一次使用了心理年龄 mentalage 简称MA 的概念 P358 1 7 2020 20 比奈智力量表后传到美国经斯坦福大学的推孟 Terman 教授修订于1916年发表了被广泛使用的智力测验即斯坦福比奈智力量表该量表第一次提出了智力商数的概念简称智商 intelligenceratio 简称IQ 比内的主要工作从1898年发表人格心理学中的测量提出许多测验开始直至1911年去世去世当年发表了他的智力测验的第二次修订版 P358 1 7 2020 21 2 现代心理测验的发展 1 操作测验的发展比奈西蒙量表以言语测验为主制约了对整体智力的测验和测验向某些人群的推广于是出现操作性测验 2 团体智力测验的发展第一次世界大战之前主要是属于个人测验后因战争需要团体智力测验迅速发展 3 能力倾向测验的发展 20世纪30年代因素分析技术使智力结构理论迅速发展促进了智力测验特别是能力倾向测验的发展 4 人格测验的发展 20世纪40年代由于社会动荡人格障碍成为社会生活中的突出问题这推动了人格理论的繁荣和发展也进而推动了人格测验的发展 P358 1 7 2020 22 3 现代心理测验在中国的发展在20世纪二三十年代我国早期心理学家进行了比奈智力量表的引进和修订工作陈鹤琴等著名心理学家进行了大量教育心理的测验和研究工作后因抗战爆发测验工作处于停滞建国后的最初几年心理测验也得到发展但后因学习苏联批判儿童学连带儿童学的研究方法心理测验也受到批判进入20世纪80年代后我国的心理测验得到顺利发展主要进行了智力与人格量表的引进和修订近年主要致力于测验的本土化工作编制适合于我国文化背景的智力测验适应行为量表等 P358 1 7 2020 23 1 用心理量表将心理现象数量化的方法是 A 个案法B 会谈法C 观察法D 测量法2 测量的二要素是 A 行为样组B 参照点C 客观性D 标准化E 单位3 测量结果可以进行加减乘除运算的量表是 A 命名量表B 顺序量表C 等距量表D 等比量表4 心理测验的要素是 A 行为样组B 参照点C 客观性D 标准化E 单位5 心理测验或心理测量的性质包括 A 神秘性B 间接性C 准确性D 客观性E 相对性返回目录本节学习检测题 1 7 2020 24 6 按测验的功能或目标分类心理测验包括 A 个人测验B 智力测验C 文字测验D 特殊能力测验E 人格测验7 下列有关心理测验性质的描述哪项是正确的 A 心理测验可以直接反映心理品质的量B 心理测验分数是心理品质的相对估计C 心理测验分数是绝对客观的没有主观因素参与D 如果两个人的测验分数相等那么他们的心理品质也完全相同8 根据测验目的可将心理测验划分为预测性诊断性和等形式 A 文字性B 非文字性C 计划性D 描述性9 我国心理门诊运用较多的心理测验主要有 A 智力测验B 管理能力测验C 人格测验D 心理评定量表E 团体智力测验返回目录 1 7 2020 25 10 最早关注个别差异测量并提出相关概念的学者是 A 高尔顿B 卡特尔C 比内D 推孟11 最早提出心理测验概念并强调要建立常模的学者是 A 高尔顿B 卡特尔C 比内D 推孟12 完成了第一个正式心理测验编制的学者是 A 高尔顿B 卡特尔C 比内D 推孟13 最早使用智力商数概念的学者是 A 高尔顿B 卡特尔C 比内D 推孟14 在比西测验问世后心理测验的主要发展为 A 操作测验的发展B 团体测验的发展C 能力倾向测验的发展D 人格测验的发展返回目录 1 7 2020 26 第二节测验的常模常模就是常定模具是衡量被试分数相对高低的固定对照模板它由原始分与导出分组成实际上就是测验所得原始分与在相应人群中该分排位的等级的对照表导出分也叫常模分是根据常模样本施测的分数计算出来的然后就成为评估被试测验分数的标准或基础导出分是具有参照点和单位的一个意义明显的测验量表是一个排位值当被试参加测验得到了原始分数之后与常模对照即可得到排位分一常模与常模分数 1 7 2020 27 二常模团体及其测量分数的转换 1 什么叫做常模团体常模团体是具有某种共同特征的人组成的一个群体或者是该群体的一个代表性样本确定常模团体的方法是先由测验将要施测的对象确定一般总体然后根据常模拟适用的范围确定目标总体再从目标总体中抽取一代表性样本就形成了一个常模团体就一个测验可以根据被试特征的不同选择出多个不同的常模团体制订出多个常模以适用于对不同被试的测量与评估一常模团体 P360 1 7 2020 28 2 常模团体的条件适合于选用的常模团体必须符合下列条件 1 所测群体的构成必须是界定明确的 2 常模团体必须是所测群体的代表性样本以保证分数的分布特征与目标总体一致 3 样本大小要适当样本大小的关键是看其是否具有代表性总体小只有几十人则需100 的样本总体大样本也要大一般不少于30或100人全国性常模一般应有2000 3000人为宜 4 具有时空的新近性 P360 1 7 2020 29 3 常模团体的取样方法取样就是从目标总体中抽取有代表性的样本其方法包括概率性抽样和非概率性抽样两类具体做法有 1 简单随机抽样 2 系统随机抽样 3 分组抽样 4 分层抽样 5 整群随机抽样 P361 1 7 2020 30 4 常模团体的抽样误差略我们期望常模团体能完全代表总体即常模团体测验得分的平均分及其分布状态与所在总体完全重合但实际上很难做到在抽样过程中会产生误差当这种误差一旦出现就会成为一个常模中的系统误差所以有必要对该误差大小进行估计以便能估计出使用这个常模来评定被试成绩时可能产生的误差范围统计学使用标准误来估计抽样误差它与被试异质性成正比与样本容量的平方根成反比即 1 7 2020 31 试比较下列两组数据 1 7 2020 32 二常模团体分数的转换常模团体的被试均按标准程序参加测验就可以得到每个被试的测验分数将这些分数按大小顺序排列就可以得到一个分数分布表一系列排位等级由此可确定各种等级位数和标准分数百分等级百分点百分位数十分位数四分位数标准分等有了上述排位值或标准分就可以找到某一被试测验分数的相对排位这种排位值就是常模分数 P361 1 7 2020 33 返回目录 1 7 2020 34 三常模的类型 1 发展常模年龄量表 1 发展顺序量表发展顺序量表就是对正常儿童样本的心理或行为能力的发展顺序进行观测并制订出各种发展水平与年龄的对照表这种对照表就是发展顺序量表它可以提供给人们的是关于各年龄正常儿童所具有的能力或行为方式它是最直观的发展常模最早的范例是葛塞尔发展顺序量表 P363 1 7 2020 35 葛塞尔发展程序表葛塞尔发展程序表是按月份显示儿童在运动水平适应性语言社会性四方面大致的发展水平他强调儿童发展的规律性顺序性具体如 4周能控制眼睛运动去追随一个对象 16周能使头保持平衡 28周能用手抓握东西并摆玩它 40周能控制躯干坐立或爬行 52周能控制腿脚运动站立或行走 P363 1 7 2020 36 皮亚杰关于儿童发展的研究皮亚杰的研究着重于从婴儿到十多岁儿童认知过程的发展尤其注重某些特殊概念的形成其中最著名的工作就是对守恒概念的研究他发现儿童不同时期出现不同的守恒概念 5岁时出现质量守恒概念 6岁时出现重量守恒概念 7岁时出现容量守恒概念 P363 1 7 2020 37 2 智力年龄比奈西蒙智力测验最先使用了智力年龄的概念这个量表实际上是一个智力发展的年龄量表根据儿童所能完成的题目处在哪一年龄就把这一年龄称为他的智力年龄简称智龄 IA 在吴天敏修订的比奈智力量表中每个年龄有六个题目所以每完成一个题目相当于智龄两个月这些题目的难度是呈梯级增加的这样可以根据被试完成的题数确定其智龄 P363 1 7 2020 38 3 年级当量年级当量就是年级量表测验结果说明被试的能力或学绩达到了哪一年级的水平年级量表的单位通常为10个月 4 5的年级当量代表的是第4年级中的第5个月水平或说中间水平而不是指4 5年级的平均水平 7 3代表的是7年级中的第3个月水平 P364 1 7 2020 39 2 百分位常模百分位常模包括百分等级和百分点四分位数十分位数未分组资料的百分等级百分点也叫百分位数计算 P364 1 7 2020 40 3 标准分常模标准分常模是将原始分数与平均数的距离以标准差为单位表示出来的量表常见的标准分数有 z分数 Z分数 T分数标准九分数离差智商 IQ 等在线性转换中加上一个常数是为消除负数乘上一个常数是为了去掉小数点如将原始分数转换为平均数为50 标准差为10的标准分则叫做T分数 T 50 10z 最早提出者是麦柯尔 P365 1 7 2020 41 非线性转换的标准分数了解标准九分是一9级的分数量表它是以5为平均数以2为标准差的一个分数量表标准十分是一10级的分数量表其以5为平均数以1 5为标准差标准二十分是一20级的分数量表其以10为平均数以3为标准差 P365 1 7 2020 42 4 智商及其意义 1 比率智商但是用比率智商反映个体的智力发展概念有缺陷首先心理年龄 MentalAge 简称MA 与实足年龄 ChronologicalAge 简称CA 并不同步增长所以比率智商不适合于年龄较大的被试其次不同年龄组儿童的比率智商分布的情况不一样所以相同的比率智商在不同年龄就具有不同意义 P366 1 7 2020 43 2 离差智商离差智商是一种以年龄组为样本计算而得标准分数并且转换成平均数为100 标准差为15的标准分数其中 X为一被试的测验分数 M为相应年龄组常模样本测验的平均分 SD为相应年龄组常模样本测验的标准差 P366 1 7 2020 44 四常模分数的表示方法 1 转换表法转换表也叫常模表一个转换表显示出一个特定的标准化样组的原始分数与其相应的等值分数百分位标准分数 T分数或者其他任何分数利用转换表可以将被试的测验分数转换为与其对应的导出分数 P368 1 7 2020 45 2 剖面图法剖面图是将测验分数的转换关系用图形表示出来从剖面图上可以很直观地看出被试在各个分测验上的表现及其相应的位置 1 7 2020 46 1 7 2020 47 1 常模团体必须是所测群体的 A 总体B 优秀分子C 随机样本D 代表性样本2 全国性常模一般常模团体应有人为宜 A 30 100B 100 500C 2000 3000D 5000以上3 最早的发展顺序量表是制订的 A 比内B 皮亚杰C 葛塞尔D 科尔伯格4 皮亚杰特别关注一些特殊概念形成的研究如概念的研究 A 数量B 守恒C 顺应D 同化5 百分位常模包括 A 百分等级B 百分点C 四分位数D 十分位数本节学习检测题 1 7 2020 48 6 小明语文分数在全班50名同学中排15名则其百分等级为 A 15 B 30 C 71 D 85 7 常见的标准分常模有 A T分数B 百分位数C 离差智商D 标准九分数8 标准T分数的平均数为50 标准差为 A 5B 10C 15D 不确定9 标准九分的平均数和标准差分别为 A 5 1B 6 1C 5 2D 6 210 标准十分的平均数和标准差分别为 A 5 1B 6 1C 5 1 5D 6 1 511 使用最广影响最大的常态化标准分数是 A T分数B 比率智商C Z分数D 离差智商 1 7 2020 49 12 16PF的量表分是 A 标准九分B 标准十分C T分数D Z分数13 比率智商是指 A 实足年龄与心理年龄之比B 心理年龄与实足年龄之比C 心理年龄与实足年龄之差D 实足年龄与心理年龄之差14 在斯坦福比内量表的发展中其主要特征是 A 测验成绩用智龄表示B 首次引用智商概念C 用离差智商代替比率智商D 用L型和M型两个等值量表15 下面哪一个是离差智商 A IQ MA CA 100B IQ MA CA 100 C IQ 100 15 X X SDD IQ 50 15 X M SD16 最简单和最基本的常模表示方法是 A 比率智商B 离差智商C 转换表D 剖面图 1 7 2020 50 第三节测验的信度分析信度是指同一被试者在不同时间内用同一测验或用另一套相等的测验重复测量所得结果的一致性程度前后测验分数一致性程度高即可信度高反之可信度低一信度的定义 P371 1 7 2020 51 信度的本质一般来说使用一个工具对个体进行测量时所得结果由两部分组成 X T E 其中 T是真分数它是稳定的值 E是随机误差它的变化是随机的如重复进行测量随机误差会造成分数起伏变化随机误差小实测分数起伏小信度较高相反随机误差大实测分数起伏大数据不稳定信度较低所以信度受随机误差而不是系统误差影响理论上讲要评估工具的信度就要对一个人反复进行测量看前后结果的稳定性但是这在很多时候是行不通的 1 7 2020 52 通常的做法是选取一个被试团体即样本使用一个工具对样本团体中的每一个体进行测量得到一组数据这一组数据的总变异方差Sx2 ST2 SE2 如果测量中没有随机误差则实测数据总方差就等于真分数方差数据完全可信如果随机误差很大真分数方差只占总方差中很小一部分数据几乎全无可信如果随机误差较小真分数占总方差的大部分则信度较高于是信度被定义为一组测量分数中真分数的方差与测验分数的总方差之比该比率也叫信度系数由公式看出随机误差引起的方差越小信度系数越接近于1 1 7 2020 53 1 7 2020 54 二信度的指标信度的定义是明确的但是在一组测量分数中真分数方差是未知的所以真分数方差与误差方差无法分离信度系数计算仍然是一句空话不过可以设想让一个被试团体接受同一种工具的两次测量因为实测分数由真分数和随机误差组成随机误差较小时实测分数主要由真分数组成而真分数在前后两次测量中是稳定的所以前后两次实测分数一致性就高具有较高的正相关反之就具有低相关甚至负相关所以两次测量结果的相关可以间接反映测量随机误差大小信度系数就是一种相关系数信度系数成为可计算的指标了 1 信度系数与信度指数 P371 1 7 2020 55 信度指数等于真分数标准差与实测分数标准差的比值所以信度系数正好等于信度指数的平方信度指数 P371 1 7 2020 56 何谓相关呢相关系数的意义是什么 1 7 2020 57 2 测量的标准误随机误差的标准差也就是标准误对于一个样本的测量来说分数的标准差一部分是反映个体真值的差异性一部分是反映随机误差的起伏变化性即误差的标准差根据前面的信度公式可以推导出 SE越大 rxx就越小反之 rxx就越大所以标准误也是一种信度指标 P371 1 7 2020 58 三信度评估的方法 1 重测信度 test retestreliabllity 又称稳定性系数使用同一测验在其他条件相同的情况下对同一组被试者前后施测两次测验求两次得分间的相关系数一般是2 4周较宜间隔时间最好不超过6个月 P372 1 7 2020 59 2 复本信度 alternate formreliability 以两个等值但题目不同的测验复本来测量同一群体然后求得被试者在两个测验上得分的相关系数复本信度反映的是测验在内容上的等值性故又称等值性系数某种意义上它更像效度 P372 1 7 2020 60 3 内部一致性信度 1 分半信度 split halfreliability 这个相关系数就代表了两半测验内容取样的一致程度式中为rhh为一半分数的相关系数 rXX为测验在原长度时的信度估计值 P373 1 7 2020 61 2 同质性信度 homogeneityreliability 代表测验内部所有题目间的一致性如果各项目测量同一心理特质则项目间得分应有显著的正相关这时内部一致性较高信度较高如果项目间出现低相关或负相关则内部一致性差信度不高当测验包含多个分测验时则应首先计算各分测验的同质性信度再计算全量表的同质性信度对二项记分测验使用库德理查逊公式计算同质信度对于多等级记分的测验计算克伦巴赫系数来估算信度大小对于项目编排时专门进行反向记分处理的项目要在计算同质性信度之前对记分进行反向调整 P373 1 7 2020 62 4 评分者信度随机抽取若干份测卷由两位评分者按评分标准分别给分然后根据每份测验卷的两个分数计算相关即得评分者信度一般要求在成对的受过训练的评分者之间评分一致性要达到0 90以上才认为评分是可信的当评分者人数达到三人以上时通过计算肯德尔和谐系数来估价评分者信度 P373 1 7 2020 63 四信度与测验分数的解释 1 解释实测得分与真分数的相关信度系数反映了实测分数变化与真分数变化的一致性程度当rxx 1 00时二者完全一致实测数据的变异量方差全部是由于真分数不同引起的当rxx 0 00时则说明实测分数的变异量全部是由随机误差起伏变化引起的实测数据变化没能反映真分数不同的任何信息当rxx 0 90 说明实测数据变化的90 都是由真分数不同引起的实测分数反映了真分数大部分的变化信息具有高的可信度所以信度系数也反映了测量的随机误差比例 P373 1 7 2020 64 在根据信度水平决定是否采用某一测验时需要重点考虑测验的目标和功用一般能力测验和成就测验信度应在0 90以上人格态度兴趣价值观等测验信度应在0 80以上另需注意 1 信度系数低于0 70时测验不能用于对人的评价和预测也不能用于作团体间的比较达到0 70以上可用于作团体比较达到0 85以上测验可用于对个人的评价和预测 2 新编测验的信度应高于同类测验或相似测验 2 确定测验的可接受程度 P374 1 7 2020 65 3 解释个人分数的意义两个作用其一是估计真实分数的范围其二是了解实得分数再测时可能的变化情形 P374 1 7 2020 66 五信度的影响因素信度常用信度系数来表示信度系数就是相关系数相关系数的获得需要一个被试样本或叫样本团体 1 样本团体异质性的影响当样本异质性高时计算的信度系数会较大可能会高估测验的信度反之计算的信度系数较小可能会低估测验信度 2 样本团体平均能力水平的影响样本平均能力水平的高低也会影响分数的分布所以也会影响信度计算一般要求在给出信度系数时也要描述相应的测量样本 1 被试样本特征 P375 1 7 2020 67 2 测验的长度测验的长度即测验的项目数会影响测验的信度 1 测验越长测验的测题取样或内容取样越具有代表性 2 测验越长被试的猜测因素对结果的影响就越小但是增加测验长度的效果是遵循报酬递减率原则的这里可以利用斯皮尔曼布朗公式的导出公式了解测验长度与信度系数的关系要使测验的信度从原来的rxx提高到rkk 则测验的长度需要增加到原来的K倍 P376 1 7 2020 68 3 测验的难度对于能力与成就测验来说存在难度问题一般来说中等难度的测验计算出来的信度系数较大太难和太容易都会使信度较低对于简答题难度为0 50 求得的信度较高对于选择题因有猜测成分所以难度应适当提高 P376 1 7 2020 69 4 时间间隔对于重测信度和不同时测量的复本信度来说存在时间间隔问题时间间隔越短计算得到的信度系数越大时间间隔越长信度系数越低一般是2 4周较宜间隔时间最好不超过6个月 P376 1 7 2020 70 1 衡量测量结果一致性程度的指标是 A 区分度B 难度C 信度D 效度2 下列可作为信度指标的是 A 信度系数B 信度指数C 标准差D 标准误3 重测信度反映的是测验在上的稳定性 A 内容B 时间C 空间D 误差4 复本信度反映的是两个测验在上的一致性 A 内容B 时间C 空间D 误差5 重测信度的计算中重测的时距一般最多不要超过 A 2周B 4周C 4月D 6月本节学习检测题 1 7 2020 71 6 内部一致性信度主要包括两种 A 分半信度和重测信度B 重测信度和复本信度C 复本信度和同质性信度D 分半信度和同质性信度7 二级评分测验同质信度可用以下方法计算 A 分半信度B 库德理查逊公式法C 系数法D 重测信度法8 计算的分半信度为0 80 那么整个测验的信度大约为 A 0 80B 0 85C 0 89D 0 959 用库德理查逊公式计算信度的方法适用于 A 多等级选择测验B 判断题测验C 多项选择和判断题测验D 简答题10 克伦巴赫系数法适合于测验的信度计算 A 多等级选择测验B 判断题测验C 多项选择题测验D 简答题 1 7 2020 72 11 评估评分者之间一致性的信度是 A 复本信度B 肯德尔和谐系数C 同质信度D 分半信度12 一个测验选用哪种方法计算信度主要是看 A 哪种因素导致更大的误差B 哪种因素导致的误差最小C 哪种方法更简单D 对哪种方法更熟练13 要取得较高的同质信度测验内部项目间得分要有 A 较高正相关B 较高负相关C 较低正相关D 较低负相关14 当一个测验的信度系数为0 85时就可以说 A 真分数变异占总变异的85 B 真分数变异占总变异的15 C 随机误差变异占总变异的85 D 随机误差变异占总变异的15 15 一般的能力测验和成就测验的信度系数应达到以上 A 0 70B 0 80C 0 90D 0 95 1 7 2020 73 16 影响信度的因素包括 A 样本特征B 测验长度C 测验难度D 时间间隔17 样本团体同质性高则计算的信度系数 A 会低估测验的信度B 会高估测验的信度C 会偏低D 会偏高18 当希望以增加测验长度的方法使其一50题组成的测验的信度系数从0 85提高到0 90 那么测验长度要增加题 A 30B 60C 80D 9019 受时间间隔影响的信度计算是 A 重测信度B 分半信度C 同质信度D 克伦巴赫系数 1 7 2020 74 第四节测验的效度一效度的概念 1 什么叫做效度在心理测验中效度是指一个测验所能测量到它想要测量的心理特质或倾向的程度也就是它对测量目标测量的准确性测量分数可分解为真分数和随机误差真分数可以再分解为两部分反映测量目标水平的分数和系统误差即与测量目标有关的部分和与测量目标无关的部分效度是在一组测量分数中与测量目标有关部分的方差S2V与总方差S2X之比 P379 1 7 2020 2020 1 7 75 76 2 效度的性质 1 效度具有相对性任何测验都是针对一定目标编制的用于该目标就会有效用于其他目标就可能无效对某一总体有效的测验对于其他总体未必有效某一心理学家认为有效的测验其他心理学家可能认为无效 2 效度具有连续性说明一测验效度也是用相关系数表示有高低之分非有和无之差二是效度是针对测量结果来说的 P379 1 7 2020 77 3 效度与信度的关系 1 信度是效度的必要条件但不是充分条件 2 效度总会受到信度的制约它不会超过信度的平方根 P380 1 7 2020 78 二效度评估的方法美国心理学会在1974年所发行的教育与心理测量之标准一书中将效度分为三大类内容效度构想效度效标效度 1 内容效度 content relatedvalidity 内容效度是指测验项目在内容上的适合性即是否是所欲测量的行为领域的代表性取样要编制有高内容效度的测验就要对测量的心理特性有明确的定义并划定出相应的行为内容其次测验题目应是所界定的行为内容的代表性取样 P380 1 7 2020 79 内容效度的专家评定法专家评定是最常用的内容效度评估方法是请有关专家对测验题目与测量目标的符合性程度作出评判看测验的题目是否代表欲测的内容也可以请专家对测验项目的适合性进行定量评定专家的判断多是依赖于对内容的逻辑分析所以这种评估的效度也叫做逻辑效度 P381 1 7 2020 80 关于内容效度要注意的两个问题第二内容效度与表面效度的区分最高作为测验可以有比较高的表面效度典型行为测验则要有比较低的表面效度但两类测验都要有高的内容效度第一测验要有高的内容效度但不一定要有高的同质性 P381 1 7 2020 81 2 构想效度 1 什么叫做构想效度构想效度就是一个测验对于某一理论构想或内在心理特质假设的证实程度测量程度所以也叫做构思效度结构效度等建立构想效度的逻辑顺序基于相关专业知识和观测资料提出某一心理特质假设或某一心理结构理论假设然后根据理论或假设所可能对应的行为特点编制测验并进行施测最后对测量结果进行相关或因素分析验证其与理论假设的符合程度 P382 1 7 2020 82 2 构想效度的评估方法从测验的组成成分来分析其结构是否与理论构思一致常用因素分析方法来确定测验的结构成分当使用一个新编制的测验对目标群体施测后对测验项目进行因素分析还可以通过计算相容相关和区分相关来间接验证所编测验能够测量的是不是某一种心理特质或理论构想 P382 1 7 2020 83 3 效标效度 1 什么叫效标效度效标效度是指使用测验分数预测个体在某种情境下行为表现的准确性被预测的行为同时也就成为检验测验有效性的效标这种效度也叫实证效度根据效标资料与测验分数获得的时间不同效标效度又分为同时效度和预测效度二者差异主要在于测验的目的不同同时效度与用来诊断现状的测验有关后者与预测将来结果的测验有关 P383 1 7 2020 84 2 效标效度的评估方法相关法区分法命中率法 P384 1 7 2020 85 4 效度系数的计算方法效标效度的计算第一步取得测验分数x和效标分数y 好的效标需要具备下列条件有效的反映测验的目标具有较高的信度稳定可靠可以客观地加以测量可用数据或等级来表示测量的方法要简单省时省力经济可用 1 7 2020 86 当测验分数效标资料均为连续数据时使用积差相关当测验分数效标资料均为等级变量时使用等级相关第二步根据两种分数的性质选用适当方法计算相关系数 1 7 2020 87 三效度系数的作用预测效标效度系数的实际意义常以决定系数表示即效度的内涵为相关系数的平方它表示测验正确预测或解释的效标方差占总方差的比例如测验的效度是0 80 则测验分数能正确预测效标分数变异量的64 效度系数是根据测验分数和效标分数计算出来的相关系数所以它也反映了二者所具有的共变关系这样就可以建立二者的回归方程式以便由测验分数预测效标分数 P385 1 7 2020 88 如果用一被试的测验分数来估计他的效标分数误差会有多大呢这用标准误来估计从公式看效度系数的大小与估计的误差有关如果效度系数rxy 1 00 则估计误差等于0 通过测验分数可准确预测效标分数变化如果rxy 0 00 则以测验分数无法估计效标分数以测验分数预测效标则无异于猜测 P385 1 7 2020 89 预测效率指数据预测效标分数的标准误计算公式无关系数K的计算公式 K反映了测验分数与效标分数的无关程度它受效度系数的影响当效度系数等于1时 K 0 测验分数与效标分数有完全的对应关系当效度系数等于0 K 1 测验分数与效标分数100 的无关测验与效标分数完全无关它对效标分数没有任何预测力当效度系数等于0 90时可以计算出K 0 436 即测验分数与效标分数的无关程度是43 6 预测效率指数就是56 4 即使用该测验预测被试的效标分数较之瞎猜可以减少56 4 的误差 P386 1 7 2020 90 四效度的影响因素根据前文关于信度和效度概念的分析知道随机误差影响信度进而影响效度系统误差直接影响效度本身所以凡是会产生随机误差和系统误差的因素都会影响测验的效度 P386 1 7 2020 91 1 测验编制本身的因素测验取材的代表性长度试题类型难度区分度以及编排方式等都会影响效度为此编制要注意 1 测验材料要有应测内容具有代表性 2 尽量避免误差较大的题型如是非题 3 难度要适中具有较大的区分度 4 测验长度要恰当保证一定的题量 5 测题的排列应先易后难 P386 1 7 2020 92 2 测验施测过程中的干扰因素 1 测验实施中主试的影响如是否按标准化来实施测验与效标测量的实施的时间间隔测验环境的布置等 2 测验实施中被试的影响如被试参加测验的动机情绪态度身体状态反应定势等 P386 1 7 2020 93 3 所抽取的样本团体的特点 1 样本团体的异质性其他条件相同样本团体同质性越高分数范围越小得到的效度系数就会越低会低估测验效度反之得到的效度系数就越大可能会高估效度比如只使用经选拔后的被试组成样本团体增加了被试同质性测验得到的效度系数会较低 2 干涉因素样本团体的有些变量会影响效度测验比如被试的年龄性别受教育程度智力动机兴趣职业等特征对于同一个测验来说使用的样本团体不同得到的效度系数也会不同 P387 1 7 2020 94 4 效标的性质 1 效标与测验分数是否是线性关系 2 效标测验本身的可靠性即信度 P388 1 7 2020 95 1 效度是指测验的准确性即 A 真分数方差与总方差之比B 随机误差方差与总方差之比C 与测量目标有关的真实方差与总方差之比D 真分数方差与系统误差方差之比2 反映测验题目是否是所欲测量的行为领域的代表性取样属于 A 内容效度B 构想效度C 效标效度D 表面效度3 使用专家判断法评估的效度也叫 A 效标效度B 表面效度C 逻辑效度D 构想效度4 在下列测验中最需要降低表面效度的测验是 A 智力测验B 气质测验C 性格测验D 学绩测验本节学习检测题 1 7 2020 96 5 当效度系数等于1时被试的测验分数 A 可以准确预测其效标分数B 对效标分数没有任何的预测力C 就是效标分数D 与效标分数有最大的正相关6 影响效度的因素包括 A 测验本身B 主试因素C 被试因素D 效标的性质7 用下列样本评估中学生智力测验效度得到较大效度系数的是 A 全省中学生的代表性样本B 全省重点高中学生的代表性样本C 全省青少年的代表性样本D 全省当年高考一本上线代表性样本 1 7 2020 97 第五节项目分析一项目的难度 1 难度的定义测验项目的难易程度通常以题目的通过率为指标 2 难度的计算方法 1 二分法计分项目最简单方法就是以被试在该项目上的通过率评估难度当被试人数多时可以高分组和低分组通过率的平均数来评估 P PH PL 2 P389 P R N 100 1 7 2020 98 在有多选项的选择题中为了平衡机遇因素的影响可采用吉尔福特的难度校正公式来计算难度 Cp为校正后的通过率 P为实际得到的通过率 K为被选答案数 1 7 2020 99 2 非二分计分的项目即以被试在某一项目上得分的平均值除以该题满分再乘以100 P390 1 7 2020 100 3 难度水平的确定 1 项目难度的确定难度分析的目的在于筛选项目难度确定取决于测验的目的性质以及项目的形式一般来说 P值越接近于0 50 区别力越高为了使测验具有更大的区别力各题目难度可考虑控制在0 50 0 20 当测验用于选拔时可较多地选择难度接近于录取率的项目当测验用于筛选或诊断出少数被试则难度要比较低即P值要比较大 P390 1 7 2020 101 2 测验难度的确定整个测验的难度取决于组成项目的难度如果测验分数接近于常态分布说明整个测验的难度较为恰当如果出现明显的正偏态分布说明难度偏大可增加一些较容易的题目如果出现明显的负偏态说明难度偏小可增加一些难度较大的题目 P390 1 7 2020 102 二项目的区分度 1 项目区分度的定义项目区分度也叫鉴别力是指测验项目对被试的心理特性倾向性或发展水平的区分能力项目区分度的取值范围在 1 1之间主要是指项目得分与实际能力水平之间的相关程度相关系数越大区分度越高 P391 1 7 2020 103 2 区分度的计算方法 1 鉴别指数通常以测验总分高分组前27 和低分组后27 在一项目上通过率或得分率之差作为该项目的鉴别指数即D PH PL 美国测量专家伊贝尔 L Ebel 提出了一套项目鉴别指数的平均标准 0 40 很好0 30 0 39 良好修改后更佳0 20 0 29 尚可但需修改0 19以下差必须淘汰 P391 1 7 2020 104 2 相关法计算区分度最常用的方法是以某一项目分数与效标成绩或测验成绩总分的相关作为该项目区分度的指标相关越高表明项目越具有区分功能 P392 1 7 2020 105 3 区分度与难度的关系一般来说中等难度的项目区分度最大但是区分度和难度都是相对的有条件的较难的项目对高水平的被试区分度高较容易的项目对低水平的被试区分度高中等难度的项目对中等水平的被试区分度高测验中项目的难度分布最好也是常态分布的其中很难的和很容易的项目都较少中等难度的项目最多平均难度在0 50左右这样可以提高整个测验的鉴别力 P392 1 7 2020 106 下列公式中属于难度计算的是 A R N 100 B P PH PL 2C K

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

心理测量学(基础知识)PPT课件.ppt

文档简介

温馨提示

最新文档

评论

心理测量学(基础知识)PPT课件.ppt

文档简介

温馨提示

最新文档

评论

相关文档