心理测量学.doc_第1页
心理测量学.doc_第2页
心理测量学.doc_第3页
心理测量学.doc_第4页
心理测量学.doc_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

心理测量学21第一章 心理测量的理论基础一、心理测量的基础1、 心理测量的定义测量就是依据一定的法则,使用工具对事物的特征进行定量描述的过程。2、 测量的基本要素参照点:绝对参照点、相对参照点。单位:要有确定的意义、要有相等的价值。3、 测量的量表称名量表、顺序量表、等距量表、比率量表4、 心理测量的特征间接性:我们只能通过一个人对测验项目的反应来推断出他的心理品质。相对性:测量就是看每个人处在这个序列的什么位置上,由此测得一个人智力的高低、兴趣的大小。客观性:客观性是对一切测量的基本要求。5、 心理测量的分类按功能分能力测验、成就测验、人格测验按对象分个别测验、团体测验按形式分纸笔测验、操作测验、口头测验、电脑测验按目的分描述性测验、诊断性测验、预示性测验按要求分最高行为测验、典型行为测验按速度和难度分速度测验、难度测验按性质分构造性测验、投射性测验按解释分常模参照测验、标准参照测验按应用分教育测验、职业测验、临床测验2、 经典测量理论(CTT)(1) 心理特质的可测性1、 心理特质的特征(1) 特质是一组内部相关行为的概括,具有一定的抽象性。(2) 特质是“一种一般的神经心理系统,它可以综合不同的刺激,使人对这些刺激做出相同的反应。”(3) 特质是一个人身上比较稳定的特点。(4) 一个人的精神面貌是由多种特质分多个层次有机组合而成的。(5) 特质可以决定一个人对特定刺激的反应倾向,可以对人的行为进行某种预测。2、 可测性假设(1) 凡客观的事物都有其数量;(2) 凡有数量的东西都可以测量。3、 经典测量理论的数学模型(1) 观察分数:实测分数。(2) 真分数:反映被试某种心理品质真正水平的数值。(3) 误差分数(4) 数学模型:X=T+E4、 经典测量理论的假设公理 “一均,两相关”(1) 若一个人的某种心理品质可以用平行测验反复测量多次,则其观察分数的平均值会接近真分数。(2) 真分数与误差分数之间的相关为零。(3) 各平行测量上的误差分数之间的相关为零。5、 推生结论 “真分数,观测分数,误差”(1) 在问题的范围之内,反应个体某种心理特质水平的真分数假定是不会变的,测量的任务就是估计这一分数的大小。(2) 观察分数被假定等于真分数和误差分数之和。(X=T+E)(3) 测量误差是完全随机的,并服从均值为零的正态分布。(2) 测量的信度和效度1、 信度的定义信度即是测量结果的可靠性。(1) 信度是真分数变异与观测分数之比;(真分数变异/观测分数)(2) 信度是真分数和观测分数相关系数的平方;(2)(3) 信度是两个平性测验间的相关系数。()2、 信度的作用(1) 信度是测量过程中随机误差的反应;(2) 信度可以用来解释测验分数的意义;(3) 信度可以帮助进行不同测验分数的比较。3、 信度的估计方法名称含义使用条件重测信度用同一测验,对同一组被试前后两次施测,两次测验分数的相关系数。(皮尔逊积差相关)(跨时间一致性)心理特质必须稳定;遗忘和练习的效果基本上相互抵消;两次施测之间没有获得更多的学习和训练。(间隔时间24周,不能超过6个月)复本信度一组被试在两个平行测验上的得分的相关系数。(皮尔逊积差相关)(跨形式一致性)存在平行测验;尽量缩短间隔时间,排除记忆和练习的干扰。分半信度按正常的程序实施测验,然后将全部项目分为相等的两半,计算这两半的相关系数。只能施测一次或没有复本的情况下使用;当一个测验无法对等分半时不能用。 同质性信度内部一致性信度,指测验内部所有题目之间的一致性。(同质性)克龙巴赫系数值大说明信度高评分者信度随机抽取部分试卷,由两个或多个评分者独立按评分标准打分,然后求其间的相关。积差相关、等级相关、肯德尔W系数、卡方检验评分者要达到0.9以上,评分才是客观的。4、 注意:可以接受的信度水平是rxx0.7;团体取样异质会高估信度。 标准误=标准差5、 信度的影响因素 “三个人,三个测”(1) 被试:个体被试心理特质水平的稳定性;团体团体内部水平的离散程度和团体的平均水平。(2) 主试与评分者:施测人员不按规定施测,故意制造紧张气氛,或给学生一定的暗示,会降低测验信度。评分者若评分标准不一,也会降低测验信度。(3) 施测情境:安静、通风、设备。(4) 测验本身:测量工具是否稳定,试题取样、试题之间的同质性程度、试题难度等。(5) 两次施测的时间间隔:计算重测信度和稳定性、等值性系数时,时间间隔越短越好。6、 信度的改进方法 “三度,被试、施测、两测间隔”(1) 增加测验长度;(2) 把难度控制在中等水平;(3) 提高试题区分度;(4) 选取恰当的被试团体;(5) 间隔时间适当;(6) 严格执行施测规程。记忆方式信度的影响因素改进被试恰当选择主试评分者测验长度、难度(适中)、区分度施测严格执行施测规程两测间隔间隔时间适当1、 效度的定义一个测验或量表实际能测出其所要测的心理特质的程度。(1) 效度是一个相对的概念,是相对于一定的测量目的而言的;(2) 效度是随机误差和系统误差的综合反应;(3) 判断一个测量是否有效要从多方面搜集证据。2、 效度的估计方法名称含义确定方法用途内容效度一个测验实际测到的内容与所要测量的内容的吻合程度。逻辑分析法:1、明确所要测量的全部内容范围;2、确定每个题目所要测量的内容,编制双向细目表;3、制定评定量表。成就测验信度系数一般在0.80.9。职业测验(预测效度、内容效度)结构效度一个测验实际测到所要测量的理论结构或特质的程度。1、 测验内部寻找证据;2、 测验之间寻找证据;3、 考察测验的实证效度。智力测验人格测验实证效度效标关联效度一个测验对处于特定情境中个体的行为进行估计的有效性。效标测量的要求:有效性、可靠性、客观性、实用性。1、 相关法;(最常用)2、 区分法;3、 命中率法。各种选拔性测验临床诊断3、 效度的影响因素(1) 测验的构成:样本代表性、难度、指导语、题目标志、测验长度。(2) 测验的实施过程:不遵守指导语、出现意外干扰、计分出错。(3) 被试情况:个体的身心状态、团体是否同质。(4) 所选效标的性质:不同测验选择不同效标、效标与测验分数必须是线性关系。(5)测量的信度:效度受信度制约。4、 效度的改进方法(1) 通过标准化全面减少各种测量误差;(2) 精心编制测验量表,避免出现较大系统误差;(3) 妥善组织测验,控制随机误差;(4) 创设标准的应试情境,让被试发挥正常水平;(5) 选好正确的效标,定好恰当的效标测量。5、 信度和效度的关系(1) 信度高是效度高的必要非充分条件;(2) 效度受信度制约,信度系数的平方根是效度系数的最高限度。(对比统计学中的决定系数)(三)心理测量的误差1、 测量误差的定义测量误差是指在测量过程中由那些与测量目的无关的变化因素所产生的一种不准确或不一致的测量效应。误差可以分为两类:随机误差、系统误差。随机误差:由与测量目的无关的、偶然因素引起的、不易控制的误差。系统误差:由与测量目的无关的、恒定而有规律的效应。2、 测量误差的来源测量工具、测量对象、施测过程3、 测量误差的估计(1) 经典测量理论假定:实得分数、真分数、测量误差之间存在着线性关系。 X=T+E(2) 其他关于误差的假设: “平均、平均、独立、关系”如果一个人测量无数次,其误差之和为0,平均误差为0;误差与真分数相对独立;一个团体的平均真分数r等于该团体中所有被试实得分数的平均值X。对于一个团体来说,实得分数、真分数、测量误差之间的关系为:SX2=ST2+SE2 ST2=SV2+SI2(4) 心理测验的项目分析难度1、 难度的含义难度是指测验项目的难易程度。2、 难度的计算(1) P=R/N (P:项目难度;N:全体被试数;R:答对该项目的人数)(2) P=(PH+PL)/2 (PH:最高的27%的被试的通过率;PL:最低的27%的被试的通过率)(3) (X为所有被试在该项目上的平均分,Xmax为该项目的满分)3、 难度对测验的影响(1) 项目难度普遍较大的测验,分数分布呈现正偏态;项目难度普遍较小的测验,分数的分布呈现负偏态。一般能力测验和成就测验的平均难度在0.5左右(0.50.2)为宜。(2) 过难或过易的测验会使测验分数相对地集中在低分端或高分端,从而使分数的全距缩小。但胶南的题目对高水平的被试区分度高。区分度1、 区分度的含义区分度是指测验项目对被试心理品质水平差异的区分能力或鉴别能力。区分度的范围:【-1,1】。2、 区分度的计算(1) 项目鉴别指数法:D=PH-PL(鉴别力指数D在0.19以下时,必须淘汰)(2) 相关法(3) 方差法3、 区分度的相对性(1) 不同的计算方法,所得区分值不同;(2) 样本容量大小影响相关法区分度值的大小;(3) 分组标准影响鉴别指数;(4) 被试样本的同质性程度影响区分度值的大小。4、 区分度与难度的关系:难度越接近0.5,潜在区分度越大。3、 项目反应理论1、 单维性假设测验能够只测量被试的某一种能力,而忽略其他能力对测验结果的影响。2、 项目特征曲线(ICC)用能稳定反应被试水平的潜在特质变量代替卷面总分作为回归曲线的自变量曲线。3、 单参数模型:难度参数b。4、 双参数模型:难度参数b、区分度参数a。5、 三参数模型:难度参数b、区分度参数a、猜测参数C。6、 项目信息函数项目信息函数反应了每个项目对每个被试进行评价时所提供信息的大小。用项目信息函数计算出来的值叫项目信息量。项目信息量越大,说明进行评价时所提供信息量越大,测量误差越小。双参数模型时,特质参数与难度参数相等时,误差最小。说明题目要与能力相匹配。7、 测验信息函数把一个测验中所有的项目信息函数都累加起来,就得到了测验信息函数。测验提供的信息量越大,则该测验在评价该被试的特质水平时就越准确。8、 测验和项目信息函数有如下重要性质:1) 每个项目所提供的信息量是它所测被试特质水平的函数,因而项目及测验信息函数值均是针对某一被试特质水平来说的,随被试特质水平取值的不同而变化;2) 每个项目在某一特质水平处所能提供的信息量还受项目自身特质的影响;区分度越大、猜测可能越小,所能提供的信息量越多;3) 每个项目所提供的信息不受其他项目的影响,测验中各项目均独立地对测验总信息做贡献,项目信息函数具有可加性,测验信息函数等于所含全部项目的信息函数的和。4) 测验信息函数在某一特质水平上的值的平方根的倒数,就是该点特质水平估计值的估计标准误。4、 概化理论任何测量都处在一定的情境关系中,要从测量的情境关系中具体地考察测量工作1、 方差分量的估计第一步,把总体方差分解为测量目标主效应方差、测量侧面主效应方差、各种交互效应方差。第二步,利用样本方差估计各种效应的期望均方。2、 概化系数(1)即G系数,用相对误差估计出来的信度系数;(2)测量目标效应方差/测量目标效应方差+相对误差方差;(3)是常模参照测验的稳定性程度的度量。3、 可靠性指数(1) 即系数,用绝对误差估计出来的信度系数;(2) 测量目标效应方差/总效应方差;(3) 概化系数和可靠性指数的开方等于实得分数与真实水平之间的相关。(4) 是目标参照测验的稳定性程度的度量。4、 概化系数与可靠性指数的开方等于实得分数与真实水平之间的相关,其值越高,则测验信度就越高。5、 G研究(1) 研究者设计的测验情景关系及用一定方法采集的测验数据称为测验的观察领域,G研究在观察领域数据上进行。(2) 其目的是要定量估计观察领域中测量目标的方差以及测量侧面所产生的测量误差方差。采用的方法是方差分量分析法。6、 D研究1) 又称决策研究,是概化理论最具特色的计量分析手段。2) 目的是利用G研究的结果数据,在原设计的测验情况关系范围之内,分析比较各种可能的测验方案,分析结果,结合实施条件,根据误差方差和信度系数,优选实际测验方案。3) D研究最终提供各种测验方案下的测验估计值。在D研究中,会有两个比较优劣的误差指标:相对误差方差、绝对误差方差。第2章 心理测验及其应用1、 心理测验的编制技术1、 测验编制的基本程序(1) 确定测验目的(2) 制定编题计划(3) 编辑测验项目(4) 预测与项目分析(5) 合成测验(6) 测验的标准化(7) 鉴定测验(8) 编写测验说明书2、 命题双向细目表命题双向细目表是测验编制过程中的重要依据,相当于编题的计划清单,是包括两个维度的表格(左一列表示测验内容,第一行表示测量结果)。(1) 双向细目表可以使命题工作避免盲目性,具有计划性;(2) 使命题者明确测验的目标,提高命题的效率和质量;(3) 提高测验的内容效度。3、 题目编制的一般原则(1) 项目取样有代表性;(2) 项目取样范围同编题计划所列项目范围一致;(3) 项目难度有一定分布范围;(4) 项目的说明必须简明;(5) 题目用语力求简练、明了;(6) 初编题目数量多于最终所需数量;(7) 题目应避免涉及社会禁忌和个人隐私。4、 测题的种类固定应答型题目、自由应答型题目5、 测验标准化(1) 内容标准化。测验题目必须能测量所要测的目标。(2) 施测标准化。让所有被试都在相同的情绪条件下接受测验。(3) 评分标准化。评分的客观性。(4) 建立常模。常模能标准化地解释测验分数。6、 测验等值技术(1)含义:通过对考核同一心理品质的多个测验形式做出测量分数系统转换,使得这些不同测验形式的测验分数之间有可比性。(2)条件:同质性、等信性、公平性、可递推性、对称性、样本不变性。(3)计算方法:等百分位等值、线性等值。(4)等值结果的表示方法:列表法、公式法、图示法。(5)锚测验:测验等值设计中,有时采用一组测验来关联两个待等值的测验,以寻找两形式的等值关系,这组测验就是锚测验。7、测验等值的条件:1)同质性:被等值的不同测验形式所测的必须是同一心理品质,且内容和范围基本相同;2)等信性:被等值的不同测验形式,必须有相等的信度。3)公平性:考生参加不同测验形式中的任一测试,等之后的结果必须是相同的。4)可递推性:测验X与测验Y等值、测验Y与测验Z等值测验X与测验Z等值。5)对称性:从等值的两个测验的任何一个出发,得到的等值结果都应该是相等的。6)样本不变性:两测验的转换关系是内在的,不随所使用样本的变化而变化。2、 心理测验的施测1、 测验的设计测验的设计是指对测验的结构和内容、进行测验可达到的目的、测验结果可提供的信息、测验的适用范围、测验的心理测量学指标等进行总体设计。2、 施测的程序和步骤(1) 施测前的准备工作:准备好测验材料;熟练掌握施测手续;熟记测验指导语并能用口语清楚流利的说出来。(2) 指导语:主要作用是使受试者按正确地形式对题目做出反应;测试的主持者和指导语都应保持中立。(3) 测验情景:测验场地。(4) 测验焦虑:会影响结果的真实性。(5) 与受测者建立良好的协调关系:以保证他能按指导语行事。(6) 评分技术:及时记录、制作答案、进行比较。(7) 分数的解释(12年考题)主试充分了解测验的性质和功能;对导致测验结果原因的解释应慎重,防止片面极端;必须充分估计测验常模和效度的局限性,一定要从相近的团体、最匹配的情境中获得资料;解释分数应参考其他资料;以“一段分数”来解释;不同分数不能直接比较。3、 测验常模1、 常模根据标准化样本的测验分数,经过统计处理而建立起来的具有参照点和单位的测验量表;是关于原始分数、导出分数和常模团体的有关具体描述。2、 常模团体含义:是具有共同特征的人组成的一个群体。确定常模团体的注意事项:(1) 群体构成的界限必须明确;(2) 样本必须具有代表性;(3) 取样过程必须详尽描述;(4) 样本大小要适当;(5) 要注意常模的时间;(6) 一般常模与特殊常模的结合。呈现常模的方法:转化表、剖析图。3、 分数的转换1) 含义:根据测验的计分标准,对照被试的反应所计算出的测验分数,叫做原始分数,它反应了被试作答的正确程度,但不能直接反映出被试之间的差异状况和被试在总体分布中的位置。在原始分数转换的基础上,按照一定的规则,经过统计处理后获得的具有一定参照点和单位且可以相互比较的分数称为导出分数,具有等值、等单位、有参照点和有意义等特点。按某种规则将原始分数转化为导出分数的过程,就是分数转换。2) 常见的导出分数有:百分等级(缺点:单位不等;只具有顺序性;是相对于特定被试团体而言的,解释时不能离开团体)。标准分数(具有复杂的统计学原理,一般人难以理解)。标准分数的变式(T分数、标准九分数、标准分数变式的其他形式)。4、 分数的合成分数合成是指,将几个分数或几个预测源组合起来,以获得一个合成分数或做总的预测;具体包括项目的组合、分数的组合和测验的组合。合成方法:(1) 临床诊断:靠知觉合成;(2) 加权求和(3) 多重回归(4) 多重划分5、 常模的编制(1) 确定有关的比较团体;(2) 对常模团体进行施测,并获得该团体成员的测验分数及分数分布;(3) 确定常模分数类型,把原始分数转化为量表分数,制作常模量表,给出抽取常模团体的书面说明、指南等。4、 标准参照测验1、 标准参照测验的定义即目标参照测验,根据某一明确界定的内容范围而缜密编制的测验,并且,被试在测验上所得结果也是根据某一明确界定的行为标准直接进行解释的。2、 标准参照测验的作用了解个体在所规定的的测量内容上的行为水平,其出发点是个体本身的绝对水平,而不再是个体间的水平差异。3、 标准参照测验的题目分析(1) 内容范围的确定:包括所欲测量特质中蕴含的全部行为。内容范围具有明确边界;每一内容范围均可分类,每类可再分为更小的类;界定结果常以命题双向细目表呈现。(2) 内容效度分析:专家评定法。(3) 难度分析:与常模参照测验一样,常以通过率表示。(4) 区分度分析:难度差值、相关系数。(5) 测验的预测:前测-后测方法;已接受教学组-未接受教学组方法;对照组方法。4、 标准参照测验的信度和效度(1) 信度:分类一致性信度、荷伊特信度。(2) 效度:内容效度、效标关联效度。5、 标准参照测验的分数解释专家评定法(Nedelsky法、Angoff法)、效标组预测法(临界组法、对照组法)五、心理测验的应用1、 心理测验在心理咨询中的应用(1) 在自我认识、人生规划咨询中的应用。(2) 在神经症、人格障碍等咨询中的应用。2、 心理测验在人事测评中的应用(1) 在人的心理特点评估中的应用。(2) 人员培训后的心理特点评估。(3) 工作人员的绩效评估。3、 测量在教育评价中的应用

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论