心理测量学知识 测量与测量量表_第1页
心理测量学知识 测量与测量量表_第2页
心理测量学知识 测量与测量量表_第3页
心理测量学知识 测量与测量量表_第4页
心理测量学知识 测量与测量量表_第5页
已阅读5页,还剩73页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

心理测量学知识,广西大学教育学院周永红博士,第一节概述第一单元测量与测量量表,一、什么是测量测量就是依据一定的法则用数字对事物加以确定。事物:测量的对象;其属性或特征;心理能力、人格特点、外显行为数字:代表某一事物或事物某一属性的量;区分性、序列性、可加性法则:测量所依据的规则和方法;称(重量)、温度计(温度)、尺子(长度)智力量表(智力水平),二、测量要素参照点:计算的起点绝对零点:重量、长度相对零点:海拔高度单位:确定的意义相同的价值,三、测量量表(1)称名/命名量表称名变量只说明某一事物与其他事物在名称、类别或属性上的不同,并不说明事物与事物之间差异的大小、顺序的先后及质的优劣。(2)顺序变量顺序变量是指可以就事物的某一属性的多少或大小按次序将各事物加以排列的变量,具有等级性和次序性的特点。(3)等距变量等距变量除能表明量的相对大小外,还具有相等的单位。(4)比率/等比变量比率变量除了具有量的大小、相等单位外,还有绝对零点。,第二单元心理测验的基本概念,一、心理测验的定义依据心理学理论,使用一定的操作程序,通过对观察人的少数有代表性的行为,对于贯穿在人的全部行为活动中的心理特点做出推论和数量化分析的一种科学手段。测量的是人的某种行为或反应通过对行为样本的观察来推论所有被试的心理特征测验的条件完全相同与他人的分数比较或与常模比较才有意义,二、心理测验的性质间接性相对性客观性测验用的项目或作业、施测说明、施测者的言语态度及施测时的物理环境等均须标准化评分记分的原则和手续标准化分数的转换和解释经过标准化,第三单元心理测验的分类,一、按测验的功能分类智力测验:比纳西蒙智力测验、斯坦福-比纳智力量表、魏克斯勒儿童和成人智力量表特殊能力测验:音乐、绘画、机械技巧、文书才能测验人格测验:MMPI、16PF、EPQ、TAT、罗夏测验,二、按测验材料的性质分类文字测验:呈现文字材料,以言语做刺激,被试者用言语做出反应;缺点是受文化背景的影响操作测验:呈现图形、实物、工具、模型的辨认和操作,无须使用言语做答,不受文化背景的影响或限制;缺点是费时三、按测验材料的严谨程度分类客观测验:呈现的刺激词句、图形等意义明确,只需被试者直接理解,无需发挥想象力来猜测和遐想投射测验:刺激没有明确意义,问题模糊,对被试的反应也没有明确规定。被试者做出反应时,一定要凭自己的想象力加以填补,是指具有意义,因此,可以将被试者的思想、情感和经验投射出来。,四、按测验的方式分类个别测验:一对一;优点:主试对被试的言语和情绪状态有仔细的观察,合作良好,结果可靠;缺点:费时、复杂、主试要求高团体测验:对许多被试在同一时间内同时施测;优点:省时、主试要求低;缺点:难以控制被试的行为,结果可靠性比个别测验低五、按测验的要求分类最高作为测验:被试者尽可能作最好的回答,有正确答案典型行为测验:被试者按通常的习惯方式反应,没有正确答案,第四单元纠正错误的测验观,一、错误的测验观测验万能论测验无用论心理测验等于智力测验二、正确的测验观心理测验是重要的心理学研究方法之一,是决策的辅助工具心理测验作为研究方法和测量工具尚不完善,第五单元心理测验在心理咨询中的应用,一、智力测验WAIS-RC、C-WISC、C-WYCSI、WISC-CR、SPM、CRT二、人格测验EPQ、16PF、MMPI三、心理评定量表精神病评定量表、躁狂状态评定量表、抑郁量表、焦虑量表、恐怖量表,第六单元心理测验的发展史,一、科学心理测验的产生与发展二、现代心理测验在我国的发展,第二节测验的常模第一单元常模团体,一、常模团体的性质常模团体:具有某种共同特征的人所组成的一个群体,或者是该群体的一个样本。代表总体:确定一般总体、确定目标总体、确定样本,二、常模团体的条件群体的构成必须明确界定常模团体必须是所测群体的代表性样本样本的大小要适当标准化样组是一定时空的产物,三、取样的方法简单随机抽样系统抽样分组抽样分层抽样,四、常模分数与常模常模分数常模一般常模特殊常模,第二单元常模的类型,一、发展常模发展顺序量表智力年龄年级当量,二、百分位常模百分等级:在常模样本中低于这个分数的人数百分比PR=100-(100R-50)/N百分点:处于某一百分比例的人对应的测验分数是多少四分位数十分位数,三、标准分常模种类:z分数、Z分数、T分数、标准九分数、离差智商(IQ)线性转换的标准分数z=(X-X)/SDZ=A+Bz非线性转换的标准分数:常态化T分数:T=50+10z/标准九分数B=5+2z/离差智商,四、智商及其意义心理年龄比率智商IQ=MA/CA*100离差智商IQ=100+15z/=100+15(X-X)/SD,第三单元常模分数的表示方法,转换表法剖面图法,第三节测验的信度第一单元信度的概念,一、信度的定义指同一被试者在不同时间内用同一测验(或用另一套相等的测验)重复测量,所得结果的一致程度。稳定性可靠性一致性信度乃是一个被测团体真分数的变异数与实得分数的变异数之比。rXX=ST2/SX2,SX2,ST2,Rxx=ST2/SX2=(SX2-SE2)/SX2=1-SE2/SX2,信度的定义二,信度乃是一个被测团体真分数与实得分数的相关系数的平方。rXX=2TX=ST2/SX2,信度的定义三,信度乃是一个测验X与它的任意一个平行测验X的相关系数。rXX=PXX,A卷:你是一个喜欢热闹的人吗?,1=绝对是2=是3=不一定4=不是5=绝对不是,B卷:你是一个喜欢安静的人吗?,1=绝对是2=是3=不一定4=不是5=绝对不是,二、信度的指标信度系数与信度指数测量标准误SE=Sx,第二单元信度评估的方法,重测信度复本信度内部一致性信度分半信度同质性信度评分者信度,重测信度(Test-RetestReliability),定义:同一量表,同一被试群体,在不同时间,两次施测,求其相关。实质:表示测验结果的稳定性。故称之为稳定性系数(CoefficientofStability)形式:施测适当时间再施测优点与缺点,时间间隔的把握,间隔时间越长,稳定性系数越低。适宜时间间隔依照测验目的、性质及被试特点而定。几分钟至几年。年幼儿童,间隔要小;年长群体,间隔可大。智力测验的间隔不能太短,成就测验的间隔不能太长。一般间隔时间不超过六个月。(即不能让被试记住上一次测验的内容,又不能让其特质发生变化,或对所学知识产生遗忘),复本信度(Alternate-formraliability),因为任何测验只是所有可能题目中的一份取样(行为样本),所以可编制许多平行的等值测验,叫做复本。,复本等值要符合下列条件:,各份测验测量的是同一种心理特性。各份测验具有相同的内容和形式。各份测验的题目不应重复。各份测验题目数量相等,难度和区分度大体相同。各份测验的分数分布(平均数和标准差)大致相等。复本编好后,应再测一次,以确保各份测验的等值。,定义:两个复本施测同一被试群体,求其相关。,等值性系数:同时连续施测,反映内容变异。形式:复本A最短时间复本B稳定性与等值性系数:时间间隔施测,内容变异重测信度误差形式:复本A适当时间复本B优点与局限,分半信度(Split-HalfReliability),定义:在测验没有复本且只能实施一次的情况下,可将测验项目分成对等的两半,根据被试在这两半测验中所得的分数计算相关系数,即得分半信度。计算分半信度先要对测验分半。不同的分半法可能会得到不同的信度值。,内部一致性信度,主要反映条目之间的关系,表示测验能够测量相同内容或特质的程度分半信度同质性信度,分半信度(Split-HalfReliability),为了使两半基本等值,可将项目按由易到难的顺序排列编号,然后按奇数和偶数序号将项目分半。要注意使那些性质相同、联系紧密的项目分在相同的一半,否则会使信度值偏高。由于分半信度实际上只是半个测验的信度,测验越长、项目越多,两半分数的相关就越高。因此,对长度不同的测验,要用校正公式。Rxx=2rhh/(1+rhh),同质性信度(HomogeneityReliability),同质性指测验的所有题目测量的是同一种心理特质,表现为各个题目得分之间有较高的相关,相关越高则同质性越强。库德-理查逊公式克伦巴赫系数因素分析的思路,评分者信度(ScorerReliability),评分者信度是指不同评分者之间在测验结果计分上的一致性。在心理测验中,评分者信度的计算,通常是随机抽取若干份试卷,由至少两位受过训练的评分者按计分规则分别判分,然后计算它们的相关。几个评分者的评分越一致,评分者信度越高。,最简单的估计方法就是随机抽取若干份答卷,由两个独立的评分者打分,再求每份答卷两个评判分数的相关系数。这种相关系数的计算可以用积差相关方法,也可以采用斯皮尔曼等级相关方法。如果评分者在三人以上,而且又采用等级记分时,就需要用肯德尔和谐系数来求评分者信度。,估计信度的方法与测验复本的数目以及施测次数的关系,在一般情况下,间隔施测的复本信度最低,因为很多因素有机会影响到分数。相反,校正过的分半相关,因为影响的因素少,所得的信度估计为最高。,各种信度系数相应误差变异的来源,实际上,有多少种误差来源,便有多少种估计信度的方法。一个测验哪种误差大,便应该用哪种误差估计。有时一个测验需要有几种信度系数,这样我们就把总分数的变异数分成不同的分支。,假设对100个六年级学生以两个月的时间间隔先后施测一个创造力测验的AB两个复本,所得的等值性与稳定性系数为0.70。我们还根据被试对每个复本的反应计算出分半信度为0.80(先计算每个复本的分半相关系数。将二者平均后再用斯皮尔曼-布朗公式校正)。同时,我们让另一个评分者随机抽取50份卷子另外评分,得到评分者信度为0.92。然后,我们对这三种方法所产生的误差变异进行分析。,一个假想测验的误差变异来源分析,一个假想测验的误差变异来源分析,第三单元信度与测验分数的解释,一、解释真实分数与实得分数的相关二、确定信度可以接受的水平能力与成就测验:0.9以上人格测验、兴趣、态度、价值观等测验:0.8-0.85原则一:当信度小于0.7,不能用于对个人作评价或预测,也不能做团体比较;信度介于0.7-0.85之间,可用于团体比较;信度不小于0.85,才用于鉴别或预测个人成绩原则二:新编的测验信度应高于原有的同类测验或相似测验,三、解释个人分数的意义95%的置信区间范围:平均分上下一个标准差的范围内四、比较不同测验分数的差异韦氏智力测验的言语测验和操作测验分数之间的差异超过多少分才能算是有明显差别?,第四单元影响信度的因素,一、样本特征样本团体异质性的影响样本团体平均能力水平的影响二、测验长度测验越长,测题取样或内容取样越有代表性测验越长,被试的猜测因素影响越小例如:一个40个条目的测验信度是0.8,欲将信度提高到0.9,问至少需要增加多少条目?,三、测验难度难度0.5,信度最高选择题中,五择一:0.7;四择一:0.74;三择一:0.77;二择一:0.85不同能力水平的被试,测验有不同的难度,影响信度四、时间间隔时间越短,信度越大;时间越长,影响因素增多,信度降低,第四节测验的效度第一单元效度的概念,一、效度的定义效度是指测验的准确性,即测验能够测出他们所欲测的特质的程度。准确度/符合度,SX2,ST2,Rxy2=SV2/SX2,效度的信度关系(1)高效度,高信度(2)高信度,低效度(3)低信度,低效度,二、效度的性质效度具有相对性效度具有连续性,第二单元效度评估的方法,一、内容效度指测验实际测到的内容与所要测量的内容之间的吻合程度。评估方法:专家判断法、统计分析法、经验推测法表面效度最高行为测验典型行为测验,二、构想/结构效度指测验对于被称作构想的某一理论概念或特质测量的程度。估计方法对测验本身的分析测验间的相互比较:相容效度、区分效度、FA(EFA、CFA)效标效度的证明实验法和观察法证实,三、效标/实证效度指一个测验对处于特定情景中的个体的行为进行估计的有效性。选择的效标具备的四个条件评估方法相关法区分法命中率法,第三单元效度的功能,一、预测误差二、预测效标分数三、预测效度指数,第四单元影响效度的因素,一、测验本身的因素二、测验实施中的干扰因素主试的影响因素被试的影响因素三、样本团体的性质样本团体的异质性干涉变量四、效标的性质,第五节项目分析,目的:选择和修改测验题目,提高测验的信度和效度定性分析:内容效度,题目编写的恰当性和有效性;定量分析:难度、区分度,第一单元项目的难度,一、定义指项目的难易程度非能力测验中称“通俗性”通过率:P=R/N*100%P值大小与难度高低成反比,二、计算方法二分法记分的项目P=(PH+PL)/2CP=(KP-1)/(K-1)非二分法记分的项目P=X/Xmax*100%三、难度水平的确定项目的难度难度在0.5左右的试题区分度最大选择条目时,各题的平均难度接近0.5,各题难度在0.50.2之间对于是非题而言,其难度应该为0.75最为合适;而对四选一的题目,其难度约为0.63时最为合适。测验的难度正偏态分布与负偏态分布,第二单元项目的区分度,一、定义区分度也称鉴别力,指测验项目对被试的心理特性的区分能力项目区分度是评价项目质量和筛选项目的主要指标,也是影响效度的重要因素范围:-11相关系数越大,区分度越大,二、计算方法鉴别指数D=PH-PL项目鉴别指数与评价标准相关法点二列相关二列相关相关法三、区分度与难度的关系,第六节测验编制的一般

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论