心理测验技能教材培训课件_第1页
心理测验技能教材培训课件_第2页
心理测验技能教材培训课件_第3页
心理测验技能教材培训课件_第4页
心理测验技能教材培训课件_第5页
已阅读5页,还剩120页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

心理测验技能教材一、概述测量与测量量表测量:就是依据一定的法则用数字对事物加以确定.主要元素:1事物2数字3法则.测量要素:1参照点2单位参照点:1绝对零点2相对零点单位1确定的意义2相同的价值2心理测验技能教材(一)、测量量表测量的本质是根据某一法则将事物数量化,即在一个定有单位和参照点的连续体上把事物的属性表现出来,这个连续体称为量表.命名量表顺序量表等距量表等比量表3心理测验技能教材命名量表:这是测量水平最低的一种量表形式,只是用数字来代表事物或者将事物分类.顺序量表:比命名量表水平高,其中的数字不仅指明类别,同时指明类别的大小或者含有某中属性的程度.等距量表:比顺序量表又进一步,不但有大小关系,而且具有相等的单位,其数值相互做加、减运算,但没有绝对的零点,因此不能做乘、除运算.等比量表:是最高水平的量表,既有相等单位又有绝对零点,所得数值可以做加、减、乘、除运算.4心理测验技能教材

(二)、心理测验的基本概念1、心理测验的定义:根据心理学理论,使用一定的操作程序,通过观察人的少数有代表性的行为,对于贯穿在人的全部行为活动中的心理特点做出推论和数量化分析的一种科学手段.2、心理测验的性质:间接性、相对性、客观性5心理测验技能教材(三)、心理测验的分类1、按测验的功能分:智力测验、特殊能力测验、人格测验2、按测验材料的性质分:文字测验、操作测验3、按测验材料的严谨程度分:客观测验、投射测验4、按测验的方式分类:个别测验团体测验5、按测验的要求分类:最高作为测验、典型行为测验6心理测验技能教材(四)、纠正错误的测验观1)错误的测验观:测验万能论、测验无用论、心理测验即智力测验2)正确的测验观:心理测验是重要的心理学研究方法之一,是决策的辅助工具;心理测验作为研究方法和测量工具尚不完善7心理测验技能教材(五)心理测验在心理咨询中的应用

智力测验:WAIS、SPM、CRT,求助者特殊要求或对方有可疑智力障碍人格测验:MMPI、16PF、EPQ,有助于了解人格特征,对问题深入了解,针对性开展咨询,MMPI了解对方精神是否异常心理评定量表:精神评定量表、躁狂状态评定量表,抑郁量表、焦虑量表,恐怖量表等,了解心理障碍存在与否及程度

8心理测验技能教材

(六)心理测验的发展史法国心理学家比内(A.Binet)经过与助手西蒙(T.Simon)的精心研究,发表了一篇文章,题为:<<诊断异常儿童智力的新方法>>,是世界上第一个正式的心理测验.综观心理学的发展,有以下几点:1)操作测验的发展2)团体智力测验的发展3)能力倾向测验的发展4)人格测验的发展9心理测验技能教材

二、测验的常模10心理测验技能教材统计学基本知识总体、样本与个体总体具有某种特征的一类事物的全体(母体)总体的特征无法进行一一测量,只能通过样本来推测。个体构成总体的每一个单元个体特征可以测量,但因其随机性太大,常常不能准确地反映总体的特征。样本构成总体的一个部份,常用“n”或“N”来表示。可以被测量,常将其特征来代表总体特征。样本从总体中抽出,存在抽样误差,某些抽样误差可以控制,但随机误差不能控制。。在心理统计中,n≤30称为小样本,n>30称为大样本。11心理测验技能教材次数、频率和概率次数(频数)指某一事件出现的回(次)数简单计数,常用f来表示。频率指相对次数,所观察发生某一事件与总体事件的比率,常用%来表示。概率又称机(会)率,用P来表示。估计概率和真实概率估计概率:由一定数量的观察中得到频率真实概率:事物真实发生的频率当观察数量无限增大时,估计概率越接近真实概率。概率(P)=f/N12心理测验技能教材统计量(特征数)反映一组数据统计特征的数字例:3组20岁男性的体重(公斤)1组:45、50、55、58、60、60、62、65、70、752组:50、55、55、60、60、60、60、65、65、703组:40、45、50、55、60、60、65、70、75、80常用的统计量反映数据集中性质或集中程度(平均数、中位数等)反映数据离中(离散)性质或离中(离散)程度(标准差、方差、全距等)反映两种特征之间的关系(相关系数)13心理测验技能教材算术平均值平均值(数)中的一种,英文mean,用M来表示,或用X来表示。反映数据的集中趋势。计算公式

X=∑Xi/N∑Xi为所有数据的和,∑Xi

=X1+X2+……XnN为数据的个数计算举例(上例1组)X1=(45+50+55+58+60+60+62+65+70+75)/10=6014心理测验技能教材方差和标准差反映数据离中(离散)趋势的两种指标。英文variance(方差)用S2或σ2来表示;standarddeviation(标准差),用S或SD来表示,亦可用σ表示。对离中趋势进行度量的意义全面反映事物的面貌:平均值只反映了事物的典型情况,标准差可反映事物的特殊性。判断集中量数(如平均值)的代表性:在一组数据中,离中趋势越小,集中趋势量数的代表性就越好,相反就越差。15心理测验技能教材基本公式方差计算公式

S2=∑(Xi-X)2/NXi为每个数据,从X1、X2……Xn(Xi-X)为离均差(Xi-X)2为离均差平方∑(Xi-X)2为离均差平方和N为数据的个数标准差计算公式

S=√S216心理测验技能教材正态分布正态分布又称常态分布,统计学中一种重要的理论分布,在自然界、人类社会、心理与教育中大量的现象和特征均按正态的形式分布,如能力、人格特征、学习成绩、社会态度、行为表现以及身高、体重等。正态分布曲线17心理测验技能教材18心理测验技能教材正态分布的特点正态分布的形式是对称的正态分布曲线的两端与基线趋于无穷远,但不会相交。正态分布曲线与基线之间的面积等于1(100%),代表了总体事件。从正态分布曲线的最高点作垂直线,形成正态分布的中轴,将面积分为相等的两半,各占50%。平均值位于正态分布的中轴上。正态分布曲线下各对应的横坐标(即标准差)处与平均数之间的面积可用积分公式计算,也可查正态分布表获得。正态分布曲线下,标准差与概率(面积)之间的关系举例:平均值±(加减)Z个SD,包含A%的面积(概率)平均值±(加减)1个SD,包含68.26%的面积(概率)平均值±(加减)1.96个SD,包含95%的面积(概率)平均值±(加减)2.58个SD,包含99%的面积(概率)平均值±(加减)2个SD,包含95.45%的面积(概率)平均值±(加减)3个SD,包含99.73%的面积(概率)19心理测验技能教材正态分布理论在心理测验的应用化等级评定为测量数据测定题目的难易度利用正态分布将原始分转变为标准分在评定时确定人数(概率)20心理测验技能教材常模团体常模团体的性质:

常模团体是由具有某种共同特征的人所组承德一个群体,或者是该群体的一个样本对测验的编制者而言,常模的选择主要是基于对将要施测的总体的认识,常模团体必须能够代表该总体对测验的使用者而言,要考虑的是现有的常模团体哪一个最合适:受测者的分数必须与合适的常模进行比较21心理测验技能教材常模团体对于编制测验时的意义常模的选择基于对实测对象的总体认识一般程序:确定一般总体→确定目标总体→确定样本一般总体:准备评价的对象群体目标总体:准备采样的范围人群常模样本:根据总体性质(如性别、年龄、文化程度等)确定的、有代表性的样本常模样本应能够代表一般总体,即具有充分的代表性。常模团体对于使用测验时的意义准备测评的对象的性质最近似哪个常模样本的特征(例:职业测评)哪个常模分数最适合被测评对象(例:WAIS-RC或C-WISC)22心理测验技能教材常模团体的条件常模团体的界定必须明确:常模团体是由具有某种共同特征的人所组成的一个群体,或者是该群体的一个样本。确定常模时,必须清楚地说明所要测量的群体的性质与特征一个测验可能有多个常模团体WAIS-RC:分城乡、分年龄共16个常模团体MMPI:分男、女性别两个常模团体EPQ(成人):分性别、分年龄12个常模团体常模团体必须是所测群体的代表性样本23心理测验技能教材建立常模时的注意事项本的大小适当。因为抽样误差与样本大小成反比,理论上样本越大越好,但也要考虑具体条件的允许。样本的数量总体数目小,全部作为样本。总体数目较制定常模时,须清楚地说明所要测量群体的性质与特征,依据不同的性质(变量)确定群体,便可得到不同的常模。大,样本也要大,30~100人。全国常模2000~3000人。样本的代表性样系统抽样要求目标总体无序可排,也无等级结构存在。一般常模和特殊常模24心理测验技能教材取样的方法取样即从目标人群中选择有代表性的样本随机取样根据随机的原则选择样本,在该范围内每个人被抽到的机会相等。常用的抽样方法简单随机抽样:利用随机数字表抽样、抽签系统抽样在总体项目为N的情况下,选择K分之一的作为样本。K=N/nK为组距N为总样本人数n拟抽取样本量

举例:K为2:两个中抽1个,随机确定首个是谁,隔一个抽1个K为20:每隔20位抽1个从121名学生中抽40人作为调查样本K=121÷40≈3若首位是第8号,则每隔3位抽一个,即8、11、14……25心理测验技能教材分组抽样当总体数目较大,无法进行编号,而群体又具多样性时采样先分组,再在组内随机抽样分层抽样制定常模是最常用的方法先按某种(或几种)变量分层,然后在每层中随机抽取一定样本,组合成常模样本。分层比例抽样26心理测验技能教材分层非比例抽样当各层次差异很大时,有些层次的重要性大于其它层次,这时应采用非比例抽样,以降低各层的标准差。

ni=n×NiSi/∑(NiSi)27心理测验技能教材常模与常模分数常模:是一种供比较的标准量数,由标准化样本测试结果计算而来,是心理测验用于比较和解释测验结果的参照分数标准按照样本的大小和来源:全国常模,区域常模,特殊常模常模分数:就是施测常模样本后,将受测者的原始分数按一定规则转换出来的导出分数(具有一定的参照点和单位)28心理测验技能教材常模的类型发展常模分数的计算及解释许多心理特质是随时间(年龄)变化而发展的。将被测者的成绩与各种发展水平人群平均表现相比较,这种常模即发展常模,该量表亦称年龄量表。发展顺序量表测验条目(能力或行为)按出现的早晚排列,完成该条目说明达到相应的年龄水平。葛塞尔婴幼儿发育量表:包括运动水平、适应性、语言、社会性四个方面。29心理测验技能教材智力年龄一个人在采用年龄量表方式编制的智力测验上得到的分数,简称智龄。计算方法每个条目代表一定的年(月)龄,将所通过的条目折算出月龄,然后相加计算出智力年龄。如比内量表。以标准化样本每个年龄组平均原始分数作为常模,被试者从测验中得到原始分数与其比较,从而确定智龄。比内量表智龄计算举例计算公式

IQ=MA(心理年龄)/CA(实足年龄)×100计算举例(例1)30心理测验技能教材心理年龄的分数计算确定起始年龄起点:从实际年龄低1岁组开始测验回头测试原则:若被试在某类型条目失败时,需回头做低年龄组的类似条目,直至成功通过为止。确定最高年龄:某年龄组6个条目均失败时停止继续原则:尽管已确定止点,但该年龄段不含某类型条目,此时应继续做高年龄组的类似条目,直至失败为止。确定心理年龄2~5岁组的条目,每通过1条获得1个月心理年龄;6~SAⅠ组的条目,每通过1条获得2个月心理年龄;SAⅡ组的条目,每通过1条获得5个月心理年龄;SAⅢ组的条目,每通过1条获得6个月心理年龄;起始年龄以下的条目,假定被试完全通过,获得相应的心理年龄。31心理测验技能教材举例(例1):某10岁儿童心理年龄的计算年龄水平通过的测验数目每项测验得到的月数全部得分年月8岁6(起始年龄)—8—9岁521010岁621211岁521012岁3(在5个测验中)2.47.213岁22414岁122AA122SAⅠ00SAⅡ155SAⅢ0(最高年龄)60总分852.2心理年龄(MA)12岁4月2天32心理测验技能教材年级当量年级当量:就是年级量表。说明测验结果属于哪个年级的水平年级量表的单位为十个月,十个月为一个年级33心理测验技能教材百分位常模分数的计算及解释百分位常模包括百分等级、百分点、四分位数和十分位数。百分等级百分等级是应用最广泛的表示测验分数的方法百分等级指出的是个体在常模团体中所处的位置百分等级的计算未分组资料

PR=100-(100R-50)/NR指某人原始分排列的顺序数N指样本总人数举例:小东在30名同学中语文成绩是80分,排列第5名,其百分等级多少?

PR=100-(100×5-50)/30=85计算步骤公式:PR=100/N[(x-l)fp/h+cf]N=164x=38l=36fp=23h=12cf=123PR=100/164[(38-36)23/12+123]PR=100/164×126.83PR=77.3434心理测验技能教材百分点百分点用于计算处于某一百分比例的人相对应的测验分数是多少计算方法(直线内插法)举例:已知高考的最高分为695,其百分等级为100,最低分为103分,百分等级为1,求百分等级80所对应的分数是多少?公式:C指上限百分等级SC上限百分等级对应的分数F指下限百分等级SF下限百分等级对应的分数X已知百分等级PP根据已知百分等级,要求的对应分数35心理测验技能教材计算部骤(因式分解)20/(695-PP)=79/(PP-103)79(695-PP)=20(PP-103)(等号两侧交叉相乘)54905-79PP=20PP-206054905+2060=20PP+79PP56965=99PPPP=56965/99PP=575.436心理测验技能教材四分位数和十分位数四分位数和十分位数只是百分位数(百分等级)的两个变式。举例百分位数(百分等级):将量表分成100等份四分位数:将量表分4等份,1~25%、26~50%、51~75%和76~100%四段。十分位数:将量表分成10份,1~10%为第一段,91~100%为第十段。37心理测验技能教材标准分的计算及解释标准分是将原始分数与平均数的距离以标准差为单位表示出来的量表。标准分的基本单位是标准差。常见的标准分数有z分数、Z分数、T分数、标准九分数、离差智商(IQ)等。根据转换方式的不同,标准分可分为:线性转换的标准分:z分数、Z分数、T分数非线性转换的标准分:z’分数当原始分不成常态分布,需进行转换使之成为常态分布转换方法(百分等级法)对每个原始分计算累计百分比在常态曲线面积表中,求出对应于该百分比的z分数转换后的z分数称为z’分数38心理测验技能教材常见的标准分形式基本形式

z分:z=(X–X)/SDX为任一原始分X为样本平均数SD为样本标准差常用标准分Z分数

Z=A+BzA为量表的平均数(根据需要指定的常数)B为量表的标准差(根据需要指定的常数)z为基本形式的z分举例:韦氏智力量表智商的平均值为100(A),标准差为15(B)。某人的全量表分高于常模1个标准差,问其FIQ应为多少?115(IQ)=100+15×139心理测验技能教材T分数T分数由麦克尔于1939年提出,有纪念推孟和桑代克之意T分数目前表示任何常态化和非常态化的转换标准系统,量表分平均值固定为50,量表分标准差固定为10。许多人格问卷均采用T分量表,如MMPI、EPQ

T=50+10(X–X)/SD或T=50+10z50(A)为T分数(量表分)的平均值10(B)为T分数(量表分)的标准差标准九分1~9分的九级分数量表,平均值为5、标准差为2。

标准9分=5+2(X–X)/SD或标准9分=5+2z40心理测验技能教材标准十分

1~10分的十级分数量表,平均值为5、标准差为1.5。卡特尔16PF

标准10分=5+1.5(X–X)/SD或标准10分=5+1.5z举例:(16PF)30岁女性被试乐群性得分为15分,常模平均值为10.90、标准差3.23,其量表分是多少?标准二十分1~19分的分数量表,平均值为10、标准差为3。韦氏智力量表

标准20分=10+3(X–X)/SD或标准20分=10+3z举例:(WAIS-RC)16岁被试算术分测验得分为15分,常模平均值为12.73、标准差3.55,其量表分是多少?41心理测验技能教材智商的计算及其意义最早的比内–西蒙量表用心理年龄来表示智力的高低测验题目的安排完全按难度排列,某条目在某年龄组中50%能通过,该条目就被当成该年龄组的题目。比率智商比率IQ=MA(心理年龄)/CA(实足年龄)×100比率智商的不足之处个体智力的增长与年龄的关系并非一直呈直线关系,因此不适合于成人。比率智商的分数在不同年龄组具有不同的意义。42心理测验技能教材离差智商是一种以年龄组为样本计算而得的标准分数,为了使其与传统的比率智商基本一致,一般研究者将离差智商的平均值定为100。韦克斯勒智力量表的标准差定在15

IQ=100+15(X–X)/SD或IQ=100+15z斯坦福-比内量表的标准差定在16

IQ=100+16(X–X)/SD或IQ=100+16z常模标准分转换表在实际工作中,测验编制者会采用某种标准分公式计算出与原始分相对应的标准分,并编制成原始分转换标准分等值表,附在手册上方便使用。每个测验采用何种标准分,以及量表分的平均值和标准差均可从测验手册中查到。举例(C-WYCSI)4岁城市儿童,言语分量表得分42分,常模平均值为49.94、标准差11.58,其言语IQ是多少?43心理测验技能教材注意事项发展常模换算及解释时需要注意的问题只适用于所测特质随年龄发生系统变化的情况只适用于在典型环境下生长的儿童发展量表的单位在各年龄并不相等,因为各年龄发展速度不同百分位常模换算及解释时需要注意的问题各百分位单位不相等,不能加、减、乘、除原始分转换为百分等级时,靠近中央的分数其差异被夸大,靠近两极的分数其差异被缩小。(见后附表)不同被试之间不能精确比较标准分常模换算及解释时需要注意的问题计算非线性转换的标准分数时,要求所测特质本质上应是常态分布。来自不同测验的离差智商,只有标准差相同或相近时,才可进行比较44心理测验技能教材常模分数表示法转换表表示法又称常模表,最简单、基本的表示方法。将测验的原始分转换成相对应的常模分数(如百分位、标准分、T分等)举例简单转换表:将单一测验原始分转换成一种或几种分数。如:瑞文推理测验、全量表IQ复杂转换表:包括几个分测验或几种常模团体的原始分与导出分数的对应关系。如:韦氏智力测验粗分等值量表分转换表、MMPIT分转换表等。45心理测验技能教材剖面图表示法剖面图是将分数的转换关系用图形表示出来剖面图能直观地表示出被试在各分测验上的表现及相对位置有的剖面图直接可作为粗分等值量表分转换表用,如韦氏成人智力测验记录纸的剖面图WISC-R剖面图举例总智商在平均值以上言语智商相当高,操作智商一般。46心理测验技能教材

三、测量的信度、47心理测验技能教材(一)信度分析定义信度(reliability)是指同一被试在不同时间内用同一测验(或另一套相等的测验)重复测量所得结果的一致程度。(本教材)信度指测验或量表的可靠性(可靠程度)。(龚耀先)信度就是对测量一致性程度的估计。(金喻)在编制或修订心理测验时,信度研究是必须的环节,信度资料是测验手册里必备的测量学指标。在使用心理测验时,没有信度资料的测验不能使用。48心理测验技能教材信度的指标1、信度系数与系度指数:是一种相关系数,同一受测者样本所得的两组资料的相关信度指数的平方就是信度系数2、测量的标准误:测量误差分布的标准差,用来表示误差的大小。公式:SE=Sx√1-rxxSx分数的标准差rxx测验的信度49心理测验技能教材测量误差与真分数测量误差是由与测验目的无关的偶然因素引起,使得几次测量结果不一致,且这种不一致是非系统的、随机的。真分数指测量中不存在测量误差时的真值或客观值。真分数的操作定义就是无数次测量的平均值,常用X∞来表示。表示真分数的公式:

Xi=X∞+XeXi指实测分数X∞指真实分数Xe指误差分数实测分数是真分数与误差分数的函数。在进行心理测量时,X∞被视为是稳定不变的,因此Xi的变化由Xe所引起。据此,Si2

=S∞2+Se2由于测量误差的随机性,误差分数的平均数为0。50心理测验技能教材信度的表达式信度的定义可以理解为一组测验分数中真分数方差与实测分数方差的比率

在实际工作中,“真分数(X∞)”是很难获得的,我们通常将实测分数(Xi)作为真分数的“估计值”。由于真分数(X∞)难以获得,因此S∞2也很难获得,但后者可以通过其与实测分数方差和误差的关系推出来。根据rxx=rx∞2=S∞2/Si2和Si2

=S∞2+Se2两式信度(rxx)则作为反映实测分数作为“真分数”估计值的准确程度指标。例:如果某测验的信度为0.9,其误差则为0.1。51心理测验技能教材测验误差的来源测验本身引起的测量误差测验题目抽样误差测验题目的形式测验题目的难度过高或过低测题或指导语用词不当测验时限过短测验实施引起的测量误差物理环境主试方面意外干扰评分不客观,计算、登记、转换出错被试引起的测量误差动机的影响测验的焦虑生理因素学习、发育和教育测验经验52心理测验技能教材(二)信度的类型及估计方法重测信度(test-retestreliability)又称稳定性系数(stability),主要用于评价时间误差。方法:皮尔逊积差相关公式:

rxx

相关系数X1、X2同一被试的两个分数N样本例数X1、

X2两次测验组平均数S1、

S2两次测验组标准差53心理测验技能教材相关分析计算两种具有相关关系的不同现象之间关系程度的统计学方法直线相关与曲线相关(见图)直线相关的关系分三种情况正相关:两列变量变动方向相同负相关:两列变量变动方向相反零相关:两列变量之间无相关相关分析的方法计量资料的相关分析方法:积差相关(皮尔逊相关)等级资料的相关分析方法:肯德尔和谐系数质与量的相关分析方法:点二列相关、二列相关相关系数:表示相关程度的统计学指标相关系数取值于–1.00~+1.00之间。负值表示负相关,正值表示正相关。“0”表示两个变量之间完全没有关系,“1”表示两个变量之间呈现一对一的关系。相关系数不是等距的度量值,因此在比较时只能说绝对值大者比绝对值小者相关更密切一些。相关系数与其他统计量一样也存在抽样误差,因此其统计学意义也应进行显著性检验。54心理测验技能教材复本信度(alternate-formreliability)又称等值性系数,以两个等值但题目不同的测验(复本)来测量同一群体,然后求被试者在两个测验得分的相关,用于评价两个测验内容的一致性。实施两个测验的间隔时间长短可能影响复本信度复本信度的计算方法同重测信度内部一致性信度(internalconsistencyreliability)分半信度(split-halfreliability)用于评价同一测验内部条目抽样的误差。方法:将测验条目按单双号分为两组,计算出两组的得分,然后进行相关。在同样的情况下,信度的高低与条目数量成正比,分半信度只计算了一半条目的信度,因此要用斯皮尔曼—布朗的公式进行校正。校正公式:rhh为两半分数的相关系数rxx为校正后(原测验长度时)信度的估计值55心理测验技能教材同质性信度(homogeneityreliability)评价测验内题目间一致性(内容抽样误差)库德–理查逊公式(K-R20公式):适用于0、1记分的测验N为测验题目数Pi通过某题目的人数比例qi未通过该题目的人数比例Sx2测验总分数的变异(方差)

举例(例4)56心理测验技能教材举例(例4):

10名被试在一个有8个条目的测验中得分如下,求其信度?被试测验题目得分12345678总分10000000002100000001310100000241100100035010100103611101010571111110068111111006911110101610111111118合计8765543240Pi0.80.70.60.50.50.40.30.2piqi0.160.210.240.250.250.240.210.161.7257心理测验技能教材公式:N=8p1=8/10=0.8qi=1-0.8=0.2p1q1=0.8×0.2=0.16∑piqi=p1q1+p2q2+…+pnqn=1.72Sx2=[(0-4)2+(1-4)2+(2-4)2+(3-4)2+(3-4)2+(3-4)2+(5-4)2+(6-4)2+(6-4)2+(6-4)2+(8-4)2]/10

=6.058心理测验技能教材库德–理查逊公式(K-R21公式)X为测验总分平均值Sx2

测验总分数的变异(方差)举例(上例):平均值=459心理测验技能教材克伦巴赫α系数:适用于各种分数形式N为测验题目数Si2为某一题目分数的变异(方差),∑Si2为所有题目方差之和当题目以1、0记分时,∑Si2=∑piqi,所以rKR20公式可以当作α系数的特例Sx2

测验总分数的变异(方差)举例(例5):60心理测验技能教材举例(例5):10名被试者在一个有10个条目的测验中得分如下,求该测验的α系数?被试测验题目得分得分123456789101222122100113221121001008322221211111541001000000251201000000462212211110137221211000098222201101011922222110001210221121100111平均值1.81.71.31.51.10.90.60.30.30.39.8Si20.160.410.410.450.690.490.240.210.210.213.4861心理测验技能教材公式:N=10S12=[(2-1.8)2+(2-1.8)2+(2-1.8)2+(1-1.8)2+(1-1.8)2+(2-1.8)2+(2-1.8)2+(2-1.8)2+(2-1.8)2+(2-1.8)2]/10=0.16∑Si2=3.48M=∑X/N=98/10=9.8Sx2=[(13-9.8)2+(8-9.8)2+(15-9.8)2+(2-9.8)2+(4-9.8)2+(13-9.8)2+(9-9.8)2+(11-9.8)2+(12-9.8)2+(11-9.8)2]/10=15.3662心理测验技能教材评分者信度(scorerreliability)评价不同评分者之间的一致性指标(不同评分者之间的误差)方法:随机抽取若干份测验卷,有两位或多位评分者按标准评分,计算每两个评分者对同一被试答卷所评分数之间的相关一般要求评分者之间一致性达0.9以上计算方法两个评分者之间的一致性用皮尔逊积差相关方法或等级相关方法计算多个评分者之间的一致性:等级资料时用肯德尔和谐系数来评价公式

Ri为每一对象被评等级的总和N被评对象的人数或答卷数K

评分者人数举例(例6)

三位专家给6篇论文评等级,结果见表,求评分者信度?63心理测验技能教材三位专家给6篇论文的评定(例6)专家123456124156223415523341462Ri81231417664心理测验技能教材计算公式:N=6K=3∑Ri=8+12+3+14+17+6=60∑Ri2=82+122+32+142+172+62=73865心理测验技能教材有关信度评估的一些问题重测信度的间隔时间两次测验间隔时间的长短影响重测信度间隔多久适宜因测验的目的、性质和被试特点而异,一般为2~4周,最好不超过6个月。复本信度计算复本信度时,一半被试先做A本再做B本,另一半被试则相反,由此抵消测验顺序效应。副本的两个测验必须在项目的内容、形式、数量、难度、时限、指导语等方面相同或相似。分半信度测量的其它方法异质心理学变量的测量问题对于某些复杂的、异质的心理学变量(如智力、人格),单一的测验无法解决,可用几个异质的分测验来分别测量各个方面,保持分测验内部的同质性。66心理测验技能教材(三)信度与测验分数的解释解释真实分数与实得(测验)分数的关系信度系数可以用于解释总方差中有多少比例是由真实分数决定的。因为:Si2

=S∞2+Se2,并且如果我们将总方差看成是1(100%)的话所以:Se2

=1-rxx

例如当rxx=0.9时,我们可以说实得分数中有90%的变异是真分数造成,近10%的来自误差。各种信度的可接受水平一般原则当信度≥0.85时,可用于对个人作评价当0.70≤信度<0.85时,可用于对团体作评价,但不能对个人作评价当信度<0.7时,不能用作评价因测验类型而异一般能力测验要求0.9以上人格、兴趣、态度等测验要求0.80以上(见表)67心理测验技能教材几种心理测验的信度系数测验类型信度低中高成套成就测验0.660.920.98学术能力测验0.560.900.97成套倾向性测验0.460.880.96客观人格测验0.460.850.97兴趣测验0.420.840.93态度量表0.470.790.9868心理测验技能教材解释个人分数的意义测量标准误(SEm,SE)测量误差分布的标准差,用来表示误差的大小。公式:SE=Sx√1-rxxSx分数的标准差rxx测验的信度

举例:已知WAIS-RC城市20岁组FIQ的信度为0.95,求其测量标准误。SE=15√1-0.95=15×0.224=3.3569心理测验技能教材测量标准误的用途确定真分数的置信区间(可信区间)公式:XT=X±ZSEX为某人的具体得分Z置信区间的概率水平SE测量标准误举例:20岁城市男性在已知WAIS-RC全量表IQ为105,问95%的置信区间是多少?从上例已知20岁组FIQ的测量标准误为3.35当置信区间概率水平为95%时,Z为1.96IQ=105±1.96×3.25≈99~111比较不同测验分数的差异(离散分析)测量标准误在评价两个不同测验分数的差异是否具有统计学意义上的显著性时非常重要这种比较可以是两个人的分数是否存在差别,也可以是同一被试的两个测验分数该内容留在智力测验结果分析时讲70心理测验技能教材(四)影响信度(相关系数)的因素样本的特征:样本团体的异质性若计算信度的样本较常模团体样本异质,往往会高估测验的信度,相反则会低估测验的信度。样本团体平均水平的影响:对不同水平的团体,题目难度不同,累积就会影响信度71心理测验技能教材测验的长度测验的长度,亦即测验条目数,也是影响信度系数的一个因素。一般说来,增加同质的条目可以提高测验的信度。如果我们在预备试验中已知道某测验的信度,希望提高至某一水平,可以运用斯皮尔曼–布朗的公式计算出至少应增加多少条目。公式:K指改变后长度为原长度的倍数rkk指期望达到的信度水平rxx指原信度系数举例:中国–韦氏幼儿智力量表(城市版)领悟力分测验有18个条目,平均分半信度为0.69。期望将其信度提高至0.80,问需要多少条目?需要条目=18×1.797≈3272心理测验技能教材

测验的难度

难度对信度的影响,只存在于某些测验中,如智力测验,对无对错之分的测验,不存在

难度与信度并无简单对应关心

测验的时间间隔只对重测信度和不同时间测量的复本信度有影响,其余信度不受影响以再测法或复本法求信度,间隔时间越短,信度系数越大,时间越久,信度系数越低73心理测验技能教材四、效度分析(一)定义效度(validity),在心理测验中是指所测量的与所要测量的心理特点之间吻合的程度。心理测验的准确性心理测验的有效性(龚耀先)在编制或修订心理测验时,效度研究是必须的环节,效度资料是测验手册里必备的测量学指标。在使用心理测验时,没有效度资料的测验也不能使用。74心理测验技能教材效度的性质相对性:是对一定的目标来说的连续性:用相关系数来表示,只有程度上的不同75心理测验技能教材(二)效度的类型与估计方法内容效度(content–relatedvalidity)指测验条目对有关内容或行为取样的实用性。换句话说,所选用的条目是否能测到想要测量的行为。估计方法专家判断法请有关专家对条目进行审定审定步骤

①定义测验总体范围,描述相关知识与技能及所用材料的来源。②编制双向细目表,确定各种内容所占比例,标出每个条目设计所测内容。(见表)③制定一个相应的评定量表来评价效度,如测验包括的内容、技能、材料的重要程度、条目对内容的实用性等。请每位评定者对各方面进行评价,然后总合所有评定者的评价。76心理测验技能教材高中化学标准测验双向细目表识记了解应用分析综合评估合计第一章8210第二章10621028第三章3624722第四章291265640合计525281422610077心理测验技能教材统计分析法计算两个评审者之间一致性克伦巴赫推荐的方法:先编出两个测验复本(取自同样内容范围),在同一组被试中实测,然后计算其相关。再测法:学习前先测验一次,学习后在测试一次,计算两次相关。经验推测法通过实践来检验如检验儿童发展量表的效度,观察不同年龄阶段儿童通过率是否随年龄的增长而增加。78心理测验技能教材构想效度(construct–relatedvalidity)指测验能够测量理论上的构想或特质的程度,亦即测验的结果能否证实或解释某一理论的假设、术语或构想,解释的程度如何。构想效度一般要回答以下几个问题:测量了什么心理构想?对这构想测量得有多好?测验分数中有多少比例的变异来自测验所欲侧之构想?估计方法对测验本身的分析测验的内容效度可以作为构想效度的证据测验的同质性信度指标,如分半相关、α系数等分析被试对条目的反应特点(表面效度)79心理测验技能教材测验间的相互比较与经典、成熟的同类测验相比较:计算新测验与经典测验之间分数的相关。相关系数的平方即两测验分数共同解释的变异大小,又称为相容效度(congruentvalidity)。区分效度(discriminatevalidity):一个有效的测验不仅应与其他测量同一构思的测验成绩有相关,还必须与测量不同构思的测验成绩无相关,后者就是区分效度。因素分析方法(factoranalysis):对一组测验进行因素分析,找出影响测验分数的共同因子,这种因素可能就是我们要测量的心理特征。用效标效度做证明根据效标选择不同的被试群体,比较不同组测验成绩的差异利用心理素质的变化关系,如儿童年龄增长与能力发展的关系。实验法和观察法观察实验前和实验后测验分数的差异80心理测验技能教材效标效度(criterion–relatedvalidity)效标效度又称实证效度,反映的是测验预测个体在某种情景下行为表现的有效性程度。被预测的行为是检验效度的标准,简称效标。估计方法相关法求测验分数与效标资料间的相关最常用的是积差相关,根据资料的特征也可用等级相关、二列相关等方法。81心理测验技能教材区分法区分法是检验测验分数能否有效地区分由效标所定义的团体的一种方法公式(t检验公式)

t检验统计量XH高分组平均值XL低分组平均值SH2高分组方差SL2低分组方差NH高分组样本人数NL低分组样本人数82心理测验技能教材举例(例7):用能力倾向测验给工作成功(N=60)和工作失败(N=40)两组工人测试,工作成功组平均得分6.05,方差为3.31;工作失败组平均得分4.25,方差为1.69,问两组得分差异是否具有显著意义?无效假设:假设两组得分的差异是由抽样误差所造成自由度(df)=NH+NL-2=60+40-2=98查t值表:t(0.01)=2.66,本例5.79>2.66,所以p<0.01结论:无效假设成立的概率<0.01,差异有非常显著意义。83心理测验技能教材能力倾向测验与工作成绩的分布(例7)工作成绩能力倾向测验得分12345678910合计工作成功101190812375121961252411552633216413524116工作失败314692123252231211214011合计人数1313172123965210084心理测验技能教材从t检验方法中可以发现差异显著性与样本大小有密切关系,当样本较大时,平均数之间的小差异也有显著性,但这种差异用于区分团体时实际价值很小。重叠计算法如果t检验有显著差异,进一步求两个分部的重叠量,以解决上述缺点。一组(A组)内被试超出另一组(B组)平均值的人数与该组(B组)内部平均值以上人数之比。如果该比例越低,说明两组差异越大。举例:前例中以6分为界,失败组有7人≥6分,而成功组有38人≥6分,其比例为7/38。计算两组分布共同区的百分比,重叠量越大,说明分数差异越小,测验效度越差。举例:前例中两组分布重叠范围从2~7分,共86%的人分布在此区域。85心理测验技能教材命中率法用测验结果作为取舍依据时,用其正确决定的比例作为效度指标的一种方法。计算命中率时除有测验分数外,还需具备某种效标资料。

效标成绩测验预测

失败(-)成功(+)

成功(+)

(A)失误(B)命中

失败(-)(C)命中(D)失误命中率计算总命中率(PCT)=命中/(命中+失误)=(B+C)/(A+B+C+D)正命中率(PCP)=测验与效标皆成功人数/测验成功人数=B/(A+B)举例:上例测验成绩以≥6分为界,工作成绩以≥4分为界。A=22,B=38,C=33,D=7总命中率(PCT)=(38+33)/(22+38+33+7)=71%正命中率(PCP)=38/(22+38)=63%86心理测验技能教材(三)效度的功能预测误差决定性系数效度系数的实际意义常常以决定性系数来表示,即相关系数的平方,它表示测验正确预测或解释的效标的方差占总方差的比例。举例:高考英语成绩与入大学后第1学年英语课考试成绩的相关为0.6。估计的标准误(Sest):指预测效度分数时预测误差大小的估计值。

Sest=SDy√1-r2xySDy效标成绩的标准差r2xy效度系数的平方,即决定性系数预测误差的判断与信度一样,当r2xy=1.0时,效度完美,估计标准误也为0,测验分数可完全代表效标。当r2xy=0时,测验分数完全不能代表效标。87心理测验技能教材预测效标分数的可信区间估计标准误可用于估计真正效标分数的可信区间。公式:YT=Y±ZSestY为某人的具体得分Z置信区间的概率水平Sest估计标准误举例:某脑外伤病人在WAIS-RC中的事前智力(全量表)为105,该计算(回归)方法的效度系数为0.625,问该病人病前全量表智商的95%可信区间是多少?计算估计标准误(Sest)Sest=SDy√1-r2xy计算病前智力的可信区间88心理测验技能教材预测效标分数如果X与Y两变量呈直线相关,只要确定出二者的回归方程,就可以从一个变量推估出另一个变量。一般常从测验分数来预测效标成绩公式(回归方程):为预测的效标分数A为纵轴的截距,用来纠正平均数的差异Byx为斜率,Y向X回归的系数X为测验分数计算byx和a的公式byx=rxy×Sy/Sxrxy为测验分数与效标分数的相关Sy和Sx为效标分数与测验分数的标准差a=Y-byxXY为效标分数的平均值,X为测验分数的平均值89心理测验技能教材举例(前例):用能力倾向测验预测工作绩效,该组平均测验分数为5.35分,标准差1.80分;平均绩效分数为4.28分,标准差1.89分;测验分与绩效分的相关系数为0.68,计算其回归方程?计算byx=rxy×Sy/Sx已知rxy=0.68Sy=1.89Sx=1.80byx=0.68×1.89/1.80=0.714计算a=Y-byxX已知Y=4.28X=5.35a=4.28-0.714×5.35=0.46回归方程:应用举例:某人能力倾向测验得分为6分,求绩效分?90心理测验技能教材预测效率指数前面公式-25中的称作无关系数,以K表示。K值大小表明预测源分数与效标分数无关的程度无关系数公式:预测效率指数(E)=100(1-K)E值的大小表明使用测验比盲目猜测能减少多少误差举例:一个测验的效度系数为0.80,其预测效率指数为多少?说明使用测验比盲目猜测减少40%的误差也说明测验预测误差仅为随机误差的60%91心理测验技能教材信度和效度的关系信度和效度的差别在于所涉及的误差不同信度考虑的是随机误差的影响效度则还包括测验稳定的测量误差(系统误差)信度是效度的必要条件而非充分条件(见图)一个高效度的测验,其信度必然也高;一个高信度的测验,其效度不一定高。效度受信度的制约效度与信度的关系式:rxy≤√rxxrxy效度系数rxx信度系数92心理测验技能教材效度分析的注意事项要求内容效度的测验,不一定要求测验为同质的。测量单一心理特质的测验要求测验条目有高度的同质性测量一组不同心理特质的成套量表,不要求各分测验之间具有同质性。不同类型的测验对表面效度的要求是不同的表面效度是指测验使用者或被试在主观认识上觉得有效需要被试者在测验中尽最大努力的测验要求较高的表面效度需要被试这尽可能按自己实际情况回答的测验要求较低的表面效度93心理测验技能教材构想效度的建立先从某一理论出发,设计相应的分测验和条目,然后要验证测验结果与假设的符合程度。构想效度常用相关和因素分析方法来验证以人格测验为例:人格包括几个特质,内容是什么?人格特质是相对稳定的儿童时期的遭遇对人格的形成有着巨大的影响检验效标效度的难点在于找到合适的效标效标能够最有效地反映测验的目标效标具有较高的信度,稳定可靠效标可以被客观地测量效标测量的方法简单、实用。94心理测验技能教材(四)影响测验效度的因素1、测验本身的因素:测验取材必须具有代表性设计题目时尽量避免容易引起误差的题型(如是非题)题目难度适中,具有较高的区分度;测验长度恰当,具有一定的题量;测题的排列按先易后难的次序。2、测验实施中的干扰因素:主试者的影响受测者的影响3、样本团体的性质:样本团体的异质性干涉变量4、想表的性质:小标测量的信度不可靠,与测验分数间的关系也失去了可靠性使用积差相关评估效度时,应注意测验分数与效标之间是否为线性关系。95心理测验技能教材五、项目分析测验的项目分析定性分析和定量分析定性分析:测验的内容效度、题目编写的恰当性和有效性定量分析:对题目的难度和区分度进行分析项目分析的目的是:通过选择和修改测验题目,提高测验的信度和效度。96心理测验技能教材项目的难度分析难度(difficulty),指项目的难易程度,能力测验中一个重要的指标。在人格测验中,类似的指标是“通俗性”。即取自相同总体样本中,能在答案方向上回答该题的人数。两种指标的计算方法是相同的97心理测验技能教材难度的计算二分法记分的项目(1、0记分)公式(通过率):P=R/N×100%P指项目的难度(通过率)R答对或通过该项目的人数N全体被试人数举例(前例4):第一题10名被试中8人答对,其难度为:P1=8/10×100%=80%98心理测验技能教材样本例数较大时的计算方法根据测验总成绩将被试分为三组高分组(NH):分数最高的27%中间组:分数居中的46%低分组(NL):分数最低的27%计算高分和低分组的通过率计算两组平均通过率作为难度指标

公式:P=(PH+PL)/2P指难度(通过率)PH指高分组通过率PL指低分组通过率

举例:某测验条目高分组通过率为85%,中间组通过率为52%,低分组通过率为35%,问平均通过率是多少?99心理测验技能教材吉尔福特的难度校正公式因为选择题易受到猜测的影响,备选答案越少,机遇的作用越大,越不能反映真实难度,吉尔福特的校正公式用于对此进行校正。公式:CP校正后通过率P校正前通过率K备选答案数目举例:上题若为5选1的题型,请计算校正后的通过率?

100心理测验技能教材非二分记分项目的难度计算公式:X指全体被试在该题上的平均得分Xmax为该题的满分举例(前例5):计算难度(通过率)第一题平均得分1.8分,最高分2分,通过率:P1=1.8/2.0×100%=90101心理测验技能教材难度水平的确定进行难度分析的目的是为了筛选条目,项目难度多高合适,取决于测验的目的、性质及项目的形式。一般而言,难度(通过率)在0.5时,区别力最高,对信度和效度影响最好。在能力测验中,为了使尽可能少的人在测验中得0分或得满分,因此必须安排很容易的项目和很难的项目,但测验的平均通过率最好控制在0.5水平。102心理测验技能教材测验的难度测验的难度取决于组成测验项目的难度通过观察测验分数的分布,可以进行直观检验。如果测验难度适中,分数的分布应当接近常态分布;如果测验偏难,分布呈正偏态(图5-4,A)如果测验偏容易,分布呈负偏态(图5-4,B)测验偏难或便容易时,可以通过增加或减少不同难易程度的条目来解决。某些测验(如标准参照测验)允许测验分数呈偏态分布。103心理测验技能教材项目的区分度项目区分度(itemdiscrimination)也叫鉴别力,是指测验项目对被试者的心理特征的区分能力。高区分度条目:实际水平高者能通过,实际水平低者不能通过。区分度的计算方法鉴别指数相关法104心理测验技能教材鉴别指数鉴别指数计算步骤按测验总分依次排列确定高分组和低分组高分组:排序最高的27%的被试低分组:排序最低的27%的被试分别计算高分组与低分组在每个项目上的通过率公式:D=PH-PLD指鉴别指数PH高分组在某项目上的通过率PL低分组在某项目上的通过率举例(例8)105心理测验技能教材鉴别指数的判断因为高分组条目总得分上高于低分组,理论上他们每个条目的通过率也要高于低分组。D>0时,D越大,说明该条目区分两种水平(组)的能力越强D<0则反映高分组的得分反而低于低分组,说明该条目有问题。伊贝尔(L.Ebel,1965)关于鉴别指数评价项目性能的标准:

鉴别指数(D)项目评价0.40以上很好0.30~0.39良好,修改后会更佳0.20~0.29尚可,但需修改0.19及以下差,必须淘汰106心理测验技能教材相关法计算区分度常用的方法是相关法,即以某一条目得分与效标成绩或测验总分进行相关运算。相关系数越高,说明该条目越具有区分功能。常用于项目分析的相关方法点二列相关二列相关Ф相关107心理测验技能教材点二列相关适用于一类变量为二分变量,另一类变量为连续变量的相关计算。公式:rpq点二列相关系数为与二分变量通过组相对应的连续变量的平均数为与二分变量未通过组相对应的连续变量的平均数St为连续变量的标准差p通过组人数与总人数之比(通过率)q未通过组人数与总人数之比(未通过率)举例(例9):108心理测验技能教材二列相关适用于两个连续变量,但其中一个变量被人为分成两类。公式:rb为二列相关系数y为p与q交界处正态曲线的高度Xp、Xq、St、p、q的意义与点二列相关公式相同当两个变量均为连续变量时,也可使用皮尔逊积差相关方法计算。举例:(例9)109心理测验技能教材区分度与难度的关系区分度与难度呈现的是一种曲线(倒“U”的关系)。难度为0.5时,区分度最高难度较高或较低时,区分度中等非常高或非常低的难度时,区分度也很低不同水平被试中区分度与难度的关系较难的题目对高水平被试有较高的区分度中等难度的题目对中水平被试有较高的区分度较容易的题目对低水平被试有较高的区分度平均难度0.5左右,能保持整体较好的区分度。111心理测验技能教材D的最大值与项目难度的关系项目通过率理论上最大区分度(以总分对半划分高、低分组时)高分组通过率低分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论