心理测量学(基础部分)_第1页
心理测量学(基础部分)_第2页
心理测量学(基础部分)_第3页
心理测量学(基础部分)_第4页
心理测量学(基础部分)_第5页
已阅读5页,还剩190页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

,心理测量学,国家职业资格培训心理咨询师,南方医科大学心理学系张茂运,(基础部分),事物可以认知,但不可穷知。,凡有数量的东西都可以测量。,凡客观存在的事物都有其数量。,基础知识,第一节概述第二节测验的常模第三节测验的信度第四节测验的效度第五节项目分析第六节测验编制的一般程序第七节心理测验的使用,心理测量学,教学内容,第一单元测量与测量量表第二单元心理测验的基本概念第三单元心理测验分类第四单元错误与正确的测验观第五单元咨询中常用测验及其应用第六单元心理测验发展史,第一节概述,一、测量的概念,依据一定法则用数字对事物进行确定。,第一单元测量与测量量表,测量的三个主要元素组成事物:数字:区分性、等级(序列)性、等距性、可加性法则:原理、规则、方法、理论依据法则有优劣质之分心理测验的最大问题就是理论基础不够坚实。,第一节概述,二、测量要素条件,参照点,第一单元测量与测量量表,第一节概述,单位有确定意义有相同价值,绝对零点0=无,相对零点0无,测量的起点,心理测量没有绝对零点,单位也不完善(既不统一,也不等距)。,三、测量量表,第一单元测量与测量量表,测量就是根据某一法则将事物数量化,即在一个定有单位和参照点的连续体上把事物的属性表现出来。这个连续体称为量表(测量工具)。,第一节概述,量表的分类,命名量表对事物进行分类、编码。顺序量表分级或排序。无相等单位,无绝对零点。等距量表有相等单位,无绝对零点;可进行加减运算。等比量表有相等单位,有绝对零点;可进行四则运算。,第一单元测量与测量量表,第一节概述,心理量表多属于顺序量表,斯蒂文思(S.S.Stevens)根据量表的精确程度由低级到高级把量表分为:,第二单元心理测验的基本概念,一、心理测验的定义,依据心理学理论,使用一定的操作程序,通过观察人的少数有代表性的行为,对于贯穿在人的全部行为活动中的某种(些)心理特点做出推论和数量化分析的一种科学手段。,第一节概述,不同被试同一条件同一测验的结果才具有可比性。,心理测验直接得到的原始分数通常无意义。,第二单元心理测验的基本概念,二、心理测验的性质,间接性根据对测验项目的反应(行为)推论心理特质相对性结果是与团体行为(常模)进行比较而言客观性项目、实施与评分和解释的标准化,第一节概述,其他艰巨性、顺序性、可行性,第三单元心理测验的分类,1.智力测验Binet-Simon智力测验、Stanford-Binet智力测验、Wechsler智力测验、瑞文测验等。2.特殊能力测验职业倾向、音乐、绘画能力测验等3.人格测验个性中除能力之外问卷法MMPI、16PF、EPQ等;投射法罗夏墨迹测验、主题统觉测验,一、按测验的功能分类,第一节概述,第三单元心理测验的分类,1.文字测验文字、言语作为刺激Binet-Simon、Stanford-Binet、Wechsler智力测验量表的言语部分;MMPI、16PF、EPQ等。2.操作测验图形、实物、模型作为刺激Wechsler智力测验中的操作部分、Raven测验、罗夏墨迹测验、主题统觉测验等。,二、按测验材料的性质分类,第一节概述,第三单元心理测验的分类,三、按测验材料的严谨程度分类,1.客观测验刺激明确,反应明确Binet-Simon智力测验、Stanford-Binet智力测验、Wechsler智力测验量表MMPI、16PF等。2.投射测验刺激模糊,反应不明确罗夏墨迹测验、主题统觉测验(TAT)、自由联想测验、句子完成测验。,第一节概述,第三单元心理测验的分类,四、按测验的方式分类,1.个别测验韦氏、比内智力测验、罗夏墨迹测验、主题统觉测验等。2.团体测验MMPI、16PF、EPQ。,第一节概述,一般地,团体测验材料,可以个别方式实施;但个别测验材料多不能以团体方式进行。,第三单元心理测验的分类,五、按测验的要求分类,1.最高作为测验最佳应答各种智力测验、特殊能力测验等。2.典型行为测验最合适应答MMPI、16PF、EPQ等人格测验,评定量表,第一节概述,第四单元对待心理测验的观念,一、测验的错误观,1.测验万能论测验解决一切认识人的问题分数绝对化使用泛滥化2.测验无用论测验侵犯个人隐私,侵犯人权为宿命论和种族歧视提供依据3.测验单一论“心理测验=智力测验=智商=遗传决定论”,第一节概述,第四单元对待心理测验的观念,二、正确的测验观,重要的心理学研究方法,应用广泛;心理测验尚不完善,有待改进。,第一节概述,第五单元测验在心理咨询中的应用,咨询中常用的三类测验,智力测验求助者有要求且有可疑智力障碍时使用人格测验了解求助者人格及是否有精神异常评定量表了解心理障碍存在与否、程度及病情演变,第一节概述,使用测验时机:,咨询关系建立前咨询结束咨询过程无法进行时,第六单元心理测验的发展史,第一节概述,首先倡导科学心理测验的学者是英国生物学家和心理学家高尔顿,他对遗传差异性的研究,可认为是心理测验的开端。,一、科学心理测验的产生与发展,1890年,美国心理学家卡特尔在心理杂志上发表了心理测验与测量一文,首次提出心理测验的概念。同时,他认为:“心理学若不立足于实验与测量上,决不能够有自然科学之准确性。”,第六单元心理测验的发展史,第一节概述,1905年,法国心理学家比内与助手西蒙在心理学年报上发表了诊断异常儿童智力的新方法,这是世界上第一个正式的心理测验(智力测验)。,19世纪80年代是高尔顿的十年;90年代是卡特尔的十年;20世纪头十年则是比内的智力测验的十年。,第六单元心理测验的发展史,第一节概述,20世纪心理测验的主要发展:,1.操作测验的发展,2.团体智力测验的发展,3.能力倾向测验的发展,4.人格测验的发展,文字测验受教育限制;全面评估智力水平,提高智力测验的效率,陆军甲种和乙种智力测验,韦氏智力测验的系列发展,人格测验的先驱克雷丕林(E.Kraepin)最早将自由联想测验用于精神病人,1920年问世的罗夏测验是投射测验的发端,能力测验的多元化发展,第六单元心理测验的发展史,第一节概述,二、我国心理测验的发生与发展,盂子:“权,然后知轻重;度,然后知长短。物皆然,心为甚。”心理的可测性刘勰新论.专学篇“使左手画方,右手画圆,无一时俱成”分心测验科举取士制度选拔测验“抓周”预示性测验“七巧板”创造力测验“九连环”智力测验,(一)中国古代的心理测验思想,第六单元心理测验的发展史,第一节概述,(二)中国现代心理测验的发展,起源二十世纪初。翻译、修订、使用国外心理量表,1915年,克雷顿对广州500名儿童试用心理测验。1918年,瓦尔科特对清华学校学生进行智力测验。1920年,廖世承和陈鹤琴在南京高等师范学校首先开设测验课程,并用心理测验测试报考该校的学生。1921年,两人又合作出版心理测验法一书。1924年,陆志韦发表了修订的比奈西蒙量表。l931年,中国测验学会在南京成立,通过了中国测验学会简章,产生了理事会。1932年,学会会刊测验杂志创刊。,第六单元心理测验的发展史,第一节概述,1979年后,心理学各个领域迅速发展。,近些年来,我国心理学家正在致力于测验本土化,编制适合我国文化背景的智力测验、适应行为量表等。,1979年,中国心理学会于天津召开全国学术会。1979年,心理学家林传鼎、吴天敏和张厚粲教授在武汉举办第一个全国心理测验培训班。1980年,北大开设了心理测量课。2001年,北京师范大学成立心理学院随后,积极修订国外著名心理测验量表。心理学刊物蓬勃发展。,复习思考题,第一节概述,1.测验的主要元素不包括下列哪一项(C)A、法则B、数字C、参照点D、事物2.Stevens根据(B)将量表分为四种水平A、用途B、精确程度C、事物D、测量性质3.根据Stevens的分类,心理测量一般属于何种量表(C)A、命名量表B、等距量表C、顺序量表D、等比量表4.对命名量表述错误的是(D)A、用数字代表某一事物或某属性的全体B、是测量水平最低的一种形式C、数字只用来作为标记和分类D、可以进行数量化分析5.关于心理测验,下列描述不正确的是(D)A、心理测验测量的是人的行为,即一个人对测验题目的反应B、要有代表性的样本,即行为样本C、可靠的常模D、同一测验,对于不同被试者,测验的评分标准不必相同,复习思考题,第一节概述,6.由于(B)是从行为模式中推论出来的,所以心理测量永远是间接的A、人格B、特质C、投射D、能力7.测验的(C)性实际上就是测验的标准化问题A、绝对B、相对C、客观D、主观8.各种心理测验的客观性高低是不相同的,相对而言,客观性由高到低依次是(A)A、神经心理测验,智力测验,人格问卷,投射测验B、神经心理测验,人格问卷,投射测验,智力测验C、智力测验,人格问卷,投射测验,神经心理测验D、智力测验,神经心理测验,人格问卷,投射测验9.用于测量性格、气质、兴趣、态度、品德、情绪、动机、信念等方面的个性心理特征的心理测验是(A)A、人格测验B、主观测验C、特殊能力的测验D、操作测验,复习思考题,第一节概述,10.心理咨询过程中,心理测验(C)A、是必不可少的B、是没有必要的C、应根据情况选用D、可有可无11.首先倡导心理测验的是英国生物学家和心理学家(A)A、卡特尔B、高尔登C、达尔文D、比内12.1890年(C)在心理杂志上发表了心理测验与测量,这是心理测验第一次出现于心理学文献中A、比内B、皮尔逊C、卡特尔D、高登13.纵观心理测验的发展,人们常说20世纪头十年是谁的十年(C)A、高尔登B、卡特尔C、比内D、韦克斯勒14.我国心理测验蓬勃发展始于(D)A、1914年B、1949年C、1976年D、1979年,一、测量误差,二、均数、标准差与百分位数,三、变量相关与相关系数,补充内容,相关统计知识,在实际测量中,由于测量依据的理论及测量工具不完善、测量使用的标准偏高或偏低、计算公式的近似性等原因,使测量值不是分散在真实值两侧,而是有方向性地、稳定地偏离真值。,系统误差,系统误差可以通过测量工具的完善等来消除或使之减弱,但不能靠概率统计办法来消除或减弱。,即偶然误差,指排除了系统误差后尚存的误差。它受多种偶然因素的影响,使测量值不按方向性和系统性而随机地变化(测量值时而偏大,时而偏小)。随机误差服从正态分布。多数测量所得到的一系列数据的偶然误差有一定统计规律:,随机误差,绝对值相等的正的与负的误差出现机会相同。绝对值小的误差比大的误差出现的机会多。,随机误差可用概率统计的方法处理。,110名7岁男童身高(cm)资料如下112.4117.2122.7123.0113.0110.8118.2108.2118.9118.1123.5118.3120.3116.2114.7119.7114.8119.6113.2120.0119.7116.8119.8122.5119.7120.7120.7114.3122.0117.4119.8122.9128.0121.3126.1117.7124.5129.0121.8112.7120.2120.8126.6120.0130.5120.0121.5114.3124.1117.2119.0117.0114.9129.1118.2113.2116.0120.4112.3114.9124.4112.2125.2116.3125.8121.0115.4121.2117.9120.2118.0122.8120.7117.4112.4118.6113.0120.0114.8123.8119.4122.8120.7117.1126.2122.0125.3118.0120.7116.3125.1120.3114.2123.5122.4110.3119.3125.0111.5116.2125.5123.3119.5120.5127.4120.3120.6132.5116.3130.8,二、均数、标准差与百分位数,身高组段组中值(X)频数(f)累计频数(G)f*Xf*X2108109111091188111011134333369631121139131017114921114115922103511902511611715371755205335118119185521422548981201212176254130746112212314901722211806124125101001250156250126127410450864516128129310738749923130131210926234322132134133111013317689合计()110131941584990,根据资料编制频数表,108110112114116118120122124126128130132134身高(cm)110名7岁男童身高的频数分布,人数,7岁男童身高的正态分布,二年级三个班同学身高的比较,班级,人数,平均身高(cm),身高范围(cm),甲班,乙班,丙班,50,122,110134,50,123,112136,47,122,108135,(一)(算术)均数(X)的计算,1.根据定义计算,X=-,n,X1X2X3Xn,3.根据正态分布的特征计算,2.根据频数表计算,(二)标准差(s,SD)的计算,为了简化运算,常使用其变形公式:,2,(X)离均差(X).离均差总和(X)2.离均差平方和(X)2-总体方差2N(X)2-总体标准差N(XX)2-样本标准差sn-1,个体差异(异质性)与方差的关系,标准差与方差的关系,方差与变异的关系,计算步骤:1)在频数表上计算f、fX、fX22)代入上述公式计算标准差,得,频数表上计算标准差s,如果观察对象为正常人,则95%或99%数据的散布范围称为正常值范围,并以此作为判断某人某项指标是否正常的统计学依据。,标准差的应用,Xs68.3115.23124.677568.18X1.96s95.0110.70129.2010494.55X2.58s99.0107.77132.1310999.10,110名7岁男童身高实际分布与理论分布比较,理论分布身高范围实际实际分布(%)(cm)人数(%),Xns,计算步骤:1)在频数表上计算累计频数2)确定各百分位数所在的组段位置秩号n.p%所在组段及下限Lp频数fp前累计频数AX25%11025%=281161522X50%11050%=551181837X75%11075%=831221476X95%11095%=10512831043)代入上式计算,得X25%=116.8(cm)X50%=120.0(cm)X75%=123.2(cm)X95%=128.7(cm),(三)频数表上计算百分位数(XP%)-百分点,1.计算中位数和四分位间距。Md=X50%=120.0(cm)=7525=123.0116.8=6.4(cm)2.估计正常值范围。此方法可用于任何分布的资料95%的正常值范围:2.597.599%的正常值范围:0.599.52.597.5=111.8130.3(cm),百分位数的应用,三、变量相关及相关系数,两个变量的相关关系,相关系数,相关系数,相关系数r的计算,(X变量离均差平方和),(Y变量离均差平方和),2,2,2,2,(X与Y离均差积和),例题,某人用自编智力量表和韦氏智力量表对14名被试进行智力测验,智商评估结果如下:,韦氏IQ931048711795999810110811012286105131,被试1234567891011121314,自编IQ6573587859686569698590627398,请问,两个智力测验结果相关程度如何?,韦氏IQ(X),931048711795999810110811012286105131,自编IQ(Y),6573587859686569698590627398,解:,合计(),X2,Y2,XY,8649108167569136899025980196041020111664121001488473961102517161,42255329336460843481462442254761476172258100384453299604,6045759250469126560567326370696974529350109806332766512838,1456,1012,153584,74956,107102,被试,1234567891011121314,r=0.94,LXY,LYY,LXX,2,2,=153584=2160,14562,14,(X),(Y),LXY=(X-X)=XY-,n,(Y-Y),2,=107102=1854,14,14561012,1808,2160,1854,教学内容,第一单元常模团体第二单元常模类型第三单元常模分数表示方法,第二节测验的常模,第二节测验的常模,测验对象的全体,总体,常模团体,原始分数,常模分数,常模,统计,抽样,标准,实施,测验,处理,系列,分布,工作思路,第一单元常模团体,常模团体的确定:,例:在读大学生价值观研究总体:所有在读大学生样本:不同性别、年龄和专业等的大学生,第二节测验的常模,总体:具有某种共同特征的人组成的群体。,一、常模团体,常模团体:总体或代表性样本。即常模样本。,样本:总体中的一部分。,第一单元常模团体,第二节测验的常模,对测验的使用者来说,要考虑的问题是,现有的常模团体哪一个最合适?被试者的分数应该与哪一个常模做比较?适用性,对测验的编制者而言,在明确总体特征和结构的前提下,确保选定的常模团体能够代表该总体。代表性,第一单元常模团体,二、常模团体的条件,总体的构成(特征)必须明确划分变量:性别、年龄、职业一个测验可有多个常模团体常模团体必须具有代表性随机取样常模团体的大小要适当总体只有几十个人,全部;总体较大时,最低不少于30100人;全国性总体,应有20003000人。常模团体要定期更新,第二节测验的常模,第一单元常模团体,1.简单随机抽样个体编号,按照随机数字表顺序选择2.系统抽样(机械抽样)个体随机编号,等组距取样3.分组抽样(整群抽样)组群编号,随机取样4.分层抽样-误差最小,最常用将总体按变量分层,再从各层中随机抽样,三、常模团体的取样方法,第二节测验的常模,非随机抽样随机抽样,第一单元常模团体,原始分数:被试的反应与标准答案相比较而获得的测验分数(粗分)。常模分数:常模团体测试后,将其原始分数按一定规则转换出来的导出分数。,四、常模分数与常模,(一)常模分数,常模:常模分数构成的分布。,(二)常模,第二节测验的常模,原始分数在转换为导出分数时,既要根据原始分数的分布特点,又要遵循现代数理统计的方法,才能转换出有意义、等单位、带参照点的导出分数。,原始分数,导出分数,原始分数,第二单元常模的类型,即年龄与相应的平均表现对应表。,一、发展常模,人的许多心理特质是随着时间以有规律的方式发展的。根据人群中不同年龄发展水平的平均表现制成的量表就是发展常模,亦称年龄量表。,(一)发展顺序量表,如“二抬四翻六会坐,七滚八爬周会走”。,第二节测验的常模,婴幼儿的感觉运动发展程序:4周能控制眼睛运动,去追随一个对象看16周能使头保持平衡28周能用手抓握东西并玩弄它40周能控制躯干、坐立或爬行52周能控制腿脚运动、站立和行走,葛塞尔婴幼儿发育量表,运动水平,适应性,语言,社会性,第二单元常模的类型,第二节测验的常模,13岁儿童行走动作发展顺序,第二单元常模的类型,例如:在吴天敏修订的比内-西蒙量表中,每个年龄都有6个测题,答对一题则得智龄2个月。假如某儿童6岁组的题目全部通过,7岁组通过4题,8岁组通过3题,9岁组通过2题,其智龄为:6(岁)+42(月)+32(月)+22(月)=6岁+18月=7岁6个月。,(二)智力年龄,智力年龄(智龄),也称心理年龄,指一个儿童在年龄量表上所得的分数对应的智力水平的年龄。比内-西蒙量表首先使用该概念。,儿童的智龄是基础年龄与在较高年龄水平的题目上获得的附加月份之和。,第二节测验的常模,第二单元常模的类型,年级当量实际上就是年级量表,测验结果说明被试属哪一年级的水平。即被试的测验得分与常模(各年级常模样本的平均原始得分)相比较而来。在教育成就测验中最常用。例如:测验提示,某学生的算术是6年级水平,阅读是4年级水平,理解是5年级的水平等。,(三)年级当量,第二节测验的常模,第二单元常模的类型,一个测验分数的百分等级是指在常摸样本中低于这个分数的人数百分比。它表明个体在常模团体中所处的位置。,二、百分位常模,(一)百分等级(PR),R:测验分数按由大到小排列的顺序数N:样本总人数,第二节测验的常模,应用最广,包括百分等级、百分点、四分位数及十分位数等,第二单元常模的类型,举例:小东在30名同学中语文成绩是80分,排列第5名,其百分等级多少?PR=100-(1005-50)30=85,N,100R-50,PR=100-,第二节测验的常模,N,R-0.5,PR=(1-)100,N,R,PR(1-)100=-100,N-R,N,第二单元常模的类型,与百分等级相反,百分点是指处于某一百分比例的人对应的测验分数是多少。即对应于某一个百分等级的具体分数值。,(二)百分点(PP),(直线内插法),C指上限百分等级SC上限百分等级对应的分数F指下限百分等级SF下限百分等级对应的分数X已知百分等级PP求X对应的百分位数,第二节测验的常模,百分位数,举例,某年高考的最高分为695,最低分为103,现欲录取20%的考生,录取分数线应定多少?,分析:695分的百分等级是100,103分的百分等级是1,前20%即百分等级是80。,PP575,100,百分等级,80,1,103,695,百分位数,?,非同时等距,人数分布,第二单元常模的类型,百分位数是将量表分成100等份,每份相当于1%。四分位数是将量表分成四等份,每份相当于25。十分位数是将量表分成十等份,每份相当于10。,(三)四分位数和十分位数,四分位数和十分位数只是百分位数的两个变式,其含义相似。,第二节测验的常模,第二单元常模的类型,三、标准分常模,常见的标准分数有:z分数、Z分数、T分数、标准九分数、离差智商(IQ)等。,第二节测验的常模,标准分常模是将原始分数与平均数的差以标准差为单位表示出来的量表。因为它的基本单位是标准差,所以叫标准分数。,第二单元常模的类型,(一)线性转换的标准分数,z分数为最典型的线性转换的标准分数。z分数表示某一分数与平均数之差是标准差的几倍。,X为任一原始分数X为样本平均数SD为样本标准差,第二节测验的常模,第二单元常模的类型,由于z分数经常是小数和负数,计算和使用很不方便,所以通常需要将z分数转换成另一种形式的量表分数。,举例,韦氏智力量表智商的平均值为100,标准差为15。某人的全量表分高于常模1个标准差,问其FIQ应为多少?,FIQ=100+151=115,第二节测验的常模,Z:为转换后的标准分数A:根据需要指定的常数(代表量表的平均数)B:根据需要指定的常数(代表量表的标准差),Z=A+Bz,第二单元常模的类型,(二)非线性转换的标准分数,常态分布的离均值(查常态曲线面积表),原始分数,百分等级,求出对应的分数,第二节测验的常模,第二单元常模的类型,与线性导出分数一样,常态化标准分数也可以转换为任何方便的形式。当以50为量表平均数,以10为量表标准差来表示时,通常称为T分数。,T分数由麦克尔于1939年提出,以纪念推孟和桑代克。T分数可用于任何分布的资料,量表分平均值固定为50,量表分标准差固定为10。许多人格问卷采用T分数,如MMPI、EPQ。,第二节测验的常模,第二单元常模的类型,标准九分,19分的九级分数量表,平均值为5、标准差为2。,标准九分=5+2z=5+2(XX)/SD,用于性向测验、美国空军操作技能测验和某些教学成就测验。,第二节测验的常模,第二单元常模的类型,标准十分,110分的十级分数量表,平均值为5.5、标准差为2。卡特尔16PF。,标准十分=5.5+2z=5.5+2(XX)/SD,举例30岁女性被试16PF测验中乐群性得分为15分,样本组平均值为10.90、标准差3.23,其量表分是多少?,标准十分=5.5+2(1510.9)/3.238.3,第二节测验的常模,第二单元常模的类型,标准二十分,119分的分数量表,平均值为10、标准差为3。韦氏智力量表。,标准20分=10+3z=10+3(XX)/SD,举例16岁被试算术分测验得分为15分,样本组平均值为12.73、标准差3.55,其量表分是多少?,标准20分=10+3(1512.73)/3.5511.9,第二节测验的常模,第二单元常模的类型,四、智商及其意义,最早的比内-西蒙智力测验使用心理年龄表示测验结果。缺点是不同年龄儿童间缺乏可比性。,(一)比率智商1916年,推盂教授修订斯坦福-比内量表时提出以比率智商表示测验结果。,第二节测验的常模,第二单元常模的类型,由于:比率智商并不适合于年龄较大的被试;相同的比率智商在不同年龄具有不同意义。韦克斯勒采用了离差智商的概念。,离差智商是一种以年龄组为样本计算而得的标准分数。为了与传统的比率智商基本一致,一般将量表的离差智商的平均值定为100。,(二)离差智商,韦克斯勒智力量表的标准差定在15IQ=100+15(XX)/SD=100+15z斯坦福-比内量表的标准差定在16IQ=100+16(XX)/SD=100+16z,第二节测验的常模,第二单元常模的类型,4岁城市儿童,使用WPPIS-R测得言语分量表得分42分。样本平均值为49.94、标准差11.58,其言语IQ是多少?,举例,VIQ=100+15z=100+15(XX)/SD,VIQ=100+15(4249.94)/11.58,VIQ90,第二节测验的常模,第二单元常模的类型,在实际工作中,通常将原始分数与IQ值的对应关系计算出来作为常模表,使用时可在常模表上按其年龄直接查出智商。,必须指出,不同测验获得的离差智商只有当常模标准差相同或接近时才可以比较,标准差不同,其分数的意义便不同。,第二节测验的常模,百分数分布SD=12SD=14SD=15SD=16SD=18130以上O.71.62.23.15.l1201294.36.36.77.58.511011915.216.016.115.815.410010929.826.l25.023.621.0909929.826.l25.023.621.0808915.216.016.l15.815.470794.36.36.77.58.570以下0.71.62.23.15.1总计100.O100.0100.0100.0100.0,以100为平均数不同标准差下每一IQ组距正态曲线下所占百分比,分数,按国际疾病分类标准,IQ值70,诊断为智力落后(弱智)。,正态分布与标准分关系,第三单元常模分数的表示方法,一、转换表法(常模表),一个转换表显示出一个特定的标准化样组的原始分数与其相对应的等值分数百分位数、标准分数或者其它任何导出分数。,利用转换表可将原始分数转换为与其对应的导出分数,从而对测验的分数作出有意义的解释。,第二节测验的常模,测验分数,百分等级,性别,剖面图是将测验分数的转换关系用图形表示出来。,二、剖面图法,第二节测验的常模,复习思考题,1.对常模的理解,正确的是(B)A、只要掌握常模资料,就可以对分数做出确切合理的解释B、常模的功能是给测验分数提供一个用于比较的标准C、任何测验都有常模D、一个测验只能有一个常模2.全国性常模样本的大小一般在(D)A、100人左右B、100200人C、1000人D、20003000人3.采用系统抽样方法,对150名1416岁的男孩进行身高的检测,抽取1/3作为样本,下列方法错误的是(B)A、样本量为50B、每段均从高到矮排列,取最高者C、K=150/50=3,可分50段,每段3人,取1人D、将150名男孩进行编号,随机抽取M号做第一人,在依次抽取nK+M人构成样本4.常模分数就是施测常模样本被试后,将被试者的原始分数按一定规则转换出来的(B)A、真分数B、导出分数C、参照点D、百分等极,第二节测验的常模,复习思考题,5.发展常模不包括(B)A、发展顺序量表B、十分位数C、年级当量D、智力年龄6.(A)首先采用了心理年龄或称智力年龄的概念A、比内西蒙B、卡特尔C、达尔文D、高尔登7.某6岁儿童进行修订的比内-西蒙测验,通过题目分别为6岁组全部,7岁组3个,8岁组3个,其智龄为(B)A、6岁半B、7岁C、7岁半D、8岁8.T分数是(C)A、以50为均数,5为标准差B、以60为均数,10为标准差C、以50为均数,10为标准差D、以55为均数,10为标准差9.标准九分是(C)A、以9为均数,3为标准差B、以5.5为均数,1.5为标准差C、以5为均数,2为标准差D、以4.5为均数,1.5为标准差,第二节测验的常模,复习思考题,10.关于比率智商错误的是(A)A、实足年龄与心理年龄之比,再乘以100B、如一个儿童的心理年龄等于实足年龄,其智商为100C、不适于年较大的被试者D、相同的比率智商分数在不同年龄被试者的意义是不相同的11.在公式IQ=10015(X-M)/SD中,SD代表(B)A、某人所在年龄组的平均数B、某人所在年龄组分数的标准差C、某人的原始分数D、标准Z分数,教学内容,第三节测验的信度,第一单元信度的概念第二单元信度评估方法第三单元信度与测验分数的解释第四单元影响信度的因素,信度与效度,信度:稳定性,一致性,效度:准确性,有效性,A,C,B,花生重量=花生净重+泥土重量,花生重量=花生仁重量+花生壳重量+泥土重量,第一单元信度的概念,第三节测验的信度,信度是指同一被试在不同时间内用同一测验(或用另一套相等的测验)重复测量,所得结果的一致程度。信度只受随机误差的影响。系统误差稳定,不影响信度。随机误差越大,信度越低。因此,信度亦可视为测验结果受随机误差影响的程度。,一、信度的定义,实得分数(X)=真实分数(T)+误差(E),第一单元信度的概念,第三节测验的信度,根据方差分析变异理论,SX2是测验实得分数的方差(即总方差),ST2是测验真分数的方差,SE2是测验误差的方差。,在测量理论中,信度被定义为:一组测量分数的真分数方差与总方差的比率。,(ST2不可能知道),第一单元信度的概念,第三节测验的信度,二、信度的描述指标,真分数标准差与实得分数的标准差的比值称信度指数。它是信度系数的平方根。,2.信度指数,rXT=ST/SX=rxx,(一)信度系数与信度指数,1.信度系数最常用,指同一被试样本所测得的两组资料的相关系数。理论上,是真分数方差与实得分数的方差的比值。,(0rxx1),(rXTrxx),第一单元信度的概念,第三节测验的信度,可见,测量的标准误与信度呈负相关。,(二)测量标准误,使用同一测验对一个人实施N次测量,得到N个测量值,从N个测量值中随机抽取n(nN)个数据M次,即得到M个平均数,平均数的标准差即标准误(SE),它反映抽样误差的大小。,SE为测量的标准误,SX是所得分数的标准差,rXT为测验的信度系数。,第二单元信度评估的方法,第三节测验的信度,两次施测的时距一般是两周到四周,最好不超过六个月。,一、重测信度稳定性系数,使用同一测验,在同样条件下对同一组被试前后施测两次测验,求两次得分间的相关系数。,举例10名学生用同一量表两次测验的成绩如下,求它们之间的相关系数?第1次成绩:86587964885855823275第2次成绩:88568976856847764575,第1次成绩(X),86587964885855823275,第2次成绩(Y),88568976856847764575,例解,合计(),X2,Y2,XY,7396336462414096774433643025672410245625,7744313679215776722546242209577620255625,7568324870314864748039442585623215305625,677,705,48603,52061,50107,LXX=(X-X)2=X2-=2770.1,(X)2,n,LYY=(Y-Y)2=Y2-=2358.5,(Y)2,n,(X),(Y),LXY=(X-X)=XY-,n,r=0.93,LXY,LYY,LXX,=2378.5,(Y-Y),第二单元信度评估的方法,第三节测验的信度,以两个等值但题目不同的测验(复本)来测量同一群体,然后求得被试者在两个测验上得分的相关系数。复本信度反映的是测验在内容上的等值性,故又称等值性系数。,二、复本信度等值性系数,要有两份或以上真正平行的测验。即在题目内容、数量、形式、难度、区分度、指导语、时限以及所用例题、公式和测验等其他方面都相同或相似。,被试有条件接受两个测验。,复本信度使用前提条件:,第二单元信度评估的方法,第三节测验的信度,(一)分半信度测验实施后将测验题按奇、偶数分为相等的两半,分别计算每位被试在两半测验上的得分,求出这两半分数的相关系数。,三、内部一致性信度,同质性主要反映测验内部所有题目间的一致性。若各测题的得分有较高的正相关时,则测验为同质的。相反,若各测题的得分相关很低或为负相关时,则测验为异质的。,(二)同质性信度,10名被试者在一个有10个条目的测验中得分如下,求该测验的分半信度?,举例,第二单元信度评估的方法,第三节测验的信度,两位评分者对随机抽取的若干份测验卷按评分标准分别给分,然后根据每份测验卷的两个分数计算相关系数,即得评分者信度。它反映不同评分者之间所产生的误差。一般要求在成对的受过训练的评分者之间平均一致性达0.90以上,才认为评分是客观的。,四、评分者信度,第二单元信度评估的方法,第三节测验的信度,举例A、B两位教师给6篇作文评分,结果如下,试求两位教师评分一致性的程度。,作文123456教师A253027202832教师B222623202535,第二单元信度评估的方法,第三节测验的信度,信度类型误差(变异)来源重测信度时间误差复本信度(连续施测)内容误差复本信度(间隔施测)*时间、内容误差分半信度内容(项目)误差同质信度项目异质误差评分者信度评分者间误差,几种信度相应误差(变异)的来源,*重测复本信度,第二单元信度评估的方法,第三节测验的信度,估计信度的方法很多,实际上有多少随机误差的来源,便有多少估计信度的方法。所以,在确定测验的信度时,应根据情况采用不同的信度指标,原则上一个测验哪种误差大,便应该用哪种误差估计。,第三单元信度与测验分数的解释,第三节测验的信度,如rXX=0.85,可认为实得分数中85的变异是真分数造成的,15是来自测验的随机误差。,一、解释真实分数与实得分数的关系,信度系数可以解释总的方差中有多少比例是由真实分数的方差决定的,也就是测验的总变异中真实分数造成的变异占百分之几。,第三单元信度与测验分数的解释,第三节测验的信度,一般的能力测验和成就测验的rXX都在0.90以上,有的可达0.95;而人格测验、兴趣、态度、价值观等测验的rXX一般在0.800.85。,二、确定信度可以接受的水平,个人评价、预测团体比较rXX0.700.70rXX0.85rXX0.85,信度系数对测验的评价,第三单元信度与测验分数的解释,第三节测验的信度,估计真实分数的范围(置信区间);了解实得分数再测时的可能范围。,三、解释个人分数的意义,即,真实分数(或再测分数)有95的可能性落在所得分数X1.96SEXTXl.96SE的范围内(即有5的可能性落在该范围之外)。,X1.96SEXTXl.96SE,即测量标准误的应用。,SE=SX1-rXX,第三单元信度与测验分数的解释,第三节测验的信度,例题,假设在一个智力测验中,某个被试的IQ为100,这是否反映了他的真实水平,如果再测一次他的分数将改变多少?(已知该智力测验的标准差为15,信度系数为0.84),这个被试的真实IQ(再测一次,他的IQ分数)有95的可能性落在88与112之间。,SE=SX1-rXX,SE=151-0.84=6.0,X1.96SEXTXl.96SE,88XT112,第三单元信度与测验分数的解释,第三节测验的信度,使用测量标准误和信度可以评价两个人同一测验不同分数的差别或同一被试在两个测验上的差别是否有统计学意义。,四、比较不同测验的分数差异,SEd差异的标准误;S两个测验使用的标准差,要求相同。,统计学上差异(0.05)1.96*SEd,第三单元信度与测验分数的解释,第三节测验的信度,例题,某被试在韦氏成人智力测验中言语智商为102,操作智商为110。已知两个分数都是以100为平均数,15为标准差的标准分数。假设言语测验和操作测验的分半信度分别为0.87和0.88。问其操作智商是否显著高于言语智商呢?,SEd=152-0.87-0.88=7.5,统计学上差异1.96*SEd15,第三单元信度与测验分数的解释,第三节测验的信度,例题,甲、乙两被试经某智力测验测得智商分别为125和110。已知该智力测验平均数为100,标准差为16;重测信度为0.90。问甲、乙两人的智力水平是否有统计学差别?,SEd=162-20.90=7.2,统计学上差异1.96*SEd14,从统计学上看,有95%的把握认为,甲、乙两人的智力水平有差别,即甲的智力水平高于乙。,第四单元影响信度的因素,第三节测验的信度,一、样本特征,样本团体越异质(个体差异大),真实分数的方差XT2就越大,所获得的信度就越高。,(二)样本团体平均能力水平的影响,样本团体的平均能力越高,测验题的难度就越小,测验分数中的真实分数就越高,所获得的信度也就越高。,(一)样本团体异质性的影响,第四单元影响信度的因素,第三节测验的信度,测验长度,即测验题的数量。在一个测验中增加同质的题目,可以使信度提高。这是因为:,二、测验长度,测验题目越多,测验的测题取样或内容取样就越有代表性。测验题目越多,被试的猜测因素对测验实得分数的影响就越小。,第四单元影响信度的因素,第三节测验的信度,难度对信度的影响,只表现在智力测验、成就测验、能力倾向测验等测验中。,三、测验难度,测验对某团体太难或太易,则分数范围将缩小,从而使信度降低。从理论上说,只有平均难度水平为50(0.5)时,才能使测验分数分布范围最大,求得的信度也最高。,洛得(Lord)提出的各类选择题的理想平均难度:五择一题为0.70;四择一题为0.74;三择一题为0.77;是非题为0.85。,第四单元影响信度的因素,第三节测验的信度,以再测法或复本法求信度,两次测验相隔时间越短,其信度系数越大;间隔时间越久,其他变因(态度、情绪、学习等)介人的可能性越大,受外界的影响也越大,信度系数便越低。,四、时间间隔,第三节测验的信度,复习思考题,1.同一被试在不同时间内用同一测验(或另一套相等的测验)重复测验,所得结果的一致性程度,称为(B)A、效度B、信度C、标准化D、命中率2.关于信度的指标,正确的是(C)A、信度系数,即实得分数方差与真分数的方差的比值B、信度指数即是信度系数C、测量标准误与信度呈负相关D、测量标准误与信度呈正相关3.对信度的评估方法(B)A、有统一通用的原则B、没有统一通用的法则C、一种信度系数就能说明信度的不同方面D、要用多种信系数来说明信度的总的方面4.重测信度两次实施测验(D)A、间隔时间越长越好B、间隔时间没有特殊要求C、应连续进行D、间隔以24周为宜,最好不超过6个月,第三节测验的信度,复习思考题,5.同质性信度(A)。A、是检验测验内部所有题目的一致性B、是用同一测验重复测量的一致性程度C、是检验两个测验在内容上的等质性D、又称半分信度6.测验长度、亦即测验的数量可影响信度,如在一个测验中增加同质题目(A)A、可致信度提高B、可致信度降低C、对信度无影响D、对信度的影响视具体情况而定7.关于心理测验,信度系数(B)A、0.70r0.85,不可用于团体比较B、0.70r0.85,可用于团体比较C、0.70r,可用于团体比较D、0.70r,可用于个人比较,第四节测验的效度,第一单元效度的概念第二单元效度评估的方法第三单元效度的功能第四单元影响效度的因素,教学内容,第一单元效度的概念,第四节测验的效度,一、效度的定义,效度是指一个测验或量具能够测量出其所要测量的东西的程度。或者说,效度是指测量的结果与所要测量的心理特点之间的符合的程度。,1、通俗的定义,效度反映一个心理测验的准确性、有效性。,第一单元效度的概念,第四节测验的效度,rxy2:测量的效度rxy:效度系数SX2:测量总方差SV2:有效方差SI2:无效方差,由系统误差引起,稳定,2、测量学的定义,(1)理论定义效度是指在一个测量中,与测量目的有关的真实方差(变异、变化)与总方差(变异、变化)的比率。,(2)操作定义用公式表示,即:,Sx2=ST2+SE2=SV2+SI2+SE2,ST2=SV2+SI2,第一单元效度的概念,第四节测验的效度,2.效度具有连续性测验效度通常用相关系数表示,它只有程度上的不同,而没有“全有”或“全无”的区别。,二、效度的性质,1.效度具有相对性效度是相对于某一(测验)目标的有效性而言的。,一、内容效度最常用,第二单元效度评估的方法,第四节测验的效度,(一)什么是内容效度,明确所测量的心理特征的概念,并划定出哪些行为与这种心理特征有关(内容范围)。测验题目应是界定的内容范围的代表性取样。,是指测验题目对有关内容或行为取样的适用性,从而确定测验是否是所欲测量的行为领域的代表性取样。由于这种测验的效度主要与测验内容有关,所以称内容效度。,编制有较高内容效度的心理测验,需要:,(二)内容效度的评估方法1、专家判断法,请有关专家对测验题目与原定内容的符合性做出判断,看测验题目是否代表规定的内容。因为这是一个逻辑分析的过程,也叫逻辑效度。,第二单元效度评估的方法,第四节测验的效度,MMPI双向细目表,2、统计分析法,复本分析法由一组被试在取自于同样内容范围的两个测验复本上的得分之相关来作估计。如果相关低,说明其中至少有一个缺乏内容效度;如果相关高,一般推论测验有内容

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论