心理测量学框架(3级心理咨询师重点知识点自己整理)_第1页
心理测量学框架(3级心理咨询师重点知识点自己整理)_第2页
心理测量学框架(3级心理咨询师重点知识点自己整理)_第3页
心理测量学框架(3级心理咨询师重点知识点自己整理)_第4页
心理测量学框架(3级心理咨询师重点知识点自己整理)_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、心理测量学知识第一节概述第一单元测量与测量量表一、什么是测量 测量就是依据一定的法则用数字对事物加以确定。测量的三个元素事物:测量的对象,更确切的说,就是引起我们兴趣的事物的属性和特征。数字:某一事物或该事物某一属性的量,具有区分性、序列或等级性、等距性、可加性法则:测量所依据的规则和方法。二、测量的基本要素1.参照点:确定事物的量,须有一个计算的起点,这个起点 叫参照点。绝对零点:(绝对参照点)重量、长度等,0即无,表示什么都测不到。相对零点:(相对参照点)人定的0,海拔高度,温度, 0 IQ=0 0岁儿童一般的智力心理测量的单位不够完善:既无统一的单位,也不符合等距的要求。三、测量量表命名

2、量表 用数字来代表个别事物或归类。如运动员编号,或用1代表男,2代表女。数字只用来标记或分类,而不能做数量化分析,不能比大小,也不能作四则运算顺序量表数字不仅代表类别,还指明类别的大小某种属性的程度。用于分等或排出顺序,无相等单位,无绝对零点,如考试第1名,2名等距量表不但有大小关系,且有相同单位,但无绝对零点,可做加减运算,不能乘除,200度比100度,但不能说200度是100度的2倍,0度是人为定的相对零点等比量表最高水平的量表,有绝对零点,可做四则运算。心理测量一般用顺序量表。第二单元 心理测量的基本概念心理测量的定义依据心理学理论,使用一定的操作程序,通过观察人的少数有代表性的行为,对

3、于贯穿在人的全部行为活动中的心理特点做出推论和数量化的一种科学手段。1心理测量的对象是人的行为。2只对少数经过慎重选择的行为样本进行观察,来间接推知受测者的心理特征。3为具有可比性,施测条件要一致。4个人在测验中所得到的原始分数并不具有任何意义,只有将与其他人的分数或常模相比才有意义。心理测量的性质间接性、相对性、客观性(一)间接性 :只能通过一个人对测验项目的反应来推论出他的心理特质。特质是个人对刺激作反应的一种内在倾向。是个体特有的、稳定的、可辩别的特征,它又是一个抽象产物,一个构思,而不是一个直接测量到的有实体的个人特点。 (二)相对性 :对人的行为做比较,没有绝对标准。(三)客观性:包

4、括(1)测验的刺激是客观的;(2)对反应的量化是客观的;(3)对结论的推论是客观的。测验的客观性实际上就是测验的标准化问题。包括测验用的项目或作业标准化、评分记分的原则和手段的标准化、分数转换和解释经过了标准化。 测验的客观性不包括()的客观性。绝对的标准特质:是个体特有的、稳定的、可辨别的特征。第三单元心理测验的分类最高行为测验有正确答案,智力测验和成就测验属于最高行为测验典型行为测验没有正确答案,各种人格测验均为典型行为测验第四单元 纠正错误的测验观测验万能论 测验无用论 心理测验即智力测验第五单元 心理测验在心理咨询中的作用一智力测验二人格测验三心理评定量表第六单元 心理测量的发展史科学

5、心理测验的产生与发展高尔顿:首先倡导科学心理测验,使用了测量差异,心理测验的开端他的学生皮尔逊:积差相关法卡特尔:1890年卡特尔在心理杂志上发表“心理测验与测量”第一次心理测验名词的出现比内:第一个正式的心理测验第二节测验的常模第一单元常模团体常模团体是由具有某种共同特征的人所组成的一个群体,或者是该群体的一个样本。先确定一般总体,再确定目标总体,最后确定样本。常模团体的条件1群体的构成必须明确界定2代表性样本3大小要适当。总体数目小,只有几十个人,则需要100%的样本。如果总体数目大,相应的样本也大,一般最低不小于30或100个。全国性常模,一般应有20003000人为宜。在实际工作中,应

6、从经济的或实用的可能性和减少误差这两个方面来综合考虑样本的大小。4是一定时空的产物,注意选择新近的常模取样的方法(一) 简单随机抽样(二) 系统抽样(等距抽样)(三) 分组抽样(四) 分层抽样常模与常模分数全国常模 区域常模 特殊常模原始分数 导出分数1 常模分数:施测常模样本被试后,将被试者的原始分数按一定规则转换出来的导出分数。2 原始分数:被试的反应与标准答案相比较而得到的测验分数叫原始分。3 导出分数:由原始分数构成的分布转换而来的分数叫导出分数。第二单元 常模的类型一、发展常模(年龄量表)(一)发展顺序量表葛塞尔发展程序表按月份显示儿童在运动水平、适应性、语言、社会性四个方面的大致水

7、平。4周,控制眼睛,16周,能使头保持平衡,28周,能用手抓握,40周能控制躯干,坐立或爬行,52周,控制脚的运动,站立和行走等。皮亚杰:5岁理解质量守恒,6岁掌握重量守恒,7岁容量守恒(二)智力年龄基础年龄加高年龄水平的题目上获得的附加月份之和。高年龄每道题得2个月智龄。(三)年纪当量(年级量表)以10个月为单位,为1年级 二、百分位常模百分等级一个分数的百分等级是指在常模样本中低于这个分数的人数百分比。85表示有85%的人比这个分数低百分点(百分位数)百分点则是计算处于某一百分比例的人对应的测验分数是多少。四分位数和十分位数四分位数是将量表分成四等分,相当于百分等级25%,50%,75%对

8、应的三个百分点分成的四段。三、标准分常模标准分常模是将原始分数与平均数的距离以标准差为单位表示出来的量表,因基本单位是标准差,所以叫标准分数。标准差SD SQRT(X-Xi)2 ) 方差(X-Xi)2(一)线性转换的标准分数z= (X-X) SD x为原始分数,X为样本平均数,SD为样本标准差,z为某一分数与平均数之差是标准差的几倍。可能负,可能是小数。Z=A+Bz, 加上常数A是为了去掉负数,乘以常数是去掉小数点使单位变小。不改变原来的等距关系。T分数 50 10(加50平均数,乘10标准差)九分 5 2十分 5.5 1.5二十分 10 3离差智商 100 15(1)建立在统计学基础之上;(

9、2)它表示的是个体智力水平年龄组中所处的位置;(3)是表示智力高低的一种理想指标。(二)非线性转换的标准分数当原始分数不是常态分布时,也可以通过非线性转换使之常态化。常态化过程主要是将原始分数转化为百分等级,再将百分等级转化为常态分布上相应的标准分数。四、智商比率智商IQ=MA/CA*100,MA心理年龄,CA实足年龄离差智商平均数100,标准差15IQ=100+15(X-X)/SD第三单元常模分数的表现方法第三节 测验的信度第一单元信度的概念信度:是指同一受测者在不同时间内用同一测验(或用另一套相等的测验)重复测量,所得结果的一致程度。信度受随机误差影响,误差式,信度低。信度的指标信度指数

10、信度指数的平方就是信度系数测量一次,得到一个分数的同时,便有一个误差,测多少次就有多少次误差。误差组成了一组数据,其标准差就是标准误 SE=Sx1-rxx SE标准误 Sx标准差 rxx信度系数测量的标准误和信度是互为消长的关系,信度越高,标准误越小,信度越低,标准误越大。第二单元 信度评估的方法一、重测信度 稳定性系数两到四周,间隔最好不超过6个月二、复本信度 等值性系数 它是以两个等值但题目不同的测验来测量同一群体,然后求得受测者在两个测验上得分的相关系数。如果两个复本的施测相隔一段时间,则称重测复本信度或稳定与等值系数。复本信度的缺点:(1)如果测量的行为易受练习的影响,则复本信度只能减

11、少而不能完全消除这种影响;(2)由于第二个测验只改变了题的内容,已经掌握的解题原则可以迁移到同类的问题;(3)对于许多测验来说,建立复本是十分困难的。三、内部一致性信度分半信度同质性信度测验内部所有题目间的一致性,当各个题目的得分有较高的正相关时,不论题目的内容和形式如何,其测验是同质的。几个计算同质性信度的公式如下: (1)库德-理查逊公式 (用于0、1记分) 计算同质性信度,常用的是K-R20公式,在各测题难度相同或近似的情况下,还可采用计算更为简便的K-R21公式。 K-R20公式、K-R21公式有别于克伦巴赫系数的是,它们只能用于()。是非题(2)克伦巴赫系数 (不适用于多重记分)四、

12、评分者信度测量不同评分者之间产生的误差。要求平均一致性达到0.90以上,才认为评分是客观的。 当多个评分者评定多个对象,并以等级法记分时,可采用肯德尔和谐系数作为评分者信度的估计。第三单元 信度与测验分数的解释当rxx0.70,不可靠不能用,当0.70rxx0.85,才用来鉴别升预测个人成绩或作为。SE=Sx1-rxx SE标准误 rxx测验的信度解释个人分数的意义95%的概率水平,X-1.96SEXT X+1.96SE,这就是说,大约有95%的可能性真分数落在所得分数1.96SE的范围内。比较不同测验分数的差异例:某人韦氏测验VIQ102,PIQ112,言语与操作测验的信度分别为)0.87和

13、0.88,操作智商是否显著高于言语智商?解:求出SEdS2 rxx r yy 152 0.87 0.88=7.5 求出 X=1.96 SEd1.967.514.7 实际的差为11210210 X, 所有两者差异不显著SEd标准误,S标准差 rxx ryy信度系数第四单元 影响信度的因素一、样本特征 (一)样本团体异质性的影响 若获得信度的取样团体较为异质的话,往往会高估测验的信度,相反则会低估测验的信度。 (二)样本团体平均能力水平的影响 因为每个题目具有不同的难度,对幼年者和能力水平较低者,其信度值相对较低。二、测验长度 (一)测验越长,测题取样或内容取样越有代表性 (二)测验越长,被试的猜

14、测因素影响就越小。 (三)测验太长,有时反而会引起被试者疲劳和反感而降低可靠性。 斯皮尔曼-布朗公式 通过斯皮尔曼-布朗公式的导出公式可计算出最少应增加的题数:(公式5-18)。 例:一个包括40个题目的测验信度为0.80,欲将信度提高到0.90,问至少需要增加多少题目? 根据斯皮尔曼布朗公式:K=0.90(10.80)/ 0.80(10.90)=2.25 即要取得0.90的信度,测验长度就为原来的2.25,即需要增加402.25=90个题目,90-40=50。三、测验难度 (地板效应与天花板效应) 洛德(Lord)提出在学绩测验中,为了保证其可靠性,各类选择题的理想平均难度为:五择一测题,0

15、.70;四择一测题,0.74;三择一测题,0.77;是非题,0.85。 只有平均难度水平为50时,才能使测验分数分布范围最大。四、时间间隔: 两次测验相隔时间越短,其信度系数越大 注意事项 斯皮尔曼-布朗公式为校正分半信度的经验公式,它的假设是两半测验分数的变异数相等。当假设不成立时,可以采用弗朗那根(Flanagan)公式或卢伦(kulon)公式之一,直接求得测验的信度系数。 对于一些复杂的、异质的心理学变量,采用单一的同质性测验是不行的,因而常常采用若干个相对异质的分测验。第四节 测验的效度 美国心理学会在1974年发行的教育与心理测量之标准一书中将效度分为:(1)内容效度;(2)构想效度

16、;(3)效标效度。第一单元 效度的概念(有效性或者说准确性) 一、效度的定义 : 在心理测验中,效度是指所测量的与所要测量的心理特点之间符合的程度,或者简单地说是指一个心理测验的准确性。(是科学测量工具重要的必备条件)。 因为测验分数的总方差等于真实方差与误差方差之和(公式5-8),而真实方差又分成两部分,即有关方差与无关的但稳定的方差:(公式5-19) 以公式5-19代入公式5-8得:(公式5-20) 在测验理论中,效度被定义为在一组测量中,与测量目标有关的真实方差(或称有效方差)与总方差的比率,即:(公式5-21) 二、效度的性质 1.效度具有相对性任何测验的效度是对一定的目标来说的,或者

17、说测验只有用于与测验目标一致的目的和场合才会有效。效度具有相对性,在评鉴测验的效度时,必须考虑测验的(目的)与(功能)。 2.效度具有连续性 测验效度通常用相关系数表示,它只有程度上的不同,而没有“全有”或“全无”的区别。效度是针对测验结果的。 测验效度是“测验结果”的有效性程度。信度考虑的是随机误差,效度还包括与测验无关但稳定的测量误差。1信度是效度的必要而非充分条件。2效度受信度制约。效度高,信度必然高,当信度高时,效度不一定高,且效度不会超过信度的平方根。第二单元 效度评估的方法一、内容效度(content-related validity)什么是内容效度: 内容效度指的是测验题目对有关

18、内容或行为取样的适用性,从而确定测验是否是所欲测量的行为领域的代表性取样。内容效度的评估方法:(确定)1专家判断法 (描述性语言) 请有关专家对测验题目与原定内容的符合性做出判断,看测验的题目是否代表规定的内容。如果专家认为测验题目恰当地代表了所测内容,则测验具有内容效度。由这种估计效度的方法,是一个逻辑分析的过程,所以内容效度又称“逻辑效度”。 为了使内容效度内容确定过程更为客观,弥补专家的不足,可采用如下几个步骤: (1)定义好测验内容的总体范围,描述有关的知识与技能及所用材料的来源; (2)编制双向细目,确定内容和技能各自所占比例,并由测验编制者确定各题所测是何种内容与技能; (3)制定

19、评定量表来测量测验的整个效度。2统计分析法 :包括(1)对评分者一致性的评定;(2)两个测验复本的相关性和课程内容的学习等分析;(3)再测法。3经验推测法 :通过实践来检验效度。内容效度的特性: 内容效度经常与表面效度(face validity)混淆。表面效度是由外行对测验作表面上的检查确定的,它不反映测验实际测量的东西,只是指测验表面上看来好像是测量所要测的东西;内容效度是由够资格的判断者(专家)详尽地、系统地对测验作评价而建立的。 最高行为测验注重表面效度,测典型行为时则应该把表面效度降低,尽量不让你知道在测试的内容。这就是内容效度与表面效度的区别。二、构想效度(construct-re

20、lated validity) 构想效度指(1)测验能够测量到理论上的构想或特质的程度,(2)即测验的结果是否能证实或解释某一理论的假设、术语或构想,解释的程度如何。(3)涉及的是心理学的理论概念问题。(4)构思效度。 构想效度的估计方法: 1对测验本身的分析:可以作为构想效度的证据有:测验的内容有效;测验内部一致性;被试者对题目的反应特点 2测验间的相互比较:(1)相容效度:与其他测量同一构思的测验有相关;(2)区分效度:与测量不同构思的测验无相关:(3)因素分析法:种因素与原先的理论构思一致,则说明构思效度很高。) 3效标效度的研究证明 4实验法和观察法证实 三、效标效度(criterio

21、n-related validity) 什么是效标效度 效标效度又称实证效度,反映的是测验预测个体在某种情境下行为表现的有效性程度。根据效标资料是否与测验分数同时获得,又可分为同时效度和预测效度两类。 一个好的效标必须具备以下条件: 效标必须能最有效地反映测验的目标,即效标测量本身必须有效; 效标必须具有较高的信度,稳定可靠,不随时间等因素而变化; 效标可以客观地加以测量,可用数据或等级来表示; 效标测量的方法简单,省时省力,经济实用。 效标效度的评估方法 1相关法:相关法是评估效标效度最常用的方法,它是求测验分数与效标资料间的相关,这一相关系数称为效度系数。 效度系数的计算:积差相关法;点二

22、列公式;二列公式; 贾思朋多系列公式。2区分法:区分法是检验测验分数能否有效地区分由效标所定义的团体的一种方法。3命中率法 : 命中率法是当测验用来做取舍的依据时,用其正确决定的比例作为效度指标的一种方法。四种情况:预测成功而且实际也成功;预测成功但实际上失败;预测失败而事实成功;预测失败且实际上也失败。称正确的预测为命中,不正确的预测为失误。 命中率高低常随划分测验分数成功与失败的临界分数的高低面变化。临界分数越高,正命中率也越高;反之,临界分数越低,则正命中率也越低。第三单元 效度的功能一、预测误差 : 效度系数的实际意义常常以决定性系数来表示,意指相关系数的平方,它表示测验正确预测或解释

23、的效标的方差占总方差的比例。决定系数是效度系数的平方。二、预测效标分数 :如果X与Y两变量呈直线相关,只要确定出二者间的回归方程,就可以从一个变量推估出另一个变量。三、预测效率指数 E=100(1-K) k无关系数P386 预测效率指数E值的大小表明使用测验比盲目猜测能减少误差,如一个测验的效度系数为0、80,E=40,这表明由于该测验的使用,使得我们在估计被试的效标分数时减少了(40)的误差。第四单元 影响效度的因素一、测验本身的因素 : (1)测验取材的代表性;(2)测验长度;(3)试题类型、难度;(4)区分度以及编排方式等都会影响效度。二、测验实施中的干扰因素 主试的影响因素 被试的影响

24、因素 三、样本团体的性质 样本团体的异质性 :样本团体越同质,分数颁布分布范围越小,测验效度就越低;样本团体越异质,分数分布范围越大,测验效度就越高。 一般而言,若获得信度的取样团体较为异质的话,往往会(高估)测验的信度,否则就会低估测验的信度干涉变量:对于不同性质的团体,同一测验的效度会有很大的不同。 美国心理学家吉塞利提出如何找出干涉变量的方法: 1、用回归方程求得每个人的预测效标分数,将该分数与实际效标分数相比较,获得差异数D。如果D的绝对值很大,说明测验中的可能存在干涉变量。 2、根据样本团体的组成分析,找出对照组,分别计算效度,从而找出干涉变量。 3、对于欲测团体,根据某些易见的干涉

25、变量将其区分为预测性高和预测性低的两个团体。对于预测性团体低的,存在干涉变量。四、效标的性质 效标与测验分数之间的关系是否是线性关系是很重要的因素。皮尔逊积差相关系数的前题条件是假设两个变量的关系是线性分布。如果是非线性分布则皮尔逊积差相关系数会低估相关的大小。 效标测量本身的可靠性是值得考虑的一个问题。效标测量的可靠性即效标测量的信度。 (信度与效度的关系:信度是效度的必要而非充分的条件,效度是受信度的制约。)第五节 项目分析 包括定性分析和定量分析两个方面,定性分析包括考虑内容和效度,题目编写的恰当和有效性等;定量分析主要是指对题目难度和区分度等。第一单元 项目的难度 一、定义 难度(di

26、fficulty),顾名思义,是指项目的难易程度。在能力测验中通常需要一个反映难度水平的指标,在非能力测验(如人格测验)中,类似的指标是“通俗性”。 难度的指标通常以通过率表示,即以答对或通过该题的人数百分比来表示(公式5-31):P=R/N100(用P 代表,P值越大,难度越低)二、计算方法 二分法记分的项目:通过记1分,错误记0分,对这类题目可直接用公式5-31计算难度。 当被试人数较多时,则可根据测验的总成绩将被试分成三组:分数最高的27被试为高分组,分数最低的27被试为低分组,中间46的被试为中间组。分别计算高分组和低分组的通过率,经两组通过率的平均值作为每一题的难度。(公式5-32)

27、 由于选择题允许猜测,所以通过率可能因机遇作用变大,吉尔福特提出了一个难度校正公式(公式5-33): CP=KP-1/K-1 非二分记分的项目 当测验项目为问题答题或不能用二分法记分的形式时,一般用下面的公式计算难度。(公式5-34)P390三、难度水平的确定项目的难度: P值越接近0或接近1,越无法区分被试间能力的差异。相反,P值越接近于0.50,区别力越高。 在选择题目时,最好使试题平均难度接近050,而各题难度在050020之间。 当测验用于选拔或诊断时,应该较多地选择难度值接近录取率的项目。如录取率20%,则难度应确定为20%.对于选择题来说,P值一般应大于概率水平。对是非题其难度值应

28、该为075最为合适;而对于四选一题,其难度值约为063时最为合适。 洛德(Lord)提出在学绩测验中,为了保证其可靠性,各类选择题的理想平均难度为:五择一测题,070;四择一测题,074;三择一测题,077;二择一题,()。0.85测验的难度 如果样本具有代表性,对于中等难度的应该接近常态分配。但有些测验,如掌握性测验或标准参照测验,分数分布出现偏态是允许的。数学测验的第7题满分为15分,该题考生的平均分为9.6分,测该题的难度为(0.64)=9.6/15 P=R/N100 在340个学生中,答对项目的人数为120人,则该项目的难度为(0.35)在700名被试者中选为高分组和低分组的被试者各有

29、100人,其中高分组有70人答对第一题,低分组有40人答对第一题,则第一题的难度为(0.55)第二单元 项目的区分度 一、定义 项目区分度(item discrimination),也叫鉴别力,是指测验项目对被试的心理特性的区分能力。 区分度取值范围介于-1至+1之间,假如项目得分与实际能力水平之间呈负相关,则区分度为负值;若呈正相关,则区分度为正值;相关系数越大,区分度越高。当区分度为负值时,则意味着被试实际能力越高,该项目的得分反而越低,这种情况一般很少发生,如果出现,该项目应该淘汰。 二、计算方法 在理论上,项目区分度是以项目得分高低与实际能力水平高低之间的相关来表示。而实际能力用的最多

30、的是测验总分。计算项目难度的公式:(1)P=R/N100;(2)P=(PHPZ)2;(3)P=XXmax100% X为全体受测者在该题 上的平均分,Xmax为该题的满分(P390页) 鉴别指数 (注意排列顺序) 1、按测验总分高低排列答卷; 2、确定高分组与低分组,每一组取答卷总数27; 3、分别计算高分组与低分组在该项目上的通过率或得分率; 4、按下列公式估计项目的鉴别指数:(公式5-35):D=PHPL,高分组与低分组通过率 1965年,美国专家伊贝尔提出评价项目性能标准是:0.40以上为“很好”;0.30-0.39为“良好,修改后会更佳”;0.20-0.29为“尚可,但需修改”;0.19

31、以下为“差,必须淘汰”。 相关法 (记住它的方法及适用范围) 计算区分度最常用的方法。即以某一项目分数与效标成绩或测验总分的相关作为该项目区分的指标。相关越高,表明项目越具有区分的功能。 1点二列相关 :适用于一类变量为二分变量,另一类变量为连续变量的成对变量相关的计算。 2二列相关 :适用于两个连续变量,但其中一个变量被人为分成两类。 3相关法 :适用于两个变量均为二分称名变量。若将测验总分按及格、不及格或录取、淘汰划分,便可计算相关系数。 4、积差相关 三、区分度与难度的关系 总体上说,中等难度的项目区分度最高。 一般说来,较难的项目对高水平的被试区分度高,较易的项目对水平低的被试区分度高

32、,中等难的项目对中等水平的被试区分度高。第六节 测验编制的一般程序 第一单元 测验的目标分析一、测验的对象 :年龄、受教育程度、社会经济、阅读水平等。二、测验的用途 :描述、诊断、选拔、预测。显示性测验:指测验题目和所要测量的心理特征相似的测 验。如成就测验。 古德纳夫分为:样本测验和标记测验。 样本测验题目取自一个很明确的总体的测验。如测综合运算能力。 标记测验题目取自一个全开放的总体的测验。如智力测验。预测性测验:指预测一些没被测量的行为的测验。 如GRE中的词汇测验。 项目难度的分布一般以(常态)分布为好,这样不仅能保证多数项目有较多的区分度,而且可以保证整个测验对被试者有较高的区分力。

33、 三、测验的目标 :是指编制的目标是用来测什么的,即用来测什么样的心理变量或心理特征。 工作分析 对于选拔和预测功用的预测性测验,它的主要任务就是要对所预测的行为活动作具体的分析,称之为任务分析或工作分析。包括两个步骤: 第一是确定哪些心理特征和行为可能使要预测的活动达到成功; 第二是建立衡量被试是否成功的标准,这个标准我们称之为效标。 对特定概念下定义 如果测验是为了测量某种特殊的心理品质或特点,那么测验编制者就必须给所要测量的心理或行为特质下定义,然后必须发现该特质所包含的维量将通过什么行为表现出来或怎样进行测量。 确定测验的具体内容 如果测验是描述性的显示测验,它的目标分析的主要任务则是

34、确定显示的内容和技能,从中取样。目标分析包括:(1)工作分析;(2)对特定的概念下定义;(3)确定测验的具体内容。第二单元 测题的编写一、搜集资料(避免直接翻译国外的测验题) 已出版的标准测验 理论和专家的经验 临床观察和记录 二、命题 的一般原则 内容方面 :(1)题目的内容符合测验的目的;(2)内容的取样要有代表性;(3)题目间的内容相互独立。 文字方面 :(1)使用当代语言;(2)语句要简明扼要;(3)最好一句话一个概念。(3)排除与答案无关的因素。 理解方面 :(1)题目要有确切答案;(2)题目的内容不超出受测团体的知识水平和理解能力;(3)题目格式不要被人误解;(4)除创造力测验与人

35、格测验外,不应具有引起争议的可能。 社会敏感性方面:尽量避开社会敏感性问题,如涉及社会禁忌或个人隐私的题目不应使用。 如必须涉及时,菲力普列举了几条策略供参考: 1、命题时假设被试具有某种行为,使他不得不在确实没有该行为时才否定,可避免否定答案过多的倾向。如:“你平均多久才手淫一次,每月一次?每周一次?每天一次?从不?” 2、命题时假定规范不一致,如“有些医生认为吸烟有害,而另一些医生认为吸烟有益,你认为呢?” 3、提出该行为是常见的,虽然是违规的,如“多数人在看色情电影时有性冲动,你呢?”三、测题的编制要领(分提供性和选择性两大类题目)1.选择题:由两部分构成:题干和选项。 选择题注意事项:

36、 (1)题干所提的问题必须明确,尽量使用简单而且明晰的词语。 (2)选项切忌冗长,要简明扼要。 (3)每题只给一个正确答案,其它属诱答。 (4)各选项长度应相等。 (5)避免题干用词与选项用词一致 。 (6)选项最好用同一形式 2.是非题。 是非题又叫正误题,是指出一个论点要被试判断是否正确,或是从是非两个答案做出选择,因此可以把是非题看作是两个备选答案的选择题 编制是非题应注意: (1)内容应以有意义的概念、事实或基本原则为基础。 (2)每道题只能包含一个概念。 (3)尽量避免否定的叙述,尤其是要避免用双重否定的叙述。 (4)若是表达意见的题目,最好说明意见的来源和根据。 (5)“是”、“非

37、”题目的数目应有适应的比例,基本相等,且要随机排列。 在编制是非题时,“是”、“非”题大致相等或答“否”题略多,是控制肯定定势的有效方法。3.简答题 在客观测验试题中,只有简答题是提供型题目,它要求被试用一个正确的词或句子来完成或填充一个未完成句子的空白,或者是提供一个正确的答案。有时将前者称之为填充题,后者称之为简答题。 编制简答题三原则: (1)宜用问句形式。如果使用未完成的句子,则空格尽量放在最后。 (2)如果是填充形式,空格不宜太多,过多空格会使题意不明确,并且所空出的应该是关键词句。 (3)每题应只有一个正确答案,而且答案要简短而具体。对不完整的答案,应事先规定评分标准。4.操作题

38、操作题是介于一般认知结果的纸笔测验和在未来真实情境的实际活动之间的测验,是让被试实际操作,如画图、走迷津、拼配物体等,可作为纸笔测验题的补充。 编制操作测验的四条原则: (1)明确所要测量的目标,并将其操作化; (2)尽量选择真实性较高的项目; (3)指导语要简明扼要,并有具体的要求; (4)制定评分标准,确定计分方法。第三单元 测验的编排和组织一、合成测验 选择与审定试题 1.选择试题形式 选择题目时,需要考虑的几点: (1)测验的目的和材料的性质 (2)接受测验的团体的特点 (3)各种实际因素2.审定题目 审定题目要注意以下几个问题: (1)题目的范围应与测验计划所列的内容技能双向目表一致

39、; (2)题目的数量要比最后所需数目多一倍至几倍,以备筛选和编制复份; (3)题目的难度必须符合测验目的的需要;(4)题目的说明必须清楚明白。 测题的编排 测验编排的一般原则: 1、测题的难度排列宜逐步上升。 2、尽可能将同类型的测题组合在一起。 3、注意根据各种类型测量题本身的特点排列题目。常见的两种排列方式: 1、并列直进式:是将整个测验按试题材料的性质归为若干分测验,在同一分测验的试题则依其难度由易到难排列。如韦克斯勒的成人、儿童和幼儿三个智力量表。2、混合螺旋式:是先将种类试题依难度分成若干不同的层次,再将不同性质的试题予以组合,作交叉式的排列,其难度则渐次升进。如比内-西蒙智力量表。

40、 测验编排的一般原则应排除()答案混合排列二、测验的预试 预测 预测应注意以下几个问题: 1、预测对象应取自将来正式测验准备应用的群体。 2、预测的时限过程与情境应力求与将来正式测验时的情况相近似。 3、预测的时限可稍放宽一些,最好 使每个被试都能将题目做完。 4、在预测过程中,应对被试的反应情形随时加以记录。 项目分析 对项目的分析包括质的分析和量的分析两个方面。前者是从内容取样的适切性、题目的思想性以及表达是否清楚等方面加以评鉴;后者是对预测结果进行统计分析,确定题目的难度、区分度、备选答案的合适度等。三、信度和效度考察 信度 效度 四、常模制订 测验分数必须与某种参照系统比较,方能显出它

41、所代表的意义。多数心理测验是把个人所得的分数与代表一般人同类行为的分数相比较,以判别其所得分数的高低。此处的“代表一般人同类行为的分数”,即为“常模”。五、编写指导手册 测验指导手册的内容有: 1测验的目的和功用。 2测验编制的理论背景以及测验中的材料是根据什么原则、应用什么方法选择出来的,许多手册还提供选择题目的统计指标。 3如何实施测验的说明。 4测验的标准答案和记分标准。 5常模资料,包括常模表、常模适用的团体及对测验分数如何做解释。 6测验的基本特征,包括难度、鉴别力、信度、效度和因素分析的资料,以及这些资料取得的条件和情境,包括调查的样本和时间。 第七节 心理测验的使用 第一单元 主

42、试的资格 主试者的知识结构包括:(1)本行业专业知识;(2)心理学基础知识;(3)心理学专业理论知识;(4)心理测验专业技能 一、知识结构 二、专业理论知识和专业技能 专业理论知识 :(1)了解测验的特点和性质;(2)熟悉它的作用的局限性;(3)了解测验的基本特征;(4)熟悉测验标准化的必要。 专业技能 :具备专业技能与经验;经过专业训练;熟悉有关测验的(1)内容;(2)适用范围;(3)测验程序;(4)记分方法等。 三、职业道德(主试者) (一)测验的保密 (二)测验中个人隐私的保护 (三)测验的控制使用第二单元 测验的选择 一、所选测验必须适合测量的目的 二、所选测验必须符合心理测量学的要求

43、第三单元 测验前的准备及注意事项一、测验前的准备工作 预告测验 准备测验材料 熟悉测验指导语 熟悉测验的具体程序 二、测验中主试的职责 1、应按照指导语的要求实施测验; 2、测验前不讲太多无关紧要的话; 3、对于被试的反应,不带任何暗示; 4、对特殊问题要有心理准备,应沉着冷静、机智、灵活地应付。 三、建立协调关系 协调关系(rapport)是一个专业术语,在临床心理咨询、心理治疗中经常用到。第四单元 测验实施的程序及要素 一、指导语 (一)对被试的指导语 1、如何选择反应形式(划、口答、书写); 2、如何记录这些反应(答卷纸、录音、录象); 3、时间限制; 4、如果不能确定正确反应时该如何操

44、作(是否允许猜测等); 5、例题(当题比较生疏时,给出附有正确答案的例题十分必要); 6、有时告知被试测验目的。 (二)对主试指导语二、时限 大多数典型行为的测验不受时限时间的限制。 一般说来,心理测验除(典型行为测验)以外,都有时限。 三、测验的环境条件 首先必须完全遵从测验手册的要求; 其次是记录下任何意外的测验环境因素; 第三,在解释测验结果时也必须考虑这一因素。第五单元 被试误差及控制方法 一、应试技巧与练习效应(一)应试技巧 “测验油子”:能觉察也正确答案与错误答案的细小差别;懂得合理分配测验时间;常常是各种题型都见过,多数情况下会比他们能力相当但缺乏测验经验或技巧的被试者获得更好的

45、分数;(4)熟悉测验的程序。(二)练习效应 1、教育背景较差、经验较少或智力较高者,其受练习效应的影响较大; 2、着重速度的测验,练习效应为明显; 3、重复实施的测验,受练习效应影响的程度要大于复本测验; 4、两次测验之间的时距越大,练习效应越小,相距三个月以上练习效应可忽略不计; 5、一般的平均练习效应,约在1/5个标准差以下,并且仅限于第一次与第二次重测,第三次以后练习效应增加不明显。二、动机与焦虑因素(一)应试动机 在测量成就、智力和能力倾向等变量时,只有被试动机强烈,才可能尽力回答,取得好成绩。 在测量态度、兴趣及人格等典型行为时,若给人以好的印象,会使测验分数降低;若给人以差的印象,

46、则会使测验分数升高。(二)测验焦虑 一般说来,适度的焦虑会使人的兴奋性提高,注意力增强,提高反应速度,从而提高智力测验、成就测验和能力倾向测验的成绩。 测验焦虑的影响因素: 1、能力高的人,测验焦虑一般较低,而对自己能力没有把握的人,测验焦虑较高; 2、抱负水平过高,求胜心切的人,测验焦虑较高; 3、具有某种人格特点,如缺乏自信、患得患失、情绪不稳定的人易产生测验焦虑; 4、测验成绩与被试的关系重大,或被试受到的压力过大,容易使其产生测验焦虑; 5、经常接受测验的人焦虑较低,而对测验程序不熟悉,尤其是测验中采取了新的题目形式或实施程序会增加测验焦虑。 三、反应定势 反应定势亦称反应风格,是独立于测验内容的反应倾向,即由于每个人回答问题的习惯不同,而使能力相同的被试得到不同的测验分数。 (一)求“快”与求“精确”的反应定势 除非反应速度“本身即为重要的研究目标,否则应

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论