心理测量学课件lily_第1页
心理测量学课件lily_第2页
心理测量学课件lily_第3页
心理测量学课件lily_第4页
心理测量学课件lily_第5页
已阅读5页,还剩89页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1,心理测量学知识王丽荣wlrlily,讲课内容,第一节概述第二节测验的常模第三节测验的信度第四节测验的效度第五节项目分析第六节测验编制的一般程序第七节心理测验的使用,第一节概述,第一单元测量与测量量表第二单元心理测验的基本概念第三单元心理测验的分类第四单元纠正错误的测验观第五单元心理测验在心理咨询中的应用第六单元心理测验的发展史,第一单元测量与测量量表,什么是测量测量要素测量量表,什么是测量,测量就是依据一定的法则用数字对事物加以确定。从字面上看,该定义包括三个主要的元素:事物;数字;法则。,所谓“事物”,指的是我们要测量的对象,更准确地说,就是引起我们兴趣的事物的属性或特征。所谓“数字”,是代表某一事物或事物某一属性的量。区分性1与2序列性321等距性321、211可加性所谓“法则”,代表的是测量所依据的规则和方法,测量要素,任何测量都应该具备这样两个要素:即参照点和单位。参照点:要确定事物的量,必须有一个计算的起点,这个起点叫做参照点。绝对零点人定的参照点即相对零点单位:是测量的基本要求,没有单位就无法进行测量确定的意义有相同的价值,测量量表,测量的本质是根据某一法则在一个定有单位和参照点的连续体上把事物的属性表现出来,这个连续体称为量表。量表的四种水平,斯蒂文斯(1)命名量表只是用数字来代表事物或对事物进行分类。量表中的数字没有任何数值意义,不能作量化分析。无大小意义,只表明类别。无参照点和单位。无法比较大小或进行任何数学方法运算。测量水平最低的一种形式,如代号、类别(2)顺序量表表明类别的大小或某种属性的多少。主要用于分等论级和分类。数字仅表示等级并不表示某种属性的真正量或绝对值。无参照点(没有绝对零度)和单位。无法进行数学方法运算。,8,(3)等距量表存在大小关系。无绝对零度,但存在相对零点。有相等单位,可以进行加减数学运算,但不能做乘除运算。(4)等比量表是最精确的测量。具有相等单位又有绝对零点。大多是物理量表,可以进行各种数学运算。可以知道事物之间的某种特点上相差多少及它们之间的倍数关系。一般说来,心理测量是在顺序量表上进行的。用统计方法把顺序量表得到的数据换算为等距数据。,9,量表的四种测量水平,第二单元心理测量的基本概念,心理测量的定义心理测量的性质,心理测量的定义,所谓心理测量,就是依据心理学理论,使用一定的操作程序,通过观察人的少数有代表性的行为,对于贯穿在人的全部行为活动中的心理特点作出推论和数量化分析的一种科学手段。首先,心理测量的对象是人的行为。其次,心理测量往往只是对少数经过慎重选择的行为样本进行观察,来间接推知受测者的心理特征。第三,为了使不同的受测者所获得的分数有比较的可能性,测验的条件对所有的受测者都必须是相同的。第四,个人在测验中所得到的原始分数并不具有什么意义,只有将它与其他人的分数或常模相比较才有意义。,心理测量的性质,间接性迄今为止,我们还无法直接测量人的心理,只能通过测量人的外显行为,即通过测量人们对测验题目的反应来推论出他的心理特质。相对性在对人的行为做比较时,没有绝对的标准,也就是没有绝对的零点,有的只是一个连续的行为序列。所谓测验就是看每个人处在这个序列的什么位置上。客观性:1、测验的刺激是客观的2、对反应的量化是客观的3、对结果的推论是客观的,第三单元心理测验的分类,按测验的功能分类智力测验、特殊能力测验、人格测验按测验材料的性质分类文字测验、操作测验按测验材料的严谨程度分类客观测验、投射测验按测验的方式分类个别测验、团体测验按测验的要求分类最高作为测验、典型行为测验,第四单元纠正错误的测验观,错误的测验观测验万能论测验无用论某些人格测验侵犯了个人隐私,违背民主原则测验为宿命论和种族歧视提供了心理学依据心理测验即智力测验正确的测验观心理测验是重要的心理学研究方法之一,是决策的辅助工具心理测验作为研究方法和测量工具尚不完善,第五单元心理测验在心理咨询中的应用,智力测验:可在求助者有特殊要求时及对方有可疑智力障碍的情况下应用;人格测验:有助于治疗者对求助者人格特征的了解,以便于对其问题有更深入的理解,并可针对性地开展咨询与心理治疗工作;心理评定量表:用于检查求助者某方面心理障碍的存在与否或其程度如何。,第六单元心理测验的发展史,科学心理测验的产生与发展现代心理测验在我国的发展,科学心理测验的产生与发展,三个主要人物的主要贡献:高尔顿(FGalton)提出人的不同气质特点和智能是按身体特点的不同而遗传的。为了研究差异的遗传性,便设计了测量差异的方法。为心理测验奠定了统计学基础。他第一个提出了相关的概念卡特尔是对心理测验发展做出巨大贡献美国心理学家。1890年,卡特尔在心理杂志上发表心理测验与测量一文,这是心理测验第一次出现于心理学文献中。在此文中,卡特尔写到:“心理学若不立足于实验与测量上,决不能够有自然科学之准确性。”又说:“心理测验如果有一个普遍的标准,则其科学的与实用的价值都可以增加。”他当时就极力主张测验手续和考试方法应有统一规定,并要有常模以便比较。所有这些都是测量学上的重要概念。比内(A.Binet)与其助手西蒙(T.Simon),于1905年研究制作了世界上第一个正式的心理测验。主张用测验的方法便别和发现智力落后儿童。,心理测验四个方面的发展:,操作测验的发展由于理论上的缺陷和实际上的需要,所以有操作测验的问世。团体智力测验的发展团体测验始于第一次世界大战,在推孟的研究生欧提斯所编团体智力测验的基础上发展了陆军甲种和乙种智力测验。能力倾向测验的发展分析个人心理品质的内部结构,为职业选拔与安置提纲依据。普通能力倾向(智力)测验也向多元化发展。人格测验的发展测量情感或行为等非智力方面的人格因素。,现代心理测验在我国的发展,我国近代心理测验大约源于1914年前后。本世纪二、三十年代,我国心理学家曾两次修订过比内-西蒙量表。1979年后,全国各地的心理学家组织起多个协作组,先后对国外的广泛采用的智力和人格测量工具进行修订。近些年来我国的心理学家正在致力于测验本土化,编制适合我国文化背景的智力测验,适应行为量表等,并已取得了初步成功。,第二节测验的常模,第一单元常模团体第二单元常模的类型第三单元常模分数的表示方法,第一单元常模团体,常模团体的性质常模团体的条件取样的方法常模分数与常模,常模团体的性质,常模团体是由具有某种共同特征的人所组成的一个群体,或者是该群体的一个样本。制定常模时要先确定常模团体,解释分数是要考虑常模团体的组成。对测验编制者而言,常模的选择主要是基于对测验将要施测的总体的认识,常模团体必须能够代表该总体。这种工作包括:确定一般总体、确定目标总体、确定样本。对测验的使用者来说,要考虑的问题是,现有的常模团体哪一个最合适。,常模团体的条件,群体的构成必须明确界定可以用来区分和限定群体的变量是很多的,如性别、年龄、职业、文化程度、民族、地理地域、社会经济地位等。依据不同的变量确定群体,便可得到不同的常模。常模团体必须是所测群体的代表性样本当所要测量的群体很小时,将所有的人逐个测量,其平均分便是该群体的最可靠的常模。在群体较大时,因为时间和人力物力的限制,只能测量一部分人作为总体的代表,这就提出了取样是否适当的问题样本的大小要适当总体数目小,只有几十个人,则需要100%的样本。如果总体数目大,相应的样本也大,一般最低不小于30或100个。全国性常模,一般应有20003000人为宜。标准化样组是一定时空的产物,取样的方法,取样即从目标总体中选择有代表性的样本简单随机抽样:在简单随机抽样中,每个人或抽样单位都有相同的机会作为常模中的一部分。按照随机表顺序选择被试构成样本系统抽样:也成等距抽样。先把个体编号、排序,然后每隔若干个号码抽取一个。要求目标总体无等级结构。分组抽样:有时总体数目较大,无法进行编号,而且群体又有多样性,这时可以先将群体进行分组,再在组内进行随机取样。分层抽样:最常用。它是先将目标总体按某种变量(如年龄)分成若干层次,再从各层次中随机抽取若干被试,最后把各层的被试组合成常模样本。包括分层比例抽样和分层非比例抽样,常模与常模分数,常模分数常模分数就是施测常模样本后,将受测者的原始分数按一定规则转换出来的导出分数。导出分数具有一定的参照点和单位,它实际上是一个有意义的测验量表,它与原始分数等值,可以进行比较常模常模由标准化样本测试结果计算而来,是心理测验时用于比较和解释测验结果的参照分数标准。常模分数构成的分布,就是通常所说的常模(norm)。有全国常模、区域常模和特殊常模等。,第二单元常模的类型,发展常模百分位常模标准分常模智商的计算及意义,发展常模,发展顺序量表智力年龄年级当量,发展顺序量表,最直观的发展常模是发展顺序量表,因为它告诉人们多大的儿童具备什么能力或行为就表明其发育正常,相应能力或行为早于某年龄出现,说明发育超前,否则即为发育滞后。最早的一个范例是葛塞尔发展程序表,其中按月份显示出儿童在运动水平、适应性、语言、社会性四个方面的大致发展水平。皮亚杰的研究着重于从婴儿到十多岁儿童认知过程的发展,尤其注重某些特殊概念的形成,其中最著名的工作就是对守恒概念的研究。,29,婴儿感觉运动的发展,4周,能控制眼睛运动,去追随一个对象看16周,能保持头部平衡28周,能用手抓握东西并玩弄它40周,能控制躯干、坐立或爬行52周,能控制腿脚运动、站立和行走,智力年龄,方法一:直接的计算基础年龄与在较高年龄水平的题目上获得的附加月份之和。方法二:年龄常模转换将标准化样本中每个年龄组的平均原始分数作为年龄常模。通过将原始分数与年龄常模对比,便可求得每个人的智龄。,31,智龄计算方法,已知某儿童完成比内-西蒙的测题如下:6岁以下全部通过7岁通过4题8岁通过3题9岁通过2题9岁以上均未通过则:智龄=6岁+42(月)+32(月)+22(月)=6岁+18月=7岁6个月,年级当量,年级当量实际上就是年级量表,说明测验结果属哪一年级的水平,在教育成就测验中最常用。其表述方式常常是:某学生的算术是6年级水平,阅读是4年级水平,理解是5年级的水平等。年级量表的单位通常为10个月间隔,在一学年中假设两个月的假期在所测量目标上的发展是不重要的,因此以10个月为一个年级。例如,40(或4.0)表示四年级开始时的平均成绩,45(或4.5)表示学年中间的平均成绩。,百分位常模,百分等级指在常模样本中低于这个分数的人数百分比。百分点百分点也称百分位数,与百分等级的计算方法正好相反。百分等级是计算低于某测验分数的人数百分比,而百分点则是计算处于某一百分比例的人对应的测验分数是多少。四分位数和十分位数百分位数是将量表分成100份,而四分位数是将量表分成四等份,相当于百分等级的25%、50%和75%对应的三个百分分成的四段。十分位数也可以依此类推出,1%10%为第一段,91%100%为第十段。,标准分常模,标准分数是将原始分数与平均数的距离以标准差为单位表示出来的量表。因为它的基本单位是标准差,所以叫标准分数。标准分数可以通过线性转换,也可以通过非线性转换得到1线性转换的标准分数常见的标准分数:T分数:平均数为50,标准差为10标准九分:以5为平均数,以2为标准差标准十分:平均数为5.5,标准差为1.5;标准二十分:平均数为10,标准差为3。离差智商2非线性转换的标准分数对每个原始分数值计算累积百分比;在常态曲线面积表中,求出对于该百分比的z分数。,智商及其意义,比率智商离差智商必须指出,从不同测验获得的离差智商只有当标准差相同或接近时才可以比较,标准差不同,其分数的意义便不同。,36,以100为平均数不同标准条件下每一IQ组距正态曲线下个案百分比,百分数分布分组分数SD=12SD=14SD=16SD=18130以上0.71.63.15.11201294.36.37.58.511011915.216.015.815.410010929.826.123.621.0909929.826.123.621.0808915.216.015.815.470794.36.37.58.570以下0.71.63.15.1总计100100100100,第三单元常模分数表示法,转换表表示法一个转换表显示出一个特定的标准化样组的原始分数与其相对应的等值分数百分位、标准分数、T分数或者其它任何分数。因此测验的使用者利用转换表可将原始分数转换为与其对应的导出分数,从而对测验的分数作出有意义的解释。剖面图表示法剖面图是将测验分数的转换关系用图形表示出来。从剖面图上可以很直观地看出被试在各个分测验上的表现及其相对的位置。,第三节测验的信度,第一单元信度的概念第二单元信度的估计方法第三单元信度与测验分数的解释第四单元影响信度的因素,第一单元信度的概念,信度的定义信度是指同一受测者在不同时间内用同一测验(或用另一套相等的测验)重复测量,所得结果的一致程度。信度只受随机误差的影响。信度的指标信度系数和信度指数。信度指数的平方就是信度系数。测量标准误。信度越高,标准误越小。,第二单元信度评估的方法,重测信度复本信度内部一致性信度评分者信度,重测信度又称稳定性系数。它的计算方法是采用重测法,即使用同一测验,在同样条件下对同一组被试者前后施测两次测验,求两次得分间的相关系数。最适宜的时距随测验的目的、性质和被试特点而异,一般是两周到四周较宜,间隔时间最长不超过六个月。,复本信度又称等值性系数,它是以两个等值但题目不同的测验(复本)来测量同一群体,然后求得被试者在两个测验上得分的相关系数,这个相关系数就代表了复本信度的高低。如果两个复本的施测相隔一段时间,则称稳定与等值系数。在计算复本信度时,应该有半数的被试先作A本再作B本,另一半被试先作B本再作A本,由此可以抵消施测顺序的效应。,内部一致性信度分半信度(split-halfreliability)是在测验实施后将测验按奇、偶数分为等值的两半,并分别计算每位被试在两半测验上的得分,求出这两半分数的相关系数。分半法经常会低估信度,必须修正,借以估计整个测验的信度。同质性信度(homogeneityreliability)同质性主要代表测验内部所有题目间的一致性。当各个测题的得分有较高的正相关时,不论题目的内容和形式如何,则测验为同质的。相反,即使所有题目看起来好象测量同一特质,但相关很低或为负相关时,则测验为异质的。,评分者信度随机抽取若干份测验卷,由两位评分者按评分标准分别给分,然后再根据每份测验卷的两个分数计算相关,即得评分者信度。一般要求在成对的受过训练的评分者之间平均一致性达0.90以上,才认为评分是客观的。当多个评分者评定多个对象,并以等级法记分时,可采用特殊公式去估计评分者信度。,第三单元信度与测验分数的解释,解释真实分数与实得分数的相关信度系数可以解释为总的方差中有多少比例是由真实分数的方差决定的,也就是测验的总变异中真分数造成的变异占百分之几。确定信度可以接受的水平当rxx0.70时,测验不能用于对个人作出评价或预测,而且不能作团体比较;当0.70rxx0.85时,可用于团体比较;当rxx0.85时,才能用来鉴别或预测个人成绩或作为。解释个人分数的意义其一是估计真实分数的范围;其二是了解实得分数再测时可能的变化情形。这就是测量标准误的应用。比较不同测验分数的差异这种比较包括两个人不同分数的差别和同一被试在两个测验上的差别。这就是差异分数的标准误问题。,第四单元影响信度的因素,样本特征:样本团体的异质性:任何相关系数都要受到团体中分数分布的范围所影响,而分数范围与样本团体的异质程度有关。若获得信度的取样团体较为异质的话,往往会高估测验的信度,相反则会低估测验的信度。样本团体的平均能力水平测验长度:一般来说,在一个测验中增加同质的题目,可以使信度提高。测验的难度:通常难度的平均水平为0.50较好。时间间隔:间隔时间越短,信度系数越大。,第四节测验的效度,第一单元效度的概念第二单元效度评估的方法第三单元效度的功能第四单元影响效度的因素,第一单元效度的概念,效度的定义效度是指所测量的与所要测量的心理特点之间的符合程度,或者简单地说是指一个心理测验的准确性.测量的效度受随机误差和系统误差的影响。可信的测验未必有效,有效的测验必定可信。效度的性质相对性连续性,专栏5-4信度与效度的关系,信度是效度的必要而非充分条件效度高必然信度高,而信度高并不一定保证效度高,说明信度高只是效度高的必要条件,并不是效度高的充分条件。效度受信度制约信度系数与效度系数之间有这样一种关系:信度系数的平方根是效度系数的最高限度;或测验的效度不会超过它的信度的平方根。,50,信度和效度的关系信度和效度的关系可以用射击靶环来形象地说明。图1弹着点十分分散,既不稳定也不准确,可视信度和效度均不高;图2着点虽然集中,弹偏离靶心,准确性差,可视信度高但效度低;图3着点全部集中在靶心,说明稳定性和准确性都好,可视信度和效度均高。,第二单元效度评估的方法,美国心理学会在1974年所发行的教育与心理测量之标准一书中将效度分为三大类:即内容效度、构想效度和效标效度。,内容效度,定义:指的是测验题目对有关内容或行为取样的适用性,从而确定测验是否是所欲测量的行为领域的代表性取样。想要编制一个具有较高内容效度的测验需要对所测心理特征有明确的概念测验题目应是所界定的内容范围的代表性取样估计方法专家判断法定义好测验内容的总体范围;编制双向细目表,确定内容和技能各自所占的比例;制定评定量表,由每位评判者在评定量表上作出判断。统计分析法计算两个评分者之间评定的一致性(评分者信度)两个测验复本上得分之相关(复本信度)再测法也可用于内容效度的评估(测验-学习-再测验)经验推测法这种效度是通过实践来检验效度内容效度与表面效度,构想效度,定义:是指测验能够测量到理论上的构思或特质的程度,即测验的结果是否能证实或解释某一理论的假设、术语或构思,解释的程度如何。估计方法对测验本身的分析测验的内容效度测验的同质性分析被试者对题目的反应特点测验间的相互比较相容效度是构思效度的一个证据。区分效度是构思效度的又一个证据。因素分析法也是建立构思效度的常用方法。效标效度的研究证明(效标分组、分数分组、心理特质的发展变化)实验法和观察法证实(训练),效标效度,定义:又称实证效度,反映的是测验预测个体在某种情境下行为表现的有效性程度。估计方法相关法:相关法是评估效标效度最常用的方法,它是求测验分数与效标资料间的相关,这一相关系数称为效度系数。区分法:分析高分组与低分组分布的重叠量。或者计算每一组内得分超过(或低于)另一组平均数的人数百分比,或者计算两组分布的共同区的百分比。重叠量越大,说明两组分数差异越小,即测验的效度越差。命中率法:命中率法是当测验用来做取舍的依据时,用其正确决定的比例作为效度指标的一种方法。,55,两个分布的重叠量,56,测验命中与失误的四中情况效标成绩失败(-)成功(+)预测测验成功(+)(A)失误(B)命中失败(-)(C)命中(D)失误,第三单元效度的功能,预测误差效度系数的实际意义常常以决定性系数来表示,意旨相关系数的平方,其表达式是rxy2,它表示测验正确预测或解释的效标的方差占总方差的比例。另一种表达方法是估计的标准误,简写为Sest,它是指所有具有某一测验分数的被试其效标分数(Y)分布的标准差,也即真正效标分数落在某一范围内有多大可能性。预测效标分数在测验工作中,人们感兴趣的是从测验分数预测效标成绩,因此最常用的是Y对X的回归方程。预测效率指数,58,回归方程:为了得到一个回归方程,必须确定a和byx这两个常数的值。,59,估计标准误的公式为:估计的标准误如同其他标准误一样解释。真正分数落在预测效标分数1.96Sest的范围内,有95%的可能性,数落在预测效标分数2.58Sest的范围内,有99%的可能性。,60,预测效率指数:E值的大小表明使用测验比盲目猜测能减少多少误差。例如一个测验的效度系数为0.80,那么E=40,这表明由于测验的使用,使得我们在估计被试的效度分数时减少了40%的误差。,第四单元影响效度的因素,测验本身的因素:测验取材的代表性、测验长度、试题类型、难度、区分度以及编排方式都会影响效度。测验实施中的干扰因素主测者的影响因素受测者的影响因素样本团体的性质样本团体的异质性干涉变量效标的性质效标测量本身的可靠性即校标测量的信度如何,是值得考虑的一个问题。,第五节项目分析,第一单元项目的难度第二单元项目的区分度,第一单元项目的难度,难度(difficulty)的定义:是指项目的难易程度。难度的计算二分法记分的项目非二分记分的项目难度水平的确定项目的难度:P值越接近于0.50,区别力越高。测验的难度如果被试样本具有代表性,对于中等难度的测验,其测验总分应该接近常态分配。对于正偏态分布,必须增加足够数量的较容易的项目;对于负偏态分布,必须增加足够数量的有较高难度的项目。,64,难度的计算,二分法记分的项目未分组资料分组资料非二分法记分的项目,65,项目的难度,为了使测验具有更大的鉴别力,应该选择难度在0.50左右的试题比较合适。但是,在实际工作中并非如此简单。如果难度都是0.50,而试题间都完全相关,则易形成“U”分布。所以在选择题目时,最好难度水平接近0.50,而各题难度在0.500.20之间变化。当测验用于选拔或诊断时,应较多地选择难度值接近录取率的项目。如选拔提高难度,诊断应降低难度。对于选择题来说,P值一般应大于概率水平。如是非题,难度应该为0.75最为合适;而对于四选一的题目,其难度约为0.63时最为合适。,66,测验分数分布的正偏态与负偏态图1为正偏态分布,即大多数集中在低分端,说明编制的测验对于所要研究的样本团体来说偏难,因此必须增加足够数量的较容易的项目;图2为负偏态分布,即大多数集中在高分端,说明编制的测验对于所要研究的样本团体来说偏易,因此必须增加足够数量的较高难度的项目;,第二单元项目的区分度,定义:也叫鉴别力,是指测验项目对被试者的心理特性的区分能力。计算方法鉴别指数D=PH-PL相关法点二列相关、二列相关、相关法。区分度与难度的关系,68,项目鉴别指数与评价标准,1965年,美国心理测验专家伊贝尔(L.Ebel)根据长期的经验提出鉴别指数评价项目性能的标准,见下表。鉴别指数(D)项目评价0.40以上很好0.300.39良好,修改后会更佳0.200.29尚可,但需修改0.19以下差,必须淘汰,69,D的最大区分度与项目难度的关系,项目通过率D的最大值1.0000.900.200.800.400.700.600.600.800.501.000.400.800.300.600.200.400.100.2000,第六节测验编制的一般程序,第一单元测验的目标分析第二单元测题的编写第三单元测题的编排与组织,第一单元测验的目标分析,测验的对象测验的用途测验的目标,测验的对象,在编制测验时必须明确测量对象,也就是该测验编成后要用于何种团体。如WAIS,我们不能用于儿童,而编制时也不会出1+1=?的题目,因为这样的题目对幼年儿童比较合适。要考虑的因素:年龄、文化程度、社会经济条件、文化背景、智力水平及阅读水平等。,测验的用途,心理测验的用途就是指我们编制测验是干什么用的,是要对被试做描述,还是做诊断,抑或是选拔和预示,这一点在测验编制前就应明确。用途不同,编制测验时的取材范围及试题难度等也不尽相同。测验的用途可分为两类:显示性测验:指测验题目和要测量的特征相似的测验,比如成就测验,它所反映的是被试具有什么能力,能完成什么任务。预测性测验:指预测一些没有被测量的行为的测验,即希望测验能作出对未知情况的预测。,测验的目标,指编制的测验是测什么的,即用来测量什么样的心理变量或行为特征。目标分析工作分析第一是确定哪些心理特征和行为可以使要预测的活动达到成功第二是建立衡量被试是否成功的标准,这个标准我们称之为效标对特定概念下定义确定测验的具体内容,第二单元测题的编写,搜集资料命题原则编制要领,搜集资料,已出版的标准测验最简单、最直接的方法是从已经出版的各种标准测验中选择合适的题目理论和专家的经验理论和专家经验有时也可以作为题目的来源之一临床观察和记录临床的观察也可以作为题目的来源,命题原则,内容方面试题要符合测验的目的;内容取样要有代表性;题目间内容相互独立,互不牵连,对不同题目的回答不致相互影响;文字方面使用准确的当代语言,避免使用生僻的字句或词汇语句要简明扼要,既要排除与答案无关的因素,又不能遗漏答题所依据的必要条件;最好是一句话说明一个概念,尽量少使用双重否定句理解方面题目内容不能超出受测团体的知识水平和理解能力;答案明确,不引起争议;题目格式不要被人误解;社会敏感性方面避开社会敏感性问题,如涉及社会禁忌或个人隐私的题目不应使用。,可是有些测验必须涉及这类社会敏感性问题,那么怎样鼓励被试作出真实的回答呢?菲力普(Phillips,D.L.)列举了几条策略值得参考:命题时假定被试具有某种行为,使他不得不在确实没有该行为时才否定,可避免否定答案过多的倾向。命题时假定规范不一致指出该行为是常见的,虽然是违规的,编制要领,对心理测验的题目进行分类的标准很多,常见的分类是根据对被试的要求不同来分,可以分为两大类:提供型(supply)和选择型(selection)题目。提供型题目:要求被试提供答案论文题:简答题填充题选择型题目:要求被试在几个选项中选择正确答案是非题选择题匹配题,第三单元测验的编排和组织,合成测验测验的预试信度与效度考察常模制定编写指导手册,合成测验,选择与审定试题选择试题形式审定题目测题的编排编排原则题目的难度排列宜逐步上升。同类型的测题尽可能组合在一起。注意各种类型测题本身的特点。编排方式并列直进式混合螺旋式,测验的预试,预测预试对象必须和将来正式测验准备测试的对象相似。预试的实施过程与情境应力求与正式测验的情况相似。预试的时限可稍宽些,以搜集充分的反应资料。应将被试的各种反应情形随时加以记录。项目分析确定题目的难度、区分度、备选答案的合适度等。为了检验所选出的项目的性能是否真正符合要求,通

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论