[其它考试]心理测量学知识08年_第1页
[其它考试]心理测量学知识08年_第2页
[其它考试]心理测量学知识08年_第3页
[其它考试]心理测量学知识08年_第4页
[其它考试]心理测量学知识08年_第5页
已阅读5页,还剩75页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、心理测量学知识心理测量学知识姜长青姜长青都医科大学附属北京安定医院首都医科大学附属北京安定医院讲课内容讲课内容 第一节第一节概述概述第二节第二节测验的常模测验的常模第三节第三节测验的信度测验的信度第四节第四节测验的效度测验的效度第五节第五节项目分析项目分析第六节第六节测验编制的一般程序测验编制的一般程序第七节第七节心理测验的使用心理测验的使用3第一节第一节概述概述 第一单元第一单元测量与测量量表测量与测量量表 第二单元第二单元心理测验的基本概念心理测验的基本概念 第三单元第三单元心理测验的分类心理测验的分类 第四单元第四单元纠正错误的测验观纠正错误的测验观 第五单元

2、第五单元心理测验在心理咨询中的应用心理测验在心理咨询中的应用 第六单元第六单元心理测验的发展史心理测验的发展史4第一单元第一单元测量与测量量表测量与测量量表 什么是测量什么是测量 测量要素测量要素 测量量表测量量表5什么是测量什么是测量 测量就是依据一定的法则用数字对事物加以确定。测量就是依据一定的法则用数字对事物加以确定。从字面上看,该定义包括三个主要的元素:从字面上看,该定义包括三个主要的元素:事事物;物;数字;数字;法则。法则。 1.“1.“事物事物”,指的是我们要测量的对象,更准确,指的是我们要测量的对象,更准确地说,就是引起我们兴趣的事物的属性或特征。地说,就是引起我们兴趣的事物的属

3、性或特征。 2.“2.“数字数字”,是代表某一事物或事物某一属性的,是代表某一事物或事物某一属性的量。量。 3.“3.“法则法则”,代表的是测量所依据的规则和方法。,代表的是测量所依据的规则和方法。 6测量要素测量要素 任何测量都应该具备这样两个要素:即参照点和单位。任何测量都应该具备这样两个要素:即参照点和单位。 参照点:要确定事物的量,必须有一个计算的起点,参照点:要确定事物的量,必须有一个计算的起点,这个起点叫做参照点。这个起点叫做参照点。 绝对零点绝对零点 人定的参照点即相对零点人定的参照点即相对零点 单位:是测量的基本要求,没有单位就无法进行测量单位:是测量的基本要求,没有单位就无法

4、进行测量 确定的意义确定的意义 有相同的价值有相同的价值7测量量表测量量表 测量的本质是根据某一法则将事物数量化,即在一个定有单测量的本质是根据某一法则将事物数量化,即在一个定有单位和参照点的连续体上把事物的属性表现出来,这个连续体位和参照点的连续体上把事物的属性表现出来,这个连续体称为量表。称为量表。量表的四种水平量表的四种水平 命名量表命名量表:代号代号/类别类别 顺序量表顺序量表:在顺序量表中,既无相等单位,又无绝对零点,数在顺序量表中,既无相等单位,又无绝对零点,数字仅表示等级,并不表示某种属性的真正量或绝对值。字仅表示等级,并不表示某种属性的真正量或绝对值。 等距量表等距量表:不但有

5、大小关系,而且具有相等的单位,其数值可不但有大小关系,而且具有相等的单位,其数值可以相互做加、减运算,但没有绝对的零点,因此不能做乘、除以相互做加、减运算,但没有绝对的零点,因此不能做乘、除运算。运算。 等比量表等比量表:是最高水平的量表,既有相等单位又有绝对零点。是最高水平的量表,既有相等单位又有绝对零点。那么,心理测量中使用的量表一般是什么量表呢?一般说来,那么,心理测量中使用的量表一般是什么量表呢?一般说来,心理测量是在顺序量表上进行的。心理测量是在顺序量表上进行的。8第二单元第二单元心理测验的基本概念心理测验的基本概念 心理测验的定义心理测验的定义 心理测验的性质心理测验的性质9心理测

6、验的定义心理测验的定义所谓心理测验,就是依据心理学理论,使用一定的操作程所谓心理测验,就是依据心理学理论,使用一定的操作程序,通过观察人的少数有代表性的行为,对于贯穿在人的序,通过观察人的少数有代表性的行为,对于贯穿在人的全部行为活动中的心理特点作出推论和数量化分析的一种全部行为活动中的心理特点作出推论和数量化分析的一种科学手段。科学手段。首先,心理测验测量的是人的行为首先,心理测验测量的是人的行为。其次,心理测验在测量个别差异的时候,往往只是对少数其次,心理测验在测量个别差异的时候,往往只是对少数经过慎重选择的行为样本进行观察,来间接推知被试者的经过慎重选择的行为样本进行观察,来间接推知被试

7、者的心理特征。心理特征。第三,为了使不同的被试者所获得的分数有比较的可能性,第三,为了使不同的被试者所获得的分数有比较的可能性,测验的条件对所有的被试者都必须是相同的。测验的条件对所有的被试者都必须是相同的。第四,个人在测验中所得到的原始分数并不具有什么意义,第四,个人在测验中所得到的原始分数并不具有什么意义,只有将它与其他人的分数或常模相比较才有意义。只有将它与其他人的分数或常模相比较才有意义。10心理测验的性质心理测验的性质 心理测量的间接性心理测量的间接性迄今为止,我们还无法直接测量人的心理,只能通过迄今为止,我们还无法直接测量人的心理,只能通过测量人的外显行为,即通过测量人们对测验题目

8、的反测量人的外显行为,即通过测量人们对测验题目的反应来推论出他的应来推论出他的心理特质心理特质。 心理测量的相对性心理测量的相对性 我们在比较不同人之间的行为或心理特征时,没有绝我们在比较不同人之间的行为或心理特征时,没有绝对的标准,也没有绝对的零点,我们有的只是一个连对的标准,也没有绝对的零点,我们有的只是一个连续的行为序列。续的行为序列。 心理测量的客观性:心理测量的客观性:1 1、测验的刺激是客观的、测验的刺激是客观的2 2、对反应的量化是客观的、对反应的量化是客观的3 3、对结果的推论是客观的、对结果的推论是客观的11第三单元第三单元心理测验的分类心理测验的分类 按测验的功能分类按测验

9、的功能分类 智力测验、特殊能力测验、人格测验智力测验、特殊能力测验、人格测验 按测验材料的性质分类按测验材料的性质分类 文字测验、操作测验文字测验、操作测验 按测验材料的严谨程度分类按测验材料的严谨程度分类 客观测验、投射测验客观测验、投射测验 按测验的方式分类按测验的方式分类 个别测验、团体测验个别测验、团体测验 按测验的要求分类按测验的要求分类 最高作为测验、典型行为测验最高作为测验、典型行为测验12第四单元第四单元纠正错误的测验观纠正错误的测验观 错误的测验观错误的测验观 测验万能论测验万能论 测验无用论测验无用论 某些人格测验侵犯了个人隐私,违背民主原则某些人格测验侵犯了个人隐私,违背

10、民主原则 测验为宿命论和种族歧视提供了心理学依据测验为宿命论和种族歧视提供了心理学依据 心理测验心理测验=智力测验智力测验=智商智商=遗传决定论遗传决定论 正确的测验观正确的测验观 心理测验是重要的心理学研究方法之一,是决策的心理测验是重要的心理学研究方法之一,是决策的辅助工具辅助工具 心理测验作为研究方法和测量工具尚不完善心理测验作为研究方法和测量工具尚不完善13第五单元第五单元心理测验在心理咨询中的应用心理测验在心理咨询中的应用 智力测验智力测验:可在求助者有特殊要求时及对方有:可在求助者有特殊要求时及对方有可疑智力障碍的情况下应用;可疑智力障碍的情况下应用; 人格测验人格测验:有助于治疗

11、者对求助者人格特征的:有助于治疗者对求助者人格特征的了解,以便于对其问题有更深入的理解,并可了解,以便于对其问题有更深入的理解,并可针对性地开展咨询与心理治疗工作;针对性地开展咨询与心理治疗工作; 心理评定量表心理评定量表:用于检查求助者某方面心理障:用于检查求助者某方面心理障碍的存在与否或其程度如何。碍的存在与否或其程度如何。14第六单元第六单元心理测验的发展史心理测验的发展史 科学心理测验的产生与发展科学心理测验的产生与发展 现代心理测验在我国的发展现代心理测验在我国的发展15科学心理测验的产生与发展(科学心理测验的产生与发展(1) 首先倡导科学心理测验首先倡导科学心理测验的学者是英国生物

12、学家的学者是英国生物学家和心理学家高尔登(和心理学家高尔登(f. f. galtongalton),因此他的工),因此他的工作被视为心理测验的开作被视为心理测验的开端。此外,高尔登也为端。此外,高尔登也为心理测验奠定了统计学心理测验奠定了统计学基础,即首先提出了相基础,即首先提出了相关的概念关的概念。francisgalton(1822-1911)16 18901890年,卡特尔在年,卡特尔在心理心理杂志上发表杂志上发表“心理测验与测量心理测验与测量”一文,这是心理测验一文,这是心理测验第一次出现于心理学第一次出现于心理学文献中文献中。并提出心理并提出心理测验的结果应与常模测验的结果应与常模进

13、行比较。进行比较。科学心理测验的产生与发展(科学心理测验的产生与发展(2)j.m.cattell(1860-1944)17科学心理测验的产生与发展(科学心理测验的产生与发展(3) 19051905年,年,比内(比内(a.bineta.binet)与其助手西蒙(与其助手西蒙(t.simont.simon)研究制作了世界上第一个研究制作了世界上第一个正式的心理测验正式的心理测验。afredbinet(1857-1911)18科学心理测验的产生与发展(科学心理测验的产生与发展(4) 操作测验的发展操作测验的发展由于理论上的缺陷和实际上的需要,所以有操作测由于理论上的缺陷和实际上的需要,所以有操作测验

14、的问世。验的问世。 团体智力测验的发展团体智力测验的发展团体测验始于第一次世界大战,在推孟的研究生欧团体测验始于第一次世界大战,在推孟的研究生欧提斯所编团体智力测验的基础上发展了陆军甲种和乙提斯所编团体智力测验的基础上发展了陆军甲种和乙种智力测验。种智力测验。 能力倾向测验的发展能力倾向测验的发展分析个人心理品质的内部结构,为职业选拔与安置分析个人心理品质的内部结构,为职业选拔与安置提供依据。提供依据。 普通能力倾向(智力)测验也向多元化发展。普通能力倾向(智力)测验也向多元化发展。 人格测验的发展人格测验的发展测量情感或行为等非智力方面的人格因素。测量情感或行为等非智力方面的人格因素。19现

15、代心理测验在我国的发展现代心理测验在我国的发展 我国近代心理测验大约源于我国近代心理测验大约源于1914年前后。年前后。 上世纪二、三十年代,我国心理学家曾两次修订过比内上世纪二、三十年代,我国心理学家曾两次修订过比内-西蒙量表。西蒙量表。 1979年后,全国各地的心理学家组织起多个协作组,年后,全国各地的心理学家组织起多个协作组,先后对国外的广泛采用的智力和人格测量工具进行修订。先后对国外的广泛采用的智力和人格测量工具进行修订。 近些年来我国的心理学家正在致力于测验本土化,编制近些年来我国的心理学家正在致力于测验本土化,编制适合我国文化背景的智力测验,适应行为量表等,并已适合我国文化背景的智

16、力测验,适应行为量表等,并已取得了初步成功。取得了初步成功。20第二节第二节测验的常模测验的常模 第一单元第一单元常模团体常模团体 第二单元第二单元常模的类型常模的类型 第三单元第三单元常模分数的表示方法常模分数的表示方法21第一单元第一单元常模团体常模团体 常模团体的性质常模团体的性质 常模团体的条件常模团体的条件 取样的方法取样的方法 常模分数与常模常模分数与常模22常模团体的性质常模团体的性质 常模团体是由具有某种共同特征的人所组成的常模团体是由具有某种共同特征的人所组成的一个群体,或者是该群体的一个样本。一个群体,或者是该群体的一个样本。 对测验编制者而言,常模的选择主要是基于对对测验

17、编制者而言,常模的选择主要是基于对测验将要施测的总体的认识,常模团体必须能测验将要施测的总体的认识,常模团体必须能够代表该总体。这种工作包括:够代表该总体。这种工作包括: 确定一般总体确定一般总体 确定目标总体确定目标总体 确定样本。确定样本。 对测验的使用者来说,要考虑的问题是,现有对测验的使用者来说,要考虑的问题是,现有的常模团体哪一个最合适。的常模团体哪一个最合适。23常模团体的条件常模团体的条件 群体的构成必须明确界定群体的构成必须明确界定 可以用来区分和限定群体的变量是很多的,如性别、年龄、可以用来区分和限定群体的变量是很多的,如性别、年龄、职业、文化程度、民族、地理地域、社会经济地

18、位等。职业、文化程度、民族、地理地域、社会经济地位等。 常模团体必须是所测群体的代表性样本常模团体必须是所测群体的代表性样本 当所要测量的群体很小时,将所有的人逐个测量,其平均当所要测量的群体很小时,将所有的人逐个测量,其平均分便是该群体的最可靠的常模。分便是该群体的最可靠的常模。 在群体较大时,因为时间和人力物力的限制,只能测量一在群体较大时,因为时间和人力物力的限制,只能测量一部分人作为总体的代表。部分人作为总体的代表。 样本的大小要适当样本的大小要适当 总体数目小,只有几十个人,则需要总体数目小,只有几十个人,则需要100%100%的样本。如果总的样本。如果总体数目大,相应的样本也大,一

19、般最低不小于体数目大,相应的样本也大,一般最低不小于3030或或100100个。个。 全国性常模,一般应有全国性常模,一般应有20002000 30003000人为宜。人为宜。 标准化样组是一定时空的产物标准化样组是一定时空的产物24取样的方法取样的方法 取样即从目标总体中选择有代表性的样本取样即从目标总体中选择有代表性的样本 简单随机抽样简单随机抽样:在简单随机抽样中,每个人或抽样单在简单随机抽样中,每个人或抽样单位都有相同的机会作为常模中的一部分。位都有相同的机会作为常模中的一部分。 系统抽样系统抽样: 有时在总体数目为有时在总体数目为n n的情况下,若要选择的情况下,若要选择k k分之一

20、的被试作为分之一的被试作为样本,则可以在抽样范围内选择每个第样本,则可以在抽样范围内选择每个第k k个人来构成样本。个人来构成样本。 要求目标总体无序可排,也无等级结构存在。要求目标总体无序可排,也无等级结构存在。 分组抽样分组抽样:先将群体分组,再在组内进行随机取样先将群体分组,再在组内进行随机取样。 分层抽样分层抽样:先将目标总体分成若干层次,再从各层次先将目标总体分成若干层次,再从各层次中随机抽取若干被试,最后把各层的被试组合成常模中随机抽取若干被试,最后把各层的被试组合成常模样本。包括分层比例抽样和分层非比例抽样样本。包括分层比例抽样和分层非比例抽样25常模分数与常模常模分数与常模 常

21、模分数常模分数 常模分数就是施测常模样本被试后,将被试常模分数就是施测常模样本被试后,将被试者的原始分数按一定规则转换出来的导出分者的原始分数按一定规则转换出来的导出分数。数。 常模常模 常模分数构成的分布,就是通常所说的常模常模分数构成的分布,就是通常所说的常模(norm),它是解释心理测验分数的基础。),它是解释心理测验分数的基础。常模有一般常模与特殊常模之分常模有一般常模与特殊常模之分26第二单元第二单元常模的类型常模的类型 发展常模发展常模 百分位常模百分位常模 标准分常模标准分常模 智商的计算及意义智商的计算及意义27发展常发展常模模 发展顺序量表发展顺序量表 智力年龄智力年龄 年级

22、当量年级当量28发展常模(发展常模(1)/发展顺序量表发展顺序量表 最直观的发展常模是发展顺序量表,因为它告最直观的发展常模是发展顺序量表,因为它告诉人们多大的儿童具备什么能力或行为就表明诉人们多大的儿童具备什么能力或行为就表明其发育正常,相应能力或行为早于某年龄出现,其发育正常,相应能力或行为早于某年龄出现,说明发育超前,否则即为发育滞后。说明发育超前,否则即为发育滞后。 最早的一个范例是最早的一个范例是葛塞尔发展程序表葛塞尔发展程序表,其中按,其中按月份显示出儿童在运动水平、适应性、语言、月份显示出儿童在运动水平、适应性、语言、社会性四个方面的大致发展水平。社会性四个方面的大致发展水平。2

23、9发展常模(发展常模(2)/智力年龄智力年龄 方法一方法一:基础年龄与在较高年龄水平的:基础年龄与在较高年龄水平的题目上获得的附加月份之和。题目上获得的附加月份之和。 方法二:将标准化样本中每个年龄组的方法二:将标准化样本中每个年龄组的平均原始分数作为年龄常模。通过将原平均原始分数作为年龄常模。通过将原始分数与年龄常模对比,便可求得每个始分数与年龄常模对比,便可求得每个人的智龄。人的智龄。30发展常模(发展常模(3)/年级当量年级当量 年级当量实际上就是年级量表,测验结果说明属哪一年级当量实际上就是年级量表,测验结果说明属哪一年级的水平,在教育成就测验中最常用。其表述方式年级的水平,在教育成就

24、测验中最常用。其表述方式常常是:某学生的算术是常常是:某学生的算术是6 6年级水平,阅读是年级水平,阅读是4 4年级水年级水平,理解是平,理解是5 5年级的水平等。年级的水平等。 年级量表的单位通常为年级量表的单位通常为10个月间隔,在一学年中假设个月间隔,在一学年中假设两个月的假期在所测量目标上的发展是不重要的,因两个月的假期在所测量目标上的发展是不重要的,因此以此以10个月为一个年级。例如,个月为一个年级。例如,40(或(或4.0)表示四)表示四年级开始时的平均成绩,年级开始时的平均成绩,45(或(或4.5)表示学年中间)表示学年中间的平均成绩。的平均成绩。31百分位常模百分位常模 百分等

25、级百分等级 指在常模样本中低于这个分数的人数百分比。指在常模样本中低于这个分数的人数百分比。 百分点百分点 百分点也称百分位数,与百分等级的计算方法正好百分点也称百分位数,与百分等级的计算方法正好相反。百分等级是计算低于相反。百分等级是计算低于某测验分数某测验分数的人数的人数百分百分比比,而百分点则是计算处于某一,而百分点则是计算处于某一百分比例百分比例的人对应的人对应的的测验分数测验分数是多少是多少。 四分位数和十分位数四分位数和十分位数 百分位数是将量表分成百分位数是将量表分成100100份,而四分位数是将量份,而四分位数是将量表分成四等份,相当于百分等级的表分成四等份,相当于百分等级的2

26、5%25%、50%50%和和75%75%对应的三个百分点分成的四段。十分位数也可以依对应的三个百分点分成的四段。十分位数也可以依此类推出,此类推出,1%1%10%10%为第一段,为第一段,91%91%100%100%为第十段。为第十段。32标准分常模标准分常模标准分数是将原始分数与平均数的距离以标准差为单位表示出来标准分数是将原始分数与平均数的距离以标准差为单位表示出来的量表。因为它的基本单位是标准差,所以叫标准分数。的量表。因为它的基本单位是标准差,所以叫标准分数。1线性转换的标准分数(常态)线性转换的标准分数(常态) 2非线性转换的标准分数(非常态)非线性转换的标准分数(非常态) 对每个原

27、始分数值计算累积百分比;对每个原始分数值计算累积百分比; 在常态曲线面积表中,求出对于该百分比的标准(在常态曲线面积表中,求出对于该百分比的标准(zz)分数)分数。 t t分数:平均数为分数:平均数为5050,标准差为,标准差为1010 标准九分:以标准九分:以5 5为平均数,以为平均数,以2 2为标准差为标准差 标准十分:平均数为标准十分:平均数为5.55.5,标准差为,标准差为1.51.5; 标准二十分:平均数为标准二十分:平均数为1010,标准差为,标准差为3 3。sdxxzbzaz33智商的计算及其意义智商的计算及其意义 比率智商比率智商 离差智商离差智商 表示个体智力在年龄组中所处的

28、位置,因而是表示个体智力在年龄组中所处的位置,因而是表示智力高低的一种理想的指标。表示智力高低的一种理想的指标。100camaiq sd)xx(15100iq 34第三单元第三单元常模分数表示法常模分数表示法 转换表表示法转换表表示法 最简单而且最基本的表示常模的方法就是转换表,最简单而且最基本的表示常模的方法就是转换表,有时也叫常模表。测验的使用者利用转换表可将原有时也叫常模表。测验的使用者利用转换表可将原始分数转换为与其对应的导出分数,从而对测验的始分数转换为与其对应的导出分数,从而对测验的分数作出有意义的解释。分数作出有意义的解释。 剖面图表示法剖面图表示法 剖面图是将测验分数的转换关系

29、用图形表示出来。剖面图是将测验分数的转换关系用图形表示出来。从剖面图上可以很直观地看出被试在各个分测验上从剖面图上可以很直观地看出被试在各个分测验上的表现及其相对的位置的表现及其相对的位置。35第三节第三节测验的信测验的信度度 第一单元第一单元信度的概念信度的概念 第二单元第二单元信度的估计方法信度的估计方法 第三单元第三单元信度与测验分数的解释信度与测验分数的解释 第四单元第四单元影响信度的因素影响信度的因素36第一单元第一单元信度的概念信度的概念 信度的定义信度的定义 描述定义:指同一被试在不同时间内用同一测验(或用另一描述定义:指同一被试在不同时间内用同一测验(或用另一套相等的测验)重复

30、测量,所得结果的一致程度。套相等的测验)重复测量,所得结果的一致程度。 操作定义:一组测量分数的真分数方差与总方差(实得分数操作定义:一组测量分数的真分数方差与总方差(实得分数的方差)的比率。的方差)的比率。 x=t+e sx2=st2+se2 rxx=st2/sx2 信度的指标信度的指标 信度系数和信度指数信度系数和信度指数 测量标准误测量标准误xxxrsse1222xtxtxxssrr/37第二单元第二单元信度的估计方法信度的估计方法 重测信度重测信度 复本信度复本信度 内部一致性信度内部一致性信度 评分者信度评分者信度38信度的估计方法(信度的估计方法(1) 重测信度(重测信度(test

31、-retestreliability) 又称又称稳定性系数稳定性系数。它的计算方法是采用重测法,即。它的计算方法是采用重测法,即使用同一测验,在同样条件下对同一组被试者前后使用同一测验,在同样条件下对同一组被试者前后施测两次测验,求两次得分间的相关系数。施测两次测验,求两次得分间的相关系数。 最适宜的时距随测验的目的、性质和被试特点而异,最适宜的时距随测验的目的、性质和被试特点而异,一般是两周到四周较宜,间隔时间最长不超过六个一般是两周到四周较宜,间隔时间最长不超过六个月。月。212121/ssxxnxxrxx39信度的估计方法(信度的估计方法(2) 复本信度(复本信度(alternate-f

32、ormreliability) 又称又称等值性系数等值性系数,它是以两个等值但题目不同的测它是以两个等值但题目不同的测验(复本)来测量同一群体,然后求得被试者在两验(复本)来测量同一群体,然后求得被试者在两个测验上得分的相关系数,这个相关系数就代表了个测验上得分的相关系数,这个相关系数就代表了复本信度的高低。复本信度的高低。 如果两个复本的施测相隔一段时间,则称如果两个复本的施测相隔一段时间,则称重测复本重测复本信度信度或或稳定与等值系数稳定与等值系数。 在计算复本信度时,应该有半数的被试先作在计算复本信度时,应该有半数的被试先作a本再本再作作b本,另一半被试先作本,另一半被试先作b本再作本再

33、作a本,由此可以抵本,由此可以抵消施测顺序的效应。消施测顺序的效应。40信度的估计方法(信度的估计方法(3) 内部一致性信度(内部一致性信度(internalconsistencyreliability) 分半信度(分半信度(split-halfreliability) 是在测验实施后将测验按奇、偶数分为等值的两半,并分是在测验实施后将测验按奇、偶数分为等值的两半,并分别计算每位被试在两半测验上的得分,求出这两半分数的别计算每位被试在两半测验上的得分,求出这两半分数的相关系数。相关系数。 分半法经常会低估信度,必须修正(斯皮尔曼分半法经常会低估信度,必须修正(斯皮尔曼-布朗公布朗公式),借以估

34、计整个测验的信度式),借以估计整个测验的信度。 同质性信同质性信度度(homogeneityreliability) 同质性主要代表测验内部所有题目间的一致性。当各个测同质性主要代表测验内部所有题目间的一致性。当各个测题的得分有较高的正相关时,不论题目的内容和形式如何,题的得分有较高的正相关时,不论题目的内容和形式如何,则测验为同质的。相反,即使所有题目看起来好象测量同则测验为同质的。相反,即使所有题目看起来好象测量同一特质,但相关很低或为负相关时,则测验为异质的。一特质,但相关很低或为负相关时,则测验为异质的。)hh1/(hh2xxrrr 41信度的估计方法(信度的估计方法(4) 评分者信度

35、(评分者信度(scorerreliability) 随机抽取若干份测验卷,由两位评分者按评分标准分别给分,随机抽取若干份测验卷,由两位评分者按评分标准分别给分,然后再根据每份测验卷的两个分数计算相关,即得评分者信然后再根据每份测验卷的两个分数计算相关,即得评分者信度。度。 一般要求在成对的受过训练的评分者之间平均一致性达一般要求在成对的受过训练的评分者之间平均一致性达0.90以以上,才认为评分是客观的。上,才认为评分是客观的。 当多个评分者评定多个对象,并以等级法记分时,可采用当多个评分者评定多个对象,并以等级法记分时,可采用肯肯德尔和谐系数德尔和谐系数作为评分者信度的估计。作为评分者信度的估

36、计。)(121)(3222nnknrrwii42第三单元第三单元信度与测验分数的解释信度与测验分数的解释解释真实分数与实得分数的相关解释真实分数与实得分数的相关 信度系数可以解释为总的方差中有多少比例是由真实分数的信度系数可以解释为总的方差中有多少比例是由真实分数的方差决定的,也就是测验的总变异中真分数造成的变异占百方差决定的,也就是测验的总变异中真分数造成的变异占百分之几。分之几。确定信度可以接受的水平确定信度可以接受的水平 当当r rxxxx0.700.70时,测验不能用于对个人作出评价或预测,而且不时,测验不能用于对个人作出评价或预测,而且不能作团体比较;当能作团体比较;当0.700.7

37、0r rxxxx0.850.85时,可用于团体比较;当时,可用于团体比较;当r rxxxx0.850.85时,才能用来鉴别或预测个人成绩或作为。时,才能用来鉴别或预测个人成绩或作为。解释个人分数的意义解释个人分数的意义 其一是估计真实分数的范围;其二是了解实得分数再测时可其一是估计真实分数的范围;其二是了解实得分数再测时可能的变化情形。这就是测量标准误的应用。能的变化情形。这就是测量标准误的应用。比较不同测验分数的差异比较不同测验分数的差异 这种比较包括两个人不同分数的差别和同一被试在两个测验这种比较包括两个人不同分数的差别和同一被试在两个测验上的差别。这就是差异分数的标准误问题。上的差别。这

38、就是差异分数的标准误问题。43第四单元第四单元影响信度的因素影响信度的因素 样本特征样本特征 样本团体的异质性:一般而言,若获得信度的取样本团体的异质性:一般而言,若获得信度的取样团体较常模总体为异质的话,往往会高估测验样团体较常模总体为异质的话,往往会高估测验的信度,相反会低估测验的信度。的信度,相反会低估测验的信度。 样本团体的平均能力水平:不同水平的团体,难样本团体的平均能力水平:不同水平的团体,难度不同度不同 测验的长度测验的长度:一般来说,在一个测验中增加:一般来说,在一个测验中增加同质的题目,可以使信度提高。同质的题目,可以使信度提高。 测验的难度测验的难度 通常难度的平均水平为通

39、常难度的平均水平为0.50较好。较好。 测量的时间间隔测量的时间间隔44第四节第四节测验的效度测验的效度 第一单元第一单元效度的概念效度的概念 第二单元第二单元效度评估的方法效度评估的方法 第三单元第三单元效度的功能效度的功能 第四单元第四单元影响效度的因素影响效度的因素45第一单元第一单元效度的概念效度的概念 效度的定义效度的定义 描述定义:指所测量的与所要测量的心理特点之间描述定义:指所测量的与所要测量的心理特点之间的符合程度,或者说是指一个心理测验的准确性的符合程度,或者说是指一个心理测验的准确性.操作定义操作定义:在一组测量中,与测量目标有关的真实:在一组测量中,与测量目标有关的真实方

40、差(或称有效方差)与总方差的比率方差(或称有效方差)与总方差的比率. . r2xy=sv2/sx2 x=t+e=v+i+e sx2=st2+se2=sv2+si2+se2 效度的性质效度的性质 效度具有相对性效度具有相对性 效度具有连续性效度具有连续性46专栏专栏5-4信度与效度的关系信度与效度的关系 信度是效度的必要而非充分条件信度是效度的必要而非充分条件 效度高必然信度高,而信度高并不一定保证效度高,效度高必然信度高,而信度高并不一定保证效度高,说明信度高只是效度高的必要条件,并不是效度高说明信度高只是效度高的必要条件,并不是效度高的充分条件。的充分条件。 效度是受信度制约的效度是受信度制

41、约的 信度系数与效度系数之间有这样一种关系:信度系信度系数与效度系数之间有这样一种关系:信度系数的平方根是效度系数的最高限度。用公式表示如数的平方根是效度系数的最高限度。用公式表示如下:下:xxxyrr47第二单元第二单元效度的估计方法效度的估计方法 内容效度内容效度 构想效度构想效度 效标效度效标效度48内容效度内容效度定义定义: : 内容效度也称逻辑效度,指的是测验题目对有关内容或行内容效度也称逻辑效度,指的是测验题目对有关内容或行为取样的适用性,从而确定测验是否是所欲测量的行为领域的代为取样的适用性,从而确定测验是否是所欲测量的行为领域的代表性取样。表性取样。估计方法估计方法 专家判断法

42、专家判断法 定义好测验内容的总体范围;定义好测验内容的总体范围; 编制双向细目表,确定内容和技能各自所占的比例;编制双向细目表,确定内容和技能各自所占的比例; 由每位评判者在评定量表上作出判断。由每位评判者在评定量表上作出判断。统计分析法统计分析法 计算两个评分者之间评定的一致性(评分者信度)计算两个评分者之间评定的一致性(评分者信度) 两个测验复本上得分之相关(复本信度)两个测验复本上得分之相关(复本信度) 再测法也可用于内容效度的评估(测验再测法也可用于内容效度的评估(测验- -学习学习- -再测验)再测验)经验推测法经验推测法 这种效度是通过实践来检验效度这种效度是通过实践来检验效度内容

43、效度与表面效度内容效度与表面效度49构想效度构想效度定义:是指测验能够测量到理论上的构思或特质的程度,即测验定义:是指测验能够测量到理论上的构思或特质的程度,即测验的结果是否能证实或解释某一理论的假设、术语或构思,解释的的结果是否能证实或解释某一理论的假设、术语或构思,解释的程度如何。程度如何。估计方法估计方法 对测验本身的分析对测验本身的分析 测验的内容效度测验的内容效度 测验的同质性测验的同质性 分析被试者对题目的反应特点分析被试者对题目的反应特点 测验间的相互比较测验间的相互比较 相容效度是构思效度的一个证据。相容效度是构思效度的一个证据。 区分效度是构思效度的又一个证据。区分效度是构思

44、效度的又一个证据。 因素分析法也是建立构思效度的常用方法因素分析法也是建立构思效度的常用方法。 效标效度的研究证明(效标分组效标效度的研究证明(效标分组/分数分组,年龄变化)分数分组,年龄变化) 实验法和观察法证实(训练)实验法和观察法证实(训练)50效标效度效标效度定义:又称实证效度,反映的是测验预测个体在某种情境下行为定义:又称实证效度,反映的是测验预测个体在某种情境下行为表现的有效性程度。表现的有效性程度。估计方法估计方法 相关法相关法:相关法是评估效标效度最常用的方法,它是求测验:相关法是评估效标效度最常用的方法,它是求测验分数与效标资料间的相关,这一相关系数称为效度系数。分数与效标资

45、料间的相关,这一相关系数称为效度系数。 区分法区分法 :是检验测验分数能否有效地分析由效标所定义的团:是检验测验分数能否有效地分析由效标所定义的团体的一种方法。或者计算每一组内得分超过(或低于)另一体的一种方法。或者计算每一组内得分超过(或低于)另一组平均数的人数百分比,或者计算两组分布的共同区的百分组平均数的人数百分比,或者计算两组分布的共同区的百分比。重叠量越大,说明两组分数差异越小,即测验的效度越比。重叠量越大,说明两组分数差异越小,即测验的效度越差。差。 命中率法命中率法:命中率法是当测验用来做取舍的依据时,用其正:命中率法是当测验用来做取舍的依据时,用其正确决定的比例作为效度指标的一

46、种方法。确决定的比例作为效度指标的一种方法。51第三节第三节效度意义的确定效度意义的确定 预测效标分数预测效标分数 在测验工作中,人们感兴趣的是从测验分数预测效标成绩,在测验工作中,人们感兴趣的是从测验分数预测效标成绩,因此最常用的是因此最常用的是y对对x的回归方程。的回归方程。 预测误差预测误差 效度系数的实际意义常常以决定性系数来表示,意旨相关系效度系数的实际意义常常以决定性系数来表示,意旨相关系数的平方,其表达式是数的平方,其表达式是rxy2,它表示测验正确预测或解释的效,它表示测验正确预测或解释的效标的方差占总方差的比例。标的方差占总方差的比例。 另一种表达方法是另一种表达方法是估计的

47、标准误估计的标准误,简写为,简写为sest,它是指所有具,它是指所有具有某一测验分数的被试其效标分数(有某一测验分数的被试其效标分数(y)分布的标准差,也即)分布的标准差,也即真正效标分数落在某一范围内有多大可能性。真正效标分数落在某一范围内有多大可能性。 预测效率指数预测效率指数52第四单元第四单元影响效度的因素影响效度的因素 测验本身的因素测验本身的因素: 测验取材的代表性、测验长度、试题类型、难度、区分度以及编测验取材的代表性、测验长度、试题类型、难度、区分度以及编排方式都会影响效度。排方式都会影响效度。 测验实施中的干扰因素测验实施中的干扰因素 主试的影响因素:包括导语、时限、评分、测

48、验情境等。主试的影响因素:包括导语、时限、评分、测验情境等。 被试的影响因素:包括兴趣、动机、情绪、态度、心身状态等。被试的影响因素:包括兴趣、动机、情绪、态度、心身状态等。 样本团体的性质样本团体的性质 样本团体的异质性样本团体的异质性 干涉变量干涉变量:如动机、兴趣(:如动机、兴趣(0.20 0.60)等。)等。 效标的性质效标的性质 效标与测验分数之间的关系是否线性相关是很重要的一个因素。效标与测验分数之间的关系是否线性相关是很重要的一个因素。效标测量本身的可靠性如何亦是值得考虑的一个问题。效标测量本身的可靠性如何亦是值得考虑的一个问题。53第五节第五节项目分析项目分析 第一单元第一单元

49、项目的难度项目的难度 第二单元第二单元项目的区分度项目的区分度54第一单元第一单元项目的难度项目的难度 难度(难度(difficulty)的定义:是指项目的难易程度,在)的定义:是指项目的难易程度,在非能力测验中类似的指标称为通俗性。非能力测验中类似的指标称为通俗性。 难度的计算难度的计算 二分法记分的项目二分法记分的项目 非二分记分的项目非二分记分的项目 难度水平的确定难度水平的确定 项目的难度项目的难度:p:p值越接近于值越接近于0.500.50,区别力越高。,区别力越高。 测验的难度测验的难度 如果被试样本具有代表性,对于中等难度的测验,如果被试样本具有代表性,对于中等难度的测验,其测验

50、总分应该接近常态分配。其测验总分应该接近常态分配。 对于正偏态分布,必须增加足够数量的较容易的对于正偏态分布,必须增加足够数量的较容易的项目;对于负偏态分布,必须增加足够数量的有项目;对于负偏态分布,必须增加足够数量的有较高难度的项目。较高难度的项目。55第二单元第二单元项目的区分度项目的区分度 定义:也叫鉴别力,是指测验项目对被试者的心理特定义:也叫鉴别力,是指测验项目对被试者的心理特性的区分能力。性的区分能力。 计算方法计算方法 鉴别指数鉴别指数 d=ph-pl 相关法相关法 点二列相关:适用于一类变量为二分称名变量,另一类变点二列相关:适用于一类变量为二分称名变量,另一类变量为连续变量的

51、成对变量的相关计算。量为连续变量的成对变量的相关计算。 二列相关:适用于两个连续变量,但其中一个变量被人为二列相关:适用于两个连续变量,但其中一个变量被人为分成两类分成两类 相关法:适用于两个变量均为二分称名变量。若将测验相关法:适用于两个变量均为二分称名变量。若将测验总分按及格、不及格或录取、淘汰划分,便可计算总分按及格、不及格或录取、淘汰划分,便可计算相关相关系数。系数。 区分度与难度的关系区分度与难度的关系56第六节第六节 测验编制的一般程序测验编制的一般程序 第一单元第一单元测验的目标分析测验的目标分析 第二单元第二单元测题的编写测题的编写 第三单元第三单元测题的编排与组织测题的编排与

52、组织57第一单元第一单元测验的目标分析测验的目标分析 测验的对象测验的对象 测验的用途测验的用途 测验的目标测验的目标58测验的对象测验的对象 描述:描述:在编制测验时必须明确测量对象,也就是该测验编在编制测验时必须明确测量对象,也就是该测验编成后要用于何种团体。如成后要用于何种团体。如waiswais,我们不能用于儿童,我们不能用于儿童,而编制时也不会出而编制时也不会出1+1=1+1=?的题目,因为这样的题目?的题目,因为这样的题目对幼年儿童比较合适对幼年儿童比较合适。 要考虑的因素:要考虑的因素:年龄、文化程度、社会经济条件、文化背景、智力年龄、文化程度、社会经济条件、文化背景、智力水平及

53、阅读水平等。水平及阅读水平等。59心理测验的用途心理测验的用途 描述:描述:心理测验的用途就是指我们编制测验是干什么用的,心理测验的用途就是指我们编制测验是干什么用的,是要对被试做描述,还是做诊断,抑或是选拔和预是要对被试做描述,还是做诊断,抑或是选拔和预示,这一点在测验编制前就应明确。用途不同,编示,这一点在测验编制前就应明确。用途不同,编制测验时的取材范围及试题难度等也不尽相同制测验时的取材范围及试题难度等也不尽相同。 测验的分类:测验的分类:显示性测验:指测验题目和要测量的特征相似的测显示性测验:指测验题目和要测量的特征相似的测验,比如成就测验,它所反映的是被试具有什么能验,比如成就测验

54、,它所反映的是被试具有什么能力,能完成什么任务。力,能完成什么任务。预测性测验:为了预测一些没有被测量的行为的测预测性测验:为了预测一些没有被测量的行为的测验,即希望测验能作出对未知情况的预测。验,即希望测验能作出对未知情况的预测。60测验的目标测验的目标 描述描述:指编制的测验是测什么的,即测什么样的心理特征指编制的测验是测什么的,即测什么样的心理特征或人格特点或人格特点。 目标分析目标分析工作分析工作分析/ / 第一是确定哪些心理特征和行为可以使要预测的活动达到第一是确定哪些心理特征和行为可以使要预测的活动达到成功成功 第二是建立衡量被试是否成功的标准,这个标准我们称之第二是建立衡量被试是

55、否成功的标准,这个标准我们称之为效标为效标 对特定概念下定义对特定概念下定义/ /确定测验的具体内容确定测验的具体内容/ /61第二单元第二单元测题的编写测题的编写 搜集资料搜集资料 命题原则命题原则 编制要领编制要领62搜集资料搜集资料 已出版的标准测验已出版的标准测验最简单、最直接的方法是从已经出版的各种标准测最简单、最直接的方法是从已经出版的各种标准测验中选择合适的题目验中选择合适的题目 理论和专家的经验理论和专家的经验理论和专家经验有时也可以作为题目的来源之一理论和专家经验有时也可以作为题目的来源之一 临床观察和记录临床观察和记录临床的观察也可以作为题目的来源临床的观察也可以作为题目的

56、来源 63命题原则命题原则 (1)内容方面内容方面 试题要符合测验的目的;试题要符合测验的目的; 内容取样要有代表性;内容取样要有代表性; 题目间内容相互独立,互不牵连,对不同题目的回答不致相互影响;题目间内容相互独立,互不牵连,对不同题目的回答不致相互影响;文字方面文字方面 使用准确的当代语言,避免使用生僻的字句或词汇使用准确的当代语言,避免使用生僻的字句或词汇 语句要简明扼要,既要排除与答案无关的因素,又不能遗漏答题所语句要简明扼要,既要排除与答案无关的因素,又不能遗漏答题所依据的必要条件依据的必要条件; 最好是一句话说明一个概念,尽量少使用双重否定句最好是一句话说明一个概念,尽量少使用双

57、重否定句 理解方面理解方面 题目内容不能超出受测团体的知识水平和理解能力;题目内容不能超出受测团体的知识水平和理解能力; 答案明确,不引起争议;答案明确,不引起争议; 题目格式不要被人误解;题目格式不要被人误解;社会敏感性方面社会敏感性方面 避开社会敏感性问题,如涉及社会禁忌或个人隐私的题目不应使用。避开社会敏感性问题,如涉及社会禁忌或个人隐私的题目不应使用。64命题原则命题原则 (2) 可是有些测验必须涉及这类社会敏感性问题,可是有些测验必须涉及这类社会敏感性问题,那么怎样鼓励被试作出真实的回答呢?菲力普那么怎样鼓励被试作出真实的回答呢?菲力普(phillips,d.l.)列举了几条策略值得

58、参考:)列举了几条策略值得参考: 命题时假定被试具有某种行为,使他不得不命题时假定被试具有某种行为,使他不得不在确实没有该行为时才否定,可避免否定答在确实没有该行为时才否定,可避免否定答案过多的倾向。案过多的倾向。 命题时假定规范不一致命题时假定规范不一致 指出该行为是常见的,虽然是违规的指出该行为是常见的,虽然是违规的65编制要领编制要领 对心理测验的题目进行分类的标准很多,常见的分对心理测验的题目进行分类的标准很多,常见的分类是根据对被试的要求不同来分,可以分为两大类:类是根据对被试的要求不同来分,可以分为两大类:提供型(提供型(supply)和选择型()和选择型(selection)题目

59、。)题目。 提供型题目:要求被试提供答案提供型题目:要求被试提供答案论文题:论文题:简答题简答题填充题填充题 选择型题目:要求被试在几个选项中选择正确答案选择型题目:要求被试在几个选项中选择正确答案是非题是非题选择题选择题匹配题匹配题66第三单元第三单元测验的编排和组织测验的编排和组织 合成测验合成测验 测验的预试测验的预试 信度与效度考察信度与效度考察 常模制定常模制定 编写指导手册编写指导手册67合成测验(合成测验(1) 筛选与审定试题筛选与审定试题选择试题形式选择试题形式 测验的目的和材料的性质:简答题、选择题、论文题测验的目的和材料的性质:简答题、选择题、论文题 接受测验的团体的特点:

60、口头测验、操作测验接受测验的团体的特点:口头测验、操作测验 各种实际因素:团体测验、个别测验各种实际因素:团体测验、个别测验 审定题目审定题目 材料内容以及所测量的认知技能上的比率与计划相符,必材料内容以及所测量的认知技能上的比率与计划相符,必要时须加以适当调整。要时须加以适当调整。 题目的数量要比最后所需的数目多一倍至几倍,以备筛选题目的数量要比最后所需的数目多一倍至几倍,以备筛选和编制复份。和编制复份。 题目的难度必须符合测验目的的需要。题目的难度必须符合测验目的的需要。 题目的说明必须清楚明白。题目的说明必须清楚明白。 68合成测验(合成测验(2) 测题的编排测题的编排编排原则编排原则

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论