新课件-心理测量学.ppt_第1页
新课件-心理测量学.ppt_第2页
新课件-心理测量学.ppt_第3页
新课件-心理测量学.ppt_第4页
新课件-心理测量学.ppt_第5页
已阅读5页,还剩256页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、心理咨询师考试心理测量学知识,张春雨() 西南大学心理学院,主要内容,第一节 概述 第二节 测验的常模 第三节 测验的信度 第四节 测验的效度 第五节 项目分析 第六节 测验编制的一般程序 第七节 心理测验的使用,第一节 概述,第一单元 测量与测量量表 第二单元 心理测验的基本概念 第三单元 心理测验的分类 第四单元 纠正错误的测验观 第五单元 心理测验在心理咨询中的应用 第六单元 心理测验的发展史,一、什么是测量 测量就是依据一定的法则用数字对事物加以确定。 三个主要的元素:(1)事物;(2)数字;(3)法则。,第一单元 测量与测量量表,所谓“事物”,指的是我们要测量的对象,更准确地说,就是

2、引起我们兴趣的事物的属性或特征。 所谓“数字”,是代表某一事物或事物某一属性的量。 区分性1与2 序列性(等级性)3 2 1 等距性 321、 211 可加性 所谓“法则”,代表的是测量所依据的规则和方法,二、测量要素,(一)参照点 参照点有两种: 绝对零点 人定的参照点,即相对零点 (二)单位 好的单位必须具备两个条件: 确定的意义 相同的价值,三、测量量表,测量的本质是根据某一法则将事物数量化,即在一个定有单位和参照点的连续体上把事物的属性表现出来,这个连续体称为量表。 由于制定量表的单位和参照点不同,量表的种类也不同。,(1)命名量表 只是用数字来代表事物或对事物进行分类。 量表中的数字

3、没有任何数值意义,不能作量化分析。无大小意义,只表明类别。 无参照点和单位。无法比较大小或进行任何数学方法运算。 测量水平最低的一种形式,如代号、类别,四类量表,(2)顺序量表 表明类别的大小或某种属性的多少。 主要用于分等论级和分类。 数字仅表示等级并不表示某种属性的真正量或绝对值。 无参照点(没有绝对零度)和单位。 无法进行数学方法运算。,(3)等距量表 存在大小关系。 无绝对零度,但存在相对零点。 有相等单位,可以进行加减数学运算,但不能做乘除运算。,(4)等比量表 是最精确的测量。具有相等单位又有绝对零点。 大多是物理量表,可以进行各种数学运算。可以知道事物之间的某种特点上相差多少及它

4、们之间的倍数关系。 心理测验本质属于顺序量表!,第二单元 心理测量的基本概念,一、心理测量的定义 二、心理测量的性质,一、心理测量的定义,所谓心理测量,就是依据心理学理论,使用一定的操作程序,通过观察人的少数有代表性的行为,对于贯穿在人的全部行为活动中的心理特点做出推论和数量化分析的一种科学手段。,二、心理测量的性质,(一)间接性 (二)相对性 (三)客观性,心理测量的间接性,研究者无法直接测量人的心理,只能测量人的外显行为,也就是说,只能通过一个人对测验题目的反应来推论他的心理特质。 特质是构成人格的最小单位,是激发与指导个体的各种反应的恒常的心理结构。,心理测量的相对性,在对人的行为做比较

5、时,没有绝对的标准,也就是没有绝对的零点,有的只是一个连续的行为序列。所谓测验就是看每个人处在这个序列的什么位置上。,心理测量的客观性,测验的客观性实际上就是测验的标准化问题。对一切测量的共同要求是测验工具的标准化。 测验用的项目或作业、施测说明、施测者的言语态度及施测时的环境等,要求标准化。 测验评分记分的原则和手续也要经过标准化,使反应的量化是客观的。 最后,分数转换和解释标准化,对结果的推论应该是客观的。,第三单元 心理测验的分类,按测验的功能分类 按测验材料的性质分类 按测验材料的严谨程度分类 按测验的方式分类 按测验的要求分类,一、按测验的功能分类,(一)智力测验 (二)特殊能力测验

6、 (三)人格测验 EPQ 16PF MMPI,二、按测验的性质分类,(一)文字测验 (二)操作测验 也称非文字测验。,三、按测验材科的严谨程度分类,(一)客观测验 (二)投射测验,四、按测验的方式分类,(一)个别测验 (二)团体测验,五、按测验的要求分类,(一)最高行为测验(智力测验、成就测验) (二)典型行为测验(人格测验),第四单元 纠正错误的测验观,错误的测验观 正确的测验观,一、错误的测验观,(一)测验万能论 (二)测验无用论 (三)心理测验即智力测验,二、正确的测验观,(一)心理测验是重要的心理学研究方法之一,是决策的辅助工具 (二)心理测验作为研究方法和测量工具尚不完善,第五单元

7、心理测验在心理咨询中的应用,智力测验 人格测验 心理评定量表,这几个方面是我国目前心理门诊中运用较多的,第六单元 心理测验的发展史,科学心理测验的产生和发展 现代心理测验在我国的发展,一、科学心理测验的产生与发展,高尔顿(FGalton) 提出人的不同气质特点和智能是按身体特点的不同而遗传的。 为了研究差异的遗传性,便设计了测量差异的方法。 为心理测验奠定了统计学基础。他第一个提出了相关的概念,卡特尔,卡特尔是对心理测验发展做出巨大贡献美国心理学家。1890年,卡特尔在心理杂志上发表心理测验与测量一文,这是心理测验第一次出现于心理学文献中。在此文中,卡特尔写到:“心理学若不立足于实验与测量上,

8、决不能够有自然科学之准确性。”又说:“心理测验如果有一个普遍的标准,则其科学的与实用的价值都可以增加。”他当时就极力主张测验手续和考试方法应有统一规定,并要有常模以便比较。所有这些都是测量学上的重要概念。,比内(ABinet) 世界上第一个正式的心理测验。,20世纪以后,心理测验主要有以下几个方面的发展: 1操作测验的发展 2团体智力测验的发展 3能力倾向测验的发展 4人格测验的发展,二、现代心理测验在我国的发展,近些年来我国的心理学家正在致力于测验本土化.,近代中国的心理测验,1914年,Creighton比较中美儿童智力差异(广州,500人) 1916年,樊炳清首先介绍了比 西智力量表 1

9、918年,Walcott用S-B施测(清华) 1918年,俞子夷编制“小学生毛笔书法量表” 1920 南京高等师范学校,廖世承、陈鹤琴开设心理测量课,1921年,廖世承、陈鹤琴出版书心理测量法 1921年,费培杰将比内智力测验翻成中文 1922年,张耀翔在北京将心理测验列为入学考试科目 1922年夏,中华教育改进社聘请美国麦柯尔 1924年,陆志韦发表订正比内西蒙智力测验说明书;36年代与吴天敏做修订(80年代吴天敏3修),1931年6月由艾伟、陆志韦、陈鹤琴、萧孝嵘等倡议,组织并成立了中国测验学会。南京 1932年,测验创刊 1935年,沈有乾用“朋洛德人格问卷”测量中国学生 1937年,周

10、先庚使用“塞斯顿情绪稳定性测验” 此时智力测验和人格测验约20种,教育测验50种,1943年,林传鼎试用“普莱西X-O测验” 丁瓒等于46,4752年分别将TAT(主题统觉测验)与韦克斯勒 布勒维测验用于临床。 194851年间,刘范使用过RIT(罗夏克墨迹图测验)。 至1949年,出版的测验方面的书籍共计20余种,1979年,林传鼎,吴天敏,张厚粲在武汉举办全国测验培训班 1979年,龚耀先主持修订“韦克斯勒成人智力量表” 1979年,林传鼎、张厚粲编制“少年儿童学习能力测验” 1980年,林传鼎、张厚粲主持修订“韦克斯勒儿童智力量表” 1980年,北师大开设心理测验课,1980年,张厚粲开

11、始对高考试卷做系统分析 1981年,刘绍衣修订“卡特尔16种人格因素问卷” 1982年,吴天敏第三次修订中国比内测验 1982年,宋维真修订“明尼苏达多相人格调查表”,1983年,龚耀先、陈仲庚修订“艾森克问卷” 1984年,中国心理学会成立心理测量专业委员会 1984年,我国正式加入“国际教育成就评价协会” 1985年,张厚粲主持修订“瑞文标准推理测验” 1986年,龚耀先主持修订“韦克斯勒幼儿智力量表”,1987年,张明园修订“生活事件量表” 1989年,李丹修订“瑞文测验(联合型)” 1990年,中国加入国际测验委员会(ITC);吴文源修订“症状自评量表(SCL-90)” 1992年,戴

12、忠恒修订“一般能力倾向测验”,1992年,宋维真编制“心理健康调查表” 1992年,沙毓(yu)英等编制“学生性格量表” 1993年,宋维真等编制“中国人个性测量表”(CPAI) 1980年代,编制超常、弱智儿童筛查量表、03(6)岁儿童发育、发展量表、CPM领导行为评价量表,真题练习,200705- 103、正确的测验观包括( )。 (A)心理测验是重要的心理学研究方法之一,是决策的辅助工具 (B)做心理测验时态度要正确 (C)心理测验作为研究方法和测量工具不完善 (D)“一考定终身”说明心理测验非常重要 200705- 104、人格测验包括( )。 (A)EPQ (B)MMPI (C)16

13、PF (D)CRT 200711-50、关于测量,正确的说法是( )。 (A)测量就是心理测量 (B)就是依据一定的法则用数字对事物加以确定 (C)就是用数字描述事物的法则 (D)就是用一些题目或数字来描述事物的属性,AC,ABC,B,真题练习,200806-105、心理测验具有( )。 (A)外显性 (B)间接性(C)相对性 (D)客观性 200806-106按测验的功能,可将测验分为( )。 (A)智力测验 (B)特殊能力测验 (C)人格测验 (D)投射测验 200806-109错误的测验观包括( )。 (A)心理测验即人格测验(B)心理测验尚不完善 (C)心理测验即智力测验(D)测验万能

14、论 200811-106、按测验的方式分类,可将测验分为( )。 (A)操作测验 (B)文字测 (C)个别测验 (D)团体测验,BCD,ABC,ACD,CD,真题练习,200811-107、心理测验具有( )。 (A)外显性 (B)间接性 (C)相对性 (D)客观性 200811-108、测量的主要元素包括( )。 (A)事物 (B)数字 (C)法则 (D)描述 200905-91、测量所用数字具有自然数的特点,即具有 (A)区分性 (B)等级性 (C)等距性 (D)可加性 200905-118、等距量表中的数值可以进行( )运算。 (A)加 (B)减 (C)乘 (D)除,BCD,ABC,AB

15、CD,AB,真题练习,200911- 34、人格测验不包括( )。 (A)EPQ (B)16PF(C)CRT(D)MMPI2 200911- 55、在顺序量表中,变量具有( )。 (A)相等单位(B)绝对零点(C)等级(D)可以做四则运算 200911- 75、编制世界上第一个正式的心理测验的学者是( )。 (A)高尔登(B)比内(C)卡特尔(D)奥蒂斯 200911- 91、按测验的功能,可将测验分为( )。 (A)智力测验(B)特殊能力测验(C)人格测验(D)投射测验 200911- 118、按测验材料的性质,可将测验分为( ) (A)文字测验(B)主题统觉测验(C)智力测验(D)操作测验

16、,C,C,B,ABC,AD,真题练习,201011- 107、按测验材料的性质,可将测验分为( )。 (A)文字测验 (B)智力测验(C)主题统觉测验 (D)操作测验 201105-53、在顺序量表中,变量具有()。 (A)相等单位(B)等级(C)绝对零点(D)可以做四则运算,AD,小结: 第一节 概述,第一单元 测量与测量量表 第二单元 心理测验的基本概念 第三单元 心理测验的分类 第四单元 纠正错误的测验观 第五单元 心理测验在心理咨询中的应用 第六单元 心理测验的发展史,心理测量学,第一节 概述 第二节 测验的常模 第三节 测验的信度 第四节 测验的效度 第五节 项目分析 第六节 测验编

17、制的一般程序 第七节 心理测验的使用,第二节测验的常模,第一单元 常模团体 第二单元 常模的类型 第三单元 常模分数的表示方法,第一单元 常模团体,一、常模团体的性质 常模团体是由具有某种共同特征的人所组成的一个群体,或者是该群体的一个样本。 用一个标准的、规范的分数表示出来,以提供比较的基础。 任何一个测验都有许多可能的常模团体。,第一单元 常模团体,一、常模团体的性质 常模的选择主要是基于对测验将要施测的总体的认识,常模团体必须能够代表该总体。 常模的选择包括:确定一般总体、确定目标总体、确定样本。 使用测验需要特别注意常模团体。,二、常模团体的条件,(一)群体的构成必须明确界定 (二)常

18、模团体必须是所测群体的代表性样本 (三)样本的大小要适当 在实际工作中,应从经济的或实用的可能性和减少误差这两个方面来综合考虑样本的大小。 一般最低不小于30或100个。全国性常模,一般应有20003000人为宜。 样本大小适当的关键是样本要有代表性。 (四)标准化样组是一定时空的产物 在选择合适常模时,要注意选择较为新近的常模。,三、取样的方法,取样即从目标人群中选择有代表性的样本。 抽样方法有下列几种:,(一)简单随机抽样 按照随机表顺序选择被试构成样本,(二)系统抽样 系统抽样要求目标总体无序可排,也无等级结构存在。,(三)分组抽样 先将群体进行分组,再在组内进行随机取样。,(四)分层抽

19、样 先将目标总体按某种变量分成若干层次,再从各层次中随即抽取若干被试,最后把各层的被试组合成常模样本。,四、常模分数与常模,(一)常模分数 常模分数就是施测常模样本被试后,将被试者的原始分数按一定规则转换出来的导出分数。 由原始分数构成的分布转换而来的分数,叫导出分数 导出分数具有一定的参照点和单位,它实际是一个有意义的测验量表,它与原始分数等值。(有意义、等单位、带参照点),(二)常模,常模分数构成的分布,就是通常所说的常模(norm),它是解释心理测验分数的基础。 常模有一般常模与特殊常模之分。,第二单元 常模的类型,发展常模 百分位常模 标准分常模 智商及其意义,一、发展常模,个人的分数

20、指出他的行为在按正常途径发展方面处于什么样的发展水平。 (一)发展顺序量表 (二)智力年龄 (三)年级当量,(一)发展顺序量表,最早的一个范例是格塞尔发展程序表 皮亚杰最著名的工作就是对守恒概念的研究。,格塞尔婴幼儿发展量表Gesell Developmental Schedules 由美国耶鲁大学的A.格塞尔及其同事制定的婴幼儿发展测量工具。最初发表于1925年,后对它作了几次修订,先后发表于1937、1940、1947和1974年。1974年修订版的测试对象为从出生至5岁、重点是3岁以下的幼儿,测试时间约30分钟。 格塞尔早期用电影记录并分析了幼儿的日常行为反应,发现了幼儿发展程序的规律。

21、他认为,幼儿的生长发展是有次序地逐步成熟和由简易分化到精细分化。幼儿的行为在抵达某一阶段时会显示出特殊的飞跃式进展,幼儿的新行为在成熟程序上具有代表性,并反映其在生长发育上已抵达新的阶段。格塞尔称这些年龄阶段为枢纽年龄,并把测定枢纽年龄列为量表的重点检查项目和诊断标准。格塞尔量表确定,1岁内以每4周为一个阶段,而以4周、16周、28周、40周、52周作为枢纽年龄,13岁间则以36月为一个阶段,以18月、24月、36月为枢纽年龄。,格塞尔婴幼儿发展量表Gesell Developmental Schedules 其检查内容分应人能:测试幼儿对周围人的应答能力和料理自己生活的能力;应物能:测试幼儿

22、看物、摘物和绘画等能力;言语能:测试幼儿听、理解和言语能力;动作能:测试幼儿坐、步行和跳跃的能力。结果以发展商数评价幼儿的发展水平。格塞尔认为,所观察到的发展现象反映了中枢神经系统的成熟程序。这一理论受到各方面的肯定。 格塞尔量表具有临床诊断的价值,它不仅适用于测量幼儿的发展水平,而且比其他量表更适用于伤残儿,被认为是婴幼儿智能测试的经典方法。20世纪60年代初,中国开始在临床上试用格塞尔量表。,(一)发展顺序量表,皮亚杰对守恒概念的研究。,儿童不是时期出现不同的守恒概念 5岁能理解质量守恒概念 6岁掌握重量守恒概念 7岁掌握容量守恒概念,(二)智力年龄 比内-西蒙量表中首先使用智力年龄的概念

23、。 一个儿童在年龄量表上所得的分数,就是最能代表他的智力水平的年龄。这种分数叫做智力年龄,简称智龄。 直接的计算 年龄常模转换,(三)年级当量 年级当量实际上就是年级量表,测验结果说明属哪一年级的水平,在教育成就测验中最常用。,二、百分位常模,百分位常模包括百分等级和百分点、四分位数和十分位数,(一)百分等级,一个测验分数的百分等级是指在常模样本中低于这个分数的人数百分比。,(二)百分点(百分位数),在分数量表上,相对于某一百分等级的分数点就叫百分点或百分位数。,(三)四分位数和十分位数,四分位数是将量表分成四等份,相当于百分等级的25%、50%和75%对应的三个点分成的四段。 十分位数是将一

24、组数据由小到大(或由大到小)排序后,用9个点将全部数据分为10等份,与9个分割点上相对应的数据称为十分位数。,三、标准分常模,常见的标准分数有:z分数、Z分数、T分数、标准九分数、离差智商(IQ)等。 标准分数可以通过线性转换,也可以通过非线性转换得到,(一)线性转换的标准分数,(公式5-2) 其中X为任一原始分数, 为样本平均数,SD为样本标准差。 Z=A+Bz(公式5-3) 加上一个常数(A)是为了去掉负值,乘以一个常数(B)是为了使单位变小从而去掉小数点。,(一)线性转换的标准分数,当以50为平均数(即加上一个常数50),以10为标准差(乘以一个常数10)来表示时,通常叫做T分数,即:

25、T50+10 (公式5-4) 最早使用T分数者是麦柯尔。,标准九分、十分、二十分,标准九分:量表是个9级的分数量表。它是以5为平均数,以2为标准差的一个分数量表。 标准十分:平均数为5,标准差为1.5; 标准二十分:平均数为10,标准差为3。 使用最广、影响最大的一种常态化标准分数则是离差智商。,(二)非线性转换的标准分数,当原始分数不是常态分布时,也可以使之常态化,这一转换过程就是非线性的。 常态化过程主要是将原始分数转化为百分等级,再将百分等级转化为常态分布上相应的离均值,并可以表示为任何平均数和标准差。计算步骤如下: 1对每个原始分数值计算累积百分比; 2在常态曲线面积表中,求出对应于该

26、百分比的z分数。 所得的z分数可将分布分成几部分,称z/分数,以区别由线性转换所求得的z分数。,四、智商及其意义,若心理年龄高于其生理年龄,则智力较一般儿童高,若心理年龄低于其生理年龄,则智力较一般儿童低。但在使用中发现,单纯用心理年龄来表示智力高低的方法缺乏不同年龄儿童间的可比性,(一)比率智商,比率智商(IQ)被定义为心理年龄(MA)与实足年龄(CA)之比。 (公式5-5) 由于个体心理年龄与实足年龄并不同步增长,所以比率智商并不适合于年龄较大的被试。,(二)离差智商,是一种以年龄组为样本计算而得的标准分数,它表示的是个体智力在年龄组中所处的位置,因而是表示智力高低的一种理想的指标。 韦克

27、斯勒将离差智商的平均数定为100,标准差定为15。 (公式5-6),16%,50%,第三单元 常模分数的表示方法,一、转换表法 二、剖析图 将测验分数的转换关系用图形表示出来。,真题练习,200705-50、常模样本量一般不小于( )。 A)100或500 (B)800或1000 (C)20或25 (D)30或100 200705-51、维克斯勒将离差智商的平均数定位100,标准差定为 (A) 17 (B)15 (C)11 (D)13 200711- 51、系统抽样的关键是计算( )。 (A) 样本量(B)总体(C)随机数(D)组距 200711- 52、百分等级的55的分数表示在常模样本中有

28、55%的人比这个分数( )。 (A)低(B)相等(C)高(D)以上都不正确 200711-53、( )可以将测验分数的转换关系用图形表示出来,便于直观的看出被试者在各个分测验上的表现及相对位置。 (A)条形图(B)直方图(C)剖面图(D)饼状图,D,B,D,A,C,200806-53、( )是由具有某种共同特征的人所组成的一个群体,或者是该群体的一个样本。 (A)团体 (B)常模团体 (C)样本 (D)受测人群 200806-54、常模分数构成的分布,就是通常所说的( ),它是解释心理测验分数的基础。 (A)常模分数 (B)常模 (C)导出分数 (D)分数 200806-55、 ,式中SD为(

29、 )。 (A)样本平均数B)任一原始分数 C)样本标准差D)标准分数 200806-56韦克斯勒将离差智商的平均数定为100,标准差定为( )。 (A)16 (B)15 (C)14 (D)13 200806-57最简单而且最基本的表示常模的方法就是 (A)转换表 (B)分布表 (C)对照表 (D)指数表,B,B,C,C,B,A,200811-55、取样是指从( )中选择有代表性的样本。 (A)总体 (B)群体 (C)目标人群 (D)样本 , 200811-56、常模分数又叫( )。 (A)导出分数 (B)粗分数 (C)原始分数 (D)总体分数 200811-57、标准二十分的标准差为( ) (

30、A)5 (B)4 (C)3 (D)2 200811-58、韦克斯勒将离差智商的平均数定为100,标准差定为 (A)16 (B)15 (C)14 (D)13 200811-105、发展顺序量表可以告诉人们某儿童的发育与其年龄相比 (A)超前 (B)滞后 (C)正常 (D)以上都不是 200905-34、以50为平均数、以10为标准差表示的标准分数叫 (A)标准九分数 (B)T分数(C)离差智商 (D)Z分数 200905-56、随机号码表法是( )。 A)简单随机抽样(B)系统抽样(C)分组抽样 (D)分层抽样 200905-76、比率智商(IQ)是( )与实足年龄之比。 A)生理年龄 (B)真

31、实年龄 (C)心理年龄 (D)智力年龄 200905-105、标准分数可以通过( )得到。 (A)线性转换(B)非线性转换(C)分析 (D)变化,C,A,C,B,ABC,B,A,C,AB,200911-56、首先使用智力年龄概念的是( )量表 (A)比内西蒙(B)韦克斯勒(C)斯坦福比内(D)瑞文 200911-105、属于标准分数常模的是( )。 (A)百分等级(B)T分数(C)比率智商(D)离差智商 20105- 34发展常模就是( )。 A团体的分数 B百分位数 C个人的分数 D年龄量表 20105- 35在心理测验中,对于非典型群体需要制定( ) A普通常模 B特殊常模 C一般常模 D

32、发展常模 20105- 56具有某种共同特征的人所组成的一个群体或者是该群体的一个样本,叫做( )。 A团体 B常模团体 C样本 D受测人人群 20105- 57以50为平均数,以10为标准差来表示的分数,通常叫 AZ分数 B标准九分数 CT分数 D离差智商 20105- 76解释心理测验分数的比较基础是( )。 A常模分数 B常模 C导出分数 D分数,A,BD,B,B,C,B,20105- 92抽样的方法一般包括( )。 A分层抽样 B系统抽样 C分组抽样 D简单随机抽样 20105- 121常模的构成要素包括( )。 A抽样分数 B原始分数 C导出分数 D对常模团体的具体描述 201011

33、- 56、常模样本量的大小,一般最低不小于( )。P337 (A)100或500 (B)800或1000(C)20或25 (D)30或100 201011- 57、“某分数的百分等级为55”表示在常模样本中有55%的人的分数比该分数(A)。P340 (A)低 (B)相等(C)高 (D)全不是 201011- 58、以50为平均数、以10为标准差来表示的分数通常叫( )。P342 (A)Z分数 (B)T分数(C)标准九分数 (D)离差分数 201011- 59、( )表示的是个体智力分数在同年龄组分数分布中所处的位置。P343 (A)离差智商B)比率智商C)百分等级 D)标准九分数,ABCD,B

34、CD,D,A,B,A,201011- 60、()是将测验分数的转换关系用图形表示出来,从而可以很直观地看出披试者在各个分测验分数分布中的相对位置。P346 (A)条形图 (B)直方图(C)剖面图 (D)散点图 201011- 106、标准分数可以通过( )得到。P341 (A)线性转换 (B)非线性转换(C)求积 (D)求和 201105-54、由具有某种共同特征的人所组成的一个群体,或者是该群体的一个样本,称为( )。 (A)团体(B)常模团体(C)样本(D)受测人群,C,AB,B,小结:第二节 测验的常模,第一单元 常模团体 第二单元 常模的类型 第三单元 常模分数的表示方法,心理测量学,

35、第一节 概述 第二节 测验的常模 第三节 测验的信度 第四节 测验的效度 第五节 项目分析 第六节 测验编制的一般程序 第七节 心理测验的使用,第三节 测验的信度,第一单元 信度的概念 第二单元 信度评估的方法 第三单元 信度与测验分数的解释 第四单元 影响信度的因素,补充内容:,经典测验理论的基本假设,一、误差的含义和种类,(一)含义 测量误差指的是在测量过程中与测量目的无关的变化因素所产生的一种不准确或不一致的测量效应。 (二)种类 系统误差 随机误差,二、误差的来源,(一)测验本身引起的误差 取样缺乏代表性,词语模棱两可 (二)施测过程引起的误差 1.主试者方面:年龄、性别、外表、动作等

36、 2.环境因素 3.时间安排 4.意外干扰 5.记分,二、误差的来源,(三)受测者本身引起的误差 应试动机 测验焦虑 学习和训练 测验经验 生理状态 反应定势,三、真分数,(一)含义 测量没有误差时所得到的真值 操作性:无数次测量结果得到的平均值 (二)实得分数、真分数与测量误差 (三)性质 一组测验分数的变异性是由测量目的有关的变异数、稳定的但出自无关来源的变异数和随机误差变异数所决定的,三、真分数,(四)真分数的数学模型 (五)三个假设公理 若某种心理特质可以用平行测验反复测量足够多次,观察分数就会接近真分数 E(X)T;E(E)0 真分数与误差分数之间的相关为零 (T,E)0 各平行测验

37、上的误差分数之间的相关为零 (E1,E2)0,三、真分数,(六)平行测验 如果两个题目不同的测验测的是同一种特质,并且题目的形式、数量、难度、区分度以及测查等值团体后所得分数的分布都是一致的,则这两个测验被称为平行测验。,第一单元 信度的概念,一、信度的定义 信度是指同一被试者在不同时间内用同一测验(或用另一套相等的测验)重复测量,所得结果的一致程度。,信度只受随机误差的影响。,如果我们讨论一组测验分数的特性时,可用方差代表具体分数,得到与公式5-7类似的公式: 式中, 是测验实得分数的方差, 是测验真分数的方差, 是测验误差的方差。,在测量理论中,信度被定义为:一组测量分数的真分数方差与总方

38、差(实得分数的方差)的比率。即: (公式59) 由于真实分数的方差是无法统计的,因此公式59还可以转化为: 因此,信度也可以看作在总的方差中非测量误差的方差所占的比例。,二、信度的指标,(一)信度系数与信度指数 (公式5-11) 信度指数的平方就是信度系数。 (二)测量标准误(误差的标准差) 信度越高,标准误越小;信度越低,标准误越大。,第二单元 信度评估的方法,重测信度 复本信度 内部一致性信度 评分者信度,一、重测信度,又称稳定性系数。 使用同一测验,在同样条件下对同一组被试者前后施测两次测验,求两次得分间的相关系数。 一般是两周到四周较宜,间隔时间最好不超过六个月。,二、复本信度,以两个

39、等值但题目不同的测验(复本)来测量同一群体,然后求得被试者在两个测验上得分的相关系数 复本信度反映的是测验在内容上的等值性,故又称等值性系数。,复本测验要求题目内容、数量、形式、难度、区分度、指导语、时限、例题等相同或相似,三、内部一致性信度,(一)分半信度(splithalf reliability) 这个相关系数就代表了两半测验内容取样的一致程度 (公式5-14) 式中为 一半分数的相关系数, 为测验在原长度时的信度估计值。,How to divide the test?,Random(随机法) odd-even(奇偶法) 1st half of items & last half of

40、items(顺序法),(二)同质性信度(homogeneity reliability) 代表测验内部所有题目间的一致性。 (1)指所有题目都测的是同一种心理特质。 (2)指所有题目得分之间都具有较高的正相关。 同质性信度就是一个测验所测内容或特质的相同程度。,克伦巴赫系数,四、评分者信度,随机抽取若干份测验卷,由两位评分者按评分标准分别给分,然后再根据每份测验卷的两个分数计算相关,即得评分者信度。 一般要求在成对的受过训练的评分者之间平均一致性达0.90以上,才认为评分是客观的。,斯皮尔曼等级相关,评分者信度:肯德尔和谐系数,被评者,评定者,公式中 K=3(评定者数) N=6(被评者数),W

41、0.86,第三单元 信度与测验分数的解释,解释真实分数与实得分数的相关 确定信度可以接受的水平 解释个人分数的意义 比较不同测验分数的差异,一、解释真分数与实得分数的相关,信度系数可以解释为测验的总变异中,真分数造成的变异占百分之几。 在极端的情况下,如有rxx1.00,则表示完全没有测量误差,所有的变异均来自真实分数;若有rxx0,则所有的变异和差别都反映的是测量误差。,二、确定信度可以接受的水平,一般原则是: 当rxx0.70时,测验不能用于对个人做出评价或预测,而且不能作团体比较; 当0.70rxx 0.85时,可用于团体比较; 当rxx0.85时,才能用来鉴别或预测个人成绩或作为。,三

42、、解释个人分数的意义,两个作用 其一是估计真实分数的范围; 其二是了解实得分数再测时可能的变化情形。 人们一般采用95%的或然率(概率)水平,其置信区间为: (公式5-16),四、比较不同测验分数的差异,测量标准误和测验信度在评价两个不同测验的分数是否有明显差异时也非常重要。这种比较包括两个人不同分数的差别和同一被试在两个测验上的差别。 差异分数的标准误公式为: (公式517),第四单元 影响信度的因素,一、样本特征 二、测验长度 三、测验难度 四、时间间隔,一、样本特征,信度常用信度系数来表示,信度系数就是相关系数,相关系数受样本是否异质及样本团体平均能力水平的影响。 (一)样本团体异质性的

43、影响 (二)样本团体平均能力水平的影响,样本团体异质性的影响,任何相关系数都要受到团体中分数分布的范围所影响,而分数范围与样本团体的异质程度有关。若获得信度的取样团体较为异质的话,往往会高估测验的信度,相反则会低估测验的信度。,样本团体平均能力水平的影响,测验的信度还受取样不同团体间平均能力水平的不同而不同。这是因为,对于不同水平的团体,题目具有不同的难度,每个题目在难度上的微小差异累计起来便会影响信度。 显而易见,每个信度系数都要求有对建立信度系数的团体的描述。在编制测验时,应把常模团体按年龄、性别、文化程度、职业等分为更同质的亚团体,并分别报告每个亚团体的信度系数,这样测验才能适用于各种团

44、体。,二、测验长度,测验长度,亦即测验的数量,也是影响信度系数的一个因素。一般来说,在一个测验中增加同质的题目,可以使信度提高。 第一,测验越长,测验的测题取样或内容取样就越有代表性。 第二,测验越长,被试的猜测因素影响就越小。长有时反而会引起被试的疲劳和反感而降低可靠性。,K=rkk(1-rxx)/rxx(1-rkk) K为改变后的长度与原长度之比 rxx为原测验的信度 rkk为测验长度是原来的k倍时的信度估计,三、测验难度,难度对信度的影响,只存在于某些测验中,如智力测验、成就测验、能力倾向测验等,对于人格测验、兴趣测验、态度量表等不存在难度问题,因为这些测验的题目没有正确或错误答案之分。

45、,三、测验难度,在实际情况下,如果某个测验适用范围很广,其难度水平通常适合于中等能力水平的被试,而对较高水平和较低水平的被试可能较易或较难,使得分数分布范围缩小,信度水平降低。因此一个标准化的测验,应根据不同能力水平报告测验的难度,以作为选择测验的参考。,四、时间间隔,时间间隔只对重测信度和不同时测量时的复本信度(重测复本信度)有影响,对其余的信度来说不存在时间间隔问题。,真题练习,200705-52、一般要求在成对的受过训练的评分者之间平均一致性达到( )以上,才认为评分是客观的。 (A)0.70 (B)0.80 (C)0.90 (D)1.00 200705-53、以再测法或复本法求信度,两

46、次测验相隔时间越短,其信度系数( )。 (A)越大 (B)越低 (C)越小 (D)不变 200705-55、信度只受( )的影响。 A)系统误差B)随机误差C)恒定效应D)概化作用 200711- 54、同质性信度主要代表测验内部( )间的一致性。 A)两半测验B)题目与分测验(C)所有题目(D)分测验 200811-59、信度只受( )的影响 (A)系统误差 (B)随机误差 (C)恒定效应 (D)概化理论,C,A,B,C,B,200905-35、以再测法或复本法秋信度,两次测验相隔时间越短,其信度系数越( )。 (A)大 (B)低 (C)小 (D)不确定 200905-77、重测信度即( )

47、。 (A)等位性系数B)稳定性系数(C)相关系数D)X系数 200905- 92、关于心理测验,下列说法正确的是( )。 (A)测验越长,测验的测题取样或内容取样越有代表性 (B)测验越长,被试者受猜测因素的影响就越小 (C)测验越长,月遵循报酬递增率原则 (D)测验太长,有时会引起被试者的疲劳和反感而降低可靠性 200911-76、在不同时间内用同一测验重复测量同一被试者,所得结果的一致程度称为( )。 (A)信度(B)效度(C)难度(D)区分度,A,B,ABD,A,20105 -77同质性信度主要反映测验内部( )间的一致性。 A两半测验 B题目与分测验 C所有题目 D分测验与分测验 20

48、1011-61、信度只受()的影响。P348 A系统误差B随机误差C恒定效应D实验误差,C,B,小结:第三节 测验的信度,第一单元 信度的概念 第二单元 信度评估的方法 第三单元 信度与测验分数的解释 第四单元 影响信度的因素,心理测量学,第一节 概述 第二节 测验的常模 第三节 测验的信度 第四节 测验的效度 第五节 项目分析 第六节 测验编制的一般程序 第七节 心理测验的使用,第四节 测验的效度,第一单元 效度的概念 第二单元 效度评估的方法 第三单元 效度的功能 第四单元 影响效度的因素,一、效度的定义,效度是指所测量的与所要测量的心理特点之间符合的程度,或者简单地说是指一个心理测验的准

49、确性。 在测验理论中,效度被定义为在一组测量中,与测量目标有关的方差(或称有效方差)与总方差的比率,即: (公式5-21),二、效度的性质,(一)效度具有相对性 在评鉴测验的效度时,必须考虑其目的与功能。,二、效度的性质,(二)效度具有连续性 测验效度通常用相关系数表示,它只有程度上的不同,而没有“全有”或“全无”的区别。因此,我们评价一个测验时,不应该说“有效”或“无效”,而应该用效度较高或较低来评价。 另外,效度是针对测验结果的,即测验效度是“测验结果”的有效性程度。,信度和效度的关系,一、信度是效度的必要而非充分条件 二、效度是受信度制约的,第二单元 效度评估的方法,美国心理学会在197

50、4年所发行的教育与心理测量之标准一书中将效度分为三大类:即内容效度、构想效度和效标效度。,一、内容效度,(一)什么是内容效度 内容效度指的是测验题目对有关内容或行为取样的适用性,从而确定测验是否是所欲测量的行为领域的代表性取样。 想要编制一个具有较高内容效度的测验需要 对所测心理特征有明确的概念 测验题目应是所界定的内容范围的代表性取样,(二)内容效度的评估方法,1专家判断法 2统计分析法 3经验推测法,1专家判断法,请有关专家对测验题目与原定内容的符合性做出判断,看测验的题目是否代表规定的内容。 又称“逻辑效度”(logical validity)。,为了使内容效度的确定过程更为客观,弥补不

51、同专家对同一测验的判断可能不一致,可采用如下几个步骤: 、定义好测验内容的总体范围,描述有关的知识与技能及所用材料的来源; 、编制双向细目表,确定内容和技能各自所占的比例,并由测验编制者确定各题所测的是何种内容与技能; 、制定评定量表来测量测验的整个效度,如测验包括的内容、技能、材料的重要程度、题目对内容的适用性等。,简约式 命题 细目表,说明: 1.全卷满分100分,表中分值即为百分比。 2.M为选择题;H为填空题;N为解答题;E为综合题。 3.试题难度分为容易题(0.7以上)、适中(0.40.7)、难(0.4以下)三级,三种试题试题的分值比例约为5:4:1。 4.考试时间120分钟,其中第

52、I卷50分钟,第II卷70分钟。,全息式命题细目表,2统计分析法,重测信度(学习前后测验):在学习某一知识前后各做一次测验,进行比较 评分者一致性信度 复本信度:来自同一范围的复本测同一批被试,看其相关,3经验推测法,即通过实践来检验效度。 不同的被试团体在测验上的得分和对每题的反应有较大差异,一般总分和各题通过率随年级上升 如儿童发展量表是否有效,经过对不同年龄阶段的儿童进行调查,然后分析其结果。,(三)内容效度的特性,内容效度与所有效度的性质一样,不是普遍适用的,而是根据具体情况分析得来。如果测验分析者和测验使用者定义的内容范围相同,则编制者报告的内容效度对使用者而言是有意义的,否则就没有

53、意义。,内容效度与表面效度,表面效度是由外行对测验作表面上的检查确定的,它不反映测验实际测量的东西,只是指测验表面上看来好像是测量所要测的东西; 内容效度是由够资格的判断者(专家)详尽地、系统地对测验作评价而建立的。 不过,在编制测验时,表面效度是一个必须考虑的特性。 例如,最高行为的测验要求有较高的表面效度,二、构想效度,(一)什么是构想效度 构思效度,还有人叫结构效度。 一个测验实际测到所要测量的理论结构和特质的程度,或者说分数能够说明心理学理论的某种结构或特质的程度。 基本特征 结构效度的大小取决于事先假定的心理结构理论; 无法证实时,有可能理论有问题,二、构想效度,(二)构想效度的估计

54、方法 1对测验本身的分析(内容效度、内部一致性信度、被试对题目的反应特点) 2测验间的相互比较(相容效度、区分效度、因素分析法) 3效标效度的研究证明 4实验法和观察法证实,三、效标效度,(一)什么是效标效度 反映的是测验预测个体在某种情境下行为表现的有效程度。被预测的行为是检验效度的标准,简称效标。 效标就是衡量一个测验是否有效的外在标准,它是独立于测验并可以从实践中直接获得的我们感兴趣的行为。 根据效标资料是否与测验分数同时获得,又可分为同时效度和预测效度两类。,常用效标:学业成就、等级评定、临床诊断、特殊训练成绩、实际工作表现等 好的效标测量的条件:(1)真实反映观念效标的重要侧面;(2

55、)效标测量必须稳定、可靠、客观;(3)在有效性的前提下,效标测量要尽可能简单、省时、省力,(二)效标效度的评估方法,1相关法 2区分法 3命中率法,1相关法,相关法是评估效标效度最常用的方法,它是求测验分数与效标资料间的相关,这一相关系数称为效度系数。,2区分法,区分法是检验测验分数能否有效地区分由效标所定义的团体的一种方法。 某政府机关通过测验录用了一批公务员,经半年试用期后,根据他们的实际工作成绩,将这批公务员区分为称职和不称职两组,然后回过头来检查这两组人在测验上的分数是否有显著差异,如果差异显著,说明这个测验在录用公务员的选拔性测验中是有效的。,由于统计上的显著性受到团体大小的影响当团

56、体较大时,平均数之间小的差异在统计上也显著,因而变得有意义了。但实际上测验很难将这两个团体的人区分开。为避免这个缺点,还要看这两个团体分布的重迭量,这里有两个指标: 一个是其中一组内被试得分超过另一组平均数的人数与另一组中被试超过其平均数的人数比率,如果比率小,说明两组差异大,测验是有效的。 另一个指标是看两组分数分布共同区域的百分比例,如果百分比例不大,说明两组差异显著比较可信,测验是有效的。,3命中率法,命中率法是当测验用来做取舍的依据时,用其正确决定的比例作为效度指标的一种方法。 使用命中率法,可将测验分数和效标资料分为两类。在测验分数方面是确定一个临界分数(即分数线),高于临界分数者预

57、测其成功,低于临界分数者预测其失败。,第三单元 效度的功能,一、预测误差 效度系数常常以决定性系数来表示,意旨相关系数的平方,它表示测验正确预测或解释的效标的方差占总方差的比例。,第三单元 效度的功能,二、预测效标分数 (公式5-26) byx=rxysy/sx a=-byxX 三、预测效度指数 E值大小表明使用测验比盲目猜测能减少多少误差 E=100(1-K) k=,第四单元 影响效度的因素,一、测验本身的因素 二、测验实施中的干扰因表 三、样本团体的性质 四、效标的性质,一、测验本身的因素,1测验材料必须对整个内容具有代表性; 2测题设计时应尽量避免容易引起误差的题型(如是非题); 3测题

58、难度要适中,具有较高的区分度; 4测验长度要恰当,即要有一定的测题量; 5测题的排列按先易后难顺序。,二、测验实施中的干扰因表,(一)主试的影响因素 标准化 预测效度的时间间隔 测验情境 (二)被试的影响因素,三、样本团体的性质,(一)样本团体的异质性 如果其他条件相同,样本团体越同质,分数分布范围越小,测验效度就越低; (二)干涉变量 年龄、性别、教育水平、智力、动机、兴趣、职业和任何有关的特征不同,同一测验的效度也会有很大不同。,四、效标的性质,效标与测验分数之间的关系是否线形 皮尔逊积差相关系数的前题是假设两个变量的关系是线性的分布。 效标测量的可靠性即效标测量的信度。,真题练习,200

59、705-105、内容效度的评估方法有( )。 A专家判断法B双向细目表法C统计分析法 D经验推测法 200711-102、效度具有相对性,因此在评鉴测验的效度时,必须考虑测验的( )。(A)信度(B)目的(C)功能(D)长度 200711-103、同200705-105 200711-104、测验实施中的干扰因素包括( )。 (A)主试者的影响因素(B)测验情景 (C)被试者的影响因素(D)其他干扰因素 200711-105、构想效度的估计方法包括( )。 (A)对测验本身的分析 (B)测验间的相互比较 (C)效标效度的研究证明(D)实验法和观察法证实 200806-58、效标与测验分数之间的相关,用皮尔逊积差相关系数的前提是假设两个变量的关系是( )的分布。 A)非线性 (B)线性 (C)抛物线 (D

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论