




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、心理测量学知识第一节 概述 第一单元 测量与测量量表一、什么是测量:1 、测量概念:测量是依据一定的法则用数字对事物加以确定。2 、测量三要素:1 )事物:指我们要测量的对象(就是心理能力和人格特点)2)数字:是代表某一事物或事物的某一属性的量。 这些数值具有自然娄的特点:区分性;序 列性(等级性);等距性;可加性3 )法则:代表的是测量所依据的规则和方法 法则有好坏之分。二、测量要素:1 、参照点(零点) :指计算的起点:1 )绝对零点:意义为“无”2)相对零点:指人定的参照点理想的参照点是绝对零点;很难找到绝对零点,多采 用人为标定相对零点。2、单位:是测量的基本要求。好的单位的条件: 1
2、)有确定的意义;2)有相同的价值。心理测量的单位不够完善,既无统一的单位,也不符合等距的要求三、测量量表:1 、量表:是一种尺度,是测量的工具,是测验的表现形式; 心理测验是心理测量的一个部分。2 、测量的本质: 1 )是根据某地法则将事物数量化; 2)定有单位和 参照点的连续体称为量表;3 、量表的种类:1 )命名量表:是最低水平的一种量表形式。(1)概念:只是用数字来代表事物或把事物归类。(2)分类:代号用数字来代表个别事物(如学生编 号)类别用数字代表某一具有 某种属性的事物的全体(3)数字只能用作标记和分类,不能作数量化分析。 2)顺序量表:比命名量表水平高。在心理测量中最常用。( 1
3、)概念:数字不仅指明类别,同时指明类别的大小或 含某种属性的程度。(2)特点:无相等单位、无绝对零点、数字仅表示等级, 并不表示某种属性的真正量或绝对值。3)等距量表:比顺序量表高级。(1)特点:A 、不但有大小关系,还有相等的单位和相对零点,但只能做加、减运算(不能乘除)B 、其数值加或减一个数值或用一个常数乘或 除,不会破坏原来数据之间的关系(2)常用于感觉测量4)等比量表:为最高水平的量表。特点:有相等单位和绝对零点;可做加、减、乘、除 第二单元 心理测验的基本概念一、心理测验的定义:1 、定义:心理测验,就是依据心理学理论,使用一定的操作程序, 通过观 察人的少数有代表性的行为,对于贯
4、穿在人的全部行为活动中的心理特 点做出推论和数量化分析的一种科学手段。2 、特点:1)心理测验测量的是人的行为;即一个人对测给题目的反应;2)心理测验在测量个别差异的时候,往往对是对少数经过慎重选择的行为 样本进行观察, 来间接推知被试者的心理特征。 不免有某种程度的偏差;(样本 是指有代表性的样本) 。3)测验的条件对所有的被试者都必须是相同的(测验的标准化);4)个人在测验中所得的原始分数,只有下其他人的分数或常模比较才有意 义;(常模指一般人即正常人的平均水平) ;二、心理测验的性质:1 、间接性即通过对测验项目的反应来推论他的心理特质。2 、相对性每个人的测得结果都是与所在的团体或大多
5、数人的行 为或某种人为确定的标准相比较而言的。3、客观性即测验的标准化问题,包括: 1)测验用的项目或作业、施测说明、施测者的言语态度及施 测时的物 理环境等,均经标准化,测验的刺激是客观的;2)评记分的原则和手段经过了标准化,对反应的量化是客观 的;3)分数转换和解释经过了标准化,对结果的推论是客观的。 第三单元 心理测验的分类一、按测验的功能分类:1 、智力测验 Binet-Simon 智力测验Stanford-Binet 智力量表 Wechsler 儿童和成人智 力量表2、特殊能力测验3、人格测验问卷法: MMP、I 16PF、 EPQ投射法:罗夏测验、主题统觉测验( TAT)二、按材料
6、的性质分类:1 、文字测验 MMP、I EPQ、 16PF、 Wechsler 儿童和成人智力量表中 的文字 部分1 )优点方便2)缺点容易受被试者文化程度的影响 3)应用团体测验较多用2 、操作测验(非文字测验) :图片类操作罗夏测验、 TAT、 Raven 测验、 Wechsler 儿童和成人智力量表中的操作量表1 )优点不受文化因素的影响 2 )缺点 不适宜团体实施,费时3 、有时二类测验常常结合作用,如: Binet-Simon 智力量表原主要 是文字测验,修订后则增加了操作测验成分; Wechsler 的三套智力量表(幼儿、 儿童、成人)每套均有文字和操作二类测验。三、按测验材料的严
7、重程度分类:1、客观测验绝大多数的心理测验都属些类测验2、投射测验:1 )特点:刺激没有明确意义,问题模糊;对被试的反应没有 明确规定;2)常用测验:罗夏测验、主题统觉测验( TAT)、 自由联想 测验、句子完成测验。四、按测验的方式分类:1 、个别测验:如: Binet-Simon 智力量表、 Wechsler 智力量表个别 测验材料不能以团体的方式进行。2、团体测验最早使用,著名的有陆军甲种和乙种测验;团体测验材料也可作个别实施如 MMP EPQ 16PF等。五、按测验的要求分类:1 、最高作为测验:要求被试者尽可能做出最好和回答,主要与认知过程 有关,有正确答案。如:智力测验、成就测验。
8、2、典型行为测验:要求被试者按通常习惯方式做出反应,没有正确 答案。如:各种人格测验。第四单元 纠正错误的测验观一、错误的测验观:1 、测验万能论2 、测验无用论3 、心理测验即智力测验二、正确的测验观:1 、心理测验是重要的心理学方法之一,是决策的辅助工具。2、心理测验作为研究方法和测量工具尚不完善。3、心理测验的最大问题是基础理论不够坚实。第五单元 心理测验在心理咨询中的应用一、智力测验吴天敏修订的中国内比量表龚耀先等人修订的韦氏成人智力量表( WAIS-RC)韦 氏 儿 童 智 力 量 表 ( C-WISC) 和 韦 氏 幼 儿 智 力 理 表 (C-WYCS)I林传鼎等人修订的韦氏儿童
9、智力量表( WISC-CR) 张厚粲主持的瑞文标准型测验( SPM) 李丹等修订的联合型瑞文测验( CRT) 二、人格测验艾森克人格问卷( EPQ)卡特尔 16 人格因素问卷( 16PF) 明尼苏达多项人格调查表( MMP)I 为临床诊断量表三、心理评定量表精神评定量表 躁狂状态评定量表 抑郁量表 焦虑量表 恐怖量表 心理测验是分析求助者心理问题的工具,它不但可以检验咨询人员的判断是 否正确,还能帮助其对求助者的问题进行深入的分析。在咨询和心理治疗过程中 并不是必不可少的一个环节。一般来讲,心理测验应在咨询关系尚未建立之前实 施,也可在咨询无法进行下去时实施。第六单元 心理测验的发展史一、科学
10、心理测验的产生与发展:1 、心理测量及统计学的奠基人高尔顿:测量智力的个体差 异; 为心理测验奠定了统计学基础;第一个提出了相关的概念2 、皮尔逊创立积差相关法 智力年龄(用年龄作智力的准则)3 、卡特尔主张测验手续和考试方法就有统一规定要有常模比较4 、比内、西蒙最早提出智力测验智力量表(1905 年)19 世纪 80 年代是高尔顿的十年;90 年代是卡特尔的十年;20 世纪头十年是比内的智力测验的十年5 、此后心理测验的主要发展:1 )操作测验的发展 2)团体智力测验的发展3 )能力倾向测验的发展4)人格测验的发展先驱:克雷丕林自由联想测验 罗夏测验投射测验的发端二、现代心理测验在我国的发
11、展:我国近代心理测验大约源于 1914 年前后。二十世纪二、三十年代,我国心理 学家曾二次修订过比内 - 西蒙量表。第二节 测验的常模第一单元 常模团体一、常模团体的性质1 、常模团体:是由具有某种共同特征的人所组成的一个群体,或者 是该群体的一个样本。2 、常模团体在某方面的心理特质:常模是用一个标准的、规范的分 数表示出来,以提供对个体作比较或评价的基础。3 、任何一个测验都有多个可能的常模团体。如智力测验分儿童智力 测验和成人智力测验。4 、对测验编制者来说,常模的选择主要基于对所要施测的总体的认 识。团体常模团体必须能够代表所要研究或施测的总体,具体工作包括:确定一 般总体、确定目标总
12、体、确定样本5 、对测验的使用者来说,要考试的问题是,现有的哪个常模团体最 适合。标准化测验通常提供许多原始分数与各种常模的比较转换表。有时能够适 用的常模团体不止一个。6 、常模团体的成员二、常模团体的条件1 、群体的构成必须明确界定;定义常模团体的标准(变量)有:性 别、年龄、职业、教育水平、社会经济地位、种族等。2 、常模团体必须是所测群体的代表性样本;3 、样本大小要恰当:取样误差与样本的大小成反比; 样本大小一 般 30 100,全国性 2000 3000,最好为题量的 5 倍;样本大小适当的关键是样 本要有代表性。4 、标准化样组是一定时空的产物三、取样的方法1 、取样:是指从总体
13、(目标人群)中选择有代表性的样本。2 、分类: 1)随机取样 2)非随机取样3 、具体取样方法:1 )简单随机取样:概念:总体中每个个体均有独立的等概率被被抽取的可 能。常用方法:抽签法和随机数字法(如从 50 随机选取 10 人)。2 )系统取样:概念:假设总体数目为 N,选择1/K的被试作为样本, 则样本的大小(n)为:n二N X 1/K ( K = N/ n )给被试编号,按组距 K分段,每 段取 1 人注意事项:要求目标总体无序可循,也无等级结构存在例如:从 40 人中 抽取 5 人,从第 3号开始抽取,为 3、 1 1 、1 9、27、353 )分组取样:如:按个方面条件基本相同的学
14、校取样适用于:总体数目大,而且群体有多样性,将群体分组,在组内随机取样。注意事项:要求尽可能减小组间差异,尽量加大组内差异4 )分层取样:方法:将目标群体按某种变量 (如年龄) 分成若干层次, 再从各层次中随机抽取若干被试。特点:使各层次差异显著。同层次保持一致,增加了 样本的代表性注意事项:要求尽可能加大层次间的差异,尽量减小层次内的差异分类: (1)分层比例取样:( 2)分层非比例取样:各层次的差异很大时采用四、常模分数与常模1 、常模分数:就是施测常模样本后,将被试者的原始分数按一定规则转换出来的导出分数。原始分数: 是指被试者的反应与标准答案相比较而获得的测验分数。导出分数:原始分数本
15、身没有多大意义,必须有一个参照标准才行,在心理测验中,这种标准是由原始分数构成的分布转换而来的分数,叫导 出分数。导出分数具有一定的对照点和单位,它实际上是一个有意义 的测验量 表,它与原始分数等值,可以进行比较。2 、常模:就是常模分数构成的分布,它是解释心理测验分数的基础。一般常模:常为测验指导书上列出的常模。特殊常模:为非典型群体建立的,如某个单位。特殊常模的建立方法:根据样本的原始分数制作次数分布图,再计算 出导出分数,最后制成转换表 第 10 页第二单元常模的类型一、发展常模(年龄量表):就是根据不同年龄上各种发展水平的人的平均表现(如智力、技能、 感觉运动等方面的发展水平)所制定的
16、量表。1、发展顺序量表:与发育正常的儿童相比,按年龄评定一个儿童的 心理发展水平。1)葛尔塞发展程序量表:按月份显示发育正常儿童在运动水 平、适应性、语言、社会性四个方面的发展水平,以此作为标准,评定个体的发 展水平。强调儿童早期行为的发展是有规律的。2) 皮亚杰的发展理论一一对守恒概念的研究:5岁时才会理解 质量守恒;6岁才会掌握重量守恒;7岁时才有容量守恒概念。守恒:是指二种 等量的物体,只要无增无减,无论怎么组合,它们在质量、重量、长度、数量及 容量等方面仍然是相等的。2、智力年龄(个体的智力所达到的年龄水平智龄)1 )比内-西蒙智力量表一一首先使用智力年龄的概念;智龄是 年龄量表上度量
17、智力的单位。编制出可区分各年龄儿童的智力水平的测题,这些测题的难度随年龄而逐渐加大,2)为每个年龄水平都编制一些适当的题目,其中的每个测题是该 年龄组 大部分儿童都能完成的。以智力年龄(智龄)作为度量智力的单位。智 力年龄是指一个儿童在年龄量表上所得的分数。3 )智力年龄的计算方法:范例:吴天敏修订的比内-西蒙智力量表:每个年龄组各有6个测题,每答对一题增加智龄 2个月先确定基础年龄(智力量表中全部被 通过的那一组测题所代表的年龄)。例如:六岁组的测题全部答对,更高年龄组的测题只有部分答对,或都未通过,则基础年龄为六岁,再求答对的更高年龄组上的测题数 量,每答对一题增加智龄 2个月。智力年龄二
18、基础年龄+更高年龄组上通过的测题 数量所代表的智龄增长的月数3、测定智力年龄的另一种方法一一测题不分年龄组以标准化样本中每个年龄组的平均分数作为年龄常模将个人的原始分数与年龄常摸作比较,计算其智力年龄4、 年级当量 实际上就是年级量表。将一个学生和同年级学生相比。年级量表的单位通常为 10个月间隔(故10个月为一个学年)。二、百分位常模1、百分等级:1)是应用最广的表示测验分数的方法;2 )一个测验分数的百分等级是指在常模样本中低于该分数的 人数百分比;即百分等级指出的是个体在常模团体中所处的位置,百分等级越低, 个体所处的位置就越低;3)分类:(1)未分组资料的百分位数: 计算:PR二100
19、 -( 100R-50)/N R是原始分数排列顺序,N是指总人数(样本的总人数)(2)分组资料的百分等级:2、百分点(百分位数):是计算处于某一百分比例的人对应的测验分数是多少;是分数量表上相对于某一百分等级的分数点,又称百分位数(PP)可根据直线内插法计算(举例:高考成绩):(100-百分等级)/ (最高分-PP)=(百分等级-1/PP-最低分)原始分数和百分等级可互相转换,由此编制的原始分 数与百分等级的对照表,称为百分位常模。3、四分位数和十分位数1)四分位数:将分数量表分成四等份,相当于百分等级的25%50強口 75%E个百分点分成的四段;2 )十分位数:将分数量表分为十段:10% 2
20、0%等三、标准分数(标准分数):1、是将原始分数与平均数的距离以标准差为单位表示出来的量表;2、其基本单位是标准差;3、常用的标准分数有:z分数、Z分数、T分数、标准九分数、离差 智商(IQ)等。4、分类:1 )线性转换的标准分数:(1)适用于正态(常态)分布的数据资料;(2)z分数为最典型的线性转换的标准分数;(3) z分数:z =(X-M) /SD X为任一原始分数,M为 样本平均数,SD为样本标准差。z分数可以用来表示某一分数与平均数之差是标准差的几倍。(4) 转换后的Z分数:Z二A+BzZ为转换后的标准分数,A、B为根据需要指定的常数;加上一个常数是为了去掉负值,乘以一个常数第12页是
21、为了使单位变小而去掉小数点;加或乘一个常数并不改变原来分数间的关系。2 )非线性转换的标准分数:( 1)原始分数不是常态分布使之常态化(常态化 过程是非线性的) ;( 2)常态化过程主要是将原始分数转化为百分等级, 再将百分等级转化为常态分布上相应的离均差,并可以表示为任何平均数和标准 差。(3)计算步骤:A 、对每个分数值计算累积百分数B 、在常态曲线面积中 , 求出对应的该百分比的z分数所得的z分数可将分布分成几部分,称之为Z/分数,以区别由线性转换所求得的 z 分数。与线性导出分数一样,常态化标准分数也可以被转化为任何方 便的形式,并可用以下表示:C、T 分数以 50 为平均数(即加上一
22、个 常数 50),以 10 为标准差(乘以一个常数理 10),即: T= 50 +10 z' ( 平均数为 50, 标准差为 10)D、标准九分:其量表是个9级分数量表(平 均数为 5, 标准差为 2)E、标准十分平均数为 5,标准差为1.5 ;标准二十分平均数为 10,标准差为 3。(使用最广、影响最大的一种常态化标 准分数是离差智商)四、离差智商及其含义: 在最早的比内西蒙智力测验中没有智商的概念, 只用“心理年龄”(MA来表示被试智力的高低。目前一般都用比率智商和离差智商来表示智力的 高低。1、比率智商(IQ):为心理年龄(MA与实足年龄(CA之比。为避 免小数,将商数乘以100
23、。计算公式IQ = MA/CAC100如果一个儿童的心理年龄等 于实足年龄,他的智商就 为 100。 IQ 等于 100代表正常的或平常的智力。比率 智商并不适合于年龄较大的被试。2 、离差智商:是一种以年龄组为样本计算而得的标准分数;韦克斯 勒将离差智商的平均数定为 100,标准差为 1 5;离差智商表示的是个体智力在年 龄组中所处的位置;是表示智力高低的一种理想指标。计算公式:IQ=100+15z'=100+15 (X-M /SDX 表示被试的量表分数,M表示被试所在年龄水平的平均量表分数,SD表示这一年龄水平被试的量表分数的标准差。将原始分与IQ值的对应关系计算出来作为常模表 (
24、P344 表)。韦克斯纳:平均数定为 100,标准差为 15斯-比测验:平均数为 100,标准差为 16第三单元 常模分数的表达方法一、转换表法(常模表)是最简单而且最基本的表示常模的方法。1 、一个转换表显示出一个特定的标准化样组的原始分数与其对应的 等值分数百分位、 标准分数、 T 分数或其他任何分数。 利用转换表可将原始分 数转换为与其对应的导出分数,从而对测验的分数作出有意义的解释。2 、简单的转换表就是将单项测验的原始分数转换成一种或几种导出 分数( P346 表 5 2)。复杂的转换表通常包括几个分测验或几种常模团体的原始 分数与导出分数的对应关系(P347表达一3)二、剖面图是将
25、测验分数的转换关系用图形表示出来。可以很直观地看 出被试在各分测验上的表现及其相对位置( P346 表 51)。标准差代表一组数据的离散程度, 如一个班内学生数学成绩的离散 程度从理论上说,心理测量数据一般服从为正态分布,或接近正态分布正态分布 曲线的形状取决于标准差,但曲线下的面积始终为 1 个单位在心理测量中,个体 在团体中的相对位置,以 Z 分数的大小表示,而 Z 分数是标准差作为单位,既以 包含几个标准差表示个体分数与总体平均分数的距离,而不是用两者的绝对分数 之差表示表示个体在团体中的相对位置根据 Z 分数可确定低于或某或高于某个分 数的人数比例,也可以对不同的测量结果进行比较心理统
26、计基本知识 第三节 测验的信度 第一单元 信度的概念一、信度的定义:1 、信度:是指同一被试者在不同时间内用同一测验(或一个同等形 式的测 验)重复测量,所得结果的一致程度。2 、信度是评价一个测验是否合格的重要指标之一;也是标准化心理 测验的基本要求之一。3、信度只受随机误差的影响。随机误差越大,信度越低。4、实得分数(X)总是由真实分数(T)和误差(E)二部分构成的:X=T+E5、如果我们讨论一组测验分数的特性时,可用方差代表具体分数;公式如下:S平方x=S平方T+S平方ES 平方 x 是测验实得分数的方差; S平方T是测验真分数的方差;S平方E是测验误差的方差。在测量理论中,信度被定义为
27、:一组测量分数的真分数方差现总方差(实得分数的方差)的比率。即: rxx=S 平方 T/S 平方 x 此公式还可以转化为: rxx=S 平方 x-S 平方 E/S 平方 x=S 平 方 E/S 平方 x 因此, 信度也可以看作在总的方差中非测量误差的方差所占的比例。二、信度的指标1 、信度系数与信度指标:1 )大部分情况下,信度是以信度系数为指标的,它是一种相 关系数。是同一被试样本所得的两组资料的相关,理论上说就是真分数方差与实 得分数的方差的比值;公式是:rxx=r平方XT=S¥方T/S平方X2)公式中的 r 平方 TX 是真分数标准差与实得分数的标准差 的比值,称信度指数;3)
28、信度指数的平方就是信度系数。2 、测量标准误:1 )信度系数仅表示一组测量的实得分数与真分数的符合程度, 但并没有直接指出个人测验分数的变异量。由于存在误差,一个人所得分数有时 比真分数高,有时比真分数低,有时二者相等。2 )如用一组被试二次测验结果来代替对同一人的反复测试,于是就有了信度的另一个指标一一测量的标准误。公式是:SE=Sfi号1- r 公式中SE为测量的标准误,Sx是所得分数的标准差,rxx为测验的信度系数。信度 越高,标准误越小;信度越低,标准误越大。第二单元 信度的评估方法一、重测信度(稳定性系数) :1 、方法:采用重测法。即使用同一测验,在同样条件下以同一组被 试者前后施
29、测二次测验,求二次得分间的相关系数。2 、优点:能提供有关测验是否随时间而变异的资料,可作为被试将 来行为表现的依据。3 、缺点:是易受练习和记忆的影响。4 、二次测验的最适宜时距一般是二周到四周较宜。二、复本信度(等值性系数)1 、方法:以两个等值但题目不同的测验(复本)来测量同一群体, 然后求得被试者在二个测验上得分的相关系数, 反映的是测验在内容上的等值性。 在应用上,应该有关数的被试先做 A 本再做 B 本,另一半被试先做 B 本再做 A 本。2 、要考虑两个复本实施测试的时间,若相隔一段时间,称稳定与等值系数3 、优点:能免避免重测信度的一些问题;4 、缺点:1 )测量行为易受练习的
30、影响,复本信度只能减少而不能完全 消除这种影响;2)由于第二个测验只改变了题目的内容,已经掌握的解题原 则,可以很容易地迁移到同类问题。三、内部一致性信度内部一致性系数主要反映是的题目之间的关系, 表示测验能够测量相同内容或特质的程度。包括:1 、分半信度:1 )概念:指采用半分法估计所得的信度系数。2)方法:只需一种测验形式,实施一次测验。按奇、偶题分 为等值的两部分,分别计算在二半测验上的分数,求出二半分数的相关系数。这 个相关系数就代表了二半测验内容取样的一致程度,因而属于内部一致性信度系 数。3 )采用积差相关方法计算信度系数。在其他条件相同的情况 下,测验越长,信度越高。半分法经常会
31、低侉信度必须修正。修正公式:斯皮尔 曼 - 布郎公式。公式下下: rxx=2rhh/1+rhh 式中 rhh 为一半分数的相关系数, rxx 为测验在原长度时的信度会计值。2 、同质信度:同质性主要代表测验内容所有题目间的一致性。 同质:指各测题的得分有实高的正相关,不论题目的内容和形 式如何;异质:指各测验的得分相关很低或为负相关,即使所有题目看起来好象 测量同一特质。计算公式:库德-理查逊公式:最常用的是 K R20公式(测量 同质性信度)克伦巴赫系数a系数四、评分者信度: 少用。一般要求在成对的受过训练的评分者之间平均一致性达0.90以上,才认为评分是客观的。多人评定信度的估计,可采用肯
32、德尔和谐系数( W)。第三单元 信度与测验分数的解释 一、解释真实分数与实得分数的相关:信度系数可以解释为总的方差中有多少比例是由真实分数的方差决 定的,也就是测验的总变异中真分数造成的变异占百分之几。二、确定信度可接受的水平:一般原则是:1 )当1 r v 0.70时,测验不能用于对个人做出评价或预测,且不能作团体比较;2)当1 0.70 <rv 0.85 时,可用于团体比较;3 )当1 r > o,85时,才能用来鉴别或预测个人成绩或作为。三、解释个人分数的意义;一是估计真实分数的范围;二是了解实得分数再测时可能的变化情形。真分数的置信区间,一般采用 95%的或然水平,其置信区
33、间为:X-1.96SE< X < X+1.96SE也就是说, 大约有 95%的可能性真分数落在分数± 1.96SE 的范围内, 或有 5%的可能性落在范围之外。实际上也表明了再测时分数改变的可能范围。四、比较不同测验分数的差异: 包括二个人不同分数的差别和同一被试在二个测验上的差别, 这就是 差异分数的标准误问题,其公式为:SEd=M号2-rxx-ryy式中SEd为差异的标准误,S代表二个测验使用的标准差。要求两测验的标准差相同;在统计上,经常要求二个分数在差异程度达到 0.05 显著性水平,才能承认不是误差的影响。第四单元 影响信度的两个重要因素一、样本特征:1 、样本
34、团体异质性的影响:一般而言,若获得信度的取样团体较为异质的话,往往会高估测验的信度,相反则会低估测验的信度。2、样本团体平均能力水平的影响二、测验长度:1 、在一个测验中增加同质的题目,可以使信度提高;2、测验越长,测验的测题取样或内容取样就越有代表性;3、测验越长,被试的猜测因素影响越小;4、测验的长度最少应增加的题数:斯皮尔曼 - 布郎公式三、测验难度理想平均难度为:五择一题, 0.70 ;四择一题, 0.74 ;择一题, 0.77 ;是非题, 0.85 。四、时间间隔对重测信度和不同时测量的复本信度有影响;二次测验 间隔时间越短,其信度系数越大;间隔时间越久,信度系数便载低。第四节 测验
35、的效度 第一单元 效度的概念、效度的定义:效度是指一个测验实际测量的与所要测量的心理特点之间符合的程度,也就是指一个心理测验的准确性。测量的效度除受随机误差的影响外,还受系统误差的影响。可信的测验未必有效,而有效的测验必定可信。信度是效度的必要条件。二、效度的性质:1 、效度具有相对性2、效度具有连续性第二单元 效度的估计方法一、内容效度:1 、定义:内容效度是指测验题目对有关内容或行为取样的适用性,从而确定测验是否是所欲测量的行为领域的代表性取样。2、编制要求:1 )要对所测量的心理特征有个明确的概念,并划定出哪些行为与这种心理特性有关,以较密切;2)测验题目应是界定的内容范围的代表性取样。
36、3 、评估方法:1 )专家判断法:步骤: (1)定义好测验内容的总体范围; (2) 编制双向细目表; (3)制定评定量表。2)统计分析法:步骤: (1)计算两个评分者之间评定的一致 性;(2)同一组被试在两个复本上得分的相关; ( 3)再测法求相关3 )经验推测法:调查、观察等。2)常与4、内容效度的特性: 1 )不是普遍适用的表面效度混淆二、构想效度(构思效度、结构效度)1 、定义:测验能够测量到理论上的构想或特质的程度。即:测验的结果是否能证实或解释某一理论的假 设,术语或构想,解释的程度如何。2 、构想效度的估计方法:1 )对测验本身的分析:通过研究测验内部结构来界定理论构 思,从而为构
37、思效度提供证据。(1)测验的内容效度分析; (2)测验的同质性指标; ( 3) 被试对测题的反应特点。2 )测验间的相互比较: ( 1)相容效度(与成熟的测验比较) ;(2)区分效度(与不同构思的测验比较) ;( 3)因素分析法。3 )效标效度的研究证明:一个测验若效标效度理想,那么该 测验所预测的效标的性质和种类就可以作为分析测验构思效度的指标。(1)采用效度理想的效标; ( 2)心理特质的发展变化基 本规律。4 )实验法和观察法证实三、效标效度(实证效度)1 、概念:效标效度是预测个体在某种情景下行为表现的有效性程度。 被预测的行为是检验效度的标准,简称效标。2 、分类:1 )同时效标:即
38、测验所得的分数可与效标同时验证,通常与心理特征的评估及诊断有关。2)预测效度:其效标资料需要一段时间才可搜集到,通常用 于选拨、分组。3)一个好的将近标必须具备的条件:(1)必须最有效在反映测验的目 标;(2)必须具有较高的信度,稳定可靠;(3)可以客观地加以测量,可用数据或等级来表示;( 4)测量方法简单、经济实用。3 、评估方法:1 )相关法:最常用。求测验分数与效标资料之间的相关 称效度系数效度系数的计算方法:积差相关法点二列相关公式二列相关公式2 )区分法:是检验测验分数能否有效地区分由效标所定义的 团体( t 检验)的一种方法。组间平均数差异在统计表的显著决策 取决于团体大 小。当团
39、体实大时,平均数间的小差异在统计上也变得有意义,但测验区分这些 团体的实际价值很小。为了避免这一点,应该分析高分组(前27%)与低分组(后27%)分布的重叠量。重叠量越大,说明二组分数差异越小,即测验的效度越差。3 )命中率法:是当测验用来做取舍的依据时,用春正确决定 的比例作为效度指标的一种方法。方法: ( 1)确定一个临界值:高于临界值者预 测其成功;低于临界值者预测其失败。 ( 2)预测是否成功:正确的预测命中; 不成功的预测失误。第三单元 效度的功能一、预测误差1 、效度系数的实际意义常常以决定性系数来表示,意旨相关系数的 平方,它表示测验正确预测或解释的效标的方差占总方差的比例。2
40、、另一种表达方法是估计的标准误( Sest ),它是指所有某一测验分数的被试其效度分数(Y)分布的标准差,也即预测误差大小的估计值,是真正分 数估计的误差大小。计算公式:Sest = Sy根号1 - r平方xy式中:r平方xy代表系数的平方,即决定系数; Sy 为效标成绩的标准差。估计的标准误可如同其他 标准误一样解释。 真正效标分数落在预测分数± 1Sest 的范围内, 有 68%的可能性; 落在预测效标± 1.96%Sest 的范围内,有 95%的可能性;落在预测效标分数 ±2.58Sest 的范围内,有 99%的可能性。二、预测效标分数:建立回归方程,从测验
41、分数预测效标分数三、预测效率指数:E=100 (1- K), K=根号1-r平方xy二Sest/ Sy ,根号1 - r平方xy为无关系数四、信度和效度的关系信度是效度的必要条件而不是充分条件效度受 信度的制约一个好的效标必须具备的条件:能有效地反映测验目标具有高的信度 可以客观测量测量方法要简单第四单元 影响效度的因素一、测验本身的因素:1 、测验取材必须对对整个内容具有的代表性2 、测题设计时应尽量避免容易引起误差的题型(如是非题)3 、测题难度要适中,具有较高的区分度4、测验长度要恰当,即要有一定的测题量5 、测题的排列按先易后难顺序编排二、测验实施中的干扰因素:1 、主试的影响因素2、
42、被试的影响因素三、样本团体的性质: 1 、样本团体的异质性:一般来说,样本团 体越异质,分数分布范围越大,测验效度就越高。2、干涉变量四、效标的性质:1、效标效度是以测验分数与效标测量的相关系数来表示 的;2、效标本身测量的可靠性3、效标与测验分数之间的关系是否线性关系第五节 项目分析第一单 元项目的难度一、定义:项目难度指项目(题目)的难易程度。常以通过率表示:P=RNX 100%P代表项目的难度,N为全体被试者人数,R为答对或通过该题目的人数。二、计算方法1 、二分法计分的项目:1 )项目为选择题,通过记1 分,错误记0 分,直接用:P =( R/N) 100%2)被试人数较多时,则可根据
43、测验总成绩将被试分成三组: 高分组 27%, 低分组 27%,中间组 46%用公式: P=( PH+PL) /2P 表示难度, PH为高分组, PL 为低分组难 度校正公 式 : CP=(KP-1) / (K-1)CP 为校正后通过率, P 为实际得到的通过率, K 为备选答案的数目。2、非二分记分的项目:当测验题为问答题或不能用二分法记分的形 式时。P= (X/Xmax)100% X 为全体被试者在该题上的平 均分,Xmax为该题的满分。三、难度水平的确定:1 、项目的难度: 1 )目的:保证区分度, P 值接近 0.50 区别力越高;2 )难度水平取决于测验目的、性质和项目的形式2 、测验
44、的难度:1 )取决于组成测验的项目的难度2 )人的心理特性基本上呈正态分布,希望测验结果也基本上呈正态分布3 )偏态分布:正偏态和负偏态第二单元 项目的区分度一、定义: 项目区分度(鉴别力) ,是指测验项目对被试的心理特性的区分能力 项目区分度是评价项目质量和筛选项目的主要指标也是影响测验效度的重要因 素。 区分度取值范围介于 -1 至+1 之间,相关系数越大,区分度越高。、计算方法:1 、鉴别指数(区分度) :区分度( D)= PH - PL2 、相关法:最常用,以作为该项目区分度的指标某一项目与效标成 绩或测验总分的相关。1 )点二列相关:适用于一类变量为二分称名变量,另一类变 量为连续变量相关系数要进行显著性检验2 )二列相关:要求二分变量的分布在连续测量时必须为正态 分布对于连续变量的分布,必须是单峰,而且要对称对两个变量均为连续变量, 也可用积差相关
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025湖南永州市零陵区第二批公开引进急需紧缺专业人才(医疗岗9人)考前自测高频考点模拟试题及完整答案详解一套
- 2025湖南中医药大学第二附属医院招聘21人(第一批)模拟试卷及答案详解一套
- 航天科技知识考试题库及答案
- 模电考研考试题库及答案
- 2025年国电“学安全、反违章、防事故”学习考试活动题库(含答案)
- 2025年物流运输合伙合同
- 2025年广西壮族自治区省直机关公开遴选公务员笔试题及答案解析(A类)
- 海关检疫员考试题及答案
- 高三月考试卷数学及答案
- 魔法学院考试内容及答案
- GB/T 13460-2016再生橡胶通用规范
- 《矩阵论》研究生教学课件
- 中国荨麻疹诊疗指南(2022版)
- 北京市统一医疗服务收费标准
- 陈明伤寒论经方加减治疗脾胃病陈明
- 简明新疆地方史赵阳
- 基础观感验收自评报告
- 班级管理(第3版)教学课件汇总全套电子教案(完整版)
- 公路桥梁工程施工安全专项风险评估报告
- T∕ACSC 02-2022 中医医院建筑设计规范
- 《医古文》教学大纲
评论
0/150
提交评论