心理测量学-网络课件_第1页
心理测量学-网络课件_第2页
心理测量学-网络课件_第3页
心理测量学-网络课件_第4页
心理测量学-网络课件_第5页
已阅读5页,还剩81页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第五章心理测量学知识 第一节第一节 概述概述无论是临床诊断,判定疗效,还是进行无论是临床诊断,判定疗效,还是进行 心理咨询和治疗,都心理咨询和治疗,都必须必须以以心理测量为基础心理测量为基础第一单元 测量与量表一、什么是测量测量就是依据一定的法则用数字对事物加以确定测量定义的三个主要元素(1)事物事物测量对象在心理测量中,所测量的实际是心理现象的外显行为(2)数字数字事物或其属性的量数的逻辑性:区分性、序列性或等级性、等距性、可加性(3)法则)法则测量所依据的规则和方法法则有好坏之分二、测量要素(一)(一)参照点参照点计算的起点:绝对零点 相对零点在心理测量中很难找到绝对零点,多用人为标定的相

2、对零点(书本的错误P.325)(二)二)单位单位好的单位必须具备两个条件1、 有确定的意义2、 有相同的价值三、测量的量表测量的本质是根据某一法则将事物数量化,即在一个定有单位和参照点的连续体上把事物的属性表现出来,这个连续体就称为量表。根据量表的精确程度,斯蒂文斯(S.S.Stevens)将测量从低级到高级分成四种(一) 命名量表命名量表:1、代号 2、类别(二) 顺序量表顺序量表: 有大小关系、无相等单位、无绝对零点(三) 等距量表等距量表:有大小关系、有相等单位、无绝对零点(四) 等比量表等比量表: 有相等单位、有绝对零点心理测量一般在顺序量表上进行,但利用某种统计方法可心理测量一般在顺

3、序量表上进行,但利用某种统计方法可以将数据换算为等距数据来进行统计以将数据换算为等距数据来进行统计第二单元 心理测量的基本概念一、心理测验的定义 心理测验,就是依据心理学理论,使用一定的操作程序,通过观察人的少数有代表性的行为,对于贯穿在人的全部行为活动中的心理特点做出推论和数量化分析的一种科学手段1、测量的是人的行为、测量的是人的行为2、行为样本、行为样本3、标准化、标准化4、常模、常模二、心理测验的性质心理测量的间接性心理测量的间接性心理测量的相对性心理测量的相对性心理测量的客观性心理测量的客观性项目、实施方法记分分数的转换和解释 第三单元 心理测验的分类 一、按测验的功能分类 (一)智力

4、测验(一)智力测验(二)特殊能力测验(二)特殊能力测验 (三)人格测验(三)人格测验问卷法、投射法 二、按测验材料的性质分类(一)文字测验(一)文字测验(二)操作测验(二)操作测验三、按测验材料的严谨程度分类(一)客观测验(一)客观测验(二)投射测验(二)投射测验 四、按测验的方式分类(一)个别测验(一)个别测验(二)团体测验(二)团体测验五、按测验的要求分类(一)最高作为测验(一)最高作为测验(二)典型行为测验(二)典型行为测验 第四单元 纠正错误的测验观 一、错误的测验观 (一)(一)测验万能论测验万能论(二)(二)测验无用论测验无用论(三)(三)心理测验即智力测验心理测验即智力测验 二、

5、正确的测验观 (一)心理测验是重要的心理学研究方法之一,是决(一)心理测验是重要的心理学研究方法之一,是决策的辅助工具策的辅助工具(二)心理测验作为研究方法和测量工具尚不完善(二)心理测验作为研究方法和测量工具尚不完善 第五单元 心理测验在心理咨询中的应用 一、智力测验 二、人格测验 三、心理评定量表 第六单元 心理测验发展史始于汉代,兴于隋唐的科举制度是公认的最早的心理测验的实践始于汉代,兴于隋唐的科举制度是公认的最早的心理测验的实践一、科学心理测验的产生与发展早期发展情况早期发展情况 英国心理学家高尔登(1884)建立了一个心理测量实验室,设计出测量差异的方法。 美国心理学家卡特尔(189

6、0)发表心理测验与测量 法国心理学家比内(1905)年编制比内- 西蒙智力量表 19世纪世纪80年代高尔登的十年年代高尔登的十年19世纪世纪90年代卡特尔的十年年代卡特尔的十年20世纪头十年是比内的十年世纪头十年是比内的十年 2020世纪世纪2020年代以后的发展特点年代以后的发展特点 操作测验的发展 团体智力测验的发展 能力倾向测验的发展 人格测验的发展二、现代心理测验在我国的发展兴起阶段兴起阶段 1914年前后,二,三十年代翻译和二次修订比内量表低谷阶段低谷阶段 几十年停顿状态蓬勃发展蓬勃发展 1979年以来,广泛进行国外的量表的修订。 近年本土化取得初步成果第二节 测验的常模 第一单元

7、常模团体一、常模团体的性质 常模团体是具有某种共同特征的人所组成的群体,或者是该群体的一个样本。用一个标准规范的分数表示出来,以提供比较的基础二、常模团体的条件 (一)(一)群体的构成必须明确界定群体的构成必须明确界定 (二)(二)常模团体必须是所测群体的代表性样本常模团体必须是所测群体的代表性样本 (三)(三)样本的大小要适当样本的大小要适当 一般不少于30或100人 全国性常模:20003000人 (四)标准化样组是一定时空的产物(四)标准化样组是一定时空的产物三、取样的方法取样即从目标人群中选择有代表性的样本 (一)简单随机抽样(一)简单随机抽样根据随机的原则选择样本,在该范围内每个人被

8、抽到的机会相等。(二)系统抽样(二)系统抽样(三)分组抽样(三)分组抽样当总体数目较大,无法进行编号,而群体又具多样性时采样 先分组,再在组内随机抽样 (四)分层抽样(四)分层抽样制定常模是最常用的方法 先按某种(或几种)变量分层,然后在每层中随机抽取一定样本,组合成常模样本。分层比例抽样分层非比例抽样四、常模分数与常模(一)常模分数(一)常模分数将常模样本被试测验的原始分按一定规则转换出来的导出分数(如百分位、标准分、T分等) 举例:简单转换表:简单转换表: 将单一测验原始分转换成一种或几种分数。如:瑞文推理测验、全量表IQ复杂转换表:复杂转换表: 包括几个分测验或几种常模团体的原始分与导出

9、分数的对应关系。如:韦氏智力测验粗分等值量表分转换表、MMPI T分转换表等。(二)常模(二)常模常模分数构成的分布,就是常模常模分数构成的分布,就是常模常模是解释测验结果的参照指标一般常模特殊常模第二单元第二单元 常模的类型常模的类型一、发展常模(一)发展顺序量表(一)发展顺序量表 葛塞尔发展程序表 皮亚杰对守恒守恒概念的研究(二)智力年龄(二)智力年龄简称智龄智龄:比内西蒙量表(三)年级当量(三)年级当量二、百分位常模(一)百分等级(一)百分等级未分组资料的百分等级的计算 PR=100-(100R-50)NR 指某人原始分排列的顺序数N 指样本总人数举例:小东在30名同学中语文成绩是80分

10、,排列第5名,其百分等级为: PR=100-(1005-50)30=85分组资料的百分等级求法,计算方法不同,但其百分等级的意义与未分组资料一样(二)百分点(二)百分点(三)四分位数和十分位数(三)四分位数和十分位数10318069580100PPPP百分点用于计算处于某一百分比例的人相对应的测验分数是多少计算方法(直线内插法)计算方法(直线内插法)举例:举例:已知高考的最高分为695,其百分等级为100,最低分为103分,百分等级为1,求百分等级80所对应的分数是多少?计算部骤(因式分解)计算部骤(因式分解)20(695-PP)=79(PP-103)79(695-PP)=20(PP-103)

11、(等号两侧交叉相乘)54905-79PP=20PP-206054905+2060=20PP+79PP56965=99PPPP=5696599PP=575.4 575三、标准分常模标准分是将原始分数与平均数的距离以标准差为单位表示出来的量表。因为它的基本单位是标准差,所以叫标准分标准分。常见的标准分数有z分数、Z分数、T分数、标准九分数、离差智商(IQ)等。(一)线性转换的标准分数一)线性转换的标准分数原始分转换标准分基本公式: SDXXZ其中X为任一原始分数, 为样本平均数,SD为样本标准差X正态分布正态分布正态分布正态分布又称常态分布常态分布,统计学中一种重要的理论分布,在自然界、人类社会、

12、心理与教育中大量的现象和特征均按正态的形式分布,如能力、人格特征、学习成绩、社会态度、行为表现以及身高、体重等。正态分布的特点正态分布的特点正态分布的形式是对称的正态分布曲线的两端与基线趋于无穷远,但不会相交。正态分布曲线与基线之间的面积等于1(100),代表了总体事件。从正态分布曲线的最高点作垂直线,形成正态分布的中轴,将面积分为相等的两半,各占50。平均值位于正态分布的中轴上。正态分布曲线下各对应的横坐标(即标准差)处与平均数之间的面积可用积分公式计算,也可查正态分布表获得。正态分布曲线下,标准差与概率(面积)之间的关系举例:平均值(加减)Z个SD,包含A的面积(概率)平均值(加减)1个S

13、D,包含68.26的面积(概率)平均值(加减)1.96个SD,包含95的面积(概率)平均值(加减)2.58个SD,包含99的面积(概率)平均值(加减)2个SD,包含95.45的面积(概率)平均值(加减)3个SD,包含99.73的面积(概率)正态分布曲线:正态分布曲线:p.345图几种导出分数间的相互关系几种导出分数间的相互关系从上图以及书中p.345图中可以看出:z分1.00分,T分60分,CEEB600分,韦氏离差智商的115分,韦氏分测验的13分等分数,都表示原始分数在它所在的分布中是高于平均数一个标准差,对于常态化的标准分数或趋于常态分布的z分数来说,大约相当于84的百分等级(实际是84

14、.13) 。两个标准差大约相当于98的百分等级(实际97.72)。2.00的z分数等分数表示低于平均值两个标准差,大约相当2的百分等级标准差不同的正态分布形式:方差和标准差方差和标准差反映数据离中(离散)趋势的两种指标。英文variance(方差)用S2 或2来表示;standard deviation(标准差),用S或SD来表示,亦可用表示。对离中趋势进行度量的意义对离中趋势进行度量的意义全面反映事物的面貌:平均值只反映了事物的典型情况,标准差可反映事物的特殊性。判断集中量数(如平均值)的代表性:在一组数据中,离中趋势越小,集中趋势量数的代表性就越好,相反就越差。基本公式基本公式方差计算公式

15、方差计算公式 Xi为每个数据,从X1、X2Xn(Xi-X)为离均差(Xi-X)2为离均差平方(Xi-X)2为离均差平方和N为数据的个数标准差计算公式标准差计算公式NXXSi22)(2SSD计算举例计算举例(下例1组)S12=(45-60)2+(50-60)2+(55-60)2+(58-60)2+(60-60)2+ (60-60)2+(62-60)2+(65-60)2+(70-60)2+(75-60)210 =70.8S1=70.8=8.41例:3组20岁男性的体重(公斤) M SD1组:45、50、55、58、60、60、62、65、70、75 60 ?2组:50、55、55、60、60、60

16、、60、65、65、70 60?3组:40、45、50、55、60、60、65、70、75、80 60?例:3组20岁男性的体重(公斤) 计算结果(平均值与标准差) M SD1组:45、50、55、58、60、60、62、65、70、75 60 8.412组:50、55、55、60、60、60、60、65、65、70 605.483组:40、45、50、55、60、60、65、70、75、80 6012.25正态分布理论在心理测验的应用正态分布理论在心理测验的应用化等级评定为测量数据测定题目的难易度利用正态分布将原始分转变为标准分在评定时确定人数(概率)四、智商及其意义 最早的比内西蒙量表用心

17、理年龄来表示智力的高低 测验题目的安排完全按难度排列,某条目在某年龄组中50能通过,该条目就被当成该年龄组的题目。 (一)比率智商(一)比率智商 比率智商公式比率智商公式 IQ=MA(心理年龄)心理年龄)/CA(实足年龄)实足年龄)100 比率智商的不足之处 个体智力的增长与年龄的关系并非一直呈直线关系,因此不适合于成人。 比率智商的分数在不同年龄组具有不同的意义。(二)离差智商(二)离差智商是一种以年龄组为样本计算而得的标准分数,为了使其与传统的比率智商基本一致,一般研究者将离差智商的平均值定为100。韦克斯勒智力量表的标准差定在15 IQ=100+15(XX)/SD 或 IQ=100+15

18、z斯坦福-比内量表的标准差定在16 IQ=100+16(XX)/SD 或 IQ=100+16z常模标准分转换表在实际工作中,测验编制者会采用某种标准分公式计算出与原始分相对应的标准分,并编制成原始分转换标准分等值表,附在手册上方便使用。每个测验采用何种标准分,以及量表分的平均值和标准差均可从测验手册中查到以以100为平均数不同标准差条件下每一组距为平均数不同标准差条件下每一组距正态曲线下个案百分比正态曲线下个案百分比分组分数分组分数百分数分布百分数分布SD=12SD=14SD=16SD=18130以上0.71.63.15.11201294.36.37.58.511011915.216.015.

19、815.410010929.826.123.621.0909929.826.123.621.0808915.216.015.815.470794.36.37.58.570以下0.71.63.15.1总计100.0100.0100.0100.0第三单元 常模分数的表示方法一、转换表法一、转换表法 又称常模表,最简单、基本的表示方法。 将测验的原始分转换成相对应的常模分数(如百分位、标准分、T分等) 举例举例 简单转换表简单转换表:将单一测验原始分转换成一种或几种分数。如:瑞文推理测验、全量表IQ 复杂转换表复杂转换表:包括几个分测验或几种常模团体的原始分与导出分数的对应关系。如:韦氏智力测验粗分

20、等值量表分转换表、MMPI T分转换表等。二、剖面图表示法二、剖面图表示法 剖面图是将分数的转换关系用图形表示出来 剖面图能直观地表示出被试在各分测验上的表现及相对位置 有的剖面图直接可作为粗分等值量表分转换表用,如韦氏成人智力测验记录纸的剖面图 WISC-RC剖面图举例 总智商在平均值以上 言语智商相当高,操作智商一般。 第三节第三节 测验的信度测验的信度第一单元 信度的概念一、信度的定义 信度是指同一被试者在不同时间内用同一测验(或用另一套信度是指同一被试者在不同时间内用同一测验(或用另一套相等的测验)重复测量,所得结果的一致程度。相等的测验)重复测量,所得结果的一致程度。 信度指测验或量

21、表的可靠性(可靠程度)。信度指测验或量表的可靠性(可靠程度)。(龚耀先) 信度就是对测量一致性程度的估计。信度就是对测量一致性程度的估计。(金喻) 在编制或修订心理测验时,信度研究是必须的环节,信度资料是测验手册里必备的测量学指标。 在使用心理测验时,没有信度资料的测验不能使用。公式(公式(57):):X=T+E 表示实得分数(总分数)X总是由真分数T和误差E构成的 用测验分数的方差代入公式57就得到公式58 在测量理论中,信度被定义为:真分数方差与总方差的比率。即公式59 由于真实分数是无法统计的, 因此公式59可转化为公式510 信度也可以看作总的方差中非测量误差的方差所占的比例 P.34

22、9.图52显示真分数方差、测量误差方差和信度的关系二、信度的指标 (一)信度系数与信度指数(一)信度系数与信度指数 信度系数:信度系数:真分数方差与实得分数方差的比值即公式511也就是公式59 信度指数:信度指数:是真分数标准差与实得分数标准差的比值 从公式512可见信度指数的平方就是信度系数 (二)测量标准误(二)测量标准误 公式513表示: 标准误是所得分数标准差乘以1减信度系数的开方。 从公式可以看出测量的标准误与信度是互为消长的关系第二单元 信度评估的方法P.349一、重测信度一、重测信度又称稳定性系数,主要用于评价时间误差。最适宜的重测时距为24周,最好不超过6个月二、复本信度二、复

23、本信度又称等值性系数,以两个等值但题目不同的测验(复本)来测量同一群体,然后求被试者在两个测验得分的相关,用于评价两个测验内容的一致性。实施两个测验的间隔时间长短可能影响复本信度对许多测验来说,建立复本是十分困难的三、内部一致性信度三、内部一致性信度(一)分半信度用于评价同一测验内部条目抽样的误差。方法:将测验条目按单双号分为两组,计算出两组的得分,然后进行相关。在同样的情况下,信度的高低与条目数量成正比,分半信度只计算了一半条目的信度,因此要用斯皮尔曼布朗的公式进行校正。(二)同质性信度评价测验内题目间一致性(内容抽样误差)计算的公式:1、库德理查逊公式(K-R20公式) K-R21公式2、

24、克伦巴赫系数四、评分者信度四、评分者信度肯德尔和谐系数第三单元 信度与测验分数的解释一、解释真实分数与实得分数的相关二、确定信度可以接受的水平一般的原则是:一般的原则是:信度系数小于0.70时不能用于个人及团体等于或大于0.70而小于0.85时可用于团体比较等于或大于0.85时才可用来鉴别或预测个人的成绩行为另一个原则是: 新编的测验信度应高于原有的同类测验或相似测验 获得较高信度不是心理测验的最终目标,只是迈向目获得较高信度不是心理测验的最终目标,只是迈向目标的一步,是使测验有效的一个必要条件标的一步,是使测验有效的一个必要条件测验类型测验类型信信度度低低中中高高成套成就测验0.660.92

25、0.98学术能力测验0.560.900.97成套倾向性测验0.460.880.96客观人格测验0.460.850.97兴趣测验0.420.840.93态度量表0.470.790.98几种心理测验的信度系数教材P.352表54有误。以此为准三、解释个人分数的意义标准误三、解释个人分数的意义标准误标准误公式 公式515即513标准误是所得分数标准差乘以1减信度系数的开方置信区间:X1.96SE X+ 1.96SE参看教材P.353的例子:某被试IQ为100已知标准差为15,信度系数为0,84利用公式515计算得出标准误为6代入公式516计算置信区间88112结论:被试的真实IQ有95的可能性落在8

26、8112之间 xxxrSSE1TX四、比较不同测验分数的差异 测量标准误和测验信度在评价两个不同测验分数的差异否具有统计学意义上的显著性时非常重要 这种比较可以是两个人的不同分数的差别,也可以是同一被试的两个测验分数公式517是差异标准误的计算公式在统计上,通常要求两个分数的差异程度达到0.05才认为是显著的教材P.353的例子说明某被试的言语智商和操作智商的差异通过计算表明差异不显著第四单元 影响信度的因素一、样本特征一、样本特征信度系数就是相关系数信度系数就是相关系数(一)样本团体异质性的影响(一)样本团体异质性的影响取样团体较为异质,会高估信度取样团体较为同质,会低估信度(二)样本团体平

27、均能力水平的影响(二)样本团体平均能力水平的影响二、测验长度二、测验长度 测验的长度,亦即测验条目数,也是影响信度系数的一个因素。一般说来,增加同质的条目可以提高测验的信度。 如果我们在预备试验中已知道某测验的信度,希望提高至某一水平,可以运用斯皮尔曼布朗的公式计算出至少应增加多少条目。 公式518三、测验难度三、测验难度四、时间间隔四、时间间隔 时间间隔只对重测信度和不同时测量时的复本信度有影响,对其余的信度来说不存在时间间隔问题)1 ()1 (kkxxxxkkrrrrK 第四节 测验的效度第一单元 效度的概念一、效度的定义一、效度的定义在心理测验中在心理测验中效度效度是指所测量的与所要测量

28、的心理特是指所测量的与所要测量的心理特点之间符合的程度。点之间符合的程度。在编制或修订心理测验时,效度研究是必须的环节,效度资料是测验手册里必备的测量学指标。在使用心理测验时,没有效度资料的测验也不能使用。 公式公式521表明:表明: 效度系数为有效方差与总方差的比率 测量的效度除受随机误差的影响外还受系统误差的影响 可信的测验未必有效,而有效的测验必定可信 信度是效度的必要条件。二、效度的性质二、效度的性质(一)效度具有相对性(一)效度具有相对性(二)效度具有连续性(二)效度具有连续性专栏:信度和效度的关系专栏:信度和效度的关系(一)信度是效度的必要条件而非充分条(一)信度是效度的必要条件而

29、非充分条件件(二)效度受信度的制约(二)效度受信度的制约第二单元第二单元效度评估的方法效度评估的方法一、内容效度(一、内容效度(contentrelatedvalidity) (一)什么是内容效度(一)什么是内容效度 指测验条目对有关内容或行为取样的适用性。换句话说,所选用的条目是否能测到想要测量的行为。 (二)内容效度的评估方法(二)内容效度的评估方法1、专家判断法2、统计分析法3、经验推测法(三)内容效度的特性(三)内容效度的特性定义的内容、时间特定性内容效度与表面效度的关系二、构想效度(二、构想效度(constructrelated constructrelated validityva

30、lidity)(一)什么是构想效度(又叫构思效度、结构效度)一)什么是构想效度(又叫构思效度、结构效度)1954年提出,主要涉及理论概念问题。指测验能够测量到理论上的构想或特质的程度,亦即测验的结果能否证实或解释某一理论的假设、术语或构想,解释的程度如何。(二)构想效度的估计方法二)构想效度的估计方法1、对测验本身的分析2、测验间的相互比较 区分效度、因素分析法3、效标效度的研究证明4、实验法和观察法的证实三,效标效度(三,效标效度(criterion-relatedvalidity)(一)什么是效标效度一)什么是效标效度效标效度又称实证效度,反映的是测验预测个体在某种情景下行为表现的有效性程

31、度。被预测的行为是检验效度的标准,简称效标在检验一个测验的效标效度时,难点在于找到合适的效标。一个好的效标效度必须具备以下条件:1,效标必须能最有效地反映测验的目标,即效标测量本身必须有效。2,效标必须具有较高的信度,稳定可靠,不随时间等因素而变化。3,效标可以客观地加以测量,可用数据或等级来表示。4,效标测量的方法简单,省时省力,经济实用。(二)效标效度的评估方法(二)效标效度的评估方法1,相关法:相关法是评估效标效度最常用的方法,它是求测验分数与效标资料间的相关,这一相关系数称为效度系数。2,区分法:区分法是检验测验分数能否有效地区分由效标所定义的团体的一种方法。计算公式如下:3,命中率法

32、:命中率法是当测验用来做取舍的依据时,用其正确的比例作为效度指标的一种方法。LLHHLHNSNSXXt22第三单元 效度的功能一,预测误差一,预测误差二,预测效标分数二,预测效标分数三,预测效率指数三,预测效率指数第四单元 影响效度的因素一,测验本身的因素一,测验本身的因素要保证测验具有较高效度,要做好以下几点:1,测验材料必须对整个内容具有代表性;2,测题设计时应昼避免容易引起误差的题型(如是非题);3,测题难度要适中,具有较高的区分度;4,测验长度要恰当,即要有一定的测题量5,测题目的排列按先易后难顺序。二、测验实施中的干扰因素二、测验实施中的干扰因素(一)主试的影响因素(一)主试的影响因

33、素(二)被试的影响因素(二)被试的影响因素三、样本团体的性质三、样本团体的性质(一)样本团体的异质性(一)样本团体的异质性(二)干涉变量(二)干涉变量四、效标的性质四、效标的性质第五节 项目分析测验的项目分析定性分析和定量分析测验的项目分析定性分析和定量分析定性分析:定性分析:测验的内容效度、题目编写的恰当性和有效性定量分析定量分析:对题目的难度和区分度进行分析项目分析的目的是:项目分析的目的是:通过选择和修改测验题目,提高测验的信度和效度。 第一单元 项目的难度一、定义难度(difficulty),指项目的难易程度,能力测验中一个重要的指标。在人格测验中,类似的指标是“通俗性”。即取自相同总

34、体样本中,能在答案方向上回答该题的人数。两种指标的计算方法是相同的二、计算方法二、计算方法(一)二分法记分的项目(一)二分法记分的项目(1、0记分)记分)公式(通过率)公式(通过率):P 指项目的难度(通过率)R 答对或通过该项目的人数N 全体被试人数举例举例:第一题10名被试中8人答对,其难度为:P=810100=80%100NRP当被试人数较多时的计算方法:根据测验总成绩将被试分为三组 高分组(PH):分数最高的27 中间组:分数居中的46 低分组(PL):分数最低的27计算高分和低分组的通过率计算两组平均通过率作为难度指标公式:P 指难度(通过率)PH指高分组通过率PL指低分组通过率举例

35、:举例:某测验条目高分组通过率为85,中间组通过率为52,低分组通过率为35,问平均通过率是多少?8535/2=60%2LHPPP吉尔福特难度校正公式:吉尔福特难度校正公式: 因为选择题易受到猜测的影响,备选答案越少,机遇的作用越大,越不能反映真实难度,吉尔福特的校正公式用于对此进行校正。公式:公式:Cp 校正后通过率P 校正前通过率K 备选答案数目举例:举例:5选选1的题型,通过率为的题型,通过率为0.6,请计算校正后的通过率?,请计算校正后的通过率?LP11KKPCp5 . 01516 . 0511KKPCp(二)非二分法记分的项目(二)非二分法记分的项目当测验项目为问答题或不能用二分法记

36、分时,用以下的公式: 为全体被试平均分, 为该题的满分举例:举例:某题平均得分1.8分,最高分2分,通过率:P=1.82.0100%=90100maxXXPXmaxX三、难度水平的确定三、难度水平的确定(一)项目的难度(一)项目的难度 进行难度分析的目的是为了筛选条目,项目难度多高合适,取决于测验的目的、性质及项目的形式。 一般而言,难度(通过率)在0.5时,区别力最高,对信度和效度影响最好。 在能力测验中,为了使尽可能少的人在测验中得0分或得满分,因此必须安排较容易的项目和较难的项目,最好使试题的平均难度接近0.50,而各题的难度在 0.500.20之间。(二)测验的难度(二)测验的难度 测

37、验的难度取决于组成测验项目的难度 通过观察测验分数的分布,可以进行直观检验。 如果测验难度适中,分数的分布应当接近常态分布; 如果测验偏难,分布呈正偏态(图54,A) 如果测验偏容易,分布呈负偏态(图54,B) 测验偏难或偏容易时,可以通过增加或减少不同难易程度的条目来解决。 某些测验(如标准参照测验)允许测验分数呈偏态分布。第二单元 项目的区分度一、定义一、定义项目区分度,也叫鉴别力,项目区分度,也叫鉴别力,是指测验项目对被试的心理能力的区分能力高区分度条目:实际水平高者能通过,实际水平低者不能通过。h二、计算方法二、计算方法(一)鉴别指数(一)鉴别指数此方法的主要步骤如下:1,按测验总分高

38、低排列答卷;2,确定高分组与低分组,每一组取答卷总数的27%;3,分别计算高分组与低分组在该项目上的通过率或得分率;4,按下列公式估计出项目的鉴别指数。(公式5-35)D为鉴别指数, 为高分组通过率, 为低分组通过率LHPPDHPLP鉴别指数的判断鉴别指数的判断因为高分组条目总得分上高于低分组,理论上他们每个条目的通过率也要高于低分组。D0时,D越大,说明该条目区分两种水平(组)的能力越强D0则反映高分组的得分反而低于低分组,说明该条目有问题。伊贝尔(L. Ebel, 1965)关于鉴别指数评价项目性能的标准: 鉴别指数(鉴别指数(D)项目评价项目评价 0.40以上 很好 0.300.39 良

39、好,修改后会更佳 0.200.29 尚可,但需修改 0.19及以下 差,必须淘汰(二)相关法(二)相关法1,点二列相关2,二列相关3, 相关法三、区分度与难度的关系三、区分度与难度的关系项目通过率项目通过率理论上最大区分度理论上最大区分度(以总分对半划分高、低分组时)高分组通过率高分组通过率低分组通过率低分组通过率D的最大值的最大值1.001.01.00.000.901.00.80.200.801.00.60.400.701.00.40.600.601.00.20.800.501.00.01.000.400.80.00.800.300.60.00.600.200.40.00.400.100.2

40、0.00.200.000.00.00.00第六节第六节测验编制的一测验编制的一般程序般程序 心理测验中,测验的编制是较为重要同心理测验中,测验的编制是较为重要同时也是较难的一个环节。学习相关知识时也是较难的一个环节。学习相关知识不仅为日后编制测验打下基础,也可以不仅为日后编制测验打下基础,也可以使我们有能力评价和更好的使用测验使我们有能力评价和更好的使用测验第一单元第一单元测验的目标分析测验的目标分析一、测验的对象一、测验的对象 在编制测验前首先要明确测量的对象,也就是该测验编成后要用于哪些团体。二、测验的用途二、测验的用途(一)显示性测验(一)显示性测验(二)预测性测验(二)预测性测验三、测

41、验的目标三、测验的目标(一)工作分析(一)工作分析(二)对特定概念下定义(二)对特定概念下定义(三)确定测验的具体内容(三)确定测验的具体内容第二单元第二单元测题的编写测题的编写一、搜集资料一、搜集资料(一)已出版的标准测验(一)已出版的标准测验(二)理论和专家的经验(二)理论和专家的经验(三)临床观察和记录(三)临床观察和记录二、命题的一般原则二、命题的一般原则(一)内容方面:主要是要求题目的内宾符合测(一)内容方面:主要是要求题目的内宾符合测验的目的。验的目的。(二)文字方面:使用准确的当代语言,简明扼二)文字方面:使用准确的当代语言,简明扼要。要。(三)理解方面:题目应有确切的答案。(三

42、)理解方面:题目应有确切的答案。(四)社会敏感性方面:尽量避开社会敏感性问(四)社会敏感性方面:尽量避开社会敏感性问题。题。三、测题的编制要领三、测题的编制要领(一)选择题(一)选择题1,题干所提的问题必须明确。2,选项切忌冗长,要简明扼要。3,每题只给一个正确答案。4,各选项长度应相等。5,避免题干用词与选项用词一致。6,选项最好用同一形式。(二)是非题(二)是非题1,内容应以有意义的概念、事实或基本原则为基础。2,每道题只能包含一个概念。3,尽量避免否定的叙述。4,若是表达意见的题目,最好说明意见的来源和根据。5,“是”、“非”题的数目应有适应比例。(三)简答题(三)简答题1,宜用问句形式

43、。2,如果是填充形式,空格不宜太多。3,每题应只有一个正确答案,答案要简短而具体。(四)操作题(四)操作题1,明确所要测量的目标,并将其操作化。2,尽量选择真实性程度较高的项目。3,指导语要简明扼要。4,制定评分标准,确定计分方法。第三单元第三单元测验的编排和组织测验的编排和组织一、合成测验一、合成测验(一)选择与审定试题(一)选择与审定试题1,选择试题形式2,审定题目(二)测题的编排(二)测题的编排1,测题的难度排列宜逐步上升。2,尽可能将同类型的测题组合在一起。3,注意根据各种类型测题本身的特点排列题目。并列直进式 混合螺旋式二、预测与项目分析二、预测与项目分析(一)预测(一)预测1,预测

44、对象应取处将来正式测验准备应用的群体。2,预测的实施过程与情境应力求与将来正式测验时的情况相近似。3,预测的时限可稍宽一些,最好使每个被试都能将题目做完。4,在预测过程中,应对被试的反应情形随时加以记录。(二)项目分析(二)项目分析三、信度与效度的考察三、信度与效度的考察(一)信度(一)信度(二)效度(二)效度四、常模制订四、常模制订 建立常模的方法是,在将来要使用测验的全体对象中,选择有代表性的一部分人(称标准化样本),对此样本施测并将所得的分数加以统计整理,得出一个具有代表性的分数分布,此即该测验的常模。五、编写指导手册五、编写指导手册1,测验的目的和功用。2,测验编制的理论背景以及测验中的材料是根据什么原则、应用什么方法选择出来的。3,如何实施测验的说明。4,测验的标准答案和记分标准。5,常模资料。6,测验的基本特征。 第七节第七节心理测验的使用心理测验的使用第一单元第一单元主试的资格主试的资格主试资格包含技术和道德两方面的要求主试资格包含技术和道德两方面的要求。一一|、知识结构、知识结构二、专业理论和专业技能二、专业理论和

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论