




已阅读5页,还剩141页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
国家职业资格认证考试培训心理咨询师变态与健康心理学,肖长844102609人社部心理咨询师考评委员,湖南中医附一心理门诊咨询师,湖南伊蒙教育执行董事。在华夏、博海、起源、尚德、创思、市总工会等多家机构从事心理咨询师培训9年,经验丰富,广受好评。自编心理咨询师职业资格认证应试宝典即将出版。,第五章心理测量学第一节概述第二节常模第三节信度第四节效度第五节项目分析第六节编制的一般程序第七节使用,第一节概述,第一单元测量与测量量表,一、定义:测量就是依据一定的法则用数字对事物加以确定,二、定义包括三元素:1、事物:测量对象(属性/特征):确定型(长度、重量)随机型(短时记忆容量)模糊型(性格)2、法则:原理、方法、规则,3、数字:代表某一事物的“量”,区分性,序列性,等级性,等距性,可加性。,三、任何测量都应具备两个要素,1、参照点绝对参照点(绝对零点,如长度、重量。意义明确、能进行加减及乘除运算,是理想的参照点)相对参照点(人为零点,海拔、气温,只能加减、不能乘除)心理测量有没有绝对零点?,2、单位:好的单位须符合两个条件:确定的意义,同一单位对所有人来说意义相同相等的价值,即第1单位与第2单位之间的距离等于第2单位与第3单位之间的距离。,四、测量量表:量表是一个定有单位和参照点的连续体斯蒂文斯(s.stevens)划分的四种水平:1、命名量表最低水平只能对事物进行分类,具区分性名称量表用数字指代事物(编号)类别量表用数字指代事物的种类数字只起标志作用,不能作数量分析如球员的号码,各种分类标志(男或女;正常或异常)。通常计算每一类别中各元素或个体出现的“频数或频率”来进行分析。,2、顺序量表(OrderScale)按所测心理特性多少、大小、高低等级赋值、排列的数字量表。数字具区分性、等级性在心理和教育中常见(如竞赛成绩排名等)无:绝对零点、相等单位、加减乘除有:大小关系,3、等距量表(IntervalScale):能把事物作等距的分等,具有等距性(如温度计,偏爱程度等)有相等单位、有大小关系、能加减心理测量通常都是顺序量表,常把顺序量表转换为等距量表,4、等比量表/比率量表(RatioScale)给个体赋值,使数值间的比率能够反映对应个体在测量心理特性上比率及差异程度(如身高、体重、速度等)。有:绝对零点、相等单位、大小关系、加减乘除,第二单元心理测验的基本概念,一、心理测验的定义1、心理测验的基本要素:1)对象是行为样本心理测验质量高低的关键是行为样本的代表性,2)测量要标准化原始分数没有意义,只有与其他人的分数,或者与常模相比才有意义。测验内容的标准化:相同或等值施测条件的标准化:情境、指导语、时限评分规则的标准化:不同评分人的评分结果保持最大程度的一致,测验常模(结果解释)的标准化:,常模是一组有代表性的被试群体的平均测验分数被试群体理想上期望达到的程度指标准,实际达到的程度指常模。以常模为参照编制的测验叫常模测验,以标准为参照编制的测验叫标准测验,3)常模常模给测验分数提供一个可比较的参照点,4)客观性:刺激客观;对反应的量化客观;对结果的推论客观难度:能力测验,可保留适当通过率较低的项目应答率:态度、兴趣、性格测验,不能太高/低信度:可靠性,同一测验/等值测验多次测量同一团体所得的结果之间的一致性程度(最基本指标)效度:有效性,一个测验在多大程度上能够测到它所有测量的心理特质(鉴别测验好坏的首要指标),2、测量的三特性(性质)1)、心理测验的间接性通过测量外显行为来推断内隐的心理特质2)、心理测验的相对性没有绝对的标准3)、心理测验的客观性:标准化,第三单元心理测验分类,1)按测量的功能分类一般能力测验:如智力测验、成就测验,性向测验等特殊能力测验:主要用于升学和就业指导、特殊人才的选拔,如音乐能力,绘画能力,机械技能,文书才能等人格测验:测量性格、气质、兴趣、态度、品德、情绪、动机、信念等心理品质,一般有两种测量方法;问卷法和投射法,2)按测验材料分类文字(纸笔)测验:实施方便,团体测验多用;易受被试文化背景的影响非文字(操作)测验优点:不受或少受文化背景的影响(文化公平测验);适用于学期儿童及文盲缺点:局限于个别测验,不经济两类测验常结合使用,如韦氏智测,3)按严谨程度/性质分类客观性测验:呈现刺激和被试任务明确投射性测验:刺激、问题、反应不明:罗夏测验,主题统觉,自由联想,句子完成,(4)按测验的要求分类最高行为测验典型行为测验,5)按测量的对象分类、个别测验优点:观察,获取额外信息;交流,易建合作关系;适用于特殊被试(幼儿、盲人)缺点:费时、复杂、对主试要求高。、团体测验优点:高效,主试不必接受专业训练缺点:易生误差,第四单元错误与正确的测验观,(1)错误的测验观、测验万能论:测验解决一切问题,分数绝对化、测验无用论:A、某些人格测验侵犯了个人隐私、违背民主原则;B、测验为宿命论和种族歧视提供了心理学依据。、测验单一论:心理测验等于智力测验,正确的测验观,、测验是重要心理学研究方法、决策辅助工具:(如,升学指导测验;招聘)、测验作为研究方法和工具尚不完善最大的缺点是理论基础不够坚实,智力的定义,代表性的就有100多种。,(3)、科学地看待心理测验,防止乱用测验:测验使用者必须具备一定的资格;慎重选择合适的测验量表;与被试建立良好的协调关系;正确解释测验结果,实事求是报告测验结果;注意测验的保密;不能一测定终身,综合其他评价指标。,第五单元咨询中常用的三类测验及其应用,智力测验中国比内测验、韦氏量表等。求助者有特殊要求及有可疑智力障碍时用人格测验问卷法:EPQ、16PF、MMPI等投射法:罗夏测验(墨渍测验)、主题统觉测验(TAT)了解求助者人格及是否有精神异常心理评定量表精神病评定量表、症状评定量表等了解心理障碍与否、程度、病情演变,第六单元心理测验发展史,美国心理学家波林说,比纳是智力测量的鼻祖。,与西蒙,1905年研究出第一个真正意义上的智力测验量表比内-西蒙量表,97/101/105、任何测量都应该具备的要素是()(A)量表(B)参照点(C)等级(D)单位57/102、好的测量单位应具备的条件是()(A)确定的大小(B)相同的意义(C)确定的意义(D)相同的价值,CD,BD,08.5一般资料:求助者,女性,32岁,公司职员,大学本科。案例介绍:求助者在一家大型外企从事人力资源管理工作,收入较高。工作得心应手,没有量化的业绩指标压力。丈夫为某高校副教授,有一女儿3岁,健康活泼,家庭幸福。求助者对自己的生活却不满意,常常自问:“难道就这样过一辈子吗?”,但她自己也不知道该追求什么,为此很困惑,主动前来咨询。下面是心理咨询师与求助者的咨询谈话:心理咨询师:欢迎你来咨询,你需要解决哪些心理问题?求助者:今天来就是想请您帮助我弄清我到底哪里出问题了?心:要想弄清你的问题,可以先进行心理测验。求:心理测验?我听说过。但没有做过,您能给我讲讲什么是心理测验吗?,心:心理测验像医院的各种化验一样,它能帮助弄清你的问题求:我能理解,当年我知道自己怀孕就是作了化验。心:对的,心理测验可准了,有什么问题都能测验出来。求:好的,那我都做什么测验呀?心:根据你的情况,我觉得可以做EPQ、SCL-90、WAIS-RC、LES等等。求:真不好意思,我不知道您说的是什么测验。心:这些都是心理测验,你知道不知道没有关系,去做就是求:好吧,做这些需要收钱吗?心:要收钱,不过没有多少钱,你是外企的,不会在意这点钱求:好,我做完后给您看结果。心:不看,我也能估计到你的结果。求:您不看了?能行吗?心:那就看一下吧,你放心,我都做了二十多年的咨询了,通过心理测验一定能搞清你的问题。,单选:22、心理咨询师说:“它能帮助弄清你的问题”表明其对心理测验的理解是()A)夸大其作用B)心理测验有助于诊断C)缩小其作用D)心理测验无助于诊断,B,单选:23、心理咨询师说:“有什么问题都能测验出来”表明其对心理测验的理解是()。(A)夸大其作用(B)正确理解(C)缩小其作用(D)错误理解,A,多选:24、心理咨询师推荐的几种心理测验表明其()。(A)选择测验准确(B)合理使用测验(C)盲目选择测验(D)滥用心理测验,CD,多选:25、对该求助者有针对性的心理测验是()。(A)EPQ(B)SCL-90(C)LES(D)WAIS-RC,AB,多选:26、对求助者进行心理测验()。(A)应征得求助者同意(B)应说明测验的意义(C)无需求助者同意(D)须使用多种测验,AB,多选:29、“通过心理测验一定能搞清你的问题”,这句话表明该心理咨询师()。(A)相信测验结果(B)未考虑其他方法的一致性(C)夸大测验结果(D)已考虑其他方法的一致性,BC,第二节常模,一、常模团体1、性质1)是具有共同特征的人所组成的一个群体,或者该群体的一个样本。用一个标准的、规范的分数表示,以提供比较的基础。一个测验可能有多个常模团体WAIS-RC:分城乡、年龄共16个常模团体MMPI:分男、女性别两个常模团体EPQ(成人):分性别、分年龄12个常模团体,2)常模团体选择的一般程序确定一般总体:准备评价的对象群体确定目标总体:准备采样的范围人群确定样本:根据总体性质(如性别、年龄、文化程度等)确定的、有代表性的样本,总体集合,个体数据a,样本集合A,3)常模团体对于使用者的意义要考虑的问题是,现有的常模团体哪一个最合适。一般选与准备测评的对象的性质最新近似那个常模。标准化测验中,通常提供许多原始分数与各种常模团体的比较转换表,被试者的分数必须与合适的常模比较。,2、常模团体的条件,1)群体的构成必须明确界定2)常模团体必须是所测群体的代表性样本,3)样本的大小要适当因为抽样误差与样本大小成反比,理论上样本越大越好,但也要考虑具体条件的允许。总体数目小,全部作为样本。总体数目较大,样本也要大,30100人。全国常模2000-3000人。样本大小适当的关键是样本要有代表性。4)标准化样组是一定时空的产物:就近性、定期更新,标准参照测验:参考是标准,如咨询师认证考试60分是及格的标准。常模参照测验:标准是常模(标准化样组的平均数)。16PF中A因素得标准分8分,和标准十比,因为这是根据一组具有同样特征的人(标准化样组)的分算出的平均数为5,标准差为1.5的分数,8为高分。和100,60比显然不行。,3、常模的取样方法:按照规定的方法和一定的比例,从欲研究的全部样品中抽取一部分样品单位。基本要求是要保证所抽取的样品单位对全部样品具有充分的代表性。抽样的目的是从被抽取样品单位的分析、研究结果来估计和推断全部样品特性,1)简单随机抽样:利用随机号码表抽样、抽签2)系统抽样/等距抽样:系统抽样的关键是计算组距条件:目标总体无序可排,也无等级结构存在。,组距K=N/n,总体为N,抽取n个样本,如4000人中抽取200人做样本则K=4000/20020,每隔20位抽1个,即抽取总数的1/20,3)分组抽样当总体数目较大,无法进行编号,而群体又具多样性时采样先将群体进行分组,再在组内随机抽样。一般行政区域分组,4)分层抽样:最常用将目标总体按照某种变量(年龄、职业或文化程度)分成若干层次,从各个层次中随机抽取若干人,最后把各个层次的被试组合成常模样本。避免简单随即抽样中样本集中于某种特征或缺少某种特性的现象,使各层次差异显著,同一层次保持一致。如虽在儿童学业能力倾向测验中作业成绩没有性别差异,但男女各半比男3/4、女1/4的性别组成常模更能反映总体的性别分布,4、常模分数:常模分数:施测常模样本被测后,将被试者的原始分数按照一定的规则转换出来的导出分数。原始分数:被试的反应与标准答案相比较而得到的测验分数叫原始分。导出分数:由原始分数构成的分布转换而来的分数叫导出分数。导出分数有意义,具有参照点和单位,与原始分数等值,可以进行比较。,二、常模及其类型1、常模定义:据常模团体的测验分数的总体分布形态,一般用测验分数的平均数和标准差表示,这种常模分数构成的分布即常模。作用:用于比较和解释测验结果时的参照分数标准,具有参照点和单位常模分为:一般常模特殊常模:小团体建立的常模。,2、常模的类型,1)发展常模/年龄量表许多心理特质是随时间(年龄)变化而发展的A、发展顺序量表:它告诉人们多大的儿童具备什么能力或行为就表明其发育正常,相应能力或行为早于某年龄出现,说明发育超前,否则即为发育滞后。,最早的一个范例是葛塞尔发展程序表按月份显示儿童在运动水平,适应性,语言,社会性四个方面的大致发展水平。4周控眼,16周头平衡,28周抓握,40周,坐爬,52周站立行走;皮亚杰最著名的工作就是对守恒概念的研究:儿童到5岁质量守恒;6岁重量守恒;7岁容量守恒概念,B、年龄常模以年龄作单位度量智力,将个人的行为与各年龄组的一般儿童比较,在年龄量表上所得分数即代表其智力水平的年龄。智龄/心理年龄(MentalAge,MA)比内-西蒙量表中首先使用。吴天敏修订的比内-西蒙量表中,每个年龄都有6个测题,答对每题则得智龄2个。等于基础年龄与在较高年龄水平的题目上获得的附加月份之和测题按难度排列,某条目在某年龄组中50能通过,该条目就被当成该年龄组的题目。,年龄常模的基本要素:一套能区分不同年龄组的题目(将题目分到不同的年龄组没有统一标准,鲍勃太格、斯滕等提出75%通过率,俄提斯50%通过率为标准)一个由各年龄被试组成的常模团体一个表明答对哪些题或得多少分该归入哪个年龄的对照表(常模表),C、年级当量,将个体的测验分数,与各年级学生的平均成绩比较,看相当于哪个年级的水平。教育成就测验中最常用。常用单位为10个月间隔,假设一学年有2个月的假期。年级当量5.0表示五年级的初始水平,5.5表示五年级中期的平均成绩常模样本中6年级的算术平均分为35,某儿童在算术测验中也得35分,那么就有该儿童的算术是6年级水平,A、百分等级指在常模样本中低于这个分数的人数百分比;指出个体在常模团体中所处的位置。计算:未分组资料PR=100-(100R-50)NR原始分排列的顺序数,N样本总数举例:小东在30名同学中语文成绩是80分,排列第5名,其百分等级多少?PR=100-(1005-50)30=85分组资料的百分等级求法,意义与未分组一样,2)百分位常模,B、四分位数和十分位数四分位数、十分位数是百分等级的变式百分位数:将量表分成100等份,百分等级是计算低于某测验分数的人数百分比,而百分位数则是计算处于某一百分比例的人对应的测验分数是多少四分位数:将量表分4等份,125、2650、5175和76100四段。十分位数:将量表分成10份,110为第一段,91100为第十段。,标准分是将原始分数与平均数的距离以标准差为单位表示出来的量表标准分的基本单位是标准差常见的标准分数有z分数、Z分数、T分数、标准九分数、离差智商(IQ)等,3)标准分常模,常见的标准分形式A线性转换基本形式(一般Z分),常用标准分(Z分一般转换形式):Z分数=A+BzA量表平均数,B量表标准差,z基本形式的z分韦氏智力量表智商的平均值为100,标准差为15。某人的FIQ高于常模1个标准差,问其全量表分应为多少?100+151=115(IQ),B非线性转换:当原始分数不是常态化,可以通过非线性转换使之常态化。主要是将原始分数转化为百分等级,再将百分等级转化为常态分布上相应的离均值,并可以表示为任何平均数和标准差,T分数:麦克尔1939提出,T分数目前表示任何常态化和非常态化的转换标准系统,量表分平均值固定为50,标准差固定为10T=50+10(XM)/SD或T=50+10z标准九分:平均值为5、标准差为2。标准9分=5+2(XM)/SD或标准9分=5+2z标准十分:平均数为5.5,标准差为1.5标准二十分:平均数为10,标准差为3,4)智商的计算及其意义,A比率智商比率IQ=MA(心理年龄)/CA(实足年龄)100表示儿童智力发展速率或聪明程度不足:个体智力的增长与年龄的关系并非一直呈直线关系,因此不适合于成人。如4岁小孩智力迟滞1年相当于12岁的小孩迟滞3年;3-4岁间的智力增长相当于9-12的增长,B离差智商,个体在年龄组中的位置,是表示智力高低的理想指标韦克斯勒智力量表的标准差定在15IQ=100+15(XM)/SD或IQ=100+15z斯坦福-比内量表的标准差定在16IQ=100+16(XM)/SD或IQ=100+16z优点:同样的智商分数在任何年龄水平上都代表同样的相对位置,从不同测验获得的离差智商只有当标准差相同或接近时才可以比较,标准差不同,其分数的意义便不同。通常用测验值加减5(85%-90%的可信限水平)的方法判断IQ值的波动范围。比平均数高2个标准差:95%;高一个标准差:84%。,三、常模分数的表示方法1、转换表法最简单而且最基本的表示常模的方法就是转换表/常模表。测验的使用者利用转换表可将原始分数转换为与其对应的导出分数,从而对测验的分数作出有意义的解释2、剖面图剖面图是将测验分数的转换关系用图形表示出来.从剖面图上可以很直观地看出被试在各个分测验上的表现及其相对的位置,50/54/56/62、常模样本量的大小,一般最低不小于()(A)100或500(B)800或1000(C)20或25(D)30或10051/51/54/55/57、样本大小适当的关键是样本要有()(A)代表性(B)特殊性(C)相关性(D)可比性,D,A,34/56/57/58/71、以50为平均数、以10为标准差表示的标准分数叫()(A)标准九分数(B)T分数(C)离差智商(D)Z分数55、标准九分是以5为平均数,以()为标准差的量表。(A)2(B)3(C)5(D)7,B,A,第三节信度,抽样误差来源:A、系统性误差:一般由测量工具本身造成,影响效度B、偶然性误差:一般是由测量过程造成的,如测量情境、测量条件等,影响信度,一、信度含义指同一被试在不同时间内用同一测验(等值测验)重复测量所得结果的一致程度。信度反应的是随机误差的影响。,二、信度的指标,(一)信度系数与信度指数信度指数是真分数标准差与实得分数标准差的比值信度系数rxx=rXT2=ST2SX2信度指数rXT=STSX信度指数的平方就是信度系数,(二)测量标准误,标准误:测量误差分布的标准差SE=Sx1-rxxSx所得分数的标准差,rxx测验信度系数,标准误与信度之间有互为消长:信度越高,标准误越小,信度越低,标准误越大,76、在不同时间内用同一测验重复测量同一被试者,所得结果的一致程度称为()(A)信度(B)效度(C)难度(D)区分度,55/59/61信度只受()的影响(A)系统误差(B)随机误差(C)恒定效应(D)概化作用,A,B,三、信度评估的方法,1、重测信度又称稳定性系数,主要用于评价时间误差使用同一测验,在相同条件下对同一组被试者前后施测两次测验,求两次得分间的相关系数测验时距2-4周,最好不超过6个月。,2、复本信度,又称等值性系数,以两等值测验来测量同一群体得分的相关,用于评价两个测验内容/题目形式的一致性。如果两个复本施测相隔一段时间,则称:重测复本信度或稳定与等值系数。,3、内部一致性信度1)分半信度(split-halfreliability)评价同一测验内部条目抽样的误差方法:将测验条目按单双号(奇、偶数)分为两组,计算出两组得分的相关。等同于等值性系数,斯皮尔曼-布朗公式:,,rhh是一半分数的相关系数。,2)同质性信度代表测验内部所有题目间的一致性,库-理公式,克伦巴赫系数,4、评分者信度评价不同评分者之间的一致性方法:随机抽若干份测验卷,有两位或多位评分者按标准评分,计算每两个评分者对同一被试答卷所评分数之间的相关(积差相关/等级相关/肯德尔和谐系数)一般要求评分者之间一致性达0.9以上,35/53/61、以再测法或复本法求信度,两次测验相隔时间越短,其信度系数越()(A)大(B)低(C)小(D)不确定,A,.53/54/56/57/77,同质性信度主要代表测验内部()间的一致性(A)两半测验(B)所有题目(C)题目与分测验(D)分测验,B,四、信度与测验分数的解释,1、解释真实分数与实得(测验)分数的关系解释总方差中有多少比例由真分数决定。当rxx=0.9,即实得分数中有90的变异是真分数造成。,能力与成就测验0.90以上;人格、兴趣、态度等应在0.80以上;教师自编学绩测验:0.60,2、确定各种信度的可接受水平一般原则:rxx0.85,用来鉴别/预测个人成绩/作为0.70rxx0.85,用于团体评价,不用作个人评价rxx0.7,不用作个人评价/预测,且不作团体比较另一原则:新编的测验信度应高于原有的同类测验或相似测验,具体测验的信度要求因测验类型而异,信度越高,标准误越小;信度越低,标准误越大。,3、解释个人分数的意义测量标准误(SE)即测量误差分布的标准差,用来表示误差的大小公式:SE=Sx1rxxSx分数标准差,rxx测验信度,4、比较不同测验分数的差异测量标准误在评价两个不同测验分数的差异是否具有统计学意义上的显著性时非常重要这种比较可以是两个人的分数是否存在差别,也可以是同一被试的两个测验分数差异分数的标准误:SEd=S2-rxx-ryyS两个相同尺度标准分之标准差,某被试WASI-RC中言语IQ102,操作IQ110,M100,S15。言语、操作测验分半信度分别为0.87、0.88。问:操作IQ是否显著高于言语IQ?SEd=152-0.87-0.88=7.5再乘以1.96=14.7被试的差异分数110-102=8是不显著的(韦氏测验两半差异高于15分),四、影响信度的因素,1、样本特征:1)样本团体异质性的影响:异质,高估;同质低估。2)样本团体平均能力水平的影响:对于不同水平的团体,题目具有不同的难度,每个题目在难度上的微小差异累计起来便会影响信度。年幼和能力水平低者,信度值较低。,2、测验的长度,K:改变后的长度和原长度之比,rxx,原来信度,rkk:新的信度,测验越长,内容取样越有代表性;测验越长,猜测因素影响越小;报酬递减原则,过长得不偿失。,3、测验的难度太难或太易,分数范围缩小信度降低理论上说,只有测验难度为50%时,才能使测验分数分布范围最大,求得的信度也最高。事实上,难度为0.50只适于简答题。选择题因猜测,难度值应提高,洛德提出各类选择题的理想平均难度为:五择一测0.70;四择一测0.74;三择一测0.77;是非题0.854、时间间隔间隔越短,信度系数越大;越长越低,55/59,若取样团体较为异质的话,一般会()测验的信度(A)高估(B)低估(C)提升(D)降低,34/54/53/77、如果其他条件相同,样本团体越同质,分数分布范围越小,测验效度就越()。(A)高(B)低(C)大(D)接近1,A,B,第四节效度,一、效度的概念,1、理论定义:指测验的准确性、有效性2、操作定义:总变异中所测量的特质造成的有效变异与实测变异数(S实2)的比率实测分数Sx=真分数St+误差(随机)Se,与目的有关Sco,即有效变异,与目的无关(系统)Ssp,57/58/60、在心理测验中,效度是指一个心理测验的()。(A)稳定性(B)准确性(C)可信度(D)区分性,B,54、在测验理论中,效度被定义为在一组测量中,与测量目标有关的真实方差与()的比率。(A)系统误差(B)误差(C)随机误差(D)总分差,D,二、效度的性质,(一)效度具有相对性评价测验效度时,必须考虑其目的与功能(二)效度具有连续性效度只是程度上不同,没有“全”或“无”的区别评价一个测验,不应该说“有效”或“无效”,而应该用效度较高或较低来评价测验有效性是针对测验结果而言,102/106/105/107、效度具有相对性,因此在评鉴测验的效度时,必须考虑测验的()。(A)信度(B)目的(C)功能(D)长度,BC,二、效度评估的方法,1、内容效度1)定义指测验条目对有关内容或行为取样的适用性,与表面效度(2004首都师大考名词解释)的关系:表面效度影响被试动机、情绪、反应方式,及主试与被试的关系,从而影响内容效度。表面效度好,可使被试尽力完成,提高效度;也可虚假反应,降低效度。最佳行为测验往往表面效度高,其他测验则希望表面效度低。职业兴趣测验、成就测验应重视表面效度,人格测验的表面效度不宜高,避免被试反应偏差,如掩饰等。,2、内容效度的评估方法1)专家判断法/逻辑效度,避免评分者误差,客观化的几个步骤:、定义好测验内容的总体范围,描述有关的知识与技能及所用材料的来源;、编制双向细目表,确定内容和技能各自所占的比例,并由测验编制者确定各题所测的是何种内容与技能。、制定评定量表来测量测验的整个效度,如测验包括的内容、技能、材料的重要程度、题目对内容的适用性等。由各位评判者在评定量表上做出判断,总估获得测验内容效度的证据。,2)统计分析法评分者信度、克伦巴赫法、再测法3)经验推测法通过实践来检验,如检验儿童发展量表的效度,观察不同年龄阶段儿童通过率是否随年龄的增长而增加,103/105/119、内容效度的评估方法有()(A)专家判断法(B)双向细目表法(C)统计分析法(D)经验推测法,ACD,55、内容效度有时又称()。A)构想效度B)效标效度C)区分效度D)逻辑效度,D,2、构想效度/结构效度1)定义指测验能够测量理论上的构想或特质的程度2)估计方法A、对测验本身的分析,构思效度的证据:测验的内容效度;测验的内部一致性指标;被试者对题目的反应特点;,B、测验间的相互比较相关法(相容效度)、区分效度、因素分析法。与经典、成熟同类测验比较:二者相关系数的平方即两测验分数共同解释的变异大小,称相容效度区分效度:有效的测验与其他测量同一构思的测验成绩有相关,还与测量不同构思的测验成绩无相关C、用效标效度做证明D、实验法和观察法,106/106、可以作为构思效度证据的包括()A、测验的内容效度B、测验的内部一致性指标C、分析几个测验间的相互关系D、分析受测者对题目的反应特点,ABD,3、效标效度/实证效度1)定义:反映预测个体在某种情景下行为表现的有效性程度被预测的行为是检验效度的标准,简称效标,2、效标效度的评估方法,1)相关法:最常用,积差相关法,点二列相关,二列相关,2)区分法:两组分布的交叉越多,说明差异越小,效度越差,3)命中率法:当测验作为取舍的依据时,用其正确决定的比例作为效度指标额一种方法。,41/105、命中率法是当测验用来做取舍的依据时,用其正确决定的比例作为效度指标的一种方法。命中的情况是指()(A)预测成功而且实际也成功(B)预测成功但实际上失败(C)预测失败而事实上成功(D)预测失败且实际上也失败,64/57、检验测验分数能否有效地划分由效标所定义的团体的一种方法是()考试就到考试大(A)相关法(B)区分法(C)命中率法(D)失误法,AD,B,三、效度的功能,1、预测误差效度系数的实际意义常以决定系数r2xy表示,即相关系数的平方,它表示测验正确预测或解释的效标的方差占总方差的比例。如:高考英语成绩与入大学后第1学年英语课考试成绩的相关为0.8,正确预测的比例是64%。,2、预测校标分数,y是预测的校标分数a截距byx是斜率x是测验分数,40/55、式中是()。(A)预测的效标分数(B)纵轴的截距(C)斜率(D)测验分数,A,四、影响效度的因素,1、测验本身的因素:取材的代表性、测验长度、试题类型、难度、区分度以及编排方式等测验较高效度须:材料须有代表性题目尽量避免高误差题型(是非题)题目难度适中,具有较高的区分度测验长度恰当排列先易后难,2、测验实施中的干扰因素1)主试:非标准化做法2)被试:兴趣、动机、情绪、态度和健康状况等3、样本团体的性质1)异质性:越异质分数分布范围大效度越高A、只以选拔上的被试效度降低B、选拔标准太高效度降低,53/77,如果其他条件相同,样本团体越同质,分数分布范围越小,测验效度就越()(A)高(B)低(C)大(D)接近1,B,64、MMPI是采用()编制的客观化测验(A)因素分析法(B)总加评定法(C)经验效标法(D)理论推演法,C,第五节项目分析,定性分析:内容效度,题目编写的恰当性和有效性等定量分析:是指对题目难度和区分度等进行分析,分类,一、难度,1、定义:项目的难易程度,用P代表。,在非能力测验(如人格测验)中,反映难度水平的指标称通俗性。,2、难度的计算方法,(1)二分法记分的项目通过记1分,错误记0分,P代表项目的难度N为全体被试者人数R为答对或通过该项目的人数,当被试人数较多时,可根据测验总成绩将被试分成三组,高分组(NH):分数最高的27%被试低分组(NL):分数最低的27%被试中间组:分数中间的46%被试,P代表难度PH高分组通过率PL低分组通过率,(2)非二分法记分的项目,当测验项目为问答题或不能用二分法记分,常常又需对部分正确的反应给一定分数。,X为全体被试者在该题上的平均分Xmax为该题的满分,3、难度水平的确定,(1)项目的难度难度取决于测验的目的、性质、形式P值越接近于0或接近于1,越无法区分被试者之间能力的差异P值越接近于0.50,区别力越高,4、注意事项,1)测验用于选拔或诊断,应较多选择难度值接近录取率的项目,2)对于选择题:一般P值概率水平是非题:P值=0.75最合适四选一题目:P值=0.63最合适P值=概率水平:题目可能过难或题意不清,被试凭猜测回答P值概率水平:无意义,说明题目质量有问题,3)为了使测验具有更大的鉴别力,应选择难度在0.50左右的试题比较合适。每道题都是0.5,一方面不太可能做到,一方面,题目间的相关会很高。一般,把测验的平均难度控制在0.5,而每道题可在0.3-0.7中波动,二、区分度/鉴别指数1、鉴别指数1)按测验总分高低排列答卷;2)确定高分组与低分组,每一组取答卷总数的27%3)分别计算高分组与低分组在该项目上的通过率或得分率,4)鉴别力指数计算方法:D=PHPL,区分度的取值范围-1.00-+1.00。D正值为积极区分,值越大效果越好。为负值为消极区分,被试实际能力越高,得分反而越低该项目应该淘汰0为无区分。,伊贝尔(L.Ebel)项目鉴别指数与评价标准0.40以上-很好0.30-0.39-良好,修改后会更佳0.20-0.29-尚可,但须修改0.19及以下-差,必须淘汰,三、区分度与难度之间有密切关系,项目的通过率为1.00或0,则说明高分组与低分组在通过率上不存在差异,鉴别指数D为0。项目的通过率为0.50,则可能高分组的所有人都通过了,而低分组却无人通过,这样D的最大值可能达到1.00。,项目难度与区分度的关系图,一般,较难的项目对高水平的被试者区分度高,较易的项目对水平低的被试者区分度高。项目难度的分布以常态分布为好,即特别难与特别易的项目少些,接近中等难度的项目多些,而所有项目的平均难度为0.50,这样不仅能保证多数项目具有较高的区分度,而且可以保证整个测验对被试具有较高的区分能力。,53/60/60、在非能力测验(如人格测验)中,反映难度水平的指标称()。(A)流畅性(B)灵活性(C)通俗性(D)相似性55/58、难度是指项目的难易程度,用P代表。P值越(),难度越低。(A)大(B)小(C)低(D)接近0,A,C,第六节测验的编制(一级),1、测验的用途:显示性测验:表明被试具有什么能力、能完成什么任务。智力测验预测性测
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 农村竞价出售房屋合同5篇
- 内部审计考试题库及答案
- 护士中心血站考试题库及答案
- 专业知识电工考试题库及答案
- 驻校教官考试题库及答案
- 医师服务考试题库及答案
- 特教教师考试题库及答案
- 个人借款合同版
- 合规经营合同履行保障声明书(9篇)
- 兴业银行考试题库及答案
- 服装款式图模板谭敏31课件
- GB/T 45860.2-2025光纤激光束焊机的验收试验第2部分:光纤输送机的移动机构
- 《模拟电子技术(第三版)》全套教学课件
- 医院药品不良反应培训
- 子宫破裂护理常规课件
- 镇痛类药物应用与管理规范
- (2025年)国家能源集团笔试试题(+答案)
- DB34∕T 4010-2021 水利工程外观质量评定规程
- 精神专科护士工作汇报
- 客户设备大修方案(3篇)
- 大宗商品交易管理办法
评论
0/150
提交评论