




已阅读5页,还剩19页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
心理测量学 王淑敏目的:1.了解心理测量的基本概念2.掌握心理测验的形成过程,并能编制简单问卷3.了解目前常用的心理测验,并知道如何使用看一个量表(测验)需要了解测量目的适用年龄测验内容信、效度资料、常模课程内容一、心理测量学概述二、测验编制中的项目分析 难度、区分度概念及如何选择三、信度四、效度五、测验分数转化和常模怎样解释一个测验分数六、心理测验的编制和使用重点介绍如何选择一个合适的量表,如何正确解释测验 分数及如何表述 自陈量表七、人格测验回顾人格理论,常用2种人格测验 投射测验 自陈量表:明尼苏达多项人格量表、艾森克人格问卷 投射测验:TAT、墨迹图、自画像、屋树人投射测验 一对一测验八、智力测验 团体智力测验九、职业测验主要参考书1.张厚粲等 心理和教育统计 北京师范大学出版社2.L.克罗克、J.阿尔吉纳 经典与现代测验理论导论 华东师范大学出版社3.郑日昌等 心理测量学 人民教育出版社4.金瑜 心理测量 华东师范大学出版社5.陈国鹏 心理测验与常用量表 上海科学普及出版社6.吴明隆 spss统计应用实务 中国铁道出版社7.张厚粲等译 心理测量与评估 北京师范大学出版社8. 心理测验:原理和应用 上海社会科学院出版社(译本)第一章 心理测量概述第一节 测量概述将人的特定属性变成特定数字,这是测量的关键点一、界定 Stevens(1946):测量是根据一定法则给客体或事物指派数字。Lord、Novick及Torgerson(1968/1958):测量指的是客体的属性而非客体本身。测量:就是依据一定法则使用量具对客体的属性进行定量描述的过程。二、测量的要素1. 参照点 ?绝对参照点:以绝对零点作为测量的起点,如长度测量 ?相对参照点:以人为确定的零点为测量的起点。如考试成绩。只能表示差异的大小,不能表示倍数的关系2. 单位:不同测量使用单位也不同理想的测量单位必须符合两个条件:有确定的意义 要有相等的价值三、测量的四种水平量表:能够使事物的特征数量化的数字连续体(有确定单位和测量参照点)事物特征 数字连续体 数字特征Stevens 分类:精确度水平由低到高量表水平特点要素使用统计方法命名量表区分性无参照点和单位百分比、频数、众数、2检验等顺序量表区分性、等级性、顺序性无参照点和单位中位数、百分位数、等级相关系数、肯德尔和谐系数等等距量表区分性、等级性、等距性相对零点和相等单位平均数、标准差、积差相关系数、以及T检验、F检验比率量表区分性、等级性等距性、比率性相等单位和绝对零点所用统计方法心理测验属于顺序量表 将顺序量表转化为等距量表(原始分数即实际分转化为标准分)第二节 心理测验和心理测量一、心理测量1. 定义:通过观察人的少数有代表性的行为,对反映在人的行为活动中的心理特征,依确定的法则进行推论和量化分析的一种科学手段。2. 特点:间接性 心理特质(征)行为行为样本测量 个体所特有的、具有稳定性、可区别(辨别)性相对性 顺序量表,没有参照点和单位 (1)只有相对参考点,没有绝对参考点客观性 依赖于测验的四种标准化:测验内容、情境、结果解释、评分标准(测验内容无差标准化、测验情境对所有被试几乎一致、记评分标准一致、测量结果解释标准化)3心理测量的最基本假设个体差异个体差异意味着人的心理属性差异可区分、测量,在一段时间内相对稳定一个量表仅能测量人的某方面心理特征二、 心理测验(理解)1界定权威心理学家的界定界定需包含要素行为样本(一个测验就是一个行为样本) A.选择具有代表性的行为 B.每道题代表所要测量的心理特质的一个典型性行为C.行为样本的代表性决定了一个测验水平的高低标准化 样本在标准化环境下获得、保证测验客观性的最重要特征计分原则 (易懂、界定清晰、理解时无歧义)其他要素:信度、效度、难度、应答率三、心理测验的功能1. 从实际应用角度看:选拔人才、岗位安置、诊断、评价、辅助咨询2. 从理论研究角度看:搜集资料、提出和验证假设、实验分组3. 测验是重要的心理学研究方法之一,是决策的辅助工具四、心理测验的种类(了解)按测验的功能能力测验ability:目前所具有的“所能为者”aptitude:可能获得的“可能为者”学绩测验人格测验按测验方式分:个别测验团体测验按测验材料分文字测验 处在所处文化中,脱离不了文化背景的影响非文字测验按测验目的分描述性测验 (现在)诊断性测验 (临床)预测性测验 (未来)按测验的难度和时限分速度测验 难度测验按测验要求分最高行为测验典型行为测验按测验应用分教育测验职业测验临床诊断第三节 心理测量和测验的发展简史一、中国心理测量发展史(一)中国古代的心理测量思想和技术1.理论方面孔子:“差异和分类”的思想 性相近,习相远孟子:指出了心理现象进行测量的必要和可能 权,然后知轻重;度,然后知长短。物皆然,心为甚刘劭:人物志“观其感变、以审常度”2.实践方面?注意力分配测验:“左手画方,右手画圆 西方的注意力分配实验?婴儿发展测验:“周岁试儿”或“抓周”?人事测评:科举取仕制度 言语、非言语 操作、非操作测验?创造力测验:七巧板和九连环 七巧板需要个体有很强的发散性思维 刘再安中国人用的非文字测验 迷津实验 操作简单、实施方便特点:多是描述性的分类式的、多是分成若干类型或层次注重对人做整体性的鉴定和评价,并倾向于和人的道德品质联系起来具有较强的应用倾向,多与教育中的因材施教、人才选拔和使用有着密切联系(二)中国近代心理测量和测验的产生和发展(了解)为当时教育改革提供了依据,对全国儿童心理发展进行了大规模调查1.清末心理学由西方传入我国2.1916年樊炳清对比奈西蒙智力量表的引入和评述,首次正式系统介绍了西方测验3.1920年建立心理学实验4.1921年廖世承和陈鹤勤出版智力测验法一书(我国第一本心理测验书)5.1922年比奈量表由费培杰译成中文6.1923年进行了全国大规模教育调查7.1924年,陆志伟先生发表了订正比奈西蒙智力测验说明书后与吴天敏再次做了修订8.1931年中国测验学会成立(三)心理测验在科学的春天中复苏 ?停止发展时期 ?重新蓬勃发展时期(1979年开始)1980年北师大开心理测量课二.西方心理测量和测验的产生和发展(一)现代心理测量的起源1.社会需求工业发展需要(比内量表:区分智力低下儿童)精神病院需要 社会上给予人性照顾 明尼苏达多项人格测验职业指导需要 帮助选择职业;在哪一领域发展潜力更大2. 个体差异的研究 19世纪末心理物理学发展是最直接的推动因素3. 实验心理学的诞生1879年,德国心理学家冯特在莱比锡大学建立了世界上第一个心理学实验室(按照严格的步骤实验、分析结果等 即标准化程序 例子:迷津实验 3种不同的指导语 需要严格控制条件)(二)心理测量和测验的早期尝试者高尔顿 英国生理心理学家 优生遗传学创始人1869年出版遗传的天才针对个别差异,人的能力是遗传而来的,人的能力是正态分布的、有差异的,而这种能力是可以测量的1884年设立了人类测量实验室(伦敦)积累了有关简单心理现象的个别差异的大量系统资料1893年出版人类才能及其发展研究首次提出心理测量和测验术语发明了许多测量仪器从事大量测量活动将统计方法应用于心理测验数据资料的分析卡特尔 美国,师从于冯特,将实验心理学应用于测量学中在自己的实验室里编制测验50个测量肌肉运动、反应时、记忆力等1890年发表心理测验与测量一文,描述了这些测验,并首创了“心理测验”这个术语。提到常模这个词,强调测量的标准化问题比奈 心理测验的鼻祖1886年发表第一部著作推理心理学1889年与亨利?博尼建立第一所法国心理学实验室1895年创办第一份法国心理学杂志心理学年报1898年比奈在哲学杂志上发表人格心理学中的测量一文心理测量的基本原理:将个人与他人进行比较某方面的特质有何差异1903年出版智力的实验研究1905年与助手西蒙发表诊断异常儿童智力的新方法一文,介绍了世界上第一个科学的智力测验比奈-西蒙量表总评:著名美国心理学家波林指出,在测验领域中“19世纪80年代是高尔顿的10年,90年代是卡特尔的10年,20世纪头十年是比奈的10年”(三)心理测量和测验的发展1.智力测验标准化程度迅速提高瑞文 韦氏智力测验2.普通智力测验发展到特殊智力测验西沙尔(1915) 音乐能力测验最早的特殊能力测验3.人格测验的产生和发展1917 沃德沃斯个人资料调查表、第一个自陈人格量表 关于情绪适应4.从个别测验向团体测验发展“陆军甲种测验(文字测验)”和“陆军乙种测验(非文字测验)”为第一个团体智力测验5.教育测验的产生:鼻祖 桑代克小结:西方心理测量发展历史1.先是以解剖生理特征为根据,而后转向对心智活动的测量2.由测量最简单的感知能力,发展到测量复杂的认知能力3.由笼统的单一量数以评定个别间差异的观念,转变为以多个量表数兼顾个别差异与个别内差异的观念4.心理测量学是随着实验心理学的发展而产生的,二者在发展过程中由合到分,最后又走到一起来了。第二章 项目分析补充:测量与统计:变异、相关、预测、因素分析变异: x 平均数 团体平均水平 ,但不能反映出个体与个体之间的差异 (x-x ) 离差,个体水平与平均水平的差异 (x-x )2/N 方差:个体水平与平均水平的差异程度标准差Z分数 大方差说明团体在这个测验的分差异比较大 标准差:在测量上作为一个单位使用,获得Z分数 (被试在总体中的相对位置可以转化为百分数)相关 两种心理特质之间的相关程度预测:回归分析 选拔人才因素分析:解释相关引言(一)项目分析就是对组成测验的每个测题进行分析质的分析指的是内容效度分析,分析项目的内容和形式量的分析则采用统计方法来分析项目的质量(二)测验项目的关键特征检验项目需回答的问题:它所测量的属性与其他项目测量的属性是否一致。难度测量:有多少人能正确回答这个项目鉴别力测量:测验中被试对这个项目的反应和另一个项目的反应相关吗?迷惑项测量:每个选项上有多少人选择?重点:1.测验项目难度的意义及其计算方法2.测验项目的区分度3.难度和区分度的关系第一节难度分析定义:测验项目的难易程度。一、估计项目难度的方法(一)二值计分项目1.通过率P=R/N P:项目的难度;R:答对该题的人数; N:总人数(注意:P值越大,难度越小)2.极端分组法将被试依照测验总分从低到高排列,分成二组,总分高端取27%被试高分组,总分低端取27%被试低分组分别计算高分组和低分组的通过率求项目难度 计算公式P=(PH+PL)/2=?(RH/NH+RL/NL)注意:当被试人数较少时,则需采用全部被试数据当被试人数较多时,若数据相对集中,则约取33%;若数据相对较分散,则约取25%,即根据情况在25%33%范围内波动。(二) 非二值计分项目计算难度公式:P=x /xmaxx :全体考生在该题上平均分xmax:该题的满分项目难度受机遇影响的矫正(对考生由于猜测而答对)CP=(KP-1)/(K-1) CP:矫正后的难度 P:矫正前的难度 K:项目的个数(K代表“K择一”)CP=0.50时,项目的区分度最大,将其代入上述公式得P=(K+1)/2K二、测验难度水平的确定测验目的和性质 1.测验为了考察被试的差异,则P应接近0.5。 2.测验是出于选拔目的,则P应控制在接近选拔率左右项目形式 若选择P0时,D越大,项目的鉴别力越好二、项目鉴别力的估计方法1.项目鉴别指数法:较适合于二值计分项目当效标分数是连续变量时,可将分数从高到低排列,取两端27%被试,分别最为高分组 低分组 D=PH-PL 式中PH与PL分别为高分组、低分组在该项目上的通过率。2.相关系数指标:项目与总分相关 测验项目与总分区分度很高,说明二者测量性质时一样的相关法:区分度0.2,不能保留 0.2区分度0.4 保留,优秀三、难度与区分度的关系难度越接近0.50,项目潜在的区分度越大,而难度D越接近1.00或0时,项目的潜在区分度越小。项目通过率D的最大值1.000.000.900.200.700.600.600.800.501.000.400.800.300.600.100.200.000.00四、鉴别力的相对性1.不同的计算方法,所得区分值不同注意:在分析同一个测验时,各个项目的区分度值要采用同一种指标,否则不便分析比较2.样本容量大小影响相关法区分度值的大小3.被试样本的同质性程度影响区分度值的大小(必须保证被试之间是有差异的(随机抽取),男女性别数目上也要有差异)4.分组标准影响鉴别指数值(D)第三节 项目分析的实例课本P91第三章 信度重点:1.掌握真分数模型及其假设 2.评估信度方法 3.影响信度的因素 4.提高信度的方法第一节 经典真分数模型和信度一 测量误差(一)测量误差:在测量过程中与测量目的无关的变化因素所产生的一种不准确或不一致的效应。(二)测量误差的种类(1)系统误差:这是由那些与测量目的无关的因素引起的一种恒定而有规律的变化。稳定地存在于每一次测量中,具有跨情境的一致性。系统误差只与效度有关。(2)随机误差:是由那些与测量目的无关的偶然因素引起而又不易控制的误差,它使多次测量产生了不一致的变化。随机误差同时影响信度与效度。(三)测量误差的来源:(1)测验工具(2)被试本身:测验动机 测验焦虑 学习、发展与教育 测验经验 练习效应 反应定势 生理因素(3)施测过程:测试环境、主试者方面、意外干扰、评分二 经典真分数模型(一)真分数的定义真分数(T分数):反映被试某种心理特质真实水平的那个数值观察值(X分数):实际测量到的数值真分数的操作定义:经过无数次测量所得的平均值(二)数学模型及其假设1.CTT基本思想:把任何一个测验成绩看成是真分数和测量误差之和。公式:X=T+E(X:实得分数或观察值 T:假设的真分数 E:随机误差,不包含系统误差)2. 3个相关联的假设公理(书P4243) (1)若一个人的某种心理特质可以用平行的测验反复测量足够多次,则其观察分数的平均值会接近于真分数。即(X)=T 或(E)=0(2)真分数和误差分数之间的相关为零。即(T,E)=0(3)各平行测验上误差分数之间相关为零。即(E1,E2)=0注意:如果两个题目不同的测验测的是同一特质,并且题目形式、数量、难度、区分度以及测查等值团体后所得分数的分布(x 和S)都是一致的,则这两个测验被称作是彼此平行的测验。平均数与标准差越接近,说明两个平行测验的可替换性越高3.信度和真分数模型X=T+E(E=0)T=X对一个团体来说,实得分数,真分数和测量误差之间有如下关系:()(SX)2=(ST)2+(SE)2注意:真变异数由两个部分构成:与测量目的有关的变异((Sv)2)和与测量目的无关的变异(St)2(SX)2=(SI)2+(SE)2+(SV)2信度 rxx=(st)2/(sx)2效度 rxy=(sv)2/(sx)2第二节 信度的估算方法一、信度的定义(理解)(一)理论性定义:稳定性/一致性/可靠性(二)操作性定义:P46需注意的问题信度是指一组测验分数或一列测量的特征,而不是个人分数的特征。真分数的变异数是不可直接测量的,因而信度是一个理论上理想的概念,只能根据一组实得分数作出估计。二、信度系数(一)信度系数和信度指数信度系数:用同一被试样本所得的两组资料的相关。即rxx=(st)2/(sx)2 或rxx =Pxx 信度指数:实得分数与真分数的相关,即PTx = ST / Sx 信度指数的平方就是信度系数。实测分数的变异数中,有多少比例是由真分数的变异可以解释的。(信度系数)r =0.9,实际测量中有90%可以由真分数来解释,有10%可以由测量误差来解释r=1 实际测量中100%都可以由真分数来解释,不存在测量误差r=0时,测量结果完全不可靠,全都是由于测量误差引起的(二)理解信度系数时需注意1.一个测验可能不止一个信度系数。2.信度系数只能是对测量分数不一致程度的估计,并没有指出不一致的原因。3.获得很高的信度系数并不是心理测量追求的最终目的,它只是迈向目标的一步,是为了获得高效度的一个必要条件。(三)信度系数达到多高才可以接受呢? 当rxx 0.7时,测验不能用于对个人作出评价或预测,而且不能做团体间比较。 当rxx 0.7时,可用于团体比较 当rxx 0.85时,才可以用来鉴别或预测个人成绩或作用。三、信度的估计方法(定义、前提条件,注意问题等)注意:这一大部分大家都需要认真复习,主要是从定义、前提条件、误差来源、注意问题等方面复习!画的部分为重点之重点rxx=(St)2/(Sx)2 或rxx =Pxx (一)估计信度的目标:决定测验分数的变异有多少是测量误差引起的,有多少是由真分数引起的。(二)关于估计测验信度的方法:1.第一种观点:运用尽可能平行的测验进行测量2.第二种观点:由测验分数的预期作用来决定(允许一种误差存在)(三)估计方法实施两次测验的方法1.交替测验法:复本信度(等值性系数)定义:两个复本施测同一被试群体,求其相关。前提:建构出两份真正的平行测验,即两个等值测验测量误差:测验内容取样误差数据收集方法:用两个平行测验给同一组被试分别施测。平行测验A最短时间平行测验B计算方法:积差相关法(相关系数越高,越说明两个平行测验的可替换性高)注意事项:报告平行测验等值的证据:报告每个平行测验的平均数、标准差和测量的标准误若等值性系数作为信度估计值的话,这些值必须非常接近。2.重测法:重测信度(稳定性系数)定义:同一量表,同一被试群体,在不同时间,两次施测,求其相关实质:表示测验结果的稳定性,故又称稳定性系数测量误差:时间取样误差,被试个人心理和生理状态的临时变化。前提:所测量的心理特质必须是稳定的; 遗忘和练习的效果基本上是相互抵消; 在两次施测的间隔时间内,被试所要测量的心理特质方面没有获得更多的学习和训练。数据收集方法:对同一组被试施测间隔一段恰当时间再施测注意事项重测信度估计值的最小可接受值重测信度估计大小的关键影响因素:两次测量之间的间隔时间,被试的年龄以及所测特质本身的性质。两次测试之间应该间隔多长时间a.如果选取不同的时间间隔,会产生不同重测信度。b.报告重测信度应该说明间隔时间(1)间隔时间越长,稳定性系数越低,适宜时间间隔依照测验目的、性质及被试特点而定,几分钟至几年。(2)年幼儿童,间隔要小;年长群体,间隔可大;智力测验间隔时间不能太短,成就测验的间隔不能太长。3交替测验重测法(等值稳定性系数)测量误差:同时来自于内容取样、时间取样和随机误差等。数据收集方法:两次施测间隔适当时间方法一:AB(必须有实验间隔)方法二:被试1组:AB;被试2组:BA(两套测验获得的数据为等值性系数)计算方法:积差相关系数单次施测的方法:内部一致性:测验各项目之间的一致性。即同质性:所有的测验项目是否集中反映同一心理特质。检验某一心理学理论的测验一般信度要求高 1 分半法:分半信度定义:在实验没有复本且只能实施一次的情况下,将测验项目分成待对等的两半,根据被试在这两半测验中所得的分数计算相关系数,即得分半信度。误差来源:测验分半而带来的内容取样误差。分半方法:不同的分半法可能会得到不同的信度值。奇偶分半法:奇数项目分成测验1,偶数项目分成测验2难度分半法:按难度水平排序,然后把序号为奇项目测验1.,序号为偶项目测验2随计分半法,内容匹配法 由于分半信度实际上只是半个测验的信度,测验越长,项目越多,两半分数的相关就越高。因此,对长度不同的测验,要用校正公式修正公式:Spearman-Brown 修正公式 rxx=2Phh/(1+Phh) 课本P50注意:该公式的使用要建立在半分测验严格平行的假设之上Flanagan公式:rxx=21(Sa)2+(Sb)2)/(Sx)2Rulon公式:rxx=1(Sd)2/(Sx)2注意:分半信度反应的实际上是两半测验能够测量相同内容或心理特点的程度 2 同质性信度同质性指测验的所有题目测量的是同一种心理特质,表现为各个题目得分之间有较高的相关,相关越高则同质性越强。一般要求各个因素之间是中等相关。当同质性信度不高时,有两种处理方法:中等程度相关,则按分量表的形成相关程度极低时,测验编制有问题因素分析思路(1)系数:计算公式: =K/(K1)1((Si)2)/(Sx)2K:测验项目数 (Sx)2 :测验总分的变异 (Si)2 :所有被试在第i题上分数变异适用条件:二分法记分或记分权重范围较广的项目的内部一致性信度的估计注意:值是测量信度下界的一个估计值,即值大,必有高测量信度;但值小,却不能断定测量信度不高。(2)荷伊特信度1941年,荷伊特提出方差分析为基础,把人和项目当成变异来源,即:人与人的差异、项目之间的差异以及人与项目之间相互作用的差异。信度估计值定义为:rxx=1MSr/MSp MSr:误差方差的估计值 MSp:被试方差估计值 3评分者信度误差来源:评分者之间的差异如果是两个评分者,独立对被试的反应评分,则可以用积差相关来计算,或用斯皮尔曼相关系数来计算。当评分者人数多于两个时,评分者信度可用肯德尔和谐系数进行估计。各种信度系数相应误差变异的来源信度系数类型误差来源再测信度时间取样复本信度(连续施测)内容取样复本信度(间隔施测)时间与内容取样分半信度内容取样同质性信度内容的异质性评分者信度评分者之间的差异四、使用信度系数(解释和使用)测量标准误信度系数为测验分数的精确性提供了一个相对精确的测量。测验标准误:测验分数的精确程度在绝对意义上的测量。测验标准误:SEM=x 置信水平确定后,估计的精确度主要取决于标准误,标准误越小,估计就越精确?信度和效度 低信度会降低测验的基本效度 1.比较两个人的测验结果(个体之间的差异) 遵循原则:两个人在同一测验上得分之差必须大于测量标准误的两倍以上,才被认为是有差异的 2.比较同一个人在不同测验中的分数 遵循原则:同一个人在两个测验上的得分之差必须超过两个测验中较大的测量标准误的两倍,才可以解释为显著差异。第三节 影响信度的因素一、影响测量信度系数的因素1.被试的样本特征2.测验长度:遵循收益递减率3.估计信度使用的方法4.测验的难度 (针对最佳行为测验而言)5.被试的主观因素6.主试因素7.施测标准化程度1.(1)信度是某样本组被试测验分数的一个特征,它随着被试样本的变化而变化。 (2)信度系数多是以相关为基础获得的,两相关变量中任何一变量得分范围变窄,都会使得信度系数降低。 (3)样本团体异质性的影响样本团体平均能力水平的影响:Magusson(1967)提出预测样本方差变化公式,可用下面公式推算出新的信度系数:rnn=1(soo)2(1roo)/(snn)2)值得重视的是这个公式假设两组的误差方差相等2.新rxx=(n*旧rxx)/1+(n-1)旧rxx rxx为原测验的信度 n为改变后的测验长度与原来长度之比 该公式用于预测增长一个测验对该测验信度的影响二、提高信度的方法(简答)1.选取恰当的被试样本2.适当增加测验长度:新增加的项目必须与测验中原有项目同质。3.测试时间控制恰当4.将难度控制在中等水平且接近正态分布5.保证测验标准化,尽可能减少随机因素的影响。第四章 效度本章需要掌握内容:1.什么是效度?2.效度和信度关系3.掌握效度三种类型及其各自确定方法4.影响效度的因素及提高测量效度的方法第一节 效度的概述一、效度的界定(要求掌握操作性定义)(一)传统定义:测验结果的有效性程序,即一个测验对其所要测量的特质准确测量的程度暗含假设:1.一个测验只有一个效度 2.这个效度可以通过单一研究来检验:只需要判断测验测量是否是事先假设的。(二)Cronbach:效度是测验编制者或者使用者收集证据以支持根据测验分数所作出各种推论的过程。1.必须对所要求的推论进行明确的界定2.设计实验性的研究来为这一推论收集测验分数有用性的证据。(三)怎样正确理解效度?1.效度是一个相对概念(1)效度是相对于一定的测验目的而言的(2)效度只有程度上的差异2.效度是测量的随机误差和系统误差的综合反映3.判断一个测验是否有效要从多方面收集证据二、效度的理论1.(SX)2=(ST)2+(SE)22.真变异有两个部分构成:与测量目的有关的变异(SV)2和与测量目的无关的变异(SI)2(SX)2=(SI)2+(SE)2+(SV)23.效度=(SV)2/(SX)2三、信度和效度的关系(SV)2 有效变异数(SI)2(SE)2A 高信度 高效度(SV)2(SI)2(SE)2B 高信度 低效度(SV)2(SI)2(SE)2 随机误差的变异数C 低信度 低效度?信度是效度的必要条件而非充分条件?效度是受信度制约的rc=rxy/ 因为|rc|1 所以(rxy)2rxx*ryy假设作为效标的测验是完全可信的 即ryy=1 那么(rxy)2rxx,因此,一个测验的效度总是受它的信度制约的第二节 效度类型及其确定方法注意:此节内容从3种效度的定义、范围、常用确定方法这几方面复习!内容效度(用测验内容来说明目的) 结构效度(用心理学上某种理论结构来说明目的)实证效度(用工作实效来说明目的)一、内容效度(一)内容效度:一个测验实际测到的内容与所要测量的内容之间的吻合程度(二)评估目的:测验项目是否充分代表了相应的行为范围或特定研究机构(三)一个测验要具备良好内容效度必须满足两个条件:确定好内容范围;保证项目的代表性(四)适用范围:成就测验、职业测验(五)内容效度的确定方法1.专家评判法工作思路:书P62 请有关专家对测验题目与原定内容范围的吻合程度作出判断具体步骤:书P63 (1)明确预测内容范围 (2)选择一组在该内容领域有资格的专家 (3)确定每个项目所测的内容,并与测验编制者所列的结构化框架作比较 (4)收集汇总从匹配过程中得到的数据2.重测法 首次测试 训练或干预 第二次测试3.复本法:两组编制者根据同样的标准编制两组平行测验对同一组被试施测。 依据的理论基础一样,施测条件、评分标准一样。 如果存在共同的误差导致相关高,如果相关低则无法确定哪一个测验出问题(六)注意事项1.所确定的测量目标是否需要权重分配(1)根据测量目标各项目是否同等重要,同等重要则无需权重分配,重要性不等则需权重分配(2)必须进行权重分配(学科测验、能力测验等),更具重要性进行等级排序2.表面效度?当测验要求被试做的事情与被试对测验的理解相关时,则存在表面效度。具有主观性。内容效度则具有客观性。?对于最佳行为测验(智力测验、成绩测验、学科测验),要求表面效度高,希望被试能够从题目中了解测量内容;对于典型行为测验,则要求表面效度低,尽可能测量真实数据。?对表面效度进行适当控制,表面效度影响被试动机、行为等。3.文化与性别对于以英文为母语的国家的被试 测的是数学能力例:数学能力测验以英文形式呈现 对于以非英文为母语国家被试 英文掌握程度影响测验所以应该清除被试必须具备什么特征(包含在被试取样的过程中)二、结构效度(构想效度)(一)含义:一个测验实际测到所要测量的理论结构和特质的程度。或者说它是指测验分数能够说明心理学理论的某种结构或特质的程度心理结构(心理构想):一种用以对某些可以直接观测的行为加以分类和描述的观念例:智力、人格都是心理结构,我们可以对其下一个操作性定义吉尔福特对创造力下的操作性定义:人对一定刺激产生大量的变化的、独创性的反应能力,根据这一理论,他认为创造力测验重点是测量人的思维的流畅性、灵活性和创造性(二)研究特点:书P63-P64结构效度的大小首先取决于事先假定的心理特质理论 比较两个智力测验则需先知道 两个智力测验所依据的理论假设是否一样当实际测量的资料无法证实我们的理论假设时,不一定表明测验结构效度不高,可能有两方面的原因,一是理论假设不成立,二是收集方法不恰当 即被试取样不具有代表性(实验设计不能对该假设做恰当的检验)尽可能多方面搜集证据。主要适用于智力测验、人格测验(三)结构效度的确立步骤 书P64根据所获得资料确定一个理论假设(给专家一个问卷 反馈意见 适当修改理论构想,下操作性定义,被试问卷 回馈),编制量表,选择有代表性的被试测验,获得数据,用spss获得因素分析,得出实证结构,若实证结构与理论构想差别大,则可再预测(1.重新编题2.选被试要质量高、污染小)(四)估计方法方法:P6466测验内方法:从内容效度来推测结构效度被试的反应(提问或让被试写在问卷上)同质性信度(所测量编制的所有题能否都能反应某一心理特质)测验间方法多特质(矩阵分析法) 不同特质 采用相同方法研究 采用不同方法研究 采用相同方法研究信度系数相同特质 采用不同方法研究高 会聚效度系数参加课本P66图表相容效度:相同特质采用不同方法研究(和会聚效度系数一样)不同信度值的特点例:焦虑量表、抑郁量表 受时间误差影响大、重测信度比较低效标关联效度:测验分数能否将两个不同的团体(已经确认)区分开根据测验分数分为高分组和低分组,根据效标判断高分组和低分组能否区分开例:智力测验 在不同的时间点对同一被试采用相同的测试(年龄段差别、无车祸等意外事件)测验理论假设(发展水平)三、效标关联效度:实证效度(一)效标关联效度:测验总分数与外在标准(效标)之间的相关程度,反映的是用测验预测个体在某种实际情境下行为表现的有效性程度。(二)效标的含义(1)效标是检验测验效度的参照标准。(2)阿斯丁把效标分为两个层次:一是观念效标(理论定义),二是效标测量(操作定义水平)(3)效标测量必须能真正反映观念效标(4)良好的效标测量应具备条件:有效性、可靠性、客观性、实用性(增益效度)客观性:避免偏见影响效标测量,特别是以等级评定为效标时。注意:效标污染:个人的效标因评定者知道个体的测验分数而受到影响的情况,让测验评分(评分者)和效标评定(评定者)严格分离?增益效度 将某一测验工具进行预测或决策时,考虑是否经济、有用?一个很好的效标应该具有很好的增益效度(三)常用的效标:学业成就、临床诊断、实际工作表现、特殊训练成绩、等级评定、先前有效的测验临床诊断:要求比较严格、投入精力、时间多,要求专业人士作出测评结果实际工作表现:职业测验、能力测验特殊训练成绩:能力倾向测验、人才选拔等级评定:获得学业成就或工作评价的一种方法注意:效标选择效标:直接效标(容易测量、但不一定唯一标准)、中介效标和最终效标(相关性最大、花费时间长)?效标关联效度研究的两难问题:当效标测量变得容易获得时,它的重要性及其与最终效标的接近程度也就降低了。?效标选择使必须权衡:该效标能在研究时间和经费范围内可靠地被测量到;该效标与大多数测量使用者的最终效标相关(四)研究的一般步骤确定观念效标及其测量方法;选取适当被试样本;施测测量记录每个被试的测验的分数效标测量效标分数(避免效标污染)确定效标分数和测验分数之间的相关程度(获得效度系数)?注意:样本容量多大合适?SCHmidt、 Hunter 和 Uny 主张,至少90%的机会精确反映总体的效度水平需要有规模为200或更大的样本。?范围限制:测验分数范围小,方差变小,效度系数降低(二)效标关联效度类型同时效度:指的是测验分数与差不多同时施测的效标测量间的相关(指向当前)预测效度:效标是经过一段时间以后才获得的,预测效度反映的是从测验分数预测将来某个情境或时间被试行为表现的程度。(指向未来)区别:测验目的:前者多用于诊断被试现在的状态,后者多用于预测被试将来的情况。 测验时间:前者是测验实施和效标测量同时进行,后者是测验实施后间隔一段时间后再收集效标测量资料(三)确定方法 书P681.相关法2.区分法看测验分数能否区分由效标测量所定义的不同团体如果能却分开,这个测验就是有效的本质:两个独立样本的平均数差异的显著法检验3.命中率法当测验分数和效标分数都是二分变量,且用测验分数作取舍决策时,决策的正命中率和总命中率是测验有效性的指标四、解释效度系数rxy:效度系数是预测源与效标两变量的函数,任一变量范围过窄都会导致较低的预测效度(rxy)2:表示X和Y两个变量共同的变异部分,即效标分数中由测验分数造成的变异数的百分比。测验分数能够预测效度系数的程度有多大1(rxy)2 代表在效标分数中不能由测验分数解释的?效标分数一般都不会很高,一般小于0.6, 实际研究中0.3就比较高例:若r2 =0.06,则说明有6%由测验分数可以解释的,94%是由测验分数无法解释的?效度系数仅仅是决定一个测验可能提高或降低决策质量程度的许多因素(内容效度、结构效度等)的一个,可能不只有效标关联系数,跟效标的测量是否有污染也有关系五、使用效标系数(一)预测分数的估计SE=YX=SY 当测验分数与效标测量之间的相关不高时,对测验分数的解释要谨慎处理。效标系数越低,估计标准误越大,根据测量结果来预测效标就越不准确。(二)信度和效度低信度会降低测验的基本效度衰减公式(完全没有测量误差的前提下):rxy=rxy/ (真分数的效度系数)校正公式:rxy=(rxy* )/ 六、对三种类型效度的总结 ?均是围绕着效度的基本问题展开的:测量什么;测验对所测量的东西达到何种程度,并在帮助选拔、录用方面的效果如何。 ?任何一个测验都需要各式各样的效度证据,关键在于效度是由一定得测验目的规定的,不用的测验偏重于不同种类的测验效度。 ?效度验证通常是在测验编制完成之后,但是其指导思想贯穿于整个编制过程。第三节 影响效度因素一、影响效度的因素(简答)(一)测验本身的因素项目质量项目数量(影响代表性、全面性)(二)测验实施和记分问题(测量的标准化程度)按照测验手册进行指导语、材料的方法等(三)被试的主观方面(四)取样方面因素1.样本的代表性2.样本规模3.样本的异质性(五)效标性质交叉效度:即对不同被试,效度是否同样准确二、提高测验效度的方法:(简答)1.所有提高测验信度的方法,均有助于提高测验效度2.精心编制测验,避免出现较大的系统误差3.创设标准的应试环境,使每个被试都能发挥正常的水平4选好正确的效标,定好恰当的效标测量,正确的使用有关公式第四节 提高测验效度的方法 P70第五章 测验分数转化和常模第一节 分数转化原始分数:按照测验手册的规定,对每一题进行评分,将每一题得分相加所计算出的测验分数。怎样理解测验的原始分数?(1)原始分没有意义,因为从中并不能看出水平的高低或特征的倾向性(2)原始分是一种任意的分数,是测验编制者主观规定的。(3)不同测验的原始分不能相互比较导出分数:在原始分数的转换基础上,按照一定的规则,经过统计处理后获得的具有一定参照点和单位,且可以相互比较的分数。一 转化的特征它不改变个人的分数;它简单地用不同的单位来表达这个分数。它考虑了在原始数据(这里指测验项目的数量)本身中不包含的信息。它比原始分数以更富含信息且可以解释的方式呈现出个人分数。二 转化的目的1.指出个体在标准化样组中的位置,即参照他人来对他进行评价2.提供可比较的量度,从而使个体在不同测验中的分数的比较提供可能三 转化的方法 线性转化(不改变原始分数的分布形态)导出分数=常数+(权重*原始分数)(一)Z分数:最熟悉的线性转化之一Z=(x-x )/1.Z分数的转化非常有用(1)Z分数表示每个人和组平均数相比所处的位置(2)当原始分数的分布是合乎正态的时候,Z分数可以直接转化为百分位数2.Z转化的变式(1)T分数:平均数为50,标准差为10的分数,这一词最早由麦柯尔1939年提出: T=10Z+50(2)其他标准分数转化形式:Z=A*Z+B3.Z分数的缺陷(1)Z分数有正负(2)Z分数通常具有分数值,甚至当其大于一定值时,须至少带有两个小数区(3)标准分常模的局限性:标准化常模表示的是存在状态之间的横向比较,离开原常模样本,不同常模之间的比较没有意义四、转化的方法:领域转化领域转化:利用正态曲线创造量表分数值 区别:线形转化改变的只是单位 领域转化同时改变单位和参照点百分等级:一个原始分数的百分等级是指在常模样本中低于该分数人数的百分比。百分等级是应用最广的测验分数表示方法。 计算方法:百分等级往往按四舍五入原则取整数 优点:是不同的测量结果可以比较;易计算和解释;且不受原始分数分布状态的影响 缺点:单位不相同,尤其是两端,只顺序,不等距标准九分数:书P100是标准化九分制的简称;最早被广泛应用于美国空军的心理测验中,它是以5为平均数,以2为标准差的一个分数量表。它将原始分划分为9部分。第二节 常模常模:根据标准化样本的测验分数经过统计处理而建立起来的具有参考点和单位的测量量表常模分数:提供的是被试表现与常模样本或参照团体的分数分布相比较的信息。常模分数的意义依赖于:1.测验使用者对何种常模总体感兴趣2.常模样本代表总体的程度理解常模概念是需清楚:1.常模是测验分数的总体分布形态,一般用测验分数的平均数和标准差来表示,它能对个体的分数加以解释。2.常模就是各种导出分数,由于这些导出分数具有相等的单位,所以它能比
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- YHL公司基层员工满意度研究
- 运动场草坪管理师岗前安全意识考核试卷含答案
- 联碱结晶工安全教育评优考核试卷含答案
- 工程船舶水手安全生产基础知识评优考核试卷含答案
- 超精细格栅过滤对南方城市污水的碳截留特性及工艺优化
- 积木游戏提升大班幼儿学习品质的行动研究
- 保险公司健康管理服务模式创新研究-以平安健康APP为例
- 基于物联网与区块链技术的葡萄酒溯源系统研究
- 2025低压电工资格考试必考题库含答案
- 工业废水处理工操作规程能力考核试卷含答案
- 【部编】人教版六年级上册道德与法治全册知识点总结梳理
- 社区居家养老服务设计方案范文
- JT-T-1180.2-2018交通运输企业安全生产标准化建设基本规范第2部分:道路旅客运输企业
- 中国省市县行政区划
- HG/T 3809-2023 工业溴化钠 (正式版)
- 光伏钻孔灌注桩安全技术交底
- 采购物品质量保证期限约定协议
- 2024-2029全球及中国湖泊管理行业市场发展分析及前景趋势与投资发展研究报告
- 亚历山大东征与丝绸之路开通
- 《可爱的中国》课件
- 《移动卫星通信系统》课件
评论
0/150
提交评论