心理测量学 第三章和第四章 ppt课件_第1页
心理测量学 第三章和第四章 ppt课件_第2页
心理测量学 第三章和第四章 ppt课件_第3页
心理测量学 第三章和第四章 ppt课件_第4页
心理测量学 第三章和第四章 ppt课件_第5页
已阅读5页,还剩63页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章 经典测验理论的基本假设,主讲:许 莹 电邮:,2019/4/18,2,第一节 心理特质及其可测性假设,2019/4/18,3,一、心理特质的含义,内涵 表现在一个人身上所特有的相对稳定的行为方式为人的心理特质(trait)。 理解 特质是一组具有内部相关的行为的概括,具有一定的抽象性,如善良、聪明。 比较稳定,对不同的刺激做相同的反应;,2019/4/18,4,特质是一个人身上比较稳定的特点。 一个人的精神面貌(人格)是由多种特质分多个层次有机组合而成的。智力可以分语言和操作,语言可以分为词汇和文法。 特质可以决定一个人对特定刺激的反应倾向,可以对人的行为进行某种预测。,2019/4/18,5,二、心理特质的可测性,Thorndike“凡客观存在的事物都有其数量。” McCall“凡有数量的东西都可以测量。,2019/4/18,6,第二节 测量误差及其来源,2019/4/18,7,一、测量误差的含义,定义 在测量过程中由那些与测量目的无关的变化因素所产生的一种不准确或不一致的测量效应。 理解 测量误差由那些与测量目的无关的变因所致 测量误差表现为不准确或不一致两种方式。,2019/4/18,8,二、测量误差的种类,系统误差:由与测量目的无关的变因引起的一种恒定而有规律的效应(稳定); 随机误差:由与测量目的无关的、偶然因素引起、而又不易控制的误差(不稳定) 。,2019/4/18,9,(一)测量工具(测验内部)引起的误差 题目取样(影响最大) 指导语 难度 时限 测验复本不等值,三 、测量误差的来源,2019/4/18,10,(二)由测量对象引起的误差(最复杂最难控制的误差) 测验的经验 练习因素 应试动机 测验焦虑 反应定势 生理因素,2019/4/18,11,(三)由施测过程引起的误差 物理环境 主试者方面 意外干扰 评分计分,2019/4/18,12,第三节 真分数及其有关的假设,2019/4/18,13,一、真分数的含义,真分数(True Score):一个测量工具在没有测量误差时,所得到的纯正值。 操作定义:经过无数次测量所得到的平均值。 观察分数(Observed Score):实测分数,2019/4/18,14,某一物理测量数据,(1) 实测重量=真实重量+误差 (2) 误差之和为零 (3) 实测重量的平均值=真实重量的平均值,2019/4/18,15,二、数学模型及其假设 (一)CTT的数学模型 经典测验理论假定,观察分数(记为X)与真分数(T)之间是一种线性关系,并只相差一个随机误差(记为E)。 即 X = T + E (二)3个相关联的假设公理 1.若一个人的某种心理特质可以用平行的测验反复测量足够多次,则其观察分数的平均值会接近于真分数。 即:E(X)=T或E(E)=0 2.真分数和误差分数之间的相关为零。 即:(T,E)=0,2019/4/18,16,SX2,ST2,3.各平行测验上的误差分数之间相关为零。 即(E1,E2)= 0,SX2 = ST2 + SE2 ST2 = SV2 + SI2 SX2 = SV2 + SI2 + SE2,2019/4/18,17,第四章 测量信度,2019/4/18,18,请列举一些你所使用过或接触过的量表,思考: 量表的作用是什么?,2019/4/18,19,你如何解释下述现象?,一个很聪明的孩子,测得智商是80分 一个学习很好的学生,考试成绩为60分 一个人缘很好的人,人际关系测量低于常模值,2019/4/18,20,量表帮助我们了解心理现象(心理特质), 就像尺子帮助我们测量身高。,思考:我们如何知道我们有多高? 有两个工具:尺子 / 秤,2019/4/18,21,尺子的数据与我们的目测更一致,而秤盘的数据则与我们的目测不一致。因此,尺子是测量身高的有效工具效度。,什么材料的尺子?钢铁(热胀冷缩) 涉及到一致性的问题。信度,2019/4/18,22,1.70=1.7 ?,2019/4/18,23,量表是我们用来了解心理特质的工具,但这个工具是有误差的。误差是不可避免的,但误差要控制在一个许可的范围内。,2019/4/18,24,回顾,什么是误差? 误差的种类有哪些?,2019/4/18,25,第一节 信度概述 一、什么是信度? 信度(reliability)是指测量结果的稳定性程度,也叫测量的可靠性。 操作定义:指真实方差除以测量方差所得的商. 注意: (1)信度指的是一组测验分数或一系列测量的特性,而不是个人分数的特性; (2)真分数的变异数是不能直接测量的,因此信度是一个理论上构想的概念,只能根据一组实得分数作出估计。,2019/4/18,26,三种等价的信度定义,定义一 信度乃是一个被测团体真分数的变异数(方差)与实得分数的变异数(方差)之比。 如果他们的比率是.87,说明了什么?,测量方差的87%属于真实方差,2019/4/18,27,2019/4/18,28,信度的定义二,信度乃是一个被测团体真分数与实得分数的相关系数的平方。 rXX=P2TX 思考:相关系数的平方?,2019/4/18,29,2019/4/18,30,信度的定义三,信度乃是一个测验X与它的任意一个平行测验X的相关系数。 rXX=PXX,2019/4/18,31,A卷:你是一个喜欢热闹的人吗?,1=绝对是 2=是 3=不一定 4=不是 5=绝对不是,2019/4/18,32,B卷:你是一个喜欢安静的人吗?,1=绝对是 2=是 3=不一定 4=不是 5=绝对不是,2019/4/18,33,二、信度系数与信度指数,信度指数:相关系数 信度系数:相关系数的平方 注意: (1)信度系数有多种。 (2)同一种信度系数也会因样本、测查时间不同而有多个。 (3)信度系数只是对测量分数一致性的估计,但并没有指出不一致的原因。 (4)获得较高的信度只是测验有效的必要条件。,2019/4/18,34,三、信度的作用,1信度是测量过程中所存在的随机误差大小的反映 2信度可以用来解释个人测验分数的意义 SE=Sx1 rxx 真分数的置信区间(95%)=X1.96SE 3信度可以帮助进行不同测验分数的比较,2019/4/18,35,注意: 信度参照的是测验分数或测量值,而非测验本身。测验由题目组成,而这些题目本身并不能提供信度的估计值。估计信度前必须先进行施测和计分。,2019/4/18,36,第二节 信度的估计方法,一、重测信度(稳定系数) 1含义和计算 同一量表,同一被试群体,在不同时间,两次施测,求其相关。 皮尔逊积差相关系数 2使用的前提条件 所测量的心理特质必须是稳定的;(人格测验) 练习和遗忘的效果基本上相互抵消; 在两次施测的间隔时期内,被试在所要测查的心理特质方面没有获得更多的学习和训练。,2019/4/18,37,3. 实质:表示测验结果的稳定性。故称之为稳定性系数(Coefficient of Stability) 4. 形式:施测适当时间再施测,2019/4/18,38,5. 时间间隔的把握 一个校区每年都对学生进行IQ测验,而另一个校区则两年一次。第一个校区的老师可能认为IQ测验的分数在一年中会保持稳定,所以有必要进行再测,因为学生在一年后的回答可能不一致。第二个校区的老师则认为在一年中分数并没有明显的波动,那么施测的频率没有必要高于两年一次。 哪种结果正确呢? 取决于第一年和第二年成绩的相关。通常来说,大约为0.80或0.90,且保持相对稳定(Bayley,1949)所以,频率没必要高于两年一次。,2019/4/18,39,间隔时间越长,稳定性系数越低。适宜时间间隔依照测验目的、性质及被试特点而定。几分钟至几年。 年幼儿童,间隔要小;年长群体,间隔可大。智力测验的间隔不能太短,成就测验的间隔不能太长。 一般间隔时间不超过六个月。(即不能让被试记住上一次测验的内容,又不能让其特质发生变化,或对所学知识产生遗忘) 适用于速度测验和人格测验,而不适用于难度测验.,2019/4/18,40,注意 : 同样一个量表,随着第二次测量的时间不同,它可以有不同的重测信度,在报告重测信度时,要说明两次施测的间隔,以及在此期间内被试的有关经历 。 在中国修订韦氏儿童智力量表手册(C-WISC)中,就曾对重测信度的计算报告了被试情况(6-16岁城市儿童151名,农村儿童74名且各年龄儿童分配较均匀),并报告了两次测验的间隔(2-7周)及两次的相关系数(城市:0.59-0.86,农村:0.56-0.81)。,2019/4/18,41,二、复本信度 1含义和计算 复本信度(Alternate-form reliability)是指两个平行的测验测量同一批被试所得结果的一致性程度。 复本等值要符合下列条件: 各份测验测量的是同一种心理特性。 各份测验具有相同的内容和形式。 各份测验的题目不应重复。 各份测验题目数量相等,难度和区分度大体相同。 各份测验的分数分布(平均数和标准差)大致相等。 复本编好后,应再测一次,以确保各份测验的等值。,2019/4/18,42,2使用的前提条件 两测验真正平行; 被试要有条件接受两个 测验。(时间,经费的限制) 等值性系数:同时连续 施测,反映内容变异。 形式:复本A最短时间复本B 稳定性与等值性系数: 时间间隔施测,内容变异重测信度误差 形式:复本A适当时间复本B,2019/4/18,43,3.缺点:,只能减少而不能完全排除练习和记忆的影响. 对许多测验来说,建立复本是相当困难的. 4.误差来源: 测验的两种形式是否等值:测题取样是否匹配,格式是否相同,内容、题数、难度、平均数、标准差是否一致; 被试方面情绪波动、动机变化等; 测验情景的变化; 偶发因素的干扰。,2019/4/18,44,三、分半信度,1含义和计算 分半信度(split-half reliability)是指将一个测验分成对等的两半后,所有被试在这两半上所得分数的一致性程度。 计算分半信度先要对测验分半。不同的分半法可能会得到不同的信度值。 为了使两半基本等值,可将项目按由易到难的顺序排列编号,然后按奇数和偶数序号将项目分半。要注意使那些性质相同、联系紧密的项目分在相同的一半,否则会使信度值偏高,2019/4/18,45,分半信度(Split-Half Reliability),被试在两半测验上得分的相关系数只是半个测验的信度,还必须用斯皮而曼布朗公式校正 校正公式:斯皮尔曼-布朗公式 rxx= 2 rhh /(1+ rhh) 但只能在两半测验分数 的变异数( sa2 、Sb2 ) 相等时才能用。,2019/4/18,46,弗朗那根公式: rxx = 2 1 -(sa2 + Sb2)/ Sx2 卢仑公式: rxx = 1 - Sd2 / Sx2 2使用的前提条件,2019/4/18,47,例题 :,100个题目,分半信度r.70,整个测验的估计信度是多少?,2019/4/18,48,四、同质性信度,1.含义 同质性指测验的所有题目测量的是同一种心理特质,表现为各个题目得分之间有较高的相关,相关越高则同质性越强。 同质性信度(homogeneity reliability),也叫内部一致性系数,是指测验内部所有题目间的一致性程度。 2计算及适用范围 rxx = K rij / 1 +(K - 1)rij ,2019/4/18,49,KR20公式(仅适用于(0,1)记分的测验) rxx = K /(K - 1) 1-(piqi)/ Sx2 pi为答对第i题的人数的比例;qi为答错第i题的人数的比例。 K为题目数, Sx2为测验总分的变异。 KR21公式(所有题目难度接近时才适用) rxx = K /(K - 1) 1 -(K p q )/ Sx2 ,2019/4/18,50,克龙巴赫系数(可处理任何内部一致性系数的计算问题) = K /(K - 1) 1 -(Si2)/ Sx2 菏伊特信度: rxx = 1 - MS人题/ MS人 一般用于预测的测验或学绩测验可不考虑同质性。而验证理论构想时必须考虑同质性。因此,同质性不但与信度有关,还与效度有关。,2019/4/18,51,五、评分者信度 1含义和计算 评分者信度(scorer reliability)是指多个评分者给同一批人的答卷进行评分的一致性程度。 在心理测验中,评分者信度的计算,通常是随机抽取若干份试卷,由至少两位受过训练的评分者按计分规则分别判分,然后计算它们的相关。几个评分者的评分越一致,评分者信度越高 2人时:最简单的估计方法就是随机抽取若干份答卷,由两个独立的评分者打分,再求每份答卷两个评判分数的相关系数。这种相关系数的计算可以用积差相关方法,也可以采用斯皮尔曼等级相关方法。相关系数,2019/4/18,52,多人时:肯德尔和谐系数 W=12 R i2 -(R i)2 / N / K2(N3 -N) (K=3 20;N=3 7时,查W表检验)R I为第i个被试被评的水平等级之和 若N7,用2检验。 2 = K(N - 1)W,df = N - 1 若评分中有相同等级时,需校正: W=12R i2 -(R i)2 / N / K2(N2 -N)- K(n3 - n)/12,2019/4/18,53,一般要求在成对的受过训练的评分者之间平均一致性达0.90以上,才认为评分是客观的。,2019/4/18,54,各种信度系数相应误差变异的来源,2019/4/18,55,估计信度的方法与测验复本的数目 以及施测次数的关系,2019/4/18,56,在一般情况下,间隔施测的副本信度最低,因为很多因素有机会影响到分数。相反,校正过的分半相关,因为影响的因素少,所得的信度估计为最高。,2019/4/18,57,假设对100个六年级学生以两个月的时间间隔先后施测一个创造力测验的AB两个复本,所得的等值性与稳定性系数为0.70。我们还根据被试对每个复本的反应计算出分半信度为0.80(先计算每个复本的分半相关系数。将二者平均后再用斯皮尔曼-布朗公式校正)。同时,我们让另一个评分者随机抽取50份卷子另外评分,得到评分者信度为0.92。然后,我们对这三种方法所产生的误差变异进行分析。,2019/4/18,58,一个假想测验的误差变异来源分析,2019/4/18,59,一个假想测验的误差变异来源分析,第三节 提高测量信度的方法,2019/4/18,61,一、影响测量信度的主要因素 (2007心理学统考真题:),(一)被试方面 1、单个被试:身心健康情况、应试动机、注意力、耐心、求胜心、作答态度等会影响测量误差,它们会影响被试心理特质水平的稳定性。 2、被试团体: (1) 被试团体同质性越高(个体差异越小),所得相关系数(信度)就越低。 (2)被试团体异质性越高(个体差异越大),所得相关系数(信度)就越高。,2019/4/18,62,不能认为当该测验在一个团体中有较高的信度时,在另一个团体也具有较高的信度。 当将测验用于异质性团体时,用下面的公式推算出新的信度系数。 rnn=1-So2(1-roo)/Sn2 roo为 用于原团体的信度,rnn为用于异质程度不同的团体的信度,Sn为异质程度不同的团体的分数分布的标准差,So为原团体的的分数分布的标准差 某测验的被试为25年级的小学生,已知信度是0.85,标准差为10,现欲知道仅用于4年级时信度是多少,4年级的标准差是5。(0.4),2019/4/18,63,(二)主试方面 施测者: 指导语、态度、期望等 评分者:评分标准 (三)施测情境 考场是否安静,光线和通风,设备,桌面,空间等 (四)测量工具 测验内容:试题取样不当,内部一致性低,题意模糊,信度则低。如:押题,2019/4/18,64,测验长度:测验越长,信度越高。 rkk=Krxx/1+(K-1) rxx K为改变后的测验长度与原来长度之比,rxx为原测验的信度,rkk为测验长度增加为k倍后测

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论