心理测量的总结-用于合并.doc_第1页
心理测量的总结-用于合并.doc_第2页
心理测量的总结-用于合并.doc_第3页
心理测量的总结-用于合并.doc_第4页
心理测量的总结-用于合并.doc_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

综观心理测量的发展历史,可以看出以下几点趋势 1. 先以解剖生理特征为根据,而后转向心智活动的测量;2由测量简单的感知能力,发展到测量复杂的认知能力; 3由笼统的单一量数评定个别间的差异,转变为以多个量数兼顾个别差异与个别内差异;4心理测量学是随着实验心理学的发展而产生的,二者在发展过程中由合到分,最后又走到一起来了心理测量的贡献与局限 贡献: 首先,为心理科学理论的发展,特别是个体差异心理提供了具体方法和手段,构筑了差异心理理论的重要基石。 其次,心理测量为社会实践服务做出了巨大的贡献。 局限:首先,心理测量具有间接性,精确程度远远劣于物理测量。其次,心理测量所依据的理论尚不完善。第三,心理测验的编制比较复杂困难。第四,心理测量仅仅是研究差异心理的手段方法之一,而不是唯一,对于人的复杂的心理应该是多种研究方法交叉使用,方可验证其真正的规律。第五,心理测量的发展还要受政治、经济、文化等社会因素影响信度一、信度的定义 信度又叫可靠性。指的是测量的一致性程度。(操作定义) 在测量理论中,信度被定义为:一组测验分数的真变异数(就是真分数方差)与总变异数(实测分数方差)的比率。即 rxx=ST2 / Sx2 (真分数就是测量中不存在测量误差时的真值或客观值,操作定义就是无数次测量的平均数,实测分数=真分数+误差分数)。n 该定义有两点需要注意:n 第一、信度指的是一组测验分数或一列测量的特性,而不是个人分数的特性;n 第二 、真分数的变异数是不能直接测量的,因此信度是一个理论上构想的概念,只能根据一组实得分数做出估计。二、信度系数n 大部分的信度指标都以相关系数表示,即用同一被试样本所得的两组资料的相关系数作为测量一致性的指标,称作信度系数(rxx )。 n 对信度系数要注意三点:n 第一,在不同情况下,对不同样本,采用不同方法会得到不同的信度系数; 第二,信度系数只是对测量分数不一致程度的估计,并没有指出不一致的原因;第三,获得较高的信度系数并不是心理测量追求的最终目的,它只是使测验有效的一个必要条件。 n (仅供了解)信度是一个理论上构想的概念,在实际应用时,通常以同一样本所得的两组资料的相关,作为测量一致性的指标。因为测验分数的误差来源不同,估计信度的方法也不同,故每一种信度系数只能说明信度的不同方面,因而具有不同的意义。下面介绍五种估计信度的方法。 重测信度:用同一种测验,对同一组受试者,前后施测两次,再根据受试者两次测验分数计算其相关系数,即得再测信度。此种信度能表示两次测验结果有无变动,反映测验分数的稳定程度,故又称稳定性系数计算重测信度的几个假设所测量的特性必须是稳定的;遗忘与练习的效果相同;两次施测期间被试的学习效果没有差别。 误差来源1. 测验本身:测验所测的特性本身就不稳定,例如情绪。2. 被试方面:成熟、知识的发展并非人人都等量增长,且练习因素、记忆效果也存在个体差异。3. 施测情境:偶发因素的干扰,如计时错误,情绪波动,健康状况,动机变化注意事项两次测验的时间间隔要适当。最适宜的时距随测验目的、性质及被试特点而异;此方法适用于速度测验或人格测验,不适于难度测验;注意提高被试的积极性。 使用重测信度的优缺点(优点)能提供有关测验结果是否随时间而变异的资料,可作为预测受测者将来行为的依据。(缺点)容易受练习和记忆的影响,前后两次施测间隔的长短必须适度; 第一次尝试所发现的错误也可能导致第二次反应的变化而增加误差变异复本信度:根据一组被试在两个平行(等值)测验上的得分计算相关系数。误差来源 1. 测验两种形式是否等值: (1)测题取样是否匹配;(2)格式是否相同;(3)内容、题数、难度、平均数、标准差是否一致。2. 被试方面情绪波动、动机变化等。3. 测验情境的变化,偶发因素的干扰。 复本应符合以下条件:1. 各份测验测量的是同一种心理特性;2. 各份测验具有相同的内容和形式; 3. 各份测验的题目不应有重复的地方; 4. 各份测验题目数量相等,并且有大体相等的难度、区分度; 5. 分数分布(平均数和差异度)大致相等。 n 注意事项1. 两个测验必须在项目的内容、形式、数量、难易、时限、指导语等方面相同或相似; 2. 两次测验的时间间隔要适当,若太短,由于测验太相似被试可能厌倦,若太长可能又会因新的学习而产生干扰。 n 使用复本信度的局限 1. 只能减少但不能完全消除练习和记忆的影响; 2. 由于第二个测验只改变了题目的具体内容,已经掌握的解题原则,可以很容易地迁移到同类问题。 3. 对许多测验来说,建立复本是十分困难的。 分半信度:在测验无复本且只能施测一次的情况下,通常用分半法估计信度,即将测题分成对等的两半,根据各人在这两半测验的分数,用皮尔逊积差相关公式计算其相关系数,作为信度指标。n 分半的方法( 仅供参考)通常采用奇偶分半法。使用此方法应注意:1一组解决同一问题或互相有牵连的题目应尽量安排在同一半内。2当试卷中有任选题时不宜使用分半法,速度测验也不宜用。 n (三)校正公式(因为此方法和可能低估原长测验的信度,因此需要用斯皮尔曼公式进行修正)1.斯皮尔曼布朗公式rxx=2rhh/(1+ rhh)其中,rhh为两半分数的相关系数, rxx为测验在原长度时的信度估计。 此法假设:两半测验分数的变异性相等,但实际资料未必符合此假设。 n 同质性信度:同质性的含义:所谓同质性指的是测验内部题目的一致性。 题目内部的一致性主要受两方面变异的影响:1内容的一致性; 2所研究的行为的同质性。 n 同质性信度的计算 1库德理查逊公式:(1)K-R20公式: rkk=K/(K-1)(Sx2-piqi )/ Sx2) 式中K表示整个测验的题数,pi为项目通过率,qi为项目未通过率,Sx2表示测验总分的变异数(方差)。 (2)K-R21公式,适用于各题难度相近的情况: rkk=K/(K-1)( Sx2-K piqi)/ Sx2 pi为题目的平均通过率,qi为1-pi 。 K-R21公式计算较为简单,但求得的信度系数有低估的倾向,当题目难度相差大时偏差更大。公式K-R20和K-R21只适用于0,1记分的测验。 2 克伦巴赫系数: 适用于非0,1记分的一种内在一致性系数。其公式如下: n =K/(K-1)1-(Si2/ Sx2)其中Si2为每一项目分数的变异数,其他字母意义与K-R20相同评分者信度:是由多个评分者给一组测验结果评分,所得的各个分数的一致性 方法是:随机抽取相当份数的试卷,由两位或多位评分者按记分规则分别给分,然后根据每份试卷的分数计算其相关系数,即得评分者信度。 一般要求在成对的受过训练的评分者之间平均一致性达到0.90以上,才认为评分是客观的。 n 当多个评分者评多个对象,并以等级法记分时,可用肯德尔和谐系数作为评分者信度的估计:W=Rt2-(Ri)2/N/(1/12)K2(N3-N)(具体公式在书本155页)其中,K是评分者人数,N是被评的对象数,Rt是每一个对象被评等级的总和。 影响信度的因素 n 被试样本:1,团体的异质性:信度系数受分数的分布范围(全距)的影响,而分数范围与被试团体的异质程度有关。一个团体越异质,其分数范围越大,信度系数也就越高。相反,相对同质的团体分数则较为均匀。2,团体的平均水平:对于不同的团体,题目具有不同的难度。每个题目在难度上的微小差异积累起来便会影响信度。因此,我们在编制测验量表,抽选被试时,往往要考虑选取不同层次的被试,以使得测验团体呈异质性,从而使得信度提高。反之,当需要同质团体的信度时,就应该尽量选取同一层次的被试。 n 二、题目的数量:一般说来,在一个测验中增加同质的题目,可以使信度提高。即测验越长,信度越高。这是因为测验加长,加大了分数分布的范围,可能改进项目取样的代表性,从而能更好地反映受测者的真实水平。即测验的项目越多,在每个项目上的随机误差就可以互相抵消。 增加测验长度的效果可以用斯皮尔曼布朗的通式来计算; rkk=Krxx/1+(K-1)rxxn 式中K为改变后的长度与原来长度之比,rxx为原测验的信度,rkk为测验长度是原来的K倍时的信度估计。 n 但增加测验长度的效果遵循报酬递减率,测验过长是得不偿失的,可以通过下式确定一个测验究竟要增长多少才能达到理想的信度水平:n K= rkk(1-rxx)/rxx(1- rkk)n 应注意一点,只有当新题目是与原题目选自同一总体,增长测验才能改进信度。 n 三、测验的难度: 要使信度达到最高,能产生最广分数分布的难度水平方为合适。通常这个难度为0.5。洛德提出选择题的理想平均难度是:五选题0.70、四选题0.74、三选题0.77、是非题0.85。n 四、间隔时间: 间隔时间越短,信度系数越大;间隔时间越长,受外界影响越大,信度系数越小。n 测量的标准误差: n 定义:个人在两次测验中的分数差异就是测量误差,据此可制成误差分数的分布。这个测量误差分布的标准差就是测量的标准误(SE ),是表示测量误差大小的指标. 测量标准误可以通过一次测验结果及信度估计得到,公式如下:SE = Sx1rxx 式中,SE为测量标准误,Sx 为所得分数的标准差,rxx 为测验的信度。由公式可知:测量的标准误与信度之间有互为消长的关系:信度越高,标准误越小;信度越低,标准误越大。根据公式,知道了一组测量的标准差和信度系数,就可以求出测量的标准误,进一步我们就可以从每个人的实得分数估计出真分数的可能范围,即确定出在不同或然率水平上真分数的置信区间 作用:它有两个作用:其一是估计真分数的范围;其二是了解实得分数再测时可能的变化情况。n (注意事项)第一、SE 对真分数作的是区间估计,不可能由此得到一个确切的点。第二、置信水平确定后,估计的精确度主要取决于SE ,SE越小,估计就越精确,相反则越粗略。第三、真分数不等同于真正能力或特质。当系统误差对实测分数产生影响时,用此方法估计出的真分数就并非代表被试的真正能力或特质。 效度定义:效度指的是测量的准确性,即一个测验或量具能够测量出其所要测量东西的程度。(操作定义)在测量理论中,效度被定义为:在一列测量中,与测量目的有关的真实变异数(由所要测量的变因引起的有效变异)与总变异数(实得变异数)的比率,即 效度= SV2 / Sx2 式中SV2代表有效变异数, Sx2代表的是分数的变异数,即总变异数。 n 效度的性质:1,效度是针对测验结果的,即测验效度是“测验结果”的有效性程度2,效度是针对某种特定的测验目的的3,效度只有程度上的差异, 效度只有程度上的差别,而不是“全”或“无”的差别。n 效度的种类:内容效度即测验用的测题对整个测验内容范围的代表性程度,构想效度是指一个测验对某种心理学所涉及的抽象概念或心理特质测得如何,这些抽象概念或心理特质都是构想出来的。 效标效度又称实证效度或准则关联效度,指的是测验对我们所感兴趣的外在行为能够做出多好的预测。这种外在行为是衡量测验是否有效的标准,简称效标n 效度与信度的关系 (一)高信度是高效度的必要而非充分的条件(二)测验的效度受它的信度制约n 信度系数的平方根是效度系数的最高限度 n 一个测验要具有内容效度必须具备两个条件:首先,要有定义完好的内容范围,并使测验的全部项目均在此范围内。所谓内容范围可以是具体知识或技能,也可以是复杂行为。 其次,测验题目应是所界定的内容范围的代表性取样n 确定内容效度的方法:专家判断、统计分析、经验推测法n 随堂练习n 如何考查学业成绩测验的内容效度?主要方法有哪些? n 答;1、考察学业成绩测验的内容效度要从以下几方面入手:(1)分析测验项目所考核的知识技能覆盖面:(2)测验内容的深度、广度与结构比例:(3)能力水平的考核情况。2、考察学业成绩测验的内容效度的主要方法:(1)请学科专家做出系统评判:(2)实证研究的方法,令被试“出声思考”了解题目引起被试怎样的加工过程,以确定测验实有的测量考核功能。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论