心理测量的总结-用于合并_第1页
心理测量的总结-用于合并_第2页
心理测量的总结-用于合并_第3页
心理测量的总结-用于合并_第4页
心理测量的总结-用于合并_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、For personal use only in study and research; not for commercial use蒆综观心理测量的发展历史,可以看出以下几点趋势薄 1. 先以解剖生理特征为根据,而后转向心智活动的测量;2由测量简单的感知能力,发展到测量复杂的认知能力; 3 由笼统的单一量数评定个别间的差异,转变为以多个量数兼顾个别差异与个别内差异;4心理测量学是随着实验心理学的发展而产生的,二者在发展过程中由合到分,最后又走到一起来了膂心理测量的贡献与局限薈 贡献:袆 首先,为心理科学理论的发展,特别是个体差异心理提供了具体方法和手段,构筑了差异心理理论的重要基石。羂 其次

2、,心理测量为社会实践服务做出了巨大的贡献。袁 局限:蚈首先,心理测量具有间接性,精确程度远远劣于物理测量。芇其次,心理测量所依据的理论尚不完善。蚄第三,心理测验的编制比较复杂困难。蚀第四,心理测量仅仅是研究差异心理的手段方法之一,而不是唯一,对于人的复杂的心理应该是多种研究方法交叉 使用,方可验证其真正的规律。螈第五,心理测量的发展还要受政治、经济、文化等社会因素影响蚈信度膂一、信度的定义信度又叫可靠性。指的是测量的一致性程度。袇(操作定义) 在测量理论中,信度被定义为:一组测验分数的真变异数(就是真分数方差)与总变异数(实测分数方差) 的比率。即 rxx=ST2 / Sx2 (真分数就是测量

3、中不存在测量误差时的真值或客观值, 操作定义就是无数次测量的平均数,实测分数 =真分数 +误差分数)。螅 该定义有两点需要注意:袄 第一、信度指的是一组测验分数或一列测量的特性,而不是个人分数的特性;蒂 第二 、真分数的变异数是不能直接测量的,因此信度是一个理论上构想的概念,只能根据一 组实得分数做出估计。羇二、信度系数膆 大部分的信度指标都以相关系数表示,即用同一被试样本所得的两组资料的相关系数作为 测量一致性的指标,称作信度系数( rxx )。薆 对信度系数要注意三点 :芁 第一,在不同情况下,对不同样本,采用不同方法会得到不同的信度系数; 第二,信度系数 只是对测量分数不一致程度的估计,

4、并没有指出不一致的原因;第三,获得较高的信度系数并不是心理测量追求的最 终目的,它只是使测验有效的一个必要条件。肇(仅供了解) 信度是一个理论上构想的概念,在实际应用时,通常以同一样本所得的两组资料 的相关,作为测量一致性的指标。因为测验分数的误差来源不同,估计信度的方法也不同,故每一种信度系数只能说 明信度的不同方面,因而具有不同的意义。下面介绍五种估计信度的方法 。薇重测信度 : 用同一种测验,对同一组受试者,前后施测两次,再根据受试者两次测验分数计算其相关系数,即 得再测信度。此种信度能表示两次测验结果有无变动,反映测验分数的稳定程度,故又称稳定性系数肄计算重测信度的几个假设肀1.所测量

5、的特性必须是稳定的;腿2 .遗忘与练习的效果相同;羈3 两次施测期间被试的学习效果没有差别。螆误差来源肃1. 测验本身:测验所测的特性本身就不稳定,例如情绪。膇 2. 被试方面:成熟、知识的发展并非人人都等量增长,且练习因素、记忆效果也存在个体差异。膅 3. 施测情境:偶发因素的干扰,如计时错误,情绪波动,健康状况,动机变化芃袁注意事项芇1.两次测验的时间间隔要适当。最适宜的时距随测验目的、性质及被试特点而异;薅2 此方法适用于速度测验或人格测验,不适于难度测验;羅3 .注意提咼被试的积极性。薀使用重测信度的优缺点蚁1.(优点)能提供有关测验结果是否随时间而变异的资料,可作为预测受测者将来行为

6、的依据。羆2.(缺点)容易受练习和记忆的影响,前后两次施测间隔的长短必须适度; 第一次尝试所发现的错误也可能导致第二次反应的变化而增加误差变异莃复本信度: 根据一组被试在两个平行(等值)测验上的得分计算相关系数。蚃 误差来源螁 1. 测验两种形式是否等值:莇(1)测题取样是否匹配; ( 2)格式是否相同; (3)内容、题数、难度、平均数、标准差是否一致。肅 2. 被试方面情绪波动、动机变化等。莂3. 测验情境的变化 ,偶发因素的干扰。袀复本应符合以下条件:螈 1. 各份测验测量的是同一种心理特性; 2. 各份测验具有相同的内容和形式; 3. 各份测验的题目不应有重复的地 方; 4. 各份测验题

7、目数量相等,并且有大体相等的难度、区分度;5. 分数分布(平均数和差异度)大致相等。薃注意事项膁 1. 两个测验必须在项目的内容、形式、数量、难易、时限、指导语等方面相同或相似;2. 两次测验的时间间隔要适当,若太短,由于测验太相似被试可能厌倦,若太长可能又会因新的学习而产生干扰。使用复本信度的局限袅 1. 只能减少但不能完全消除练习和记忆的影响; 2. 由于第二个测验只改变了题目的具体内容, 已经掌握的 解题原则,可以很容易地迁移到同类问题。 3. 对许多测验来说,建立复本是十分困难的。芅羀分半信度: 在测验无复本且只能施测一次的情况下,通常用分半法估计信度,即将测题分成对等的两半,根据 各

8、人在这两半测验的分数,用皮尔逊积差相关公式计算其相关系数,作为信度指标。羀分半的方法( 仅供参考)芆通常采用奇偶分半法。使用此方法应注意:螃 1一组解决同一问题或互相有牵连的题目应尽量安排在同一半内。羃2当试卷中有任选题时不宜使用分半法,速度测验也不宜用。肀(三)校正公式(因为此方法和可能低估原长测验的信度,因此需要用斯皮尔曼公式进行修正)蚇 1.斯皮尔曼 布朗公式蒅 rxx=2rhh/ (1+ rhh )其中, rhh 为两半分数的相关系数,rxx 为测验在原长度时的信度估计。螂 此法假设:两半测验分数的变异性相等,但实际资料未必符合此假设。膀同质性信度: 同质性的含义:所谓同质性指的是测验

9、内部题目的一致性。题目内部的一致性主要受两方面变异的影响: 1内容的一致性;2所研究的行为的同质性。肈 同质性信度的计算袂 1库德 理查逊公式:蒀(1) K-R20 公式:rkk=K/(K-1)(Sx2-刀 piqi )/ Sx2)芀 式中 K 表示整个测验的题数, pi 为项目通过率, qi 为项目未通过率, Sx2 表示测验总分的变异数(方差) 。芄( 2) K-R21 公式,适用于各题难度相近的情况:蚄 rkk=K/(K-1)( Sx2-K piqi)/ Sx2艿 pi 为题目的平均通过率, qi 为 1-pi莀 K-R21 公式计算较为简单, 但求得的信度系数有低估的倾向, 当题目难度

10、相差大时偏差更大。 公式 K-R20 和 K-R21 只适用于 0,1 记分的测验。23.蚅克伦巴赫a系数:适用于非0, 1记分的一种内在一致性系数。其公式如下:肂 a =K/(K-1)1-(刀 Si2/ Sx2)节其中 Si2 为每一项目分数的变异数,其他字母意义与 K-R20 相同莀评分者信度: 是由多个评分者给一组测验结果评分,所得的各个分数的一致性肆 方法是:随机抽取相当份数的试卷,由两位或多位评分者按记分规则分别给分,然后根据每份试卷的分数计算 其相关系数, 即得评分者信度。 一般要求在成对的受过训练的评分者之间平均一致性达到 0.90以上, 才认为评分是客 观的。螄当多个评分者评多

11、个对象,并以等级法记分时,可用肯德尔和谐系数作为评分者信度的估计:肁 W=刀 Rt2-(刀 Ri)2/N/(1/12)K2(N3-N)(具体公式在书本 155 页)葿其中, K 是评分者人数, N 是被评的对象数, Rt 是每一个对象被评等级的总和。蒇节影响信度的因素袀被试样本 : 1,团体的异质性: 信度系数受分数的分布范围(全距)的影响,而分数范围与被 试团体的异质程度有关。一个团体越异质,其分数范围越大,信度系数也就越高。相反,相对同质的团体分数则较为 均匀。 2, 团体的平均水平: 对于不同的团体,题目具有不同的难度。每个题目在难度上的微小差异积累起来便会影响 信度。因此,我们在编制测

12、验量表,抽选被试时,往往要考虑选取不同层次的被试,以使得测验团体呈异质性,从而 使得信度提高。反之,当需要同质团体的信度时,就应该尽量选取同一层次的被试。蕿二、题目的数量 :一般说来,在一个测验中增加同质的题目,可以使信度提高。即测验越长, 信度越高。这是因为测验加长,加大了分数分布的范围,可能改进项目取样的代表性,从而能更好地反映受测者的真 实水平。即测验的项目越多,在每个项目上的随机误差就可以互相抵消。增加测验长度的效果可以用斯皮尔曼 布朗的通式来计算 ; rkk=Krxx/1+(K-1)rxx式中 K 为改变后的长度与原来长度之比,rxx 为原测验的信度, rkk 为测验长度是原来的 K

13、 倍时的信度估计。羄 但增加测验长度的效果遵循报酬递减率, 测验过长是得不偿失的, 可以通过下式确定一个测验究竟要增长多少才能达到理想的信度水平:袃 K= rkk(1-rxx)/rxx(1- rkk)虿应注意一点,只有当新题目是与原题目选自同一总体,增长测验才能改进信度。羅三、测验的难度 : 要使信度达到最高,能产生最广分数分布的难度水平方为合适。通常这个难度为 0.5 。洛德提出选择题的理想平均难度是:五选题0.70、四选题 0.74、三选题 0.77、是非题 0.85。蚆四、 间隔时间 : 间隔时间越短,信度系数越大;间隔时间越长,受外界影响越大,信度系数 越小。测量的标准误差 :蝿定义:

14、个人在两次测验中的分数差异就是测量误差,据此可制成误差分数的分布。这个测 量误差分布的标准差就是测量的标准误( SE ),是表示测量误差大小的指标 . 测量标准误可以通过一次测验结果及信 度估计得到,公式如下:莆 SE = Sx V1 rxx膃式中, SE 为测量标准误, Sx 为所得分数的标准差, rxx 为测验的信度。由公式可知: 测量的标准误与信度之间有 互为消长的关系:信度越高,标准误越小;信度越低,标准误越大。根据公式,知道了一组测量的标准差和信度系数, 就可以求出测量的标准误,进一步我们就可以从每个人的实得分数估计出真分数的可能范围,即确定出在不同或然率 水平上真分数的置信区间蒁衿

15、作用: 它有两个作用:其一是估计真分数的范围;其二是了解实得分数再测时可能的变化情况。螇(注意事项)袅第一、 SE 对真分数作的是区间估计,不可能由此得到一个确切的点。腿第二、置信水平确定后,估计的精确度主要取决于SE ,SE 越小,估计就越精确,相反则越粗略。罿第三、真分数不等同于真正能力或特质。当系统误差对实测分数产生影响时,用此方法估计出的真分数就并非代表 被试的真正能力或特质。膇效度芃定义: 效度指的是测量的准确性,即一个测验或量具能够测量出其所要测量东西的程度。节(操作定义)在测量理论中,效度被定义为:在一列测量中,与测量目的有关的真实变异数(由所要测量的变因引 起的有效变异)与总变

16、异数(实得变异数)的比率,即罿效度 = SV2 / Sx2莄 式中 SV2 代表有效变异数, Sx2 代表的是分数的变异数,即总变异数。肅效度的性质: 1, 效度是针对测验结果的,即测验效度是“测验结果 ”的有效性程度 2,效度是针对某种特定的测验目的的 3,效度只有程度上的差异,效度只有程度上的差别,而不是 “全”或 “无”的差别。羁效度的种类: 内容效度 即测验用的测题对整个测验内容范围的代表性程度,构想效度 是指一个测验对某种心理学所涉及的抽象概念或心理特质测得如何,这些抽象概念或心理特质都是构想出来的。效标效度又称实证效度或准则关联效度,指的是测验对我们所感兴趣的外在行为能够做出多好的

17、预测。这种外在行为是衡量测 验是否有效的标准,简称效标聿效度与信度的关系 (一)高信度是高效度的必要而非充分的条件(二)测验的效度受它的信度制约螅 信度系数的平方根是效度系数的最高限度蒃一个测验要具有内容效度必须具备两个条件:首先,要有定义完好的内容范围,并使测验的全部项目均在此范围内。所谓内容范围可以是具体知识或技能,也可以是复杂行为。 其次,测验题目应是所界定的内容范围的代表性取样螀确定内容效度的方法: 专家判断、统计分析、经验推测法膈 随堂练习膆如何考查学业成绩测验的内容效度?主要方法有哪些?膅答 ;1、考察学业成绩测验的内容效度要从以下几方面入手: (1)分析测验项目所考核的知识技能覆

18、盖面: ( 2)测验内容的深度、广度与结构比例: (3)能力水平的考核情况。螃 2、考察学业成绩测验的内容效度的主要方法: (1)请学科专家做出系统评判: (2)实证研究的方法,令被试 “出声 思考 ”了解题目引起被试怎样的加工过程,以确定测验实有的测量考核功能。芈内容效度的特点 : (一) 内容效度的特定性 ,一般说来测验使用者总是将测验应用于特定情况。 他在每种情况下应用测验时,都是要测量他认为重要的行为。从这一观点来看,内容效度是由特定情况决定的。 (二) 要求内容效度的测验,并不一定要求测验为同质。 (三)内容效度常与表面效度搞混薇 四、 内容效度的应用与评价 :内容效度对于学绩测验、 各种人员选拔和安置的职业测验等都是适 用的。但对于能力倾向测验和人格测验一般是不适用的。蚃内容效度的主要缺点是缺乏理想的数量指标,因而妨碍了信息交流和各测验间的相互比较。薂构想效度 莈定义 ;羈莅莁蒈肅袂肀薈蒆以下无正文仅供个人用于学习、研究;不得用于商业用途to员bkogA.nrogeHKO TOpMenob3ymoiflCH6yHeHuac egoB u HHuefigoHMucno 员 B3OBaTbCEb KOMMepqeckuxqe 员 ex.For personal use only in

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论