




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第二章 心理测量的信度心理测量学第二章第二章 心理测量的信度心理测量的信度信度与误差信度与误差1信度的种类与估方法信度的种类与估方法 2信度的影响因素信度的影响因素 3心理测量发展简史心理测量发展简史 4你如何解释下述现象?一个很聪明的孩子,测得智商是80分一个学习很好的学生,考试成绩为60分一个人缘很好的人,人际关系测量低于常模值量表帮助我们了解教育、心理现象就像尺子帮助我们测量身高。 思考:我们如何知道我们有多高?有两个工具:尺子 / 秤 尺子的数据与我们的目测更一致,而秤盘的数据则与我们的目测不一致。因此,尺子是测量身高的有效工具效度。什么材料的尺子?什么材料的尺子?钢铁(热胀冷缩)钢铁
2、(热胀冷缩)涉及到一致性的问题。涉及到一致性的问题。信度信度心理测量学第二章第二章 心理测量的信度心理测量的信度第一节第一节 信度与误差信度与误差1一、误一、误 差差n随机误差(随机误差(Random Error)u在不同情境下测量结果是不稳定的,与测量情境和测量条件在不同情境下测量结果是不稳定的,与测量情境和测量条件有关有关u由于这一误差是由测量过程造成的,因此也称测量误差由于这一误差是由测量过程造成的,因此也称测量误差(Measurement EroorMeasurement Eroor)n系统误差(系统误差(System Error)。)。u由于测量本身所造成,测量结果向一个方向偏离,其
3、数值按由于测量本身所造成,测量结果向一个方向偏离,其数值按一定规律变化。一定规律变化。u以相同的方式影响测量值以相同的方式影响测量值n随机误差随机误差-信度,如何控制和减少随机误差信度,如何控制和减少随机误差n系统误差系统误差-效度,如何提高测量工具本身的准确性效度,如何提高测量工具本身的准确性二、信度的定义(一)信度的概念(一)信度的概念n可信性可信性 稳定性稳定性 一致性一致性n 测量结果的可信程度测量结果的可信程度 n 测验结果的一致性和稳定性程度测验结果的一致性和稳定性程度 n受随机误差的影响,随机误差越大,信度越低 n 同一测试同一测试-同一测试对象同一测试对象-多次施测多次施测结果
4、不结果不稳定稳定-缺乏信度。缺乏信度。n 测验本身测验本身-抗干扰能力强抗干扰能力强-误差控制的好误差控制的好-多次施测分数的一致性高多次施测分数的一致性高-信度高,信度高, (二)信度的统计学定义n真分数Tu真实分数,在测量学上叫真分数(True Score)u理论定义:所谓真分数就是一个测量工具在测量没有误差时,所得到的真值(纯正值)。u操作定义:真分数是,经过无数次测量所得的平均值。即一个被试在许多(理论上无限多)平行测验上得分的平均值。1limKggkXTK (二)信度的统计学定义n真分数与观测分数的关系真分数与观测分数的关系u实的分数与真分数关系:实的分数与真分数关系:X=T+EX=
5、T+EnX X2 2= =T T2 2+ +E E2 2 (方差可加性)(方差可加性)n如果误差为如果误差为0 0,则,则T=X -T=X -X X2 2= =T T2 2测验误差期望为测验误差期望为0(或误差的平均数为(或误差的平均数为0)误差大小、正负方向是随机的,因此其平均数为误差大小、正负方向是随机的,因此其平均数为0误差与真分数之间是相互独立的误差与真分数之间是相互独立的即误差的出现、大小方向都与真分数无关即误差的出现、大小方向都与真分数无关因此得出:因此得出:T=X 即一组被试真分数的平均数与实的分数的平均数相等。即一组被试真分数的平均数与实的分数的平均数相等。X:实的分数:实的分
6、数 观测分数观测分数T:真分数:真分数E:测验误差:测验误差(二)信度的统计定义(二)信度的统计定义信度的统计定义信度的统计定义1定义定义1:信度是被试团体真分数方差与实得分数方差之比:信度是被试团体真分数方差与实得分数方差之比2T2E2X2T2E2X22TXXXru真分数的变异在实得分数变异中所占的比重真分数的变异在实得分数变异中所占的比重 u实得分数的变异在多大程度上是由真分数的变异引实得分数的变异在多大程度上是由真分数的变异引起的起的 。u当实得分数的变异可以由全部真分数的变异解释时,当实得分数的变异可以由全部真分数的变异解释时,测验误差就是测验误差就是0 0,这时测验的信度为,这时测验
7、的信度为1 1 (rxx=1)信度的统计定义二n信度乃是一个被测团体真分数与实得分数的相关系数的平方。nrXX= 2TXn思考:相关系数的平方?(二)信度的统计定义(二)信度的统计定义信度的统计定义三n信度乃是一个测验信度乃是一个测验X X与它的任意一个平行测验与它的任意一个平行测验X X的的相关系数。相关系数。nr rXXXX= =X XX X ( (操作定义)操作定义)n于是,可根据测试结果分数的形式,是连续变量还是二分变量等,可采用不同的相关系数计算公式。(二)信度的统计定义(二)信度的统计定义三、信度的作用u评价测验评价测验n信度越高,说明测验所得分数越接近被试的真分数,信度越高,说明
8、测验所得分数越接近被试的真分数,分数就可靠分数就可靠 。n信度要求信度要求: :u解释分数解释分数n对被试的真分数进行估计,信度越高,实得分数越对被试的真分数进行估计,信度越高,实得分数越能代表他的真分数,信度为能代表他的真分数,信度为1 1时,实得分数就是真分时,实得分数就是真分数数. .能力测验:0.90人格/兴趣测验:0.80-0.85 r0.85时,可对个人进行诊断、鉴别、解 也可以进行团体比较r=0.70-0.85,只能进行团体比较r0.70时,不能评价个人, 也不能进行团体比较 心理测量学第二章第二章 心理测量的信度心理测量的信度第二节第二节 信度的种类与估方法信度的种类与估方法
9、2信度的种类u重测信度u复本信度u同质性信度n分半信度n克龙巴赫(cronbach) 系数n库德-理查森信度u评分者信度一、重测信度nTest-Retest Reliabilityn定义:同一量表,同一被试群体,在不同时间,两次施测,求其相关。n实质:表示测验结果的稳定性。故称之为稳定性系数(Coefficient of Stability) n形式:施测 再施测 间隔适当时间重测信度时间间隔的把握n间隔时间越长,稳定性系数越低。适宜时间间隔依照测验目的、性质及被试特点而定。几分钟至几年。n年幼儿童,间隔要小;年长群体,间隔可大。智力测验的间隔不能太短,成就测验的间隔不能太长。 n一般间隔时间
10、不超过六个月。(即不能让被试记住上一次测验的内容,又不能让其特质发生变化,或对所学知识产生遗忘)重测信度的计算方法u求取同一组被试在两个不同时间施测同一个测量工具所得的结果分数的相关系数,一般使用积差相关积差相关法(法(r r)u计算重测信度的原理是对平行测验的假定,假设某测验所要测量的潜在特质,短期内不会随着时间推移而改变。但因为重测时被试的心理特质会发生变化,导致真分数变异,练习和疲劳效应也会也会使得重测的结果出现差异。u在测验手册上报告的重测信度,一般要注明被试样本的性质、大小,及是间隔多长时间所测的信度系数,以便使用者了解样本及时间因素对测验稳定性的影响。计算重测信度时应注意的问题n所
11、欲测量的心理特质是否稳定u所测的如果是人格、智力、兴趣等心理特质,则可以使用重测法,而知识、情绪等不稳定的心理特质使用重测法必须慎重。n重测结果要尽量减少练习或遗忘因素的影响u智力测验的时间间隔不能太短,成就测验则不能间隔太长,既不能让被试记住上次测验的内容,又不能使其特质发生变化,或对所学知识产生遗忘。u如果使用年龄小的被试时,测验间隔要小些,年龄大的被试可以长些。对儿童的智力测验一般是两周到四周为宜。对成年人,间隔可到半年,很少超过6个月。重测信度适用条件n重测信度适用于异质性测验。u所谓异质性测验就是说一个测验包括几个不同的部分,这几个部分分别测量着几个不同的心理特质,它们之间可能并不存
12、在相关,或相关较低。n重测信度适用于速度测验而不适用于难度测验。u速度测验的测题数量多,而且有一定的时间限制,被试很难记住第一次施测的内容,所以第二次施测较少受记忆的影响,而难度测验则相反。u重测信度还适用于运动技能的测验,如跑、跳、掷等,其测验成绩较少受重复测量的影响。二、复本信度n复本测验/平行测验u指在试题格式、题数、难度、指导语说明、施测要求等方指在试题格式、题数、难度、指导语说明、施测要求等方面都相当,并且都用来测量相同潜在特质或属性,但试题面都相当,并且都用来测量相同潜在特质或属性,但试题又是不相同的测验又是不相同的测验 。(AB卷)复本测验等值要符合下列条件:n各份测验测量的是同
13、一种心理特性。n 各份测验具有相同的内容和形式。n 各份测验的题目不应重复。n 各份测验题目数量相等,难度和区分度大体相同。n 各份测验的分数分布(平均数和标准差)大致相等。n复本编好后,应再测一次,以确保各份测验的等值。n复本信度(Alternate-form raliability)u指两个平行测验测量同一批被试所得结果的一指两个平行测验测量同一批被试所得结果的一致性程度致性程度u数值上是两个复本施测于同一被试样本所得测数值上是两个复本施测于同一被试样本所得测验分数的相关系数验分数的相关系数. .u施测方式施测方式n同一个时间连续施测同一个时间连续施测-等值性系数 n间隔一段时间后施测间隔
14、一段时间后施测-等值稳定性系数 复本测验的形式1n等值性系数:同时连续施测,反映内容变异。u形式:复本A最短时间复本Bu被试易出现疲劳、失去积极性、会出现迁移(顺序效应)n可随机分配一半被试先做复本A后做复本B,另一半先做B再做A,以平衡顺序效应。复本测验的形式2n等值稳定性系数:u时间间隔施测,内容变异重测信度误差u同时兼顾试题抽样与时间影响u形式:复本A适当时间复本B n时间间隔,减少了练习效应和疲劳效应n 时间间隔适当,可用于计算稳定性不高的心理特质的测验信度,克服了等值性系数的局限 复本信度优缺点n优点:复本信度优于重测信度u避免了重测带来的记忆效应和练习效应;u可用于长期追踪研究前后
15、测量;u减少了作弊的可能性。 n缺点:u有些测验的复本很难找到;u有些测验因正迁移效应使测验性质改变;u如测量的内容很容易受练习的影响,复本信度也无法清除这种练习效应。复本信度使用条件n各份测验测量的是同一种心理特性。n各份测验具有相同的内容和形式。n各份测验的题目不应重复。n各份测验题目数量相等,难度和区分度大体相同。n各份测验的分数分布(平均数和标准差)大致相等。n复本编好后,应再测一次,以确保各份测验的等值。三、同质性信度n也叫内部一致性信度,指测验内部所有题目间的一致性程度 ,是一个测验所测内容或特质的相同程度 u所有题目测的是同一种心理特质 u所有题目得分之间都具有较高的正相关 u假
16、设 n同质性信度高,说明测验主要测的是某一单个心理特质,由于众多的题目测试了同一心理特质,那么实测结果就是该特质水平的反映 u估计方法 n分半信度 n克龙巴赫(cronbach) 系数 n库德-理查森系数*分半信度(Split-Half Reliability)n定义:在测验没有复本且只能实施一次的情况下,可将测验项目分成对等的两半,根据被试在这两半测验中所得的分数计算相关系数,即得分半信度。 n计算分半信度先要对测验分半。不同的分半法可能会得到不同的信度值。n分半方法:u为了使两半基本等值,可将项目按由易到难的顺序排列编号,然后按奇数和偶数序号将项目分半。要注意使那些性质相同、联系紧密的项目
17、分在相同的一半,否则会使信度值偏高。n由于分半信度实际上只是半个测验的信度,测验越长、项目越多,两半分数的相关就越高。因此,对长度不同的测验,要用校正公式。n斯皮尔曼-布朗公式 :rxx=2rhh/(1+rhh)rxx: -信度系数rhh-两个“半测验”的的相关系数库德-理查森系数n当测验都是二计分题目时,可以用库德当测验都是二计分题目时,可以用库德- -理查理查森系数来估计同质性信度森系数来估计同质性信度n适用条件:只适合预测题目是二分法计分题目。适用条件:只适合预测题目是二分法计分题目。n公式:公式:nK K:测验:测验 题目的个数题目的个数nP Pi i:被试在项目:被试在项目i i上的
18、正确做答比例上的正确做答比例nqi: qi: 被试在项目被试在项目i i上错误作答的比例上错误作答的比例nS S2 2x x:测验的总方差:测验的总方差 u当测验题型较多、并非都是二分记分题时,估计测验信度可采用克龙巴赫系数 u表征多个测验项目的内部一致性 u公式:nK:测验 题目的个数nSi2:被试在项目i上的得分的方差nSx2:测验总分的总方差 *克龙巴赫(Alpha) 系数四、评分者信度nScorer Reliabilityn指不同评分者之间在测验结果计分上的一致性。u随机抽取若干份试卷,由至少两位受过训练的评分者按计分规则分别判分,然后计算它们的相关。评分越一致,评分者信度越高。n适用条件u作文、创造力、投射、道德判断等测验评分者信度的评估方法u计算积差相关或斯皮尔曼相关系数n两个评分者、或一个人两次评分u计算肯德尔和谐
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 跨学科技术在嵌入式中的应用探讨试题及答案
- 网络接入技术的发展趋势试题及答案
- 软件测试工程师与职场准备试题及答案
- 2025年网络工程师备考技巧试题及答案分析
- 2025年公共政策与经济发展的关系试题及答案
- 行政组织理论实践案例分析及2025年试题及答案
- 知识整合信息监理师试题及答案
- 网络映射与监控相关试题及答案
- 行政组织理论新领域的探索试题及答案
- 2025年软件设计师考试的方向分析试题及答案
- 【MOOC】人格与精神障碍-学做自己的心理医生-暨南大学 中国大学慕课MOOC答案
- 中学生体育运动损伤的预防和处理
- 新能源汽车电气系统检修(微课版) 课件 项目二任务2无钥匙进入和起动系统
- 生成式人工智能讲解
- 林权投资合作协议范本
- 中医康复治疗技术习题+参考答案
- 北京联合大学《Java面向对象程序设计》2022-2023学年期末试卷
- 英语导游服务能力(现场200问+)
- 2024年四川省广元市中考物理试题(含解析)
- 学术英语智慧树知到答案2024年南开大学
- 高一上学期化学人教版(2019)必修第一册+++常见反应方程式
评论
0/150
提交评论