




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第二章心理测量概述量尺度数学特类别顺序比率分类U r) 楼序( ) 可距(+ * -) 比信v)寸7机误差2.系统误差1.指那些与复习提纲第一章心理测量的历史1中国古代心理测量方法:观察法、访谈法、自然实验法2.冯特1879年在莱比锡大学建立第一所心理实验室。最先倡导测验运动的是优生学创始人高尔顿。他开创了个别差异心理学研究,并采用定量研 卡特尔89年在心理杂志上发表的论文心理测验与测量,这是心理测量第一次出现在 文献上。艾宾浩斯88年发表记忆,开了用实验方法研究记忆的先河,使他成为第一位对记忆这种 理过程进行科学定量研究的心理学家。比奈是发明智力测验常模量表的第一人年,比奈与西蒙合作,编制世
2、界上第一个智力测验- 比奈西蒙量表。美国斯坦福大学的推孟教9授年修订了斯坦福比奈量表,首次采用智商)(概念美国心理学家桑代克0年出版心理与社会测量导论,是关于测验理论的第一部著作人格测验的先驱是克雷佩林18于年最早使用自有联想测验诊断精神病人。3.心理测验的发展,主要受了发面影响:心理学理论的发展、统计学方法的进步。1、测量就是根据一定的法则用数字对事物加以确定。2、测量的三要素:事物、数字、法则3、测量的两个要素:参照点、单位 (参照点是确定事物的量时计算的起点,参照点有 两种,绝对零点和相对零点。0 C属于相对零点,并不意味着没有温度。测量目的无关的偶然因素引起的误差。 既影响测验的一致性
3、、准确性2.指引起的一种恒定而有规律的效应。不影响一致性,只影响准确性。要想使测量准确可靠,就必须减少误差;而要控制误差,就必须了解误差的来源。同物理 心理测量误差主要来自测量工具2测量对象,3测量过程。1造成的误差主要来自测验的过程, 其中项目取样勺影响最大2即被试本身引起的误差最复杂最难控制误差最容易控制和检验。) 要想控制误差,就必须使测验标准化,即测验的编制、施测、评分、解释都必须标准化-控制 的因素,减少误差,使测验分数更可信、有效。2、测量理论一般分经典测量理论、 概化理论和项目反应理论三大类。 将以真分数为 核心假设的测量理论及其方法体系,统称为经典测验理论( CTT ,或真分数
4、理论。 是最早实现数字形式化的测量理论。真分数的操作定义:无数次测量结果的平均值。CTT的基本思想:把任何一个测验成绩都看作是真分数和测量误差的T假定观察分数X 与真分数T)之间是一种线性关系,并且只相差一个测量误公式:X=T+E这就題T数字模型。(注:此处误差指引起测量不一致的因素产生的效应,即指随机误差,不包括系统误差,后者 数改变,因此包含在真值中。)3、CTT不足、局限性:统计量的样本依赖性,抽样变动大能力与难度量表的不一致性, 测量误差大信度估计的不准确性,复本编制难测验结果拓宽的有限性,预测力缺乏测量 分数的测验依赖性,分数难比较。第四章心理测量的信度1信度:指同一被试者在不同时间
5、内用同一测验(或用另一套相等的测验)重复测量,所得测量结果的稳定性与一致性程度。(书上只是划线部分)在测量理论中,信度定义:一组测量分数的真变异数与总变异数(实得变异数)的比率,即r XX= ST2 -真值方差SX2 -观测值方差2信度作用:是测量过程中随机误差大小的反映(注:信度并不反映系统误差)信度系不同的信度反映测验误备注误差来重测二稳定同一量表、同一组被试,两次测验提供测量结果是否随时间而时变取样信度性系数所得结果的一致性程度。夸时间的资料可作预测受测者将来行为的复本信=等值性度 系数分半与复本信度 信度很相似二内部两个平行测验测量同一批被试局艮:虽然比再测信度应用广泛许连续施等值、但
6、题目不同、同一群体夸多,但1.受练习、记忆影响更大测:内容形式)测量难度会由于重复而有所改变反映测验在内容上的等值系数大编制真正的等值测验困难重重小反映两个复本题目的差别。(间隔:时间&内指将一个测验分成对等两半后有误差来自题目本身,与时间因素容取样被试在这两半上所得分数的相关。;不适用于速度测验分半方法多等条件下,测验越长,信度越高。T同一测验会有多个分半信度值测验内部所有题目间的一致性题目内部一致性影响因素内容取内容的异致性性信所有题目看起来像测量同一特质样2.所研究行为的一致性。所研颓性系数评分者信分者给同一批位评分者按评分标准分别给致性达到以上,评分才是客观澜的差异可以帮助在不同测验分
7、数之间进行比较可以用来解释个体测验分数的意义3.数 差的不同来源依据人的多数心理特征具有相对稳定性、易受练习、记忆影响,前后两次取样间隔一段时间,不会有很大变化。测间隔长短务必适宜同质相关很低或负相关时,测验为异行为的同质性越甌目间一致性高。定义:多个评t机抽取若干份测验卷,由成对受过训练的评分者之间平均分者之人的答卷评分分,然后根据每份测验卷的两的致性程度个分数计算相关总述只能说在特定条件下,用于特定的团体,米用特定方法所得的信度系数 信度总是与特定情境相关攵是多少4.影响信度的因素:是测量过程中随机误差大小的反映。随机误差大,信度就低。所以引起随机误差的因素一般都影响信度。 主要有:被试因
8、素主试-施测情境 -测量工具-两次施测的间隔时间5.提高信用的常见方法:适当增加测验项目的长度因素分析和鉴别力分析弱 势矫正控制测验项目的难度选取适当的被试群体,提高测验在各同质性较强的 亚团体上的信度。第五章心理测量的效度1.效度:(指一个测验或量表实际能测出其所要测的心理特质的程度。)/所有变异中,只有由所观察的心理特性引起的变异部分才是要真正测量的,它在变异中所占比重就是效度的大小。/效度的基本问题是:测验要测量的是什么。/信度不考虑系 统误差,效度考虑。2.效度性质:效度是针对测验结果的eg.这个智力量表真的能考查智力吗;-是针对某种特定的测量目的的-所以不具有普遍性;-只有程度上的差
9、异。心理特质较隐蔽,通过其行为表现来推测,只能达到某种程度上的准确。所以效度是程度上 的差别,而不是全或无的差别。(补充说明:相对性:在评鉴测验的效度时,必须考虑其目的与功能)3.效度验证:收集大量资料和证据来检验测验效度的工作过程。常用的效度概化验证的方法:交叉效度评定元分析4.效度与信度的关系:信度高是效度高的必要非充要条件。所以, 3种组合:高信 高效,高信低效,低信低效/从信度和效度定义可解释:效度 Vai二Sv2/Sx2,信度rxx =S/Sx2,而S2二Sf+S2,因此信度的提高只给Sv2的增加提供可能性,至于是否能提高内容效度指测验题目对有关内容或 评估方行为范围取样的适当性,所
10、法关注的是测验的内容方面1、专家评定法2、统计法3、经验法=逻辑效度,专家认为代表了所测 内容,则具有内容效度(运用逻辑 思维)指测验结果能否代表或预测校标行为的有效性和准确性程度效标:指独立于测验结果,目的的行为参照反映测验方法验证策略:计算方法:b.c.同时效度与预测效度a.相关系数法分组检验法取舍正确率分类同时效度 预测效度效度还要看s2的大小。可见信度高效度不一定高,但一个测验要想使效度高,信度 必须高。测验效度受信度的制约。5.效度种类:最常见分类方式是根据效度验证的证据来源,把效度分为:内容效度 效标关联效度、构念效度。6.注:楷体书上无,属于补充特性:最高行为的测验要求有较高的表
11、面效度来解释测验分数的恰当程度效应引起)因素分析多特质?法=结构效度,测验能说明心理学上的理论内部一致性(用来衡量测量的同质性或特质的程度,用心理学上某种结构或特与其他测验的相关发展变化(教育与训术意义上,它不能算是一种效度;它不是指测验实际上所测量的效度,而是指测验表面上看 起来所要测的东西。表效影响被试测验动机。适当的表效是可以的,测验题目引起被试的动 机与兴趣,但也有较好的隐蔽性聚合效度哙聚效度,求同效度若两个测验测量同一特质J使使用方法不同它们之间相关也是高的区分效度=求异效度基 本 思 想不同特质相同低合成效度与区别效度:职业心理学家发展出来的两个新的效标关联效度。区别效度与区分效度
12、在概念和使用范围上都有所区别:ab区分效度与聚合相对的,是用以检验构念效度的指标。而区别效度用以检验职业测验关联效度的指标,它有不同含义: 某个心理测验的得分,与两种不同性质的职业绩效之间的相关系数的差异,可以作为该测验 的区别效度,用以推测选择哪种职业其成功的可能性如何。内部效度与外部效度b: a二内部一致性效度,反映测验的构念效度。:指将研究结果概化 到其他情境和总体的程度。8.影响效度的因素:测验本身因素1.测验的、校标因素、样本的代表性、干涉变量9.效度的应用:效度在测验编制中的重要作用-在选拔中的重要影响 -在决策中的重要影响-与信息组合-在人员分类与安置中的重要影响。第六章心理测验
13、的编制1.心理测验的编制的程序:“三阶段六步骤”7.其他效度:表面效度:(是测验要求被试做的事情和被试对比理解之间的互动)在技度法方程建模认知心理学上的证据测验编制的准备阶段:确定测验目的拟定编题计划测验的正式编制阶段:产生测题(1搜集有关资粒选择测题形式3编写修订测题合成测验(1预测和复核项目选择和编排等值复本的编造测验编制的完善阶段:测验的标准化( 测验内容、实施过程、评分计分、分数解释;准化测验性能评估编写测验指导手册2.心理测验编制的主要原则:(一) 遅本原则:.信度好2.效度高3.难度适中4.区分度强(二)具体要求:4点:针对题目内容、语言、表达、理解的要求心理测验编制的具体技术:(
14、想要编制良好的测验,除了必须遵循前述测验编制的程序和命 则外,还要掌握命题的方法与技巧:一)客观性题目的编制要选题2.是非题与改错题.匹配 题与排列题(二)主观性:1.填空题与简答题2.论文题3.应用题4.操作题5.联想 题3.项目分析含义&意义(why进行xmfx):信度与效度是对测验整体的分析,而 xmfx 则是细化的、对测验中每个项目(item )的具体分析。信度好与效度高必然是高质 量的项目的综合反映。通过预测,对测验的各个项目或题目进行分析,是编制和修 订测验的重要环节。在xmfx基础上,通过对项目的筛选、修订,可以改进测验的信度和效度,使测验更加简洁、实用、有效、可靠。(评价项目质
15、量的主要指和区分度4.难度:指项目的难易程度。最高作为测验中称“难度”,经典作为测验中指“通 俗性”。两者都指在总体中,能够正确或确切回答某项目的人数。5.测验难度水平的确定:效标参照测验、掌握测验,一般不考虑难度;选拔测验,nd最好接近录取率;对于选择题,nd把把应大于猜测概率。题目nd接近或等于比 较理想,此时项目具有最大鉴别力。(一般,使项目平均 nd接近,而各项目nd在士间变化即可,若nd都为,题目过分同质,也降低区分力。)6.难度对测验的影响:nd影响测验分数的分布形态、测验的信度、测验的鉴别力(区 分度)7.区分度:指测验项目对被试心理品质水平差异的区分程度,又称鉴别力。qfd也是
16、评价项目质量和筛选项目的主要指标和依据。(qfd好的测验实际水平高的被试应的高分,低得低分。Qfd高的项目,将不同水平的被试区分开来;qfd低的项目,不能 很好鉴别被试水平。)8.难度计算:p157 ()二分法计分项目的难度计率2.两端分组法(二)非1用被试得分平均数估计2.用难度的校对公式计算9.区分度计算:p16210.区分度与信度的关系:关系密切,一般测验的信度随区分度的提高而增长。(所以,提高题目区分度是提高信度的方法之一)区分度与难度关系:二者都针对一定团体而言。一般,较难项目对高水平被试区 分度高,较易低水平高。/难度中等的题目区分度最高。11. CTT中,测量误差是一个统计量,依
17、赖于样本;而在IRT中,测量误差不是一个统 计量,它是关于B的函数。12.保证试题的稳定性、分数的公平性、和合格试题的有效存储、高效成批生成等, 涉及到测量理论中两个问题:测验等值、题库建设。一、1.测量(/项目)等值:在心理与教育测量中,把测量同一种心理特质的不同测验分数, 一定的数学模型转换成同一单位系统中的简言之,等值是将测验不同版本的分数统一在一个量 表上的过程2.等值的性质与条件:等值是有条件的,并非任意两个测验都可以等值。等值 的条件由测验的性质决定。因此,测验等值的条件与性质是统一的。首先,进行等 值的测验必须是测量同一心理特质或能力(即同质性)。只有同质的事物相比较才 有实际意
18、义。其次,只有信度相等的测验才能等值(即等信度性)。两个测验即使 测量同一心理特质,但信度不同,也不能等值。等值数据资料的收集方法有很多,一般分为两大类: 一是采用以“人”为媒介的共同组等值设计;二是以“题目”为媒介的共同题等值设计。等值设计:单一组设i共同考生设共同参照测验设计共同参照测验和共同考生的混合设计 二、题库:现代意义上的题库,一般指由适用于不同目的、技能和任务需要,且具有必要参数的大量合格或优质的试题的集合。(它严格遵循心理与教育测量理论,在精确的数学模型基础上建立起来的测量评价工具。2题库建设的一般程序:试题开发-分析等值-存储建库-动态维护。第七章心理测量分数的处理与解释1.
19、常模参照测验c:在分数解释时如果参照的是被试总体的分数分布(常模),则测 验称为。标准参照测验b: 是某一事先定好的标准,贝卩。与b没有非常严格的界限,但二者有重要的区别:两者测验目的不同对题目统计 量的考虑不同内容领域规范的详略不同对测验分数的推断不同。主要对测验的内容领域,对被试进行比较分析-判明被试在团体中的位置&发展水平。所以,c通常使用年龄分数、年级当量、百分等级分数、标准分数等常模。的分数解释可采用1发展量表、2商数、3百分等级、4标准分数等形式。(商数包括 比率智商教育商数成就商数 注:2中,(1916隹孟)比率智商=(智龄MA实际年龄 CA *100智龄表心理发展水平,绝对量数
20、,智直表心理发展速率,相对量数4中,离差智商将一个人的测验分数与同龄组的人比较所得到的标准分数韦克斯勒)离 差智商Q= 100+15*Z,10(为平均数,15为标准差,Z为根据每个被试的总量表分数在常模团体中的百分等级。和b的分数解释:结果解释c(一)常模及其建立:制定常模3步: 确定有关的比较团体 获得该 团体成员的测验分数 把原始分数转化成量表,该量表能把个人分数表 示成在这个团体内的相对位置。(二)分数解释:1发展量表、2商数、3百分等级、4标准分数b(一)内容参照分数:1掌握分数、2正确百分数、3内容标准分数、4等级评定量表(二)结果参考分数:1期望结果的概率、2预期的效标分数第八章心
21、理测验的使用1.选择测验要考虑到因素:(一)所选测验必须适合测量目的和对象-必须符合测量学要求1.测验的功效性敏感性简便性科学性时效性(三)测验选择的其他考虑因g.测验的经 济性、可得性、文化适用性。2.标准化施测:当给被试的指示、施测条件、评分计分步骤都遵循同样详细和一致的程序时,此过程可称为。否则分数解释的准确性和互比性J。3.测验标准化,包括:测验的指示语、测验时间限制、测验的环境条件、测验的评分计分 都要标准化。第九章能力测验1.个体智力测验:指在一定时间内只能测量一个被试,其主要特点在于精确、反馈 及时,但不经济。目前使用最广泛的个体测验:比奈量表、韦氏量表、考夫曼量表。2.比奈-西
22、蒙智力量表是世界上第一个智力量表,诞生于 1905年。斯坦福-比奈智力 量表使用智力商数(IQ)表示智力水平。1960年,该量表舍弃比率智商,引入离差智 商。1924年,陆志韦在斯坦福-比奈量表(1916年版)基础上,修订中国比奈-西 蒙智力测验,1936年又与吴天敏合作完成第二次修订。3.韦氏量表(成人、儿童、学龄前和学龄初期儿童)的三个智力分数(言语智商、操作智商、全量表智商)的平均数都为100,标准差都为15。韦克斯勒在1949年出版 的WIS(中第一次用离差智商代替比率智商。4.考夫曼儿童成套评价测验(K-ABC于1983年编成(岁岁)青少年和成人智力测验(KAIT) 1993年(11岁以上青少年及成人),由2个分量 表组成:晶体量表、流体量表。麦卡锡幼儿智力测验( MSCA 1972年编制,用于对 儿童心
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度生猪养殖企业与运输企业合作协议
- 请假口语交际课件
- 2025就业指导课合同与劳动权益解析
- 2025设备租赁合同范本大全
- 诗经蒹葭获奖课件
- 儿童游乐设施项目设计建造合同
- 诗经王风采葛课件
- 个性化办公空间租赁协议
- 家庭室内装修设计与施工协议
- 市场营销活动策划方案模板创新与执行
- 2025版劳动合同范本下载
- 2025年医疗机构软式内镜清洗消毒技术规范试题及答案
- 2025年重庆全国导游资格考试(政策与法律法规、导游业务)历年参考题库含答案详解(5套)
- 2025年八师兵团职工考试题库及答案
- 2025年全国“质量月”质量知识竞赛题库及答案
- 子宫多发性平滑肌瘤的个案护理
- 要素式强制执行申请书(申请执行用)
- 慢性根尖周炎病例汇报
- 2025年秋数学(新)人教版三年级上课件:第1课时 几分之一
- 公司项目谋划管理办法
- 2025年职业指导师考试试卷:职业指导师专业能力
评论
0/150
提交评论