心理测量学复习重点方案_第1页
心理测量学复习重点方案_第2页
心理测量学复习重点方案_第3页
心理测量学复习重点方案_第4页
心理测量学复习重点方案_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、心理测量与测验 期末复习整理第一章 心理测量的历史1. 中国古代心理测量方法: 观察法、访谈法、自然实验法 2. 冯特1879年在莱比锡大学建立第一所心理实验室。最先倡导测验运动的是优生学创始人高尔顿。他开创了个别差异心理学研究,并采用定量研卡特尔1890年在心理杂志上发表的论文心理测验与测量,这是心理测量第一次出现在 文献上。艾宾浩斯1885年发表记忆,开了用实验方法研究记忆的先河,使他成为第一位对记忆这种 理过程进行科学定量研究的心理学家。比奈是发明智力测验常模量表的第一1人90。5年,比奈与西蒙合作,编制世界上第一个智力测验 比奈-西蒙量表。美国斯坦福大学的推孟教授年修订了斯坦福b奈量表

2、,首次采用智商)概念。美国心理学家桑代1克904年出版心理与社会测量导论,是关于测验理论的第一部著作。人格测验的先驱是克雷佩林1,8于92年最早使用自有联想测验诊断精神病人。3. 心理测验的发展,主要受了发面影响: 心理学理论的发展、统计学方法的进步 。第二章 心理测量概述 1、测量就是 根据一定的法则用数字对事物加以确定。2、测量的三要素: 事物、数字、法则。3、测量的两个要素:参照点、单位 ( 参照点是确定事物的量时计算的起点,参照点有 两种,绝对零点和相对零点。0 C属于相对零点,并不意味着没有温度。/好的单位要 有确定的意义(即对同一单位),还要有相等的价值。但心理、教育测量所用单位不

3、等值) 4、量表:要测量某个事物,必须有一个定有参照点和单位的连续体,将要测量的每 个事物放在这个连续体的适当位置上,看它距离参照点的远近,以此得到一个测量 值,这个连续体就叫量表。探 根据测量的精确程度(测量单位的理想不理想,量表分为四类:(1)命名量表:只能按照事物的某种属性对其进行分类或分组。 如性别(男、女)、 学历、企业性质、职业、地区等。(2) 顺序量表:是对事物之间等级差别或顺序差别的一种测度。它不仅可以将事物分成不同的类别,而且还可以确定这些类别的优劣或顺序。如:1考试成绩:高中、大学及以上。3具有“ 和”、“=和工”数学特性,但不能进行加、减、乘、除运算。优、良、中、及格、不

4、及格。2教育水平:小学及以下、初中、(3) 等距量表:不仅能将事物分为不同类型并进行排序,而且还可以准确地指出类别之间的差距是多少,表现为数值。如考试成绩百分制、温度等。等距量表中没有绝对“零点”。“0”表示一个数值,即“ 0”水平,而不表示“没有”或“不存在”。如“ 0”度表示一种温度水平,并不是没有温度。具有类别量表和顺序量表的数学特性外,其结果还可以进行“加、减”运算。(4) 比率量表:它具有上述三种尺度的全部特性外,还可以计算两个测度值之间的比值。既有绝对零点,又有相等单位。如长度米、重量千克、收入元等。比率量表中“ 0”表示“没有”或“不存在”。探 等距量表只能进行加、减运算,而等比

5、量表可进行加、减、乘、除运算。量尺度数学特类别顺序等距比率分类U工)4寸寸怫序)旬距(+、-)75、心理测量a:根据一定的法则用数字对人的行为加以确定。即根据一定的心理学理 论,使用一定的操作程序,给人的行为确定出一种数量化的价值。6、心理测验b:通过观察人的少数有代表性的行为,对于贯穿在人的全部行为活动中的心理特点作出推论和数量化分析的一种科学手段。a是b的一种工具,是根据 定法则对人的行为用数字加以确定的方法。7、心理测量的性质:3个间接性:无法直接测人的心理,只能测量人的外显行为,如通过对测验题目的反 应来推断他的心理特质。相对性:P28客观性:实际上就是测量的标准化问题。标准化程度越高

6、,其测量结果的客观性 也越高。(补:测验的客观性包括测验的刺激、对反应的量化、对结果的推论是客 观的)测验&心理测量的基本功能是测量个体间的差异或同一个体在不同场合下的反应。在实际工作中a和理论研究中b有着广泛的应用。a:选拔人才、人员安置、诊断、 预测、评价、咨询b :搜集资料、建立和检验假说、实验分组。第三章心理测量的误差 1、测量误差:指在测量过程中,那些与测量目的无关的因素所导致的测量结果不准 确或不一致的测量效应。可分1.随机误差2.系统误差。1.指那些与测量目的无关的偶然因素引起的误差。既影响测验的一致性、准确性2.指引起的一种恒定而有规律的效应。 不影响一致 性,只影响准确性。要

7、想使测量准确可靠,就必须减少误差;而要控制误差,就必须了解误差的来源。同物理 心理测量误差主要来自测量工具,测量对象,3测量过程。1造成的误差主要来自测验的过程, 其中项目取样勺影响最大2即被试本身引起的误差最复杂最难控制误差最容易控制和检验。) 要想控制误差,就必须使测验标准化,即测验的编制、施测、评分、解释都必须标准误差 的因素,减少误差,使测验分数更可信、有效。2、测量理论一般分经典测量理论、 概化理论和项目反应理论三大类。 将以真分数为核心假设的测量理论及其方法体系,统称为经典测验理论(CTT),或真分数理论。是最早实现数字形式化的测量理论。真分数的操作定义:无数次测量结果的平均值。C

8、TT的基本思想:把任何一个测验成绩都看作是真分数和测量误即和假定观察分数X)与真分数T)之间是一种线性关系,并且只相差一个测量误公式:X=T+E这就題T数字模型。(注:此处误差指引起测量不一致的因素产生的效应,即指随机误差,不包括系统误差,后者 数改变,因此包含在真值中。) 3、CTT不足、局限性:统计量的样本依赖性,抽样变动大能力与难度量表的不一致性, 测量误差大 信度估计的不准确性,复本编制难测验结果拓宽的有限性,预测力缺乏测量 分数的测验依赖性,分数难比较。第四章心理测量的信度1. 信度:指同一被试者在不同时间内用同一测验(或用另一套相等的测验)重复测量,所得测量结果的稳定性与一致性程度

9、。(书上只是划线部分)在测量理论中,信度定义:一组测量分数的真变异数与总变异数(实得变异数)的比率,即r XX二St2真值方差Sx2 T观测值方差2. 信度作用:是测量过程中随机误差大小的反映(注:信度并不反映系统误差) 可以帮助在不同测验分数之间进行比较可以用来解释个体测验分数的意义3.信度系不同的信度反映测验误备注冲K七误差来数 差的不同来源重测=稳定同一量表、同一组被试,两次址优提供测量结果是否随时间而信度性系数所得结果的一致性程度。夸时间的资料可作预测受测者将来行为的依据人的多数心理特征具有相对稳7缺:易受练习、记忆影响,前后两次取样间隔一段时间,不会有很大变化施测间隔长短务必适宜复本

10、信=等值性两个平行测验测量同一批被试.局限:虽然比再测信度应用广泛许连续施度 系数等值、但题目不同、同一群体夸多,但1.受练习、记忆影响更大测:内容形式)测量难度会由于重复而有所改纟易反映测验在内容上的等值系数大编制真正的等值测验困难重重(间隔:小反映两个复本题目的差别。时间内与复很指将一个测验分成对等两半所有误差来自题目本身,与时间因素容取样 信度相似被试在这两半上所得分数的相关分半关;不适用于速度测验分半方法多等条件下,测验越长,信度越高。7同一测验会有多个分半信度值=内部 同质测验内部所有题目间的一致性题目内部一致性影响因素内容取内容的异性信评分者信总述致性系数所有题目看起来像测量同一特

11、但样2.所研究行为的一致性。所研礦性相关很低或负相关时,测验为空行为的同质性越飆目间一致性高。定义:多个评随机抽取若干份测验卷,目成寸受过训练的评分者之间平均F分者之分者给同一批位评分者按评分标准分别乡致性达至0.9 0以上,评分才是客观的差异人的答卷评分分,然后根据每份测验卷的的一致性程卫个分数计算相关只能说在特定条件下,用于特定的团体,采用特定方法所得的信度系数信度总是与特定情境相关是多少。4.影响信度的因素:是测量过程中随机误差大小的反映。随机误差大,信度就低。所以引起随机误差的因素一般都影响信度。 主要有:被试因素主试-施测情境-测量工具-两次施测的间隔时间5.提高信用的常见方法:适当

12、增加测验项目的长度因素分析和鉴别力分析弱势矫正控制测验项目的难度选取适当的被试群体,提高测验在各同质性较强的亚团体上的信度。第五章心理测量的效度1. 效度:(指一个测验或量表实际能测出其所要测的心理特质的程度。)/所有变异 中,只有由所观察的心理特性引起的变异部分才是要真正测量的,它在变异中所占 比重就是效度的大小。/效度的基本问题是:测验要测量的是什么。/信度不考虑系 统误差,效度考虑。2. 效度性质:效度是针对测验结果的eg.这个智力量表真的能考查智力吗?;是针对某种特定的测量目的的T所以不具有普遍性;-只有程度上的差异。心理特质较隐蔽,通过其行为表现来推测,只能达到某种程度上的准确。所以

13、效度是程度上的差别,而不是全或无的差别。(补充说明:相对性:在评鉴测验的效度时,必须考虑其目的与功能)3. 效度验证:收集大量资料和证据来检验测验效度的工作过程。常用的效度概化验证的方法:交叉效度评定元分析4. 效度与信度的关系:信度高是效度高的必要非充要条件。所以,3种组合:高信 高效,高信低效,低信低效/从信度和效度定义可解释:效度 Val=Sv2/Sx2,信度rxx 二S/Sx2,而St2二sf+s2,因此信度的提高只给Sv2的增加提供可能性,至于是否能提高 效度还要看S2的大小。可见信度高效度不一定高,但一个测验要想使效度高,信度 必须高。测验效度受信度的制约5. 效度种类:最常见分类

14、方式是根据效度验证的证据来源,把效度分为:内容效度 效标关联效度、构念效度。6. 注:楷体书上无,属于补充内指测验题目对有关内容或评估方1专家=逻辑效度,专家认为代表了所行为范围取样的适当性,所关注的是测验的内容方评定法测内容,则具有内容效度(运用2、统计逻辑思维)度面3、经验特性:最高行为的测验要求有较高的表面效度效指测验结果能否代表或预测校标评验证策略:同时效度与预测效度行为的有效性和准确性程度估计算方法:a.相关系数法效效标:指独立于测验结果,反映测度验目的的行为参照分类同时效度b.C.分组检验法取舍正确率测效度构=结构效度,测验能说明心理学上的玉评内部一致性(用来衡量测量的同质性念构或

15、特质的程度;用心理学上某种结木估与其他测验的相关发展变化(年育与训效特质来解释测验分数的恰当程度方练效应引起)因素分析多特方法研究(法结构方程建模认知心理学上的证据7. 其他效度:表面效度:(是测验要求被试做的事情和被试对比理解之间的互动)在技 术意义上,它不能算是一种效度;它不是指测验实际上所测量的效度,而是指测验表面上看 起来所要测的东西。表效影响被试测验动机。适当的表效是可以的,测验题目引起被试的动机与兴趣,但也有较好的隐蔽性聚合效度二会聚效度,求同效度区分效二求异效度本思若两个测验测量同一特质,即使使用方法不同之间相关也是高的不同特质相同低,它们度想合成效度与区别效度:职业心理学家发展

16、出来的两个新的效标关联效度。区别效度与区分效度在概念和使用范围上都有所区别:ab区分效度与聚合相对的, 是用以检验构念效度的指标。而区别效度用以检验职业测验关联效度的指标,它有不同含义: 某个心理测验的得分,与两种不同性质的职业绩效之间的相关系数的差异,可以作为该测验 的区别效度,用以推测选择哪种职业其成功的可能性如何。内部效度与外部效度b a二内部一致性效度,反映测验的构念效度cb:指将研究结果概化 到其他情境和总体的程度。8. 影响效度的因素:测验本身因素1.测验的、校标因素、样本的代表性、干涉变量。9. 效度的应用: 效度在测验编制中的重要作用-在选拔中的重要影响 -在决策中 的重要影响

17、-与信息组合-在人员分类与安置中的重要影响。第六章心理测验的编制1.心理测验的编制的程序:“三阶段六步骤”测验编制的准备阶段:确定测验目的拟定编题计划测验的正式编制阶段:产生测题(1搜集有关资粒选择测题形式3编写修订测题合成测验(1预测和复核项目选择和编排等值复本的编造测验编制的完善阶段:测验的标准化( 测验内容、实施过程、评分计分、分数解释;准化测验性能评估编写测验指导手册2. 心理测验编制的主要原则:(一)遅本原则:.信度好2.效度高3.难度适中4.区分度强(二)具体要求:4点:针对题目内容、语言、表达、理解的要求心理测验编制的具体技术:(想要编制良好的测验,除了必须遵循前述测验编制的程序

18、和命则外,还要掌握命题的方法与技巧。一)客观性题目的编制要选题2.是非题与改错题.匹配题与排列题(二)主观性1.填空题与简答题2.论文题3.应用题4.操作题5.联想3.项目分析含义&意义(why进行xmfx):信度与效度是对测验整体的分析,而 xmfx 则是细化的、对测验中每个项目(item )的具体分析。信度好与效度高必然是高质 量的项目的综合反映。通过预测,对测验的各个项目或题目进行分析,是编制和修 订测验的重要环节。在xmfx基础上,通过对项目的筛选、修订,可以改进测验的信 度和效度,使测验更加简洁、实用、有效、可靠。( 评价项目质量的主要难度区分度4. 难度:指项目的难易程度。最高作为

19、测验中称“难度”,经典作为测验中指“通 俗性”。两者都指在总体中,能够正确或确切回答某项目的人数。5. 测验难度水平的确定:效标参照测验、掌握测验,一般不考虑难度;选拔测验, nd最好接近录取率;对于选择题,nd把把应大于猜测概率。题目nd接近或等于0.50比较理想,此时项目具有最大鉴别力。(一般,使项目平均nd接近0.5,而各项目nd 在0.5 士 0.2间变化即可,若nd都为0.5,题目过分同质,也降低区分力。)6. 难度对测验的影响:nd影响测验分数的分布形态、 测验的信度、测验的鉴别力(区 分度)7. 区分度:指测验项目对被试心理品质水平差异的区分程度,又称鉴别力。qfd也是评价项目质

20、量和筛选项目的主要指标和依据。(qfd好的测验实际水平高的被试应的 高分,低得低分。Qfd高的项目,将不同水平的被试区分开来;qfd低的项目,不能 很好鉴别被试水平。) 8.难度计算:P157 (一)二分法计分项目的难度I过率2.两端分组法(二)非1.用被试得分平均数估计2.用难度的校对公式计算9.区分度计算:p162(所10. 区分度与信度的关系:关系密切,一般测验的信度随区分度的提高而增长。以,提咼题目区分度是提咼信度的方法之一一)区分度与难度关系:二者都针对一定团体而言。一般,较难项目对高水平被试区 分度高,较易低水平高。/难度中等的题目区分度最高。11. CTT中,测量误差是一个统计量

21、,依赖于样本;而在IRT中,测量误差不是一个统 计量,它是关于0的函数。12.保证试题的稳定性、分数的公平性、和合格试题的有效存储、高效成批生成等, 涉及到测量理论中两个问题:测验等值、题库建设。一、1.测量(/项目)等值:在心理与教育测量中,把测量同一种心理特质的不同测验分数, 一定的数学模型转换成同一单位系统中的过程之,等值是将测验不同版本的分数统一在一个量 表上的过程2.等值的性质与条件:等值是有条件的,并非任意两个测验都可以等值。等值 的条件由测验的性质决定。因此,测验等值的条件与性质是统一的。首先,进行等 值的测验必须是测量同一心理特质或能力(即同质性)。只有同质的事物相比较才 有实

22、际意义。其次,只有信度相等的测验才能等值(即等信度性)。两个测验即使 测量同一心理特质,但信度不同,也不能等值。/具体说来,性质&条件要求如下: 1公平性。又叫等价性,测验等值转换关系应具有公平性。(包含等信度性、同质性、 等难度性)2对称性。又叫可逆性,指是双向的3横跨群体的不变性。应具有唯 一性、不变性4样本组间的一维性。又叫一致性、同规格性,指被等值的测验必须是 测量同一维的心理特质。3. 的等值数据资料的收集方法有很多,一般分为两大类:一是采用以“人”为 媒介的共同组等值设计;二是以“题目”为媒介的共同题等值设计。等值设计:单一组设i共同考生设共同参照测验设计共同参照测验和共同考生的混

23、 合设计 二、1.题库:现代意义上的题库,一般指由适用于不同目的、技能和任务需要,且具有必要参数的大量合格或优质的试题的集合。(它严格遵循心理与教育测量理论,在精 确的数学模型基础上建立起来的测量评价工具。2.题库建设的一般程序:试题开发-分析等值T-存储建库-动态维护。第七章心理测量分数的处理与解释1. 常模参照测验c:在分数解释时如果参照的是被试总体的分数分布(常模),则测验称为。标准参照测验b:是某一事先定好的标准,则。2. C与b没有非常严格的界限,但二者有重要的区别:两者测验目的不同对题目 统计量的考虑不同内容领域规范的详略不同对测验分数的推断不同。3.C主要对测验的内容领域,对被试

24、进行比较分析T 判明被试在团体中的位置&发展 水平。所以,C通常使用年龄分数、年级当量、百分等级分数、标准分数等常模。4. C的分数解释可采用1发展量表、2商数、3百分等级、4标准分数等形式。(商数包 括比率智商教育商数 成就商数 注:2中,(1916隹孟)比率智商Q=(智龄MA实际年龄CA *100智龄表心理发展水平,绝对量数,智商表心理发展速率,相对量数4中,离差智商将一个人的测验分数与同龄组的人比较所得到的标准分数韦克斯勒)离差智商Q= 100+15*Z,10(为平均数,15为标准差,Z为根据每个被试的总量表分数在常模 团体中的百分等级。5.C和b的分数解释:结果解释(一)常模及其建立:

25、制定常模3步: 确定有关的比较团体 获得该团体成员的测验分数 把原始分数转化成量表,该量表能把个人分数表示成在这个团体内的相对位置。(二)分数解释:1发展量表、2商数、3百分等级、4标准分数 (一)内容参照分数:1掌握分数、2正确百分数、3内容标准分数、4等级评定量表(二)结果参考分数:1期望结果的概率、2预期的效标分数第八章心理测验的使用1. 选择测验要考虑到因素:(一)所选测验必须适合测量目的和对象-必须符合测量学要求 1.测验的功效性2.-敏感性3.-简便性4.-科学性5.-时效性(三)测验选择的其他考虑 因素Eg.测验的经济性、可得性、文化适用性。2. 标准化施测:当给被试的指示、施测

26、条件、评分计分步骤都遵循同样详细和一致 的程序时,此过程可称为。否则分数解释的准确性和互比性J。3.测验标准化,包括:测验的指示语、测验时间限制、测验的环境条件、测验的评分计分 都要标准化。第九章 能力测验 1.个体智力测验:指在一定时间内只能测量一个被试,其主要特点在于精确、反馈 及时,但不经济。目前使用最广泛的个体测验:比奈量表、韦氏量表、考夫曼量表。2.比奈-西蒙智力量表是世界上第一个智力量表,诞生于 1905年。斯坦福-比奈智力 量表使用智力商数(IQ)表示智力水平。I960年,该量表舍弃比率智商,弓I入离差智 商。1924年,陆志韦在斯坦福-比奈量表(1916年版)基础上,修订中国比

27、奈-西 蒙智力测验,1936年又与吴天敏合作完成第二次修订。3. 韦氏量表(成人、儿童、学龄前和学龄初期儿童)的三个智力分数(言语智商、 操作智商、全量表智商)的平均数都为100,标准差都为15。韦克斯勒在1949年出版 的WIS(中第一次用离差智商代替比率智商。4.考夫曼儿童成套评价测验(K-ABC于1983年编成(2.5岁-12.5岁)青少年和成人智力测验(KAIT) 1993年(11岁以上青少年及成人),由2个分量表组成:晶体量表、流体量表。麦卡锡幼儿智力测验(MSCA 1972年编制,用于对 儿童心理发展作综合的测定与评价。(2.5-8.5岁儿童)5. 团体智力测验:指可以同时对多名被试同时实施的智力测验。(目前以纸笔测验为主,操作测验较少,题目以客观题为主,便于施测和计分)6. 能力倾向测验:多重-特殊-。是有各种测量不同能力的分测验组合而成, 用于了解一个人的潜能方向 用于了解能力的某一特殊方面的具体情况。7.晶体智力:代表个体已经融入自身的在他们文化中得到认可的知识的程度。流-:代表个体感知、记忆以及对基本观念进行

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论