心理测量学课件_第1页
心理测量学课件_第2页
心理测量学课件_第3页
心理测量学课件_第4页
心理测量学课件_第5页
已阅读5页,还剩883页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

心理测量概论心理测量学

心理测量的基本性质

1测验的类型与功能

2测验的编制与实施

3心理测量发展简史

4心理测量学

心理测量的基本性质

第一节心理测量学第一节心理测量的基本性质

DBCA升学升级要测验

应聘谋职要测验执业上岗要测验晋职晋级要测验

人生的每个关键时刻都要用到测验心理测量应用的普遍性一、心理测量学一、心理测量应用的普遍性(续)

1

2

3

4评估人的心理发展水平有心理成熟测验评估人的智力发展水平有智力测验

评估人的心理健康水平有心理健康测验评估人的人格特征有人格测验人心理的各个侧面都有测验心理测量学一、心理测量应用的普遍性(续)5评估人的教育水平有教育成就测验

6评估人的职业能力有执业资格测验7评估人的学术能力有学术性向测验

三百六十行,行行有测验心理测量学一、心理测量应用的普遍性(续)需要更多的专业人员

社会发展和进步的标志

心理测量发展

心理测量学第一节心理测量的基本性质二、心理的可测性人的心理非物质,人的心理可测吗?

心理测量学二、心理的可测性(续)孟子:权,然后知轻重;度,然后知长短。物皆然,心为甚。桑代克:凡客观存在的事物都有其数量。麦考尔:凡有其数量的事物都可以测量。心理测量学二、心理的可测性(续)辩证唯物主义的观点:

人的外显行为客观存在,可以感觉、知觉,进而可以测量。心理学的研究证明:

可以通过测量人的外显行为而推测人的心理。

心理测量学第一节心理测量的基本性质三、心理测量的间接性心理测量是一种间接测量。间接测量必须找准中介媒质。物理测量也有间接测量:测气温中介媒质:水银心理测量学第一节心理测量的基本性质三、心理测量的间接性(续)心理测量的中介媒质:人的外显行为外显行为:种类众多而且复杂多变心理测量的间接测量难度更大。心理测量学第一节心理测量的基本性质四、心理测量的定义广义测量定义:

测量是依据一定的法则使用量具对事物的特征进行定量描述的过程。心理测量学第一节心理测量的基本性质四、心理测量的定义心理测量定义:

依据一定的心理学理论,使用测验对人的心理品质进行定量描述的活动。心理测量学四、心理测量的定义(续)定义理解1、心理测量依据的法则:心理学理论心理测量学四、心理测量的定义(续)定义理解(续)2、心理测量工具:测验。测验的本质:一个一个精心设计、精心编排,被称为“题目”的行为刺激组成,“测验”内容千差万别,形式林林总总。

心理测量学四、心理测量的定义(续)定义理解(续)3、测量的对象:人的心理品质。心理品质具有内隐性,概念具有抽象性心理测量所测的心理品质实际上是人们的某种理论“构念”我们还要在所测对象为何物的界定上下功夫。心理测量学四、心理测量的定义(续)定义理解(续)4、心理测量的结果:对象的定量描述作为现代科学的心理测量学,涉及多门学科。心理测量学四、心理测量的定义(续)1“心理测量”:多指一项活动、一个过程。2“心理测验”:多指一样工具,一个测量文本偶尔当动词用3“心理评估”:指获取了测量结果信息后根据某种标准做出状态优劣判断的活动。

区别本书三词用法差异心理测量学第一节心理测量的基本性质五、心理测量的心理影响性心理影响性:无论主观愿望是什么,只要实施测量,就会给被测量者的心理发展带来影响。影响可能是积极的,也可能是消极的,可能是短期的,也可能是长期的。心理测量学五、心理测量的心理影响性(续)积极的心理影响:教育测量:准确评价,激励学习。经历测量也是学习,有助于提高。心理测量学五、心理测量的心理影响性(续)积极的心理影响:人格测验:了解人格,促使人格健康发展,促使行为被人悦纳。心理测量学五、心理测量的心理影响性(续)积极的心理影响:能力倾向测验:了解特长,选择和分配合适工作,人、岗和谐匹配。心理测量学五、心理测量的心理影响性(续)消极的心理影响:误用和滥用,使用质量低劣的测验夸大教育考试的作用:为应试而学习,忽视综合素质发展。频繁施行教育考试,学生疲于应付,身心受摧残。心理测量学五、心理测量的心理影响性(续)消极的心理影响(续):不科学解释智力测验:盲目乐观,迷失方向或自暴自弃,丧失动力。不合理使用人格测验:伤害自尊,甚至导致人格分裂。心理测量学五、心理测量的心理影响性(续)消极的心理影响(续):使用质量低劣测验:对被试做出错误的描述,引发严重后果。结论:编制、选择和使用测验都要非常慎重。

心理测量学第一节心理测量的基本性质六、心理测量的工具及其特性测验的本质:任何测量工具都是有参照点和测量单位的数字系统。在心理测量学中也把它叫做量表。量表的两要素:参照点、测量单位心理测量学六、心理测量的工具及其特性(续)参照点:测量的起点,也称零点。参照点分类:绝对零点:绝对理解相对零点:测值零只能说品质处于“零点”这个状态有绝对零点的测量比只有相对零点的测量性能更好优良测量单位:有统一的意义,有恒定的价值。心理测量学六、心理测量的工具及其特性(续)心理测量量表两要素的特点:参照点是人为的测量的单位要经过统计处理才能有统一意义,有恒定价值心理测量学第一节心理测量的基本性质七、心理测量误差存在的普遍性与严重性测量的误差:测量所得值与欲测品质实际值之间的差异值。误差的区别:误差的性质误差的大小误差的来源误差控制的难度心理测量学第一节心理测量的基本性质七、心理测量误差存在的普遍性与严重性心理与教育测量误差:不仅存在而且还非常的严重。测量研究主要任务:研究如何控制测量的误差。

心理测量学七、测量误差存在的普遍性与严重性(续)(一)测量误差的类型随机误差:所得值与实际值之间大小和方向都会随机变化的差异值。系统误差:所得值与实际值之间的那种大小和方向都不变的差异值。心理测量学七、测量误差存在的普遍性与严重性(续)(一)测量误差的类型(续)特点:误差与实际测量值共居一体、混淆难分。任务:将它们分离出来,评估它们的大小,研究控制办法。心理测量学七、测量误差存在的普遍性与严重性(续)(二)测量误差形成的原因1、心理品质的特殊性内隐、抽象,造成对目标认识不清晰,导致误差不稳定,波动起伏,导致误差。受测者未掌握正确作答技能,致使作答不能代表真实水平。受测者故意掩饰。致使评价出现误差。心理测量学七、测量误差存在的普遍性与严重性(续)2、使用质量不高的测量工具人的外显行为与人的心理品质只具备相关关系所测外显行为不是欲测心理品质的代表性行为测验项目只“刺激”出了欲测心理品质的一部分行为外显行为不清晰、不稳定心理测量学(二)测量误差形成的原因(续)3、施测过程和施测环境安排控制不好施测过程没有统一要求,测试指导语没有统一版本,作答起始时间和长短不统一,测试时的内外环境令被试不能集中精力测试过程失控、纪律混乱,舞弊。心理测量学(二)测量误差形成的原因(续)4、主试的不良品质主试对所测心理品质的理解有误主试实施的程序有误评分标准掌握不准确心理测量学第一节心理测量的基本性质

八、心理测量误差控制的理论与技术概述目标真分数,记为V,是测量者所追求的测量值。随机误差分数,记为E非目标真分数(系统误差分数):记为I目标真分数与非目标真分数合在一起称为真分数,记为T。心理测量学第一节心理测量的基本性质

九、心理测量误差控制的理论与技术概述(续)心理与教育测量学假设:

进而有:心理测量学第一节心理测量的基本性质

九、心理测量误差控制的理论与技术概述(续)在三者都相互独立的假设下,推得以下两公式:

心理测量学第一节心理测量的基本性质

九、心理测量误差控制的理论与技术概述(续)信度:真分数方差在观察分数方差中所占的比,记为:效度:目标真分数方差在观察分数方差中所占的比记为;

心理测量学第一节心理测量的基本性质

九、心理测量误差控制的理论与技术概述(续)心理测量的误差控制的任务:努力控制测量的随机误差,提高测量的信度。努力控制测量的随机误差和系统误差,提高测量的效度。心理测量学第一节心理测量的基本性质

九、心理测量误差控制的理论与技术概述(续)经典测量理论(ClassicalTestTheory,CTT)。其他理论:项目反应理论(ItemResponseTheory,,TRT)概化理论(JeneralizabilityTheory,GT)心理测量学第一章心理测量概论测验的类型与功能

第二节心理测量学第二节测验的类型与功能

一、按所测心理品质不同分类(一)能力测验1.智力测验(IntelligenceTest):

测量人的一般认知能力水平高低的测验。智力测验的结果比较稳定。测量理论与技术研究最早涉及领域心理测量学(一)能力测验(续)1斯坦福-比内量表2韦克斯勒智力量表3瑞文推理测验著名智力测验

心理测量学(一)能力测验(续)2.能力倾向测验(AptitudeTest):能力倾向测验类型:一般能力倾向测验:测量个体在多种能力上的潜在优势的测验。

特殊能力倾向测验:测量个体在音乐、绘画等特殊能力上的潜在优势的测验。心理测量学(一)能力测验(续)2.能力倾向测验(续):能力倾向特点:依赖于先天,与生活经验有关,一般不受专门教学或训练影响。

能力倾向测验性质:测值相对稳定,具有预测功能。心理测量学(一)能力测验(续)3.成就测验(AchievementTests):成就测验特点:

在特定领域为检测应试者对有关知识和技能的掌握程度而设计的测验。教学和训练会明显改变成就测验的结果。成就测验类型:学科成就测验、综合成就测验、诊断测验心理测量学(一)能力测验(续)具体性越来越强抽象性越来越弱稳定性越来越差

智力测验

能力倾向测验

成就测验能力测验类型特征:心理测量学一、按所测心理品质不同分类(续)(二)人格测验人格测验(PersonalityTest):测量个体人格的独特性和倾向性特征的测验。心理学人格概念特征:概念非常广泛,涉及所有情感和非智力因素。应用较广的人格测验:自陈人格测验、人格投射测验。心理测量学(二)人格测验(续)1艾森克人格问卷(EPQ)2明尼苏达多相人格调查表(MMPI).3卡特尔16种人格因素测验(16PF)

著名自陈人格测验

心理测量学(二)人格测验(续)1罗夏墨迹测验(RIT)著名投射测验

2主题统觉测验(TAT)心理测量学(二)人格测验(续)4句字完成测验3词语联想测验其他投射测验

心理测量学第二节测验的类型与功能

二、按对被试评价时所用的参照标准不同分类对被试评价所用的参照标准:相对标准、绝对标准应用相对标准的称作为常模参照测验应用绝对标准的称作为标准参照测验心理测量学二、按评价参照标准不同分类

(一)常模参照测验(Norm-ReferencedTest)定义:以个体在团体中的相对地位来评价个体发展水平的测验。心理测量学二、按评价参照标准不同分类

(一)常模参照测验性质:执行可高可低的相对难度标准,难度的高低决定于团体本身的水平。可能使一些高利害、高竞争性测验难度失控。团体水平发生变化,常模参照测验要重新修订。心理测量学二、按评价参照标准不同分类

(二)标准参照测验(Criterion-ReferencedTest)定义:以个体水平是否达到测验领域某一固定标准来评价个体发展水平的测验。心理测量学二、按评价参照标准不同分类

(二)标准参照测验(续)性质:使用绝对标准,不因很多个体都已达到而提高标准,也不因很多个体都未达到而降低标准。各种专业资格测验都属于标准参照测验。心理测量学二、按评价参照标准不同分类

按评价参照标准不同分类小结:常模参照和标准参照区分:理论上绝对,实际应用中有二者兼具的。附:潜力参照测验:定义:以个体可能达到的水平来评价个体已经达到水平的测验。性质:符合对个体进行自身激励的评价思想。

心理测量学第二节测验的类型与功能

三、标准化测验与非标准化测验标准化测验:四个方面的标准化要求测验编制过程标准化测验实施标准化测验评分标准化测验分数解释标准化心理测量学四个方面的标准化编制过程标准化

标准化测验编制步骤(六步):测验目标分解编制方案设计命题征题心理测量学四个方面的标准化编制过程标准化

标准化测验编制步骤(续):测试分析分数体系设计与制作测验使用指导书编写心理测量学四个方面的标准化编制过程标准化编制质量的标准化:

测验信度效度要求每个题目的质量要求心理测量学四个方面的标准化(续)测验实施标准化:对主试的要求对被试的要求对测试场所内外环境的要求测试过程顺序的要求心理测量学四个方面的标准化(续)测验评分标准化:试题要有公认的科学答案有统一规范的评分标准心理测量学四个方面的标准化(续)测验分数解释标准化:测验的报告分数要有明确的解释方法和解释依据。常模参照测验:配有解释常模,可以确定每个分数在团体中的确切地位。标准参照测验:配有合格分数线以确定每个分数的合格与否

。心理测量学标准化测验(续)标准化概念说明:标准化主要都是为了控制测量的随机误差和系统误差。教育与心理测量中“标准化”可以理解为是一系列的严格标准,也可以理解为是一个过程—测验的标准化过程。实际应用的测验是否是标准化测验必须严格鉴别。心理测量学标准化测验(续)标准化测验特点:编制要求严格,测验编制周期长,人财物投入大,测验设计要求面向尽量大的被试群体,使用的针对性、灵活性常常不能满足要求。心理测量学三、标准化测验与非标准化测验(续)非标准化测验特点:编制目的明确、测试对象熟悉、内容设计针对性强、方法灵活多变、编程短不能轻视自编测验的作用,同时也要努力提高自编测验的编制质量心理测量学第二节测验的类型与功能

四、计算机化测验与非计算机化测验(一)计算机化测验的发展计算机化测验:被试在计算机前根据指令进行作答计算机化测验特点:实施方便、反馈及时,测验效率高。非计算机化测验--传统的纸笔测验,还有用武之地。心理测量学(二)几种常见的计算机化测验基于计算机的测验(Computer-BasedTest,CBT)。由计算机出题,要求被试在计算机前操作作答。各种基于计算机的测验对计算机的利用程度会有很大不同。除了计算机的形式,基于计算机的测验的方法、理念与传统纸笔测验无本质不同。心理测量学(二)几种常见的计算机化测验计算机化自适应测验(ComputerizedAdaptTest,CAT)。一种新的测验理念:改变传统测验千人一面形式针对被试的水平即时调题、即时施测、即时反馈、即时估算。同时提高测验的效率和准确率。实现条件:新的测验理论指导、使用计算机。优点明显,但技术上也还需进一步完善心理测量学(二)几种常见的计算机化测验基于网络的测验(Internet-bestTest,IBT)基于计算机的测验或计算机化自适应测验采用网络的形式实施远程测试,则称其为基于网络的测验。基于网络的测验是当前计算机化测验发展的最高形式。心理测量学五、其它分类

(一)最佳行为测验和典型行为测验最佳行为测验:作答时必须尽能力找到最佳答案。典型行为测验:作答时要根据自己平时怎么想、怎么做如实作答。能力测验是最佳行为测验,自陈式人格测验是典型行为测验。典型行为测验的误差控制更为困难心理测量学五、其它分类

(二)个别测验与团体测验个别测验应用:面向特殊被试或在测试中主被试间需不断交流的测验。个别测验特点:耗时费力,一般能用团体测验就不用个别测验。教育测验大多采用团体测验,但也有例外。心理测验采用个别测验的要多一些。心理测量学五、其它分类

(三)难度测验与速度测验(四)文字测验与非文字测验(五)主观题测验与客观题测验(六)预测测验(七)行为情境判断测验(八)内隐联想测验心理测量学第二节测验的类型与功能

测验类型丰富:反应社会需求的复杂性和旺盛性。测量学者的任务:开发出更多更好的测验来满足社会的各种需求。心理测量学第一章心理测量概论测验的编制与实施

第三节心理测量学一、测验的编制明确用于:招聘、晋职升级决策?诊断、评价?了解品质还是做合格决策?

明确:测能力、人格?能力属哪个层次?人格哪个侧面?探明品质结构明确:测验对象的社会身份、身心特点、分布的范围与数量。

测验的对象是谁?

测何种心理品质?

测验结果作何用?

(一)确定测验目的--回答三个问题心理测量学一、测验的编制(二)设计测验编制方案、制定测验编制计划目标:设计一个科学、详细、可行的测验编制方案科学:方案从目标到内容、到方法都要符合心理学和心理测量学原理可行:其一是科学意义上的可行、其二是主客观条件意义上的可行心理测量学一、测验的编制(二)设计测验编制方案、制定测验编制计划(续)

测验编制方案的内容:测验的方法测验的类型题型及其分布题量及其分布分数系统量评价法测验质量总体目标编制流程设计和要求心理测量学一、测验的编制(三)题目编写测验题目:基本元素,主体材料。题目类型:客观题、主观题题型性质和功能:各有不同,有互补倾向。编写要求:发挥题型功能,测出欲测心理品质心理测量学一、测验的编制(三)题目编写(续)题干编写:内容科学、语言精练。作答要求编写:语言准确无歧义、信号强烈醒目。客观题:正确项唯一正确,迷惑项有适度迷惑力。主观题:保证答案科学性、评分标准的客观性。题量分布:题型分布、品质或内容分布、题目难度分布。

心理测量学一、测验的编制(四)测试分析测试分析目的:评估和筛选试题评估筛选指标:定性指标、定量指标。分析决策:留用、修改留用、修改再测、淘汰心理测量学一、测验的编制(四)测试分析(续)定性指标:题目的科学性、所测心理品质的相符性、答案的正确性、表述的准确性等等。定量指标:题目定性质量优劣的量化指标有各自的定义和计算方法,有各自的质量优劣标准心理测量学一、测验的编制(四)测试分析(续)测试对象:代表性的样本,有足够容量,与正式测试相同的动机水平,在似真环境中进行。心理测量学一、测验的编制(五)组卷组卷要求:1、保证入选试题高质量2、严格按照设计好的各种题量分布选调试题。3、试题顺序:题型顺序、难度顺序、心理品质层次顺序。目的:有效控制测验的系统误差。心理测量学一、测验的编制(六)信、效度调查试卷整体质量调查:信度和效度。信度:只需测验自身数据效度:还需要测验外部的一些相关凭证调查目标:信效度证据足够且都达到一定标准。

心理测量学一、测验的编制(七)编制测验分数系统原始分数:以测验内容为参照背景,不方便比较分数转换:1、获取以被试群体为参照背景的分数。2、获取以某种客观标准为参照背景的分数。报告分数:方便比较、方便理解和解释。心理测量学一、测验的编制(八)编写测验使用手册:指导正确使用手册内容(10项):1、测验目的与性质说明;2、适用对象说明;3、测验内容结构、题型结构介绍;心理测量学一、测验的编制(八)编写测验使用手册:指导正确使用手册内容(续):4、测验编制方法介绍;5、测验施测方法说明;6、评分方法与标准说明;7、测试对象范围、数量、来源、抽样方法说明;心理测量学一、测验的编制(八)编写测验使用手册:指导正确使用手册内容(续):8、测验信、效度报告;9、分数系统编制方法及分数解释方法介绍;10、测验使用人员资质要求说明。心理测量学一、测验的编制(九)编制测验备份测验备份:正式测验的平行复份。平行复份不同处:表面文字内容相同处:所测心理品质内容结构难度结构题型结构信度效度心理测量学一、测验的编制(九)编制测验备份(续)测验备份目的:应付突发事件特殊研究需要取得更可靠结果测验备份的编制:

与正式测验有完全相同的过程和标准。心理测量学二、测验的实施(一)选择测验测验内容和报告分数形式是否符合测验目的?测验形式和方法是否适合被试心身特点?测验的信度和效度是否达到标准?有无所需特殊资质技术人员?心理测量学二、测验的实施(二)实际施测施测相对简单:教育测验、团体测验、纸笔测验施测较为复杂:心理测验、个别测验、操作测验规范目的:控制各种可能误差,提高测验信效度。心理测量学二、测验的实施(二)实际施测(续)施测要求:由具备相应资质的技术人员实施按照测验指导书的要求按步骤实施规范:测验环境布置指导语宣讲测验材料发放测验进程控制心理测量学二、测验的实施(三)评分评分要求:按照测验指导书规定的方法和标准进行客观题交由计算机评分,主观题主要采用人工评阅心理测验:具备相应资质的技术人员评阅大规模教育测验:筛选阅卷员严格培训统一评分标准阅卷质量监控网上阅卷系统电子阅卷员系统心理测量学二、测验的实施(四)测验结果解释注意常模参照测验与标准参照测验报告的不同。解释要有辩证思维,不要绝对化,更不要标签化。善于在个体内部作比较,强调优势品质,鼓励改善劣势品质。以发展的眼光解释测验结果,防止负面影响。心理测量学第三节测验的编制与实施

三、测验编制与实施中的法律与道德问题(一)为维护社会公平而努力保证测验质量因为测量严重不准导致决策不公,是测量工作者的法律与道德责任。心理测量学三、编制与实施中的法律与道德问题为了保证测验质量,要防止:因粗制滥造而导致测验结果严重不准;题目内容有文化、职业或宗教偏见;某些群体数据失实、或缺失,导致常模失准。心理测量学三、编制与实施中的法律与道德问题为了保证测验质量,要防止(续):因不精心或别有用心而选用粗制滥造的测验;因不精心或别有用心而导致测试过程失控。无相应资质人员主持测验。心理测量学三、编制与实施中的法律与道德问题(二)为保护个人权益而尊重测验对象的选择要征求被试是否愿意参加测验,没有权利强迫个体参加测验。要尊重被试的作答选择,不能干涉被试的作答。使用被试信息和怎么使用被试信息都要有被试的授权。心理测量学三、编制与实施中的法律与道德问题(三)为保证测验的安全而严守测验的秘密测验泄密后果严重:能力测验泄密,造成虚高能力评价。人格测验泄密,造成虚假的人格评价。高竞争性测验泄密,造成社会不公。心理测量学三、编制与实施中的法律与道德问题(三)严守测验的秘密(续)重要测验为国家机密,受法律保护。为了尊重著作权,维护社会公正,遵守职业道德有义务保证测验的安全、严守测验的秘密,不向他人传送任何测验信息。心理测量学三、编制与实施中的法律与道德问题1心理测验管理条例中国心理学会有关测验的两个重要文件:2心理测验工作者的道德准则心理测量学第一章心理测量概论心理测量发展简史

第四节心理测量学第四节心理测量发展简史一、中国古代的心理测量思想(一)个体差异及其可测性思想(二)人才的内涵及其测量方法(三)心理与教育测量的实践活动心理测量学第四节心理测量发展简史(一)个体差异及其可测性思想孔子:“性相近,习相远。”;孟子:“权,然后知轻重;度,然后知长短。物皆然,心为甚。”心理测量学第四节心理测量发展简史(二)人才的内涵及其测量方法三国时的魏人刘劭:“夫圣贤之所美,莫美乎聪明。聪明之所贵,莫贵乎知人。知人诚智,则众材得其序,而庶绩之业兴矣。”他把人的行为表现概括为9种,称为“九征”。提出“八观”和“五视”的观察方法识别人才。心理测量学第四节心理测量发展简史(三)心理测量的实践活动孔子:将人的智力分成三个等级,即中上之人、中人和中下之人;不得中行而与之,必也狂狷乎?狂者进取,狷者有所不为也。董仲舒:“一手画方,一手画圆,莫能成。”刘劭:《人物志》西周:“国学”心理测量学第四节心理测量发展简史古代中国心理测量的特点:1.描述性的,定性的,而非定量的;2.分类式的;3.注重对人作整体的鉴定和评价,并倾向于和人的道德品质联系起来;4.具有强烈的应用性质。心理测量学第四节心理测量发展简史二、现代心理测量在西方国家的产生与发展(一)心理测量的产生是社会的需要(二)心理测量的早期探索者(三)心理测量的发展(四)心理测量发展的当代趋势心理测量学第四节心理测量发展简史(一)心理测量的产生是社会的需要工业革命成功后,对劳动力的需求急剧增加;19世纪,科学的发展和欧洲人道主义思想的广泛传播。心理测量学第四节心理测量发展简史(二)心理测量的早期探索者1.德国:冯特(W.Wundt)2.英国:高尔顿(F.Galton)3.美国:卡特尔(JamesM.Cattell)4.法国:比纳(A.Binet)和西蒙(T.Simon)心理测量学第四节心理测量发展简史(三)心理测量的发展斯坦福大学推孟(L.M.Terman)教授1916年修订斯坦福-比纳量表;桑代克(E.L.Thorndike)编制了第一个标准化的教育成就测验;人格测验的先驱克雷佩林(E.Kraepelin),他最早用自由联想测验来诊断精神病患者。心理测量学第四节心理测量发展简史(四)心理测量发展的当代趋势1.实验法和测验法相结合,产生了信息加工测验;2.计算机测试代替纸笔测试;3.项目反应理论和概化理论等现代测量理论的产生;4.新一代测验理论心理测量学第四节心理测量发展简史三、现代心理测量在中国的发展(一)二十世纪前半叶的初步繁荣(二)二十世纪后半叶的再度繁荣与发展心理测量学第四节心理测量发展简史(一)二十世纪前半叶的初步繁荣对西方心理测验量表的介绍和翻译,以及修订和编制了多种智力测验、人格测验及教育测验;出版的有关心理测量方面的著作达到了20多种。心理测量学第四节心理测量发展简史(二)二十世纪后半叶的再度繁荣与发展1.理论方面的发展经典测量理论、项目反应理论、概化理论、新一代测验理论2.心理测量的实践作用测验编制、教育及社会考试、人才选拔和人事测评心理测量学本章小结

心理测量学研究内容:如何编制测验,如何实施测验,如何控制测量误差,提高测验质量。心理测量学本章小结心理测量主要性质:心理测量是间接测量。测量有两个要素,心理与教育测量的参照点是相对的,测量单位很难恒定。任何测量都有误差,测量的误差包括随机误差和系统误差两种。心理测验依据不同指标可做许多不同分类。

心理测量学本章小结测量学工作者的社会责任:测量学者关注测验编制与实施中的法律与道德问题。测量学者还从测量及测量学发展史中汲取经验和教训,升华品质与修养。心理测量学本章小结测量学工作者的社会责任:测量学者关注测验编制与实施中的法律与道德问题。测量学者还从测量及测量学发展史中汲取经验和教训,升华品质与修养。心理测量学本章小结测量学发展的启示:我国测量活动历史悠久现代测量学发端于西方心理测量学者还从测量以及测量学的发展历史中汲取经验和教训,升华品质与修养。心理测量学第一章心理测量概论讨论题:1、为什么说人的心理是可测的,心理可测的意义何在?2、分析心理测量误差的类型与来源,试说控制方法。3、你从心理测量发展历史的介绍中感悟到了什么?心理测量学第一章心理测量概论本章参考文献[1]安妮•安娜斯塔西,苏珊娜•厄比纳著,廖小春,竺培梁译.心理测验[M].杭州:浙江教育出版社,2001.[2]金瑜.心理测量[M].上海:华东师范大学出版社,2001.[3]戴海崎,张锋,陈雪枫.心理与教育测量[M].广州:暨南大学出版社,2003.[4]郑日昌,蔡永红,周益群.心理测量学[M].北京:人民教育出版社,1999.第一节信度概述

一、信度与测量误差1.经典测量理论的假设式中,X为观察分数,T为一般真分数,E为随机误差分数,V为目标真分数,I为非目标真分数(系统误差)。

第一节信度的概述一、信度与测量误差2.信度的定义测量追求的初步目标:T占X的比例越大越好。测量追求的终极目标:V占X的比例越大越好。第一节信度的概述当T占X的比例很大时,那么测值就会是稳定的。一般来说,稳定的测值是可靠的、可信的,因此,信度可被认为是测量结果的稳定性程度。一、信度与测量误差2.信度的定义第一节信度的概述信度(reliability)是指在不同时间,使用同一测验,或者使用两个不同项目的等值测验,抑或在其他不同的测试条件下,对同一组被试实施两次或多次测试所得分数的一致性。测验信度表示测验分数中个体差异可归因于所测特质中“真实”差异的程度,以及可归因于随机误差的程度。二、信度的统计定义1.经典测量理论假设的推论第一节信度的概述二、信度的统计定义2.信度的统计定义定义1:信度是被试团体真分数方差与实得分数方差之比定义2:信度是被试团体真分数与实得分数相关系数的平方定义3:信度是一个测验X(A卷)与它的任意一个平行测验(B卷)的相关系数第一节信度的概述三、描述信度的指标1.经典测量理论的信度系数信度系数是表示测量结果的稳定性程度的指标。记为:第一节信度的概述信度系数的值域:[0,1]没有百分之百可靠的测量,因此,rXX=1只是理论上的值,实际当中是不会存在的。?相关系数的值域是[-1,+1],信度系数的值域:[0,1],为什么?三、描述信度的指标1.经典测量理论的信度系数(1)重测信度(test-retestcoefficients),是指用同一个量表对同一组被试施测两次所得结果的一致性程度,其大小等于同一组被试在两次测验上所得分数的相关系数。(2)复本信度(alternative--formcoefficients),是指两个平行的测验测量同一批被试所得结果的一致性程度,其大小等于同一批被试在两个复本测验上所得分数的相关系数。(3)内部一致性系数(internalconsistencycoefficients)也叫同质性信度(homogeneityreliability),是指测验内部所有题目间的一致性程度,主要的计算方法有KR20公式、KR21公式、克龙巴赫α系数,以及荷伊特信度等。第一节信度的概述三、描述信度的指标2.经典测量理论的测量标准误测量标准误差(standarderrorofmeasurement)是测量误差的假设分布的标准差。用下列公式能够容易地计算测量标准误差:第一节信度的概述式中,SDt表示测验分数的标准差,rXX表示信度系数。3.概化理论的概化系数(generaliabilitycoefficients)4.IRT的测验信息函数(testinformationfunction)四、分析测验信度应注意的问题1.针对测验类型选用恰当指标(1)传统的信度概念适合于常模参照测验,这种测验的主要目的是为了区分个体在特定特征上所表现出的差异性。个体在测验分数中表现出的差异范围越大,该测验的信度也就越高。第一节信度的概述四、分析测验信度应注意的问题1.针对测验类型选用恰当指标(2)标准参照测验(内容参照或领域参照测验)的目标是要确定被试是否达到或未达到某个标准,从而将个体分到不同的组别:“达标”和“未达标”。这种情况下,传统的重测信度、复本信度以及内部一致性系数就不再适用。标准参照测验可根据具体情况分别采用如下指标:适用于简单的掌握与否的两分决策,即所有的分类误差都被认为同样严重而不管它们离开临界分数的距离。在这种情况下,可以使用平行型式进行再测,以便得出在两次测验上得到相同决策的个体的百分比,进一步可算得分类一致性系数(coefficientofagreement)。

第一节信度的概述四、分析测验信度应注意的问题1.针对测验类型选用恰当指标不仅仅关心对掌握者和未掌握者的质的区分,同时也在分数连续体上描述了关于掌握和未掌握的量的差异。这类信度主要采用K2(X,T)指标:

第一节信度的概述式中,、分别为被试总体在测验上的真分数方差和观测分数方差;、分别为真分数和观测分数的平均值;ng为测验题目数,c是以做对题目百分比表示的区分标准。四、分析测验信度应注意的问题1.针对测验类型选用恰当指标K2(X,T)值越大,说明观测分与区分标准分数(划界分数)之间的差异代表真分数的对应差异量的可能性越大,因而观测分与划界分数的差异就越能反映真实能力上的差异。换言之,测验就更可信。就单个测验的结果而言,K2(X,T)的计算公式如下:第一节信度的概述式中,是由库德-理查德KR20公式求出的信度系数,其余符号意义同前。四、分析测验信度应注意的问题1.针对测验类型选用恰当指标(3)在纯速度测验(speedtest)中,个体差异完全取决于速度,此时,就无法恰当地解释施测一次测验的信度系数。如果条件许可,可采用重测法或是复本法,这是比较合适的。分半法也可以使用,但是此时的分半是按时间分半,而不是按照项目来分半。也就是,两半分数必须根据分别规定时间的两个半测验。例如,可以把奇偶项目分别印制在两张卷上,每组项目的用时为全测验的一半。这种方法等于在同一时间实施了两个等值测验。

第一节信度的概述四、分析测验信度应注意的问题1.针对测验类型选用恰当指标还有一种替代实施两个半测验的方法,就是把总时间四等分,算出每段时间的分数。这种方法简便易行,施测时每当主试发出事先安排的信号,就要测验参加进在他们正在做的项目上打个记号。然后,把第一段和第四段时间内答对的项目数相加,得出一个半测验分数;把第二段和第三段时间内答对的项目数相加,得出另一个半测验分数。四段时间如此相加,往往可以平衡练习、疲劳和其他因素的累积效应。特别是当项目难度水平前后一致,而不是逐渐增加时,这种方法尤其令人满意。第一节信度的概述四、分析测验信度应注意的问题2.信度的报告(1)任何一个信度系数是针对引起测验误差的特定因素而言的。有多少种影响测验分数的条件,就有多少种测验信度,因此,报告信度时,应该详细说明测试样本的特性和所报告的信度类型。在信度报告时只是报告信度系数,而缺乏说明估算系数的方法细节,推导系数时所用的被试群体的特征,以及获取数据当时的施测条件,等等,这种信度报告是不合格的。

第一节信度的概述四、分析测验信度应注意的问题2.信度的报告(2)没有一个单一的、最优的方法来量化信度,没有一个单独的指数能恰当地表达所有的相关事实,没有一个单独的研究方法在所有的情形下都是最佳选择,且测验编制者也不应局限于将某一种方法运用到任何一种测量手段上去。所以,测验编制者在报告测验信度时,可以从多方面予以报告。

第一节信度的概述四、分析测验信度应注意的问题2.信度的报告(3)提供详细的信度分析报告,让了解相关知识的人能够对结果进行评定,并能够重复信度分析的过程。

例如,简单说一句“某测验的信度是0.92”是不能接受的。较恰当的说法是“某测验的信度系数为0.92,该数值是通过计算一份能力测验间隔两周两次测试成绩的相关系数得出的。数据来源是从某市随机抽取的500名小学5年级的学生施测……”。第一节信度的概述五、信度的标准与作用1.信度是评价测验质量的重要指标之一。测验类型

信度系数

低中高学业成就测验0.660.920.98学术能力测验0.560.900.97特殊能力倾向测验0.260.880.96人格测验0.460.850.97兴趣测验0.420.840.93态度测验0.470.790.98注:表中数据来源,LewisR.Aiken:Psychologicaltestingandassessment(eighthedition),AllynandBacon,Inc,1994.第一节信度的概述五、信度的标准与作用2.信度是测量过程中所存在的随机误差大小的反映。第一节信度的概述例如,我们已知高考文科试卷的总信度rXX

=0.965,文科考生总分的标准差为53.42,那么,文科考试成绩的标准误为:3.信度可以用来解释个人测验分数的意义——测量标准误。如果某生的考试成绩为495分,在置信度为0.95时,其真分数的置信区间为:五、信度的标准与作用4.信度可以帮助进行不同测验分数的比较。第一节信度的概述考察两个分数的差异是否可靠,是否真有差异的问题。比如,某人的物理成绩是否真的优于化学?某人的数学技能本学期是否真有进步?某人在韦氏智力量表上操作智商与言语智商的差异是否真有显著意义等。

当两测验的方差相等时,差异分数的信度系数可用如下公式求出:式中,rXXdiff是差异分数的信度系数;rXX和rYY是两个测验各自的信度系数;rXY是两测验间的相关系数。五、信度的标准与作用4.信度可以帮助进行不同测验分数的比较。第一节信度的概述差异分数的测量标准误可用如下公式求出:式中,SEdiff是差异分数的测量标准误;rXX和rYY是两个测验各自的信度系数;SD是两测验间使用的相同的标准差。在比较分数之前,必须将两个测验分数转为具有相同量表的标准分数。五、信度的标准与作用4.信度可以帮助进行不同测验分数的比较。第一节信度的概述例如,在韦氏成人智力量表中,言语和操作分测验的信度为0.97和0.93,而它们的智商的平均数为100,标准差为15,故言语和操作智商差数的标准误为:因为4.74×1.96=9.29,因此,言语和操作智商相差10分时,在0.05水平上,我们说存在显著差异。若要在0.01水平上作出差异显著的结论,就要相差13分。?测验分数的比较与平均数差异显著性检验是一回事吗?第二节信度的种类

与评估方法详细介绍第一节中提出的各种信度估计方法的计算。一、重测信度1.含义同一个测量工具在两个不同时间对同一组被试施测所得结果的一致性程度。重测信度主要考察了一个测量工具是否能够保证在不同时间测量结果的一致性,他反映了测量工具的结果受到时间间隔因素影响的大小。一般来说,重测的时间间隔越短,那么各种施测情境的变化就越小,重测信度系数就会越大。重测信度系数较大时,说明该测量工具前、后两次的测量结果比较一致。结果具有较好的跨时间上的稳定性。第二节测验信度的种类与评估方法一、重测信度2.评估方法重测信度的大小可以通过计算测量工具的重测系数(test-retestcoefficient)或叫稳定性系数(coefficientofstability)来标志。具体来说,就是求取同一组被试在两个不同时间施测同一个测量工具所得结果分数的相关系数。第二节测验信度的种类与评估方法一、重测信度3.应用条件测量工具所测量的个体心理特质在时间上应该是相对稳定的。测量工具所测量的个体心理特质应该不存在明显的练习效应和遗忘效应。在两次施测间隔期间不应该进行专门的训练和培训,以保证重测信度反映的是随机因素的影响效应。第二节测验信度的种类与评估方法一、重测信度4.使用重测信度时需要注意的问题两次施测时间间隔的长短会影响重测信度系数估计值的大小,因此,在报告重测信度系数时应该报告间隔的时间长度。应该根据已有的相关研究结论考虑所测心理特质本身的稳定性程度,以确定前后两次施测时间的间隔究竟应该多长比较合适时,不应该随便选择间隔时间的长短。第二节测验信度的种类与评估方法二、复本信度1.含义两个平行的测验(复本测验)测量同一批被试所得结果的一致性程度。复本信度反映了由于题目的不同以及时间间隔所导致的测量误差。平行测验或复本测验指的是两个在题目内容、数量、形式、难度、区分度、指导语、时限以及所用的例题、公式和测验等其他方面都相同或相似的测验。也就是用不同的题目测量同样的内容而且其测验结果的平均值和标准差都相同的两个测验。第二节测验信度的种类与评估方法二、复本信度2.评估方法复本信度的估计过程就是计算同一批被试在两个平行的复本测验上所得分数的相关系数,也叫作等价系数(coefficientofequivalence)。测试设计:同时测试和延时测试。同时测试是在同一个时间段内进行测试,而延时测试则是在两个时间段进行测试,同时测试可能会存在作答疲劳的效应,而延时测试则可能会存在学习或培训效应。第二节测验信度的种类与评估方法二、复本信度3.应用条件要构造出两份或两份以上真正平行的测验;计算复本信度需要对同一批被试测试两份平行测验,这就需要掌握一个合理的时间安排。应该尽量在测试结果报告中,详尽地说明两次测试的时间间隔、测试顺序安排、测试过程中被试的有关测验经历等。第二节测验信度的种类与评估方法三、内部一致性信度1.含义内部一致性信度主要评价了测验各随机组成部分之间是否测量了相同的心理特质,因此,它反映的是题目内容的抽样一致性程度。具体估计方法主要包括分半信度评估法、库德-理查森信度评估法、克龙巴赫Alpha系数评估法。与重测信度和复本信度不同,在估计测验的内部一致性信度时,只要用同一个测验对一批被试测试一次。第二节测验信度的种类与评估方法三、内部一致性信度2.分半信度含义我们总是可以把一个测验的所有题目随机地划分成对半的两个部分,然后估计所有被试在这两个部分题目上得分的一致性程度,这样得到的测验一致性估计称为分半信度。分半信度评价了测验两个随机组成部分的题目是否测量了相同的心理特质。第二节测验信度的种类与评估方法三、内部一致性信度2.分半信度评估方法计算出被试在测验两个随机组成部分的题目上得分之间的相关系数。由于在用分半测验得分计算相关系数时,测验题量被缩短,信度系数需要通过以下这个公式对分半相关系数进行矫正而得到。为两个分半测验之间的相关系数,为完整长度测验的信度系数估计值。第二节测验信度的种类与评估方法三、内部一致性信度2.分半信度评估方法另外一个估计分半信度系数的方法是Rulon公式,他只需要计算所有被试在两部分测验上得分之差的方差以及总分方差:式中,为完整测验的信度估计值,为被试在两部分测验上得分之差的方差,为完整测验总分方差。

Rulon公式中分子方差反映了由于题目不同等条件带来的误差方差,他与总方差之比反映了误差方差在总方差中所占的比例。第二节测验信度的种类与评估方法三、内部一致性信度2.分半信度使用时需注意的问题在估计测验的分半信度时,虽然要求把一个测验的所有题目随机地划分成对半的两个部分,但是在实践中对测验分半时,为了尽量减少无关因素的影响,通常需要考虑题型、题分、题目测试先后顺序等因素的平衡问题,比如按照题目顺序奇偶分半就是一个经常选择的方法第二节测验信度的种类与评估方法三、内部一致性信度3.库德-理查森信度含义在估计分半信度时,把一个测验的题目分成两半的方式是非常多的。而每种分半方式得到的信度估计值总会存在一些差异,但我们无法知道究竟哪种分半结果所得到的信度估计值是最合适的。估计所有可能的分半信度系数的平均数,作为完整测验的内部一致性最佳估计值。第二节测验信度的种类与评估方法三、内部一致性信度3.库德-理查森信度评估方法:所有分半信度系数的平均数的估计方法。第二节测验信度的种类与评估方法三、内部一致性信度3.库德-理查森信度使用条件Kuder-Richardson信度系数的估计只能针对1、0记分题型,对于其他题型需要使用更加一般化的估计方法。K-R21公式假设测验中所有项目的难度是相同的。Kuder-Richardson信度反映的是项目间一致性程度,他会严重地受到测验所测行为特质的同质性程度的影响。第二节测验信度的种类与评估方法三、内部一致性信度4.Cronbach’sAlpha系数含义是一种比Kuder-Richardson方法更加一般化的信度估计方法,它可以针对各种记分方式的题型进行估计。第二节测验信度的种类与评估方法三、内部一致性信度4.Cronbach’sAlpha系数评估方法第二节测验信度的种类与评估方法公式中,k是测验题目个数,是被试在题目i上得分的方差,是被试测验总分方差。三、内部一致性信度4.Cronbach’sAlpha系数使用条件可以估计各种记分方式的测验内部一致性信度系数,是更一般化的测验内部一致性信度系数估计方法。第二节测验信度的种类与评估方法四、评分者信度1.含义在评价通过主观评分方式得到的分数时,我们必须了解不同的评分者在评价被试作答反应时给的分数值的一致性程度(信度)。一般的客观型题目在评分时很少出现误差,然而,对于诸如作文测验、语言类测验、以及其他的评价性测验(如人格特质评级、投射测验评分等),这些测验类型的评分过程就显得非常主观。第二节测验信度的种类与评估方法四、评分者信度2.评估方法两个评分者时:计算这两个评分者评定分数之间的相关系数。多个评价者评价同一批被试:计算和谐系数。第二节测验信度的种类与评估方法五、信度系数及其估计方法小结1.测试次数和测试卷份数与信度系数估计方法第二节测验信度的种类与评估方法测试次数测试卷份数1份2份1次分半信度Kuder-Richardson信度Alpha系数复本信度(同时测试)2次重测信度复本信度(延时测试)五、信度系数及其估计方法小结2.各种信度估计方法的误差方差来源第二节测验信度的种类与评估方法复本信度(延时测试)复本信度(延时测试)重测信度复本信度(同时测试)复本信度(延时测试)分半信度Kuder-Richardson

和Alpha系数评分者信度时间间隔题目内容时间间隔与题目内容题目内容题目内容与心理行为特质的同质性评分者间差异第三节测量的随机误差控制一、影响测量信度的因素影响测量信度的因素施测间隔的时间被试主试施测情境测量工具第三节测量的随机误差控制二、提高测验信度的常用方法提高测验信度的常用方法规范施测程度、统一施测环境适当增加测验的长度控制试题的难度分布努力提高每道题的区分度维持测验的同质性努力提高测验在被试中各个同质亚团体上的信度保证被试有充裕的作答时间严格控制评分误差第三节测量的随机误差控制第四节评分者信度及

评分误差的控制一、评分误差存在的严重性严重到什么程度?历史教授的答案被评阅为“不及格”高考作文《一幅漫画的启示》,67位评阅者,6至25分都有,最高分与最低分相差19分1984年,高考作文评分调查,438位老师,4篇作文,。最高得分为41.25,最低分为20.75,标准差为2.98。1985年,对1984年的四篇作文再研究,347位老师(有部分年参加研究的老师),最高得分为42.5,最低分为24.75,标准差为3.3。第四节评分者信度及评分误差控制二、评分者信度定义:多个评分者对同一批答卷评分结果的一致性程度。估计方法:①两位评分者评同一批试卷;②三位或三位以上评分者评同一批试卷第四节评分者信度及评分误差控制三、评分误差产生的原因试题原因评分者原因专业知识水平不够评判能力不够个性倾向心理状态客观效应“名片”、“光环”、“对比”、“先后”环境、组织管理的原因第四节评分者信度及评分误差控制四、控制评分误差的方法控制试题作答反应方向与范围预先制订好评分细则阅卷人员要选择、要培训流水作业分因素评分组织复查要求评分者自觉防止各种客观效应的影响大规模阅卷可考虑采用统计手段控制第四节评分者信度及评分误差控制下次上课再见!提高信度的方法——适当增加测验的长度为什么增加测验的长度,会提高信度?测验长度的增加与信度的提高不是等比例的提高信度的方法——适当增加测验的长度增加测验长度与信度提高之间关系的公式:例:有一包含10题的测验,其信度系数为0.30,若把测验增加到原测验长度的3倍,那么新测验的信度系数应该是多少?例:原测验共10题,信度系数为0.30,如要把测验信度系数提高到0.94,需要把原测验延长多少倍?增加多少题?返回两位评分者评同一批试卷的评分者信度例:甲、乙两位教师评阅10份试卷,他们对每一试卷各自所评分数如下表,问这两位教师评分的一致性如何?返回试卷得分D=甲-乙等级等级之差甲评分乙评分甲乙A94931110B9092-222.5-0.5C8692-63.52.51D8670163.573.5E8682-10541F7076-665.50.5G6865379-2H6676-1085.52.5I6468-4981J6160110100心理测量学

测量效度概述1测量工具效度验证的方法2测量的系统误差控制3心理测量学

测量效度概述1心理测量学测量效度概述

什么是效度测量工具测量了他所希望测量的心理特质或行为特征的效果和程度。效度总是与一定的测量目标相联系的。我们称为某测量工具进行效度验证的过程为效度证据的获取过程,简称为效度验证。心理测量学测量效度概述效度与信度的关系信度研究的是测量结果的稳定性问题,效度研究的是测量结果的准确性问题。测量的信度只受到随机误差或非系统测量误差的影响,而测量效度会同时受到随机误差和系统测量误差的影响。一个测量工具可能是非常稳定(信度高),但却是无效的,因为他与测量的目标之间产生了系统性的偏差;当然,一个完全不稳定的测量工具也不可能是有效的。心理测量学第三章测量效度与系统误差控制测量工具效度验证的方法2心理测量学测量工具效度验证的方法根据测量目标的不同,对测量工具进行效度验证的方法主要有三种:基于所测内容的效度验证方法。基于所测心理结构的效度验证方法。基于效标关联性的效度验证方法。心理测量学测量工具效度验证的方法基于所测内容的效度验证方法含义就是要对测量工具本身的具体内容进行系统性的查验,以确定这些内容是不是测量目标特质或行为领域的一个有代表性的样本。主要应用学业成就测验、职业资格测验,还如人员选拔与安置中的工作样本测验。心理测量学测量工具效度验证的方法基于所测内容的效度验证方法评估方法确定测量目标的全域范围及各部分内容权重。确定一批有经验的领域专家,在深入培训的基础上,要求他们按照已确定的测量全域范围及各部分内容权重,初步分析测试题目的代表性,并对题目测量的被试作答的内部心理过程进行初步分析。进行实测,根据测试数据分析和被试作答过程分析,全面验证测量工具的效度。心理测量学测量工具效度验证的方法基于所测内容的效度验证方法关于测量工具的表面效度严格来说,表面效度并不符合效度的定义,因为他反映的不是实际要测量的目标是什么,或对目标测量的程度如何,而反映的是,测量工具从表面上看测量了什么。表面效度关心的是测量的友好性和与公众的和谐关系。心理测量学测量工具效度验证的方法基于效标关联性的效度验证方法效标:它是独立于测量工具并可以从实践中获得的被试的行为特征表现,用于验证测量工具的有效性。根据测量工具与效标两者结果获得的时间间隔的不同,基于效标关联性的效度证据采集可以有同时性设计与预测性设计两种方法。心理测量学测量工具效度验证的方法基于效标关联性的效度验证方法效度证据采集的预测性设计方法含义:验证现有测量评价结果与将来才可能获取的效标评价结果之间的关联程度。主要应用:人员选拔、安置类型的测量工具心理测量学测量工具效度验证的方法基于效标关联性的效度验证方法效度证据采集的预测性设计方法首先,获取被试在当前测量工具上的评价结果,如测验分数、等级评定;然后,间隔一定的时间,采集被试在预测目标(效标)上的评价结果;最后,分析以上这两个评价结果之间的关联性程度,这种关联性程度的分析方法常用的有以下几种:相关分析区分能力分析命中率分析心理测量学测量工具效度验证的方法基于效标关联性的效度验证方法效度证据采集的同时性设计方法含义:对同时获得的测量工具评价结果与效标评价结果之间的关联性程度进行分析。主要应用经常用于评价测量工具诊断被试当前心理特质状态的效果。在许多情形下,效度证据采集的同时性设计方法会替代预测性设计方法。评估方法心理测量学测量工具效度验证的方法基于效标关联性的效度验证方法基于效标关联性的效度验证方法的影响因素群体的一致性或同质性程度:应该尽量扩大被试群体的异质性,避免低估测验的真实效度。测验长度:一般来说,测验长度越长,测试结果越稳定,效度系数会倾向于越高。效标污染心理测量学测量工具效度验证的方法基于效标关联性的效度验证方法估计标准误指的是测量工具实际测量的结果与预先设定的测量目标之间相互偏离的程度,而效度验证的过程就是要考察这种偏离程度的大小。从实际应用范围及计算过程的便利性角度看,估计标准误的实际应用更多的是基于效标关联性的效度验证方法中。心理测量学测量工具效度验证的方法基于效标关联性的效度验证方法估计标准误是表现为相关系数的效度系数;是效标评定分数的标准差。心理测量学测量工具效度验证的方法基于所测心理结构的效度验证方法含义:对测量工具测量了心理学中某种特质或特质结构的程度进行验证的方法。主要应用:各种心理测验,如智力测验、人格测验、焦虑测验、成就动机测验等。心理测量学测量工具效度验证的方法基于所测心理结构的效度验证方法评估方法专家判断分析法主要依靠专家的主观专业经验。尽量减少专家主观随意性的影响。德尔菲法。心理测量学测量工具效度验证的方法基于所测心理结构的效度验证方法评估方法测验内部一致性分析法基于所测心理结构的效度验证的一个重要证据来源。这个方法的实质是,测验总分本身是用于评价所测心理结构的效度最好的效标。相关分析法:求取每个项目与测验总分之间的相关系数,如果项目—测验相关显著,表明该项目与总测验的结构是一致的。心理测量学测量工具效度验证的方法基于所测心理结构的效度验证方法评估方法测验内部一致性分析法对照组比较法:按照被试的测验总分,选出一个高分组被试和一个低分组被试,然后,比较高分组被试与低分组被试在各个项目上的作答表现,如果高分组被试的通过比例显著大于低分组被试的通过比例,表明该项目与总测验的结构是一致的。心理测量学基于所测心理结构的效度验证方法评估方法测验内部一致性分析法很明显,测验内部一致性证据保证的是测验结构的同质性或单一性。测验内部一致性证据的作用是有限的,因为他毕竟无法证明该测验究竟测量了什么结构。测量工具效度验证的方法心理测量学测量工具效度验证的方法基于所测心理结构的效度验证方法评估方法与现有研究结论一致性的分析法通过分析新开发测量工具测试结果是否与已有研究结论相一致。在许多传统智力测验中,成长发展性变化证据是测验效度的一个重要证据。心理测量学测量工具效度验证的方法基于所测心理结构的效度验证方法评估方法与其他测量工具的相关分析法求取新开发测量工具与另一个已经被公认为有效的测量工具之间的相关关系,是证明新开发测量工具测量了相同内容结构的一个有效证据。求取新开发测量工具与另一个测量工具之间的相关关系,有时候也被用于证明该测量工具没有受到其他无关心理因素的影响。心理测量学测量工具效度验证的方法基于所测心理结构的效度验证方法其他评估方法因素分析法因素分析方法是基于所测心理结构的效度验证方法中几乎最为常用的一种方法,他很适合用于鉴别测量工具所测的心理特质结构。实际上,因素分析方法是一种分析观察数据之间相关矩阵的统计分析技术。心理测量学测量工具效度验证的方法基于所测心理结构的效度验证方法其他评估方法聚合与区分效度验证分析法为了验证测量工具所测的心理结构,我们不仅必须提供关于它与另外一个理论上应该存在高相关的测量工具之间存在高相关的实际证据,同时,也需要提供关于它与另外的无关变量之间不存在显著相关的证据。多特质—多方法矩阵分析法心理测量学测量工具效度验证的方法基于所测心理结构的效度验证方法其他评估方法实验介入分析法通过实验的方法考察某些重要变量的介入是否对被试测量分数产生显著影响。心理测量学测量工具效度验证的方法基于所测心理结构的效度验证方法其他评估方法结构方程建模分析法除了鉴别测量的潜在结构之外,对这些潜在特质结构本身之间的关系以及它们之间的影响路径进行考察,同样是非常重要的。分析潜在特质结构之间的关系及其与效标变量之间的路径,有利于我们更深入理解所测特质的作用机制。这种分析过程可以用结构方程建模的方式进行。心理测量学测量工具效度验证的方法基于所测心理结构的效度验证方法其他评估方法寻求当代认知心理学证据的分析方法基于信息加工理论的研究方法为我们深入理解人类问题解决的加工过程提供了更丰富的证据。认知加工模型让我们了解完成某种认知任务的智能过程、这个过程的组织方式、涉及的知识内容、这些知识在记忆中的表征形式及其提取模式,这些研究无疑会让我们对人类心理特质结构的认知更加深入。心理测量学第三章测量效度与系统误差控制测量的系统误差控制3心理测量学测量的系统误差控制影响测量工具有效性的因素测量的心理特质本身的特点有些心理特质至今研究不够深入,概念界定还不清晰。有些心理特质本身不太稳定。测量工具的建构过程建构过程应遵循严谨的态度才能建构出优良的测量工具,避免出现系统偏差。心理测量学测量的系统误差控制影响测量工具有效性的因素测量工具本身的信度信度是效度的必要条件。效度验证时的被试群体相同的一个测量工具,可能会因为测量对象特性的不同而测量到不同的心理特质结构。作为用相关系数表示的效度系数,希望参与效度验证的被试群体越异质越好。心理测量学引子心理测量的工具是测验,而题目则是构成测验的基石,因此研究题目的性能及其编制至关重要,它直接影响测量工具(即测验)的信度及效度,进而影响测量的准确性。在实际工作中,人们应如何来编制测验题目?如何评价测验题目质量的好差呢?本章将对这些问题做出回答。心理测量学测验题目性能与题目编制测验题目类型、功能与题目编制1测验题目的难度与难度分布控制2测验题目的区分度与区分度的提高3测验题目的猜测度与猜测控制4选择题的选项分析与选项修改5题目功能差异与测量偏差控制6

测验题目的类型功能与编制

第一节心理测量学第一节一、测验题目类型题目主要可分为客观题和主观题两大类。客观题一般有标准唯一的答案,被试的作答只有与标准答案完全一致才视为答对,否则视为答错。主观题无标准唯一答案,只有一个参考答案,被试的作答与参考答案相近或基本一致就可视为答对。心理测量学客观题主要包括选择题(含自陈式选择题)、填空题、是非判断题、匹配题、行为情景判断题等。主观题主要包括名词解释、简

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论