![经济学]心理测量学知识.ppt_第1页](http://file.renrendoc.com/FileRoot1/2019-1/5/e41285b9-ab64-4da7-9abc-ceefd5167147/e41285b9-ab64-4da7-9abc-ceefd51671471.gif)
![经济学]心理测量学知识.ppt_第2页](http://file.renrendoc.com/FileRoot1/2019-1/5/e41285b9-ab64-4da7-9abc-ceefd5167147/e41285b9-ab64-4da7-9abc-ceefd51671472.gif)
![经济学]心理测量学知识.ppt_第3页](http://file.renrendoc.com/FileRoot1/2019-1/5/e41285b9-ab64-4da7-9abc-ceefd5167147/e41285b9-ab64-4da7-9abc-ceefd51671473.gif)
![经济学]心理测量学知识.ppt_第4页](http://file.renrendoc.com/FileRoot1/2019-1/5/e41285b9-ab64-4da7-9abc-ceefd5167147/e41285b9-ab64-4da7-9abc-ceefd51671474.gif)
![经济学]心理测量学知识.ppt_第5页](http://file.renrendoc.com/FileRoot1/2019-1/5/e41285b9-ab64-4da7-9abc-ceefd5167147/e41285b9-ab64-4da7-9abc-ceefd51671475.gif)
已阅读5页,还剩132页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
主讲人:朱 莉 副 教 授 国家二级心理咨询师 一、心理测验概述 二、心理测验的技术分析 三、心理测验的编制与使用 测量:就是依据一定的法则,用数 字对事物加以确定。 如:测量人的体重;测量桌子的长 度。 包括三个要素:法则、数字、事物 1.参照点 1)绝对零点,如长度、重量的测量; 2)相对零点,如海拔高度、摄氏温度。 2.单 位 好的单位必须具备的两个条件: 一要有明确的意义;二要有相同的价值。 量表:是根据某一法则,将事物数量化的 ,定有单位和参照点的数字连续体。 根据量表的精确程度,分成4种水平: 1、命名量表 2、顺序量表:心理测量是在顺序量表上进 行 3、等距量表 4、等比量表 量表的水平量表的水平基本特征的描述基本特征的描述功功 能能举举 例例 命名量表命名量表 相互排斥,相互排斥, 且有可辨别的类别且有可辨别的类别 数字只是用来作标记数字只是用来作标记 和分类,而不能作数和分类,而不能作数 量分析,也不能进行量分析,也不能进行 、 1.1.运动员编号运动员编号 2.2.男、女男、女 顺序量表顺序量表 等级、位次、大于或等级、位次、大于或 小于,无相等单位、小于,无相等单位、 无绝对零点无绝对零点 可表类别的大小,但可表类别的大小,但 不能进行、不能进行、 、 1.1.考试名次考试名次 2.2.能力等级能力等级 3.3.心理量表心理量表 等距量表等距量表 单位相等,单位相等, 无绝对零点无绝对零点 可以进行、,但可以进行、,但 不能进行不能进行、 摄氏温度摄氏温度 等比量表等比量表 有相等单位,有相等单位, 有绝对零点有绝对零点 可以进行、可以进行、 、 1.1.重重 量量 2.2.长长 度度 3.3.时时 间间 所谓心理测验,就是依据心理学理 论,使用一定的操作程序,通过观察人 的少数有代表性的行为,对于贯穿在人 的全部行为活动中的心理特点做出推论 和数量化分析的一种科学手段。 1.间接性: 特质的抽象性和可测性 2.相对性(常模让分数的解释有意义) 3.客观性(即标准化问题) 1.智力测验。如:比内-西蒙智力测验、斯坦福比内 (S-B)智力量表、WAIS韦氏成人智力测验、Raven瑞 文推理测验。 2.特殊能力测验。如:音乐、绘画、机械技巧、文书 才能测验。 3.人格测验。测量个性中除能力以外的部分,包括: 问卷法,如:明尼苏达多项人格调查表(MMPI)、 卡特尔16种人格因素问卷(16PF)、艾森克人格问卷 (EPQ); 投射法,如:罗夏测验(Rorschach test)、主题统觉 测验(TAT)。 1.文字测验,又叫纸笔测验。如:MMPI、EPQ、 16PF、韦氏量表的言语量表。团体测验多采用此方 式,但易受文化程度和文化背景差异的影响。 2.操作测验,又叫非文字测验。如:Rorschach罗夏 墨迹测验、TAT主题统觉测验、Raven瑞文测验、韦 氏量表的操作量表。此类测验不受文化因素的限制 ,可用于学前儿童和不识字的成人,但不宜团体实 施。 两类测验常常结合使用,如:韦氏的三套智力量表 。 1.客观测验:在客观测验中,所呈现的刺激词句 、图形等意义明确,只需受测者直接理解,无须 发挥想象力来猜测和遐想,故称客观测验。绝大 多数心理测验都属这类测验。 2.投射测验:在投射测验中,刺激没有明确意义 ,问题模糊,对受测者的反应也没有明确规定。 受测者做出反应时,一定要凭自己的想象力加以 填补,使之有意义。在这个过程中,恰好投射出 受测者的思想、情感和经验,所以称投射测验。 如:罗夏墨迹测验、TAT测验、自由联想测验、句子 完成测验等。 1.个别测验 2.团体测验 如:陆军甲种和乙种团体智力测验、教育成就测 验、大多数自陈人格问卷。 团体测验材料,也可以个别方式实施,但是个 别测验材料不能以团体方式进行,除非将实施方法 和材料加以改变,使之适合团体测验。 1.最高作为测验。要求被试尽可能做出最好的回答 ,有正确答案。如:智力测验、成就测验。 2.典型行为测验。要求被试按通常的习惯方式做出 反应,没有正确答案。各种人格测验一般都属此类 测验。 分类方法分类方法一一二二三三 按功能分按功能分智力测验智力测验特殊能力特殊能力人格人格 按材料性质分按材料性质分文字测验文字测验操作测验操作测验 按材料严谨程度分按材料严谨程度分客观测验客观测验投射测验投射测验 按测验方式分按测验方式分个别测验个别测验团体测验团体测验 按测验的要求分按测验的要求分最高作为最高作为典型行为典型行为 1.测验万能论 2.测验无用论 3.心理测验即智力测 验 1.心理测验是重要的心理学研究方法之一, 是决策的辅助工具。 2.心理测验作为研究方法和测量工具尚不完 善。心理测验的最大问题是理论基础不够坚 实。 1. 智力测验 2. 人格测验 3. 心理评定量表 应该说:心理测验是分析求助者心理问题的重要 工具,它不但可以检验咨询人员的判断是否正确, 而且还能帮助其对求助者的问题进行深入的分析。 但是心理测验并不是心理咨询或治疗过程中必不 可少的一个环节。 我国始于汉代、兴于隋唐的科举取士制度被 公认为世界上最早的心理测验实践。 科学的心理测验是工业革命成功后19世纪的 欧洲发展起来的。 高尔顿:首先倡导科学心理测验;“人体 测量学实验室”被视为心理测验的开端;第 一个提出了“相关”的统计学概念。 皮尔逊:创立积差相关法。 卡特尔:1890年,在心理杂志上发表 心理测验与测量一文,这是心理测验 第一次出现于心理学文献中。 比内-西蒙量表(1905年量表):是世界上 第一个正式的心理测验。 19世纪80年代是高尔顿的十年,90年代是卡特尔的 十年,20世纪前10年是比内的智力测验的十年。 20世纪20年代以后心理测验的发展趋势: P363 1)操作测验的发展 2)团体智力测验的发展(陆军甲种和乙种智力测验 Army- Beta) 3)能力倾向测验的发展(韦氏智力量表分为言语和操作两 部分) 4)人格测验的发展(人格测验的先驱是克雷丕林,他最早 将自由联想测验施测于精神病人。1920年问世的罗夏测验则 是投射测验的发端。自40年代后,人格测验逐渐增多) 我国近代心理测验,源于1914年克雷顿在 广州对500名儿童试用过心理测验。 心理测验的本土化 常模团体:是由具有某种共同特征的人 所组成的一个群体,或者是该群体的一 个标准化样本。 常模团体的实质,就是有代表性的样本 。 常模选择的一般步骤:确定一般总体 确定目标总体确定样本。 1.群体的构成必须明确界定。 2.常模团体必须是所测群体的代表性样本。 3.样本的大小要适当。(总体数目小,只有几十个人,则 需要100%的样本。如果总体数目大,相应的样本也大,一 般最低不小于30或100个。全国性常模,一般应有20003000 人为宜。) 4.标准化样组是一定时空的产物。 1.简单随机抽样:每个人或抽样单位都有相同的机 会作为常模中的一部分。 2.系统抽样(等距抽样):关键是确定组距。第一 个第K个人从哪里数起是随机的。系统抽样要求目 标总体无序可排,也无等级结构存在。 3.分组抽样:先将群体进行分组,再在组内进行随 机取样。 4.分层抽样:在确定常模时,最常用的是分层抽样 方法。分层抽样还可以分为两种方法:分层比例抽 样和分层非比例抽样。 1.常模分数 常模分数:就是施测常模样本被试后,将被试者的 原始分数按一定规则转换出来的导出分数。 原始分数:是从测验中直接获得的。反映了被试答 对题目的个数或作答正确程度,但不能直接反映出 被试之间的差异状况,不能刻划出被试相互比较后 所处的地位。 导出分数:是由原始分数构成的分布转换而来的分 数。它具有一定的参照点和单位,实际上是一个有 意义的测量量表。它与原始分数等值,可以进行比 较。 2.常 模 常模:就是常模分数构成的分布。它是解 释心理测验分数的基础和参照体系。 常模有一般常模和特殊常模之分。 特殊常模是为非典型团体建立的。 1. 发展常模 2. 百分位常模 3. 标准分常模 4. 智 商 人的许多心理特质如智力、技能等,是随着 时间以有规律的方式发展的,所以可将个人 的成绩与各种发展水平的人的平均表现相比 较。根据这种平均表现所制成的量表就是发 展常模,亦称年龄量表。 1.发展顺序量表; 2.智力年龄; 3.年级当量 发展顺序量表是最直观的发展常模。 最早的一个范例是葛塞尔发展程序表。 瑞士心理学家皮亚杰的发展理论。其中最 著名的工作就是对守恒概念的研究。 守恒(conservation),是指这样一种认识:两种 等量的物体只要无增无减,无论怎样改变组合, 它们在质量、重量、长度、数量及容量等方面仍 然是相等的。 例如质量守恒、重量守恒、长度守恒、容量守恒 。 儿童不同时期出现不同的守恒概念。通常儿童5岁 时才会理解质量守恒;6岁才会掌握重量守恒;7 岁时才有容量守恒概念。 比内西蒙量表中首先使用智力年龄的概念。 一个儿童在年龄量表上所得的分数,就是最能代表 他的智力水平的年龄。这种分数叫做智力年龄,简 称智龄。 儿童的智龄是基础年龄与在较高年龄水平的题目上 获得的附加月份之和。 计算:智龄=岁+其它组通过的题目总数*2(月) 个体的智龄不一定和实龄相符。 年级当量实际上就是年级量表,测验结果说明属 哪一年级的水平,在教育成就测验中最常用。 其表述方式常常是:某学生的算术是6年级水平, 阅读是4年级水平,理解是5年级水平等。这种表 述的依据是把被试的测验得分与团体常模相比较 而来的,通常是把各年级常模样本的平均原始分 数作为年级常模。 年级量表的单位通常为10个月间隔(除去2个月的 假期)。 (一)百分等级 百分等级是应用最广的表示测验分数的 方法。一个测验分数的百分等级是指在常模 样本中低于这个分数的人数的百分比。因此 ,85的百分等级表示在常模样本中有85%的 人比这个分数要低。换句话说,百分等级指 出的是个体在常模团体中所处的位置,百分 等级越低,个体所处的位置就越低。 百分点也称百分位数,与百分等级的计算方法 不同。百分等级是计算低于某种测验分数的人 数百分比,而百分点则是计算处于某一百分比 例的人对应的测验分数是多少。 在分数量表上,相对于某一百分等级的分数点 就叫百分点或百分位数。 我们一般既可以由原始分数计算百分等级,又 可以由百分等级确定原始分数。通过这样的双 向方式编制的原始分数与百分等级对照表,就 是百分位常模。 四分位数和十分位数只是百分位数的两个 变式,其含义相似。四分位数是将量表分 为四等份,相当于百分等级的25%、50% 和75%对应的三个百分分成的四段。十分 位数也可以以此类推出,1%10%为第一 段,91%100%为第十段。 标准分常模:是将原始分数与平均数的距离以标 准差为单位表示出来的量表。因为它的基本单位 是标准差,所以叫标准分数。 标准分数可以通过线性转换,也可以通过非线性 转换得到。由此,可将标准分数分为两类:线性 转换和非线性转换的标准分数。 z分数为最典型的线性转 换的标准分数。 其中,X为任一原始分数, 为样本平均数,SD为样本标准差。 通常需要将z分数转换成另一种形式的量表分数。 这里,Z为转换后的标准分数,A、B为根据需要指定的常数 。加或乘一个常数并不改变原来分数间的关系。加上一个常 数是为了去掉负值,乘以一个常数是为了去掉小数点。 公 式: 当原始分数不是常态分布时,也可以使之常态 化。常态化过程主要是将原始分数转化为百分等级 ,再将百分等级转化为常态分布上相应的标准分数 。计算步骤如下: 第一:对每个原始分数值计算累积百分比 第二:在常态曲线面积表中,求出对应于该百分比 的z分数。 在最早的比内-西蒙智力测验中,并没有智商的概 念,只用“心理(智力)年龄”(mental age,简称 MA)来表示被试智力的高低。但在使用中发现, 单纯用心理年龄来表示智力高低的方法缺乏不同 年龄儿童间的可比性,因此,后来提出用比率智 商和离差智商来表示智力的高低。 目前一般用比率智商和离差智商来表示智力高低 。 比内西蒙量表传入美国后,斯坦福大学推孟教授 于1916年对其修订而成斯坦福比内量表。它在心 理年龄的基础上,以智商表示测验结果,即以后 所说的比率智商。 比率智商(IQ):是心理年龄(MA)与实足年龄 (CA)之比。为避免小数,将商数乘以100: 心理年龄与实足年龄并不同步增长,所以比率智商并不 适合于年龄较大的被试。 另外,相同的比率智商在不同实足年龄具有不同意义。 离差智商:是一种以年龄组为样本计算而得的标 准分数。 为使其与传统的比率智商基本一致,韦克斯勒将 离差智商的平均数定为100,标准差定为15。所以 离差智商建立在统计学的基础之上,它表示的是 个体在年龄组中所处的位置,因而是表示智力高 低的一种理想指标。 公 式: 其中,X表示被试的量表分数, 表示被试所在年龄水平 的平均量表分数,SD表示这一年龄水平被试的量表分数 的标准差。 在实际工作中,通常将原始分数与IQ值的对应关系 计算出来作为常模表,使用时可以在常模表上按其 年龄直接查出智商。 在1960年修订的斯-比测验中,使用的是平均数为 100,标准差为16的标准分数量表。 必须指出,从不同测验获得的离差智商只有当标准 差相同或接近时才可以比较。标准差不同,其分数 的意义便不同。 一、转换表法 最简单而且最基本的表示常模的方法就是转 换表,有时也叫常模表。 二、剖面图法 是将测验分数的转换关系用图形表示出来。 如:韦氏智力量表、16PF、MMPI等。 信度:是指同一被试者在不同时间内用同 一测验(或用另一套相等的测验)重复测 量,所得结果的一致程度。用于考察测验 结果的稳定性和可靠性。 信度只受随机误差的影响。随机误差越大 ,信度越低。系统误差产生恒定效应,不 影响信度。 (一)信度系数与信度指数 通常情况下,信度是以信度系数 为指标,它是一种 相关系数。常常是同一受侧者样本所得的两组资料 的相关。 有时也用信度指数当做信度的指标。信度指数的平 方就是信度系数。 (二)测量标准误 标准误,即真分数的变异,公式是: 公式中,SE为测量的标准误, 是所得分数的标 准差, 为测验的信度系数。 测量的标准误与信度之间有一种互为消长的 关系:信度越高,标准误越小;信度越低, 标准误越大。 1. 重测信度 2. 复本信度 3. 内部一致性信度 4. 评分者信度 又称稳定性系数。它的计算方法是采用重测法 ,即使用同一测验,在同样条件下对同一组受测 者前后施测两次,求两次得分间的相关系数。 优点:能够提供有关测验是否随时间而变 异的资料,可作为被试将来行为表现的依 据。 缺点:易受练习和记忆的影响。 最适宜的时距:一般是两周到四周,间隔 时间最好不超过六个月。 又称等值性系数 复本信度反映的是测验在内容上的等值性 如果两个复本的施测相隔一段时间,则称重测复本 信度或稳定与等值系数。 优点:能够避免重测信度的一些问题,如记忆效果 、学习效应等。 局限性: 1、如果测量的行为易受练习的影响,则复本信度只 能减少而不能完全消除这种影响; 2、由于第二个测验只改变了题目的内容,已经掌握 的解题原则,可以很容易地迁移到同类问题。 3、对于许多测验来说,建立复本是十分困难的。 内部一致性信度系数主要反映的是题目之 间的关系。 主要包括: 1.分半信度:指采用分半法估计所得的信度 系数。 2.同质性信度:主要代表测验内部所有题目 间的一致性。 用于测量不同评分者之间所产生的误差。 一般要求在成对的受过训练的评分者之间 平均一致性达到0.90以上,才认为评分是 客观的。 当多个评分者评定多个对象,并以等级法 记分时,可采用肯德尔和谐系数(W)作 为评分者信度的估计。 一、解释真实分数与实得分数的相关:信度系数可以 解释为总的方差中有多少比例是由真实分数的方差决 定的,也就是测验的总变异中真分数造成的变异占百 分之几。 二、确定信度可以接受的水平:一般原则是:当 0.70时,测验不能用于对个人做出评价或预测,而 且不能作团体比较;当0.70 0.85时,可用于团体 比较;当 0.85时,才能用来鉴别或预测个人成绩 或作为。 三、解释个人分数的意义:它有两个作用:1、估计 真实分数的范围;2、了解实得分数再测时可能的变 化情形。 人们一般采用95%的概率水平,其置信区间为: X1.96SEXTX+1.96SE(SE为测量标准误) 四、比较不同测验分数的差异P380 1. 样本团体异质性的影响 一般而言,若获得信度的取样团体较为异质的话 ,往往会高估测验的信度,相反在同质团体中则会 低估测验的信度。 2. 样本团体平均能力水平的影响 对年幼者和能力水平较低者,其信度相对较低。 一般来说,在一个测验中增加同质的题目,可以 使信度提高。 1.测验越长,测验的测题取样或内容取样就越有 代表性。2.测验越长,被试的猜测因素影响就越 小。 在此需要注意的是,增加测验长度的效果应遵循 报酬递减率原则,测验过长是得不偿失的,有时 反而会引起被试的疲劳和反感而降低可靠性。 难度对信度的影响,只存在于某些测验中,如智力 测验、成就测验、能力倾向测验等。 对于人格测验、兴趣测验、态度测验等不存在难度 问题,因为这些测验的题目没有正确或错误答案之 分。 就难度与信度间的关系而言,并没有简单的对应关 系。从理论上说,只有平均难度水平为50%时,才 能使测验分数分布范围最大,求得的信度也最高。 各类选择题的理想平均难度为:五择一测题:0.7; 四择一测题:0.74;三择一测题:0.77;是非题: 0.85; 时间间隔只对重测信度和不同时测量时的 复本信度(重测复本信度)有影响,对其 余的信度来说不存在时间间隔问题。 以再测法或复本法求信度,两次测验相隔 时间越短,其信度系数越大;间隔时间越 久,其他变因介入的可能性越大,受外界 的影响也越大,信度系数便越低。 效度:是指所测量的与所要测量的心理特点之间 符合的程度,或者简单的说是指一个心理测验的 准确性。效度是科学测量工具最重要的条件,用 来考察测验的准确性、有效性。 测量的效度除受随机误差影响外,还受系统误差 的影响。可信的测验未必有效,而有效的测验必 定可信,信度是效度的必要条件。 (一)效度具有相对性:必须考虑 其目的与功能。 (二)效度具有连续性 1. 内容效度 2. 构想效度 3. 效标效度 (一)什么是内容效度 内容效度:指的是测验题目对有关内容或行为取 样的适用性,即该测验是否是所欲测量的行为领 域的代表性取样。由于这种测验的效度主要与测 验内容有关,所以称内容效度。 要想编制有较高内容效度的心理测验: 1、要对所测量的心理特征有一个明确的概念,并 划定出哪些行为与这种心理特征密切相关。 2、测验题目应是所界定的内容范围的代表性取样 。 1、专家判断法(最常用) 定义好测验内容的总体范围; 编制双向细目表,确定内容的具体细节各自所占 的比例; 由每位评判者在评定量表上作出判断。 2、统计分析法 计算两个评分者之间评定的一致性(评分者信度 ) 两个测验复本上得分之相关(复本信度) 再测法也可用于内容效度的评估(测验-学习-再 测验) 3、经验推测法 这种效度是通过实践来检验效度 表面效度:是由外行对测验作表面上的检 查确定的,它不反映测验实际测量的东西 ,只是指测验表面上看来好像是测量所要 测的东西。 内容效度:是由够资格的判断者(专家) 详尽地、系统地对测验作评价而建立的。 最好行为的测验要求有较高的表面效度。 (一)什么是构想效度 构想效度,又叫构思效度、结构效度。 它主要涉及的是心理学的理论概念问题,是 指测验能够测量到理论上的构想或特质的程 度,即测验的结果是否能证实或解释某一理 论的假设、术语或构想,解释的程度如何。 1. 对测验本身的分析: 1)测验的内容效度; 2)测验的内部一致性指标; 3)分析被试者对题目的反应特点。 2. 测验间的相互比较 1)相容效度 2)区分效度 3)因素分析法 3. 效标效度的研究证明 4. 实验法和观察法证实 (一)什么是效标效度 效标效度又称实证效度,反映的是测验预测个体 在某种情境下行为表现的有效性程度。被预测的 行为是检验效度的标准,简称效标。 根据校标资料是否与测验分数同时获得,又可分 为同时效度和预测效度两类。 在检验一个测验的效标效度时,难点在于 找到合适的效标。因此,效标的选择至关重 要。 一个好的效标必须具备以下条件:P388 1、校标必须能够最有效地反映测验的目标,即 校标测量本身必须有效 2、校标必须具有较高的信度,稳定可靠,不随 时间等因素而变化 3、校标可以客观地加以测量,可用数据或等级 来表示。 4、校标测量的方法简单、省时省力,经济实用 。 1. 相关法(最常用):他要求测验分数 与效标资料间的相关,这一相关系数成 为效度系数。 2. 区分法:是检验测验分数能否有效地 区分由校标所定义的团体的一种方法。 3. 命中率法 一、预测误差 效度系数的实际意义常常以决定性系数 来表示,决定性系数是效度系数的平方 ,它表示测验正确预测或解释的校标的 方差占总方差的比例。 二、预测效标分数 三、预测效率指数 一、测验本身的因素 P391 二、测验实施中的干扰因素 1.主试的影响因素 2.被试的影响因素 三、样本团体的性质 1.样本团体的异质性:如果其他条件相同, 样本团体越异质,测验效度就越高;样本团 体越同质,效度就越低。 2.干涉变量 四、效标的性质 难度:是指项目的难易程度。 难度的指标通常以通过率表示,即以答对或 通过该题的人数百分比来表示。P值大小与难 度高低程反比,所以也有人将其称作易度。 P=R/N*100% P代表项目的难度,N为全体受测者人数,R 为答对或通过该项目的人数。 难度的取值范围,在0-1.00之间。 (一)二分法记分的项目 心理测验的项目如果是选择题, 通过记1分,错误记0分。对这类题目 可直接用公式P=R/N*100%计算难度。 当受测人数较多时,则可用: P=( PH+ PL )/2 P代表难度, PH和 PL分别代表高分组和 低分组通过率。 当测验项目为问答题或不能用二分法记分的形式 时,一般用下面的公式计算难度。 为全体被试者在该题上的平均分, 为该题的满分。 (一)项目的难度 项目的难度多高合适,取决于测验的目的、 性质以及项目的形式。 P值越接近0或接近于1,越无法区分被试间能 力的差异,相反,P值越接近于0.5,区别力 越高。 对于选择题来说,P值一般应大于概率水平。 例如:对于是非题而言,其难度应该为0.75 最为合适;对于四选一的题目,其难度值约 为0.63最为合适。 测验的难度直接依赖于组成测验的项目的 难度。 大多数测验在设计时希望分数呈现常态分 布的模型。如果被试样本具有代表性,对 于中等难度的测验,其测验总分应该接近 常态分布。 一般来说,最好使测验中所包含的试题的 难度在0.5 0.20之间,平均难度接近0.50. 项目区分度(item discrimination):也 叫鉴别力,是指测验项目对被试的心理 特性的区分能力。 项目区分度是评价项目质量和筛选项目 的主要指标,也是影响测验效度的重要 因素。 (一)鉴别指数 此方法的主要步骤如下: 1、按测验总分的高低排列答卷 2、确定高分组与低分组,每一组取答卷总数的 27%。 3、分别计算高分组与低分组在该项目上的通过率 或得分率。 4、按下列公式估计出项目的鉴别指数。 1965年,美国测验专家伊贝尔根据长期的经验提出 用鉴别指数评价项目性能的标准:P397 计算区分度最常用的方法是相关法,即以 某一项目分数与校标成绩或测验总分的相 关作为给项目区分度的指标。 常用的计算方法有点二列相关、二列相关 和相关法等。 相关越高,表明项目越越具有区分功能、 区分度取值范围介于1和+1之间。 难度的分布广一些,梯度多一些,是合乎 需要的。 较难的项目对高水平的被试区分度高,项 目难度的分布也以常态分布为好。 1.确定、分析测验目标 2.制定编制计划(搜集 资料) 3.设计测验题目 4.合成测验 5.项目预测与分析 6.鉴定测验(信度、 效度) 7.测验标准化(测验 内容、施测、评分、 常模) 8.编写指导手册 任何测验,都有其实施对象的范围。 只有对被试的年龄、性别、职业、受教育 程度、社会经济、受教育水平及文化背景 等有所了解,编制测验时才能有的放矢。 例如:韦氏智力量表,分城市和农村用两 式,包括幼儿、儿童、成人三套量表。 测验的用途可分两类:显示和预测,由此 我们可分为两类测验: 1. 显示性测验:样本测验和标记测验 2. 预测性测验 显示性测验和预测性测验的区分并不是绝对 的,有时是统一的。如:高考。 心理测验的目标:是指编制的测验是测什么的, 即用来测量什么样的心理变量或行为特征。 目标分析过程: 1.工作分析(任务分析),用于预测性测验。 2.对特定概念下定义,用于测量某种特殊的心理特质 。如:基本心理能力测验、态度测验。 3.确定测验的具体内容,用于显示性测验,尤其是成 就测验。 1. 已出版的标准测验 (最简单、最直接的方法) 2. 理论和专家的经验 3. 临床观察和记录 1. 内容方面:符合测验目的、取样要有 代表性、内容相互独立。 2. 文字方面 3. 理解方面 4. 社会敏感性方面 鲍勃海姆将心理测验的题目分为两大类 :提供型和选择型题目。 1.提供型题目要求被试给出正确答案,如论 文题、简答题、填充题等。 2.选择型题目要求被试在有限的几个答案中 选择正确的答案,如选择题、是非题、匹配 题等。 同样的测题内容,后一种测题一般来说难度 较低。 (一)选择题。由两部分组成:题干和选项。 对于选择题,我们既要编好题干,也要编好选项, 有如下六点必须注意: 1、题干所提的问题必须明确,尽量使用简单而且明晰 的词语。 2、选项切忌冗长,要简明扼要。 3、每道题只给一个正确答案,其它属诱答。 4、各选项长度应相等,尽量不要有长有短。 5、避免题干用词与选项用词一致,否则成了选择答案 的线索。 6、选项最好用同一形式。,选项最好随机排列,除非 本身有逻辑顺序。 (一)选择与审定试题 1.选择试题形式 一个测验中,可以采用一种或几种项目形式。 在选择题目形式时,需要考虑以下几点: 1)测验的目的和材料的性质 2)接受测验的团体的特点 3)各种实际因素 在这个过程中,编制者和有关方面专家要 对题目反复审查修订;改正意义不明确的 词语,取消一些重复的和不适用的题目。 然后将初步满意的题目汇集起来组成一个 预备测验。 审定试题要注意以下几个问题:P405 1、范围;2、数量;3、难度;4、说明 编排的一般原则: 1.测题的难度排列宜逐步上升,由易到难; 2.尽可能将同类型的测题组合在一起; 3.注意根据各种类型测题本身的特点排列。 题目两种常见的排列方式:并列直进式和混 合螺旋式。 (一)预 测: 预备测验的目的和注意事项,见P406. (二)项目分析 包括:质的分析和量的分析。 前者是从内容取样的适用性、题目的思想性 以及是否清楚等方面加以评价; 后者是对预测结果进行统计分析,确定题目 的难度、区分度、备选答案的适合度等。 (一)信度。信度是衡量测验质量的最基 本的指标,因而测验编好后首先要考察该 测验的信度。 (二)效度。如果一个测验的效度很低, 那么说明该测验所测得的东西不是它所要 测的东西。 建立常模的方法是:在将来要使用测验的全 体对象中,选择有代表性的一部分人(称标 准化样本),对此样本施测并将所得的分数 加以统计整理,得出一个具有代表性的分数 分布,此即该测验的常模。 无论哪种测验,都要参照某个系统对原始分 数加以转换成导出分数,才能做出有意义的 解释。常用的心理测验常模有百分位常模、 标准分常模、发展常模及智力商数等。 编制测验的最后一步,就是编写指导手册,也称测 验指导书。 测验指导手册的内容: 1、目的和功用 2、理论背景和原则 3、实施测验的说明 4、标准答案和记分标准 5、常模资料 6、基本特征 主测者的资格包含技术和道德两方面的要求。 一、知识结构 基础知识:普通心理学、发展心理学、社会心理学等 在专业知识方面:人格心理学、能力心理学、变态心 理学、本工作领域具备的相应的本行业的专业知识 。 二、专业理论知识和专业技能 (一)专
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025目前公务员考试试题及答案
- 2025临沂公务员试题及答案
- 技术经济学课后题及答案
- 2025经济金融学试题及答案
- 2025-2030中国色氨酸行业需求趋势及投资动态预测报告
- 样板墙施工方案(3篇)
- (正式版)DB15∕T 2124-2021 《绒山羊疫病综合防治技术规程》
- 品茗施工方案软件(3篇)
- 节食旅游产品活动策划方案(3篇)
- 采暖节能施工方案(3篇)
- 2024-2025年上海中考英语真题及答案解析
- 人教版小学数学2年级下册课时练无答案+单元测试题+期中期末检测卷(含答案)
- 西南大学2022-2023学年本科教学质量报告
- 督灸技术课件
- 护理查房及病例讨论
- 提升教师专业素养与综合能力的培训
- 人力资源顾问服务合同范本正规范本(通用版)
- 电土施表1-6 专业绿色施工、节能减排管理措施和实施记录
- 幼儿园多媒体课件设计与制作第2版(高职学前教育专业)全套教学课件
- 单位消防安全管理应知应会参考题库300题(含答案)
- 读书分享读书交流会《中国民间故事》
评论
0/150
提交评论