




已阅读5页,还剩6页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2010 年自学考试心理测验学重难点归纳 信度是指同一被试在不同时间内用同一测验(或用另一套相等的测验)重复测量, 所得结果的一致程度。信度只受随机误差的影响,随机误差越大,信度越低。 1.信度是指同一被试在不同时间内用同一测验(或用另一套相等的测验)重复 测量,所得结果的一致程度。信度只受随机误差的影响,随机误差越大,信度 越低。 信度理论定义:传统的信度理论认为,每一个测验的实得分数(X)总是由真 实分数(T)和误差(E),两个部份构成的,公式为: X=T+E 讨论一组测验分数的特性时,可用方差导标具体分数,公式: (测验实得分数的方差)=(测验真分数的方差)+(测验误差的方差) 操作定义:一组测量分数的真分数方差与总方差(实得分数的方差)的比率 ,或者是真实分数方差占总方差的的百分比。计算公式: 由于真实分数的方差是无法统计的,因此公式 3-3 可转化为: 在(书上)图 3-1 下面的话看一看。 2、信度的指标 (1)信度系数:大部分情况下,信度是信度系数为指标,它是一种相关系数 。理论上说就是真分数方差与实得分数的方差的比值,公式是: (2)测量标准误:信度系数表示一组测量的实得分数与真分数的符合程度, 但并没有直接支出个人测量分数的变异量。 测量的标准误与信度之间呈反比关系:标准误越小,信度越;标准误越大, 信度越低。 3、信度与测验分数的解释:(1)解释真实分数与实得分数的相关:信度系 数可以解释为总的方差中有多少比例是由真实分数的方差决定的,也就是测验 的总变异中真分数造成的变异占百分之几。(2)比较信度可以接受的水平:一个 测验究竟信度多高才适合,才让人满意呢?当然,最理想的情况是=1.00,但实 际上办不到。一般原则是:当0.70 时,测验不能用于对个人作出评价或预测, 而且不能作团体比较;当 0.700.85 时,可用于团体比较;当0.85 时,才能用来 鉴别或预测个人成绩或作为。(3)解释个人分数的意义:从信度可以解释个人分 数的意义,这是测量标准误的应用。它有两个作用:一是估计真实分数的范围; 二是了解实得分数再测时可能的变化情形。看书公式 3-8.(4)比较不同测验分数 的差异:测量标准误和测验信度在评价两个不同测验的分数是否有明显差异时 也非常重要。这种比较包括两个人不同分数的差别和同一被试在两个测验上的 差别。 1、重测信度:又称稳定性系数。他的计算方法是采用重测法,即使用同一 测验,在同样条件下对同一组被试前后施测两次测验,求两次得分间的相关系 数。 最适宜的时距随测验的目的、性质和被试的特点而异,一般是两周到四周 较宜,间隔时间最好不超过六个月。 重测信度的前提假设是:所测量的特性必须是稳定的;每个人对前一次 反应的遗忘程度相同;在时间间隔中没有学习另外的与测验有关的东西。 2、复本信度:又称等值性系数。它是以两个等值但题目不同的测验(复本) 来测量同一群体,然后求得被试在两个测验上得分的相关系数,这个相关系数 就代表了复本信度的高低。 复本信度的高低关键取决于复本测验的选择,因而是题目取样问题。 同重测信度一样,复本信度也要考虑两个复本实施时间间隔。如果两个复 本几乎是在同一时间内施测的,相关系数反映的才是不同复本的关系,而不掺 有时间的影响。如果两个复本的施测相隔一段时间,则称稳定与等值系数。稳 定与等值系数既考虑了测验在时间上的稳定性,也考虑了不同题目样本反应的 一致性,因而是更为严格的信度考察方法,也是应用较为广泛的方法。 内部一致性信度包括:分半信度和同质性信度。(1)分半信度:指采用分办 法估计所得的信度系数。这种方法估计信度系数只需一种测验形式,实施一次 测验。通常是在测验实施后将测验按奇、偶数分为等值的两半,并分别计算每 位被试在两半测验上的得分,求出这两半分数的相关系数。1 常见的是将测题 按其序列号的奇偶分半,这种分法的前提是:测题并非随机排列,而是按某种 顺序(如难度 )排列;如果随机排列的题目,则必须是所有题目平等的(要么难度相 等,要么性质一样);如果测验有多个分量表,应该在分量表内部排好顺序,再 把各分量表分两半组合起来求相关。2 常用的修正公式是:斯皮尔曼-布朗公 式: 3、斯皮尔曼-布朗公式为经验公式,他的假设条件是两半测验分数的变异 数相等,但实际资料有时未必完全符合这一条件。当假设不成立时,可采用: 弗朗那根公式或卢伦公式中的任一一个。(公式见书 3-12、3-13) 同质性信度:指测验内部所有题目间的一致性。当各个测题的得分有较高 的正相关时,不论题目的内容和形式如何,测验即为同质的;若所有题目看起来 好像测量的是同一特质,但相关很低或为负相关时,测验即为异质的。此外, 对于一些复杂的、异质的心理学变量,采用单一的同质性测验是不行的,因而 常常采用若干相对异质的分测验,并使每个分测验内容具有同质性,这样每个 分测验就能用来预测异质效标的某一方面。同质性信度的公式主要有:库德-理 查逊公式:常用的是 K-R20 公式,在个各测题难度相同或近似的情况下,还可 采用计算更为简便的 K-R21 公式。 克伦巴赫 系数( 这几个公式在书上好好看看) 4、评分者信度:用于测量不同评分者之间所产生的误差。为了衡量评分者 之间的信度高低,可随机抽取若干份测验卷,由两位评分者按评分标准分别给 分,然后再根据美分测验卷的两个分数计算相关,即得评分者信度。一般要求 在成对的受过训练的评分者之间平均一致性达 0.90 以上,才认为评分是客观的 。 1、样本的特征:(1)样本团体分数分布的影响:任何相关关系都是受到团 体中分数分布的影响,当分布范围增大时,其信度估计就较高;当分布范围减小 时,相关系数随之下降,信度值则较低。(2)样本团体异质性的影响:若获得信 度的取样团体较为异质的话,往往会高估测验的信度,相反则会低估测验的信 度。样本团体平均能力水平的影响:对于不同水平的团体,题目具有不同的难 度,每个题目在难度上的微小差异累计起来便会影响信度。 2、测验的长度:在一个测验中增加同质的题目,可以使信度提高。测验 越长,测验的测题取样或内容取样越有代表性;测验越长,被试的猜测因素影 响越小。 3、测验的难度:如果一个测验对某团体而言太容易,会使所得分数都集中 在高分端;当题目太困难时,得分就会集中在低分端。两种情况均会使信度样本 的分数范围变窄,从而使测验变得不够可靠。 4、测验的时间间隔:以再测法或复本法求信度,两次测验相隔时间越短, 其信度系数越大;间隔时间越久,其它变因介入的可能性越大,受外界的影响越 大,信度系数便越低 常模的团体和常模样本 1、常模团体的性质 由具有某种共同特征的人所组成的一个群体,或者是该群体的一个样本。 对编制者而言:常模的选择主要是基于对测验将要施测的总体的认识,常 模团体必须能够代表该总体。这种工作包括:确定一般总体、确定目标总体、 确定样本。 对测验使用者:要考虑的问题是,现有的常模团体哪一个最合适。 2、常模团体的条件 (1)群体的构成必须明确界定:在制定常模时,必须清楚地说明所要测量的 群体的性质与特征。依据不同的变量确定群体,便可得到不同的常规。 (2)常模团体必须是所测群体的代表性样本。 (3)样本的大小要适当。总体数目小,只有几十个人,需要 100%的样本; 如 果总体数目达,相应的样本也大,一般最低不小于 30 或 100 个;全国性常模, 一般应有 2000-3000 人为宜。 (4)标准化样组是一定时空的产物:我们在一定时间和空间中抽取的标准化 样组,它只能反映当时当地的情况。在选择合适常模时,注意选择较为新近的 常模。 3、取样的方法(1)简单随机抽样:按照随即表顺序选择被试构成样本,或 者将抽样范围内的每个人或者每个抽样单位编号,再随即选择,可以避免由于 标记、姓名、性别或其它社会赞许性偏见而造成抽样误差。(2)系统抽样:有时 在总体数目为 N 的情况下,若要选择 K 分之一的被试作为样本,则可以在抽样 范围内选择每个第 K 个人来构成样本。(3)分组抽样 (4)分层抽样:在确定常模时 ,最常用的是分层抽样方法。分层比例抽样分层非比例抽样 4、常模分数 和常模(1)常模分数:就是施测常模样本被试后,将被试者的原始分数按一定规 则转换出来的导出分数。(2)常模分数构成的分布,就是通常所说的常模,它是 解释心理测验分数的基础。测验手册上所列的常模通常为一般常模,不一定适 合使用者的具体情况;特殊常模是为非典型团体建立的,一般比为小团体建立的 常模范围更窄。 常模的类型及解释 1、发展常模:人的许多心理特质如智力、技能等,是随着时间以有规律的 方式发展的,所以可将个人的成绩与各种发展水平的人的平均表现相比较。根 据这种平均表现所制成的量表就是发展常模,亦称年龄量表。 (1)发展顺序量表:因为它告诉人民多大的儿童具备什么能力或行为就表明 其发育正常,相应能力或行为早于某年龄出现,说明发育超前,否则即为发育 滞后。最早的一个范例是格塞尔发展程序表,其中按月份显示儿童在运动水平 、适应性、语言、社会性四个方面的大致发展水平。 (2)智力年龄:比内 -西蒙量表中首先使用智力年龄的概念。 这种分数叫做智力年龄,简称智龄。 智龄是年龄量表上度量智力的单位。求智龄分方法很简单,只要将儿童在 测验上的分数与各年龄组的一般儿童比较,便可给予一个年龄分数。因此在计 算中先算出年龄,既全部题目都通过的那组题目所代表的年龄。再所有更高年 龄水平上通过的题目,用月份计算,加在基础年龄上,儿童的智龄是基础年龄 与在较高年龄水平的题目上获得的附加月份之和。 另外一种使用年龄量表的方法是不把题目分到各年龄组。首先根据被试在 整个测验中正确反应的题数或反应时间而得一原始分数,而将标准化样本中每 个年龄组的平均原始分数作为年龄常模。通过将原始分数与年龄常模对比,便 可求得每个人的智龄。例如某个儿童的原始分数等于 8 岁组的平均数,则其智 力年龄就是 8 岁。 一个人的智龄并不一定和他的实龄相符,聪明的儿童,其智龄高于实龄;愚 笨的儿童,其智龄低于实龄;只有普通儿童,其智龄与实际年龄相近似。 (3)年级当量:实际上就是年级量表,测验结果说明被试属哪一年级的水平 ,在教育成就测验中最常用。 2、百分位常模及解释 百分位常模包括百分等级和百分点、四分位数和十分位数。 (1)百分等级:是应用最广的表示测验分数的方法。一个测验分数的百分等 级是指在常模样本中低于这个分数的人的百分比。其计算分为:未分组资料的 百分等级计算;分组资料的百分等级求法。 (2)百分点:也称百分位数,与百分等级的计算方法正好相反,百分等级是 计算低于某测验分数的人数百分比,而百分点则是计算处于某一百分比例的人 对应的测验分数是多少。百分点的计算可根据直线内插法进行。在实际应用中 ,我们一般既可以由原始分数计算百分等级,又可以由百分等级确定原始分数 。通过这样的双向方式编制的原始分数与百分等级对照表,就是百分位常模。 3、标准分常模及解释 标准分常模:标准分数是将原始分数与平均分数的距离以标准差为单位表 示出来的量表。它的基本单位是标准差。 (1)线性转换的标准分数:z 分数为最典型的线性转换的标准分数。 (2)与线性导出分数一样,常态化标准分数也可以被转化成任何方便的形式 。当以 50 为平均数(即加上一个常数 50),以 10 为标准差(乘以一个常数 10)来 表示时,通常叫做 T 分数。 T 分数:T=50+10zT 分数这一概念最早由麦克尔于 1939 年提出,含有 纪念推孟和桑代克二氏。 标准九分:是另一较知名的标准分数系统,其量表是个 9 级的分数量表 ,它是以 5 为平均数,以 2 为标准差的一个分数量表。 常态化的标准分数还有标准十分(平均数 5,标准差 1.5)标准二十分(平均 数 10,标准差 3) 4、智商及其意义 (1)比率智商:比内 -西蒙量表传入美国后,斯坦福大学推孟教授于 1916 年 对其修订而成斯坦福-比内量表。它在心理年龄的基础上,以智商表示测验结果 ,即以后所说的比率智商。 比率智商提出后,普遍被心理学界和医学界所接受。但由于个体智力增长 是一个由快到慢再到停止的过程,即心理年龄与实足年龄并不同步增长,所以 比率智商并不适合于年龄较大的被试;另外,由于不同年龄组儿童的比率智商分 布的情况是不一样的,因而相同的比率智商分数在不同年龄就具有不同意义。 基于这种考虑,心理学家韦克斯乐提出了离差智商的概念。 (2)离差智商:是一种以年龄组为样本计算而得的标准分数,为使其与传统 的比率智商基本一致,韦克斯勒将离差智商的平均数定为 100,标准差定为 15. 所以离差智商建立在统计学的基础之上,它表示的是个体智力在年龄组中所处 的位置,因而是表示智力高低的一种理想的指标。由于离差智商的提出,过去 曾使用比率智商的许多测验在后来也使用了离差智商,如在 1960 年修订的斯一 比测验中,就使用的是平均数为 100,标准差为 16 的标准分数量表。必须指出 ,从不同测验获得的离差智商只有当标准差相同或接近时才可以比较,标准差 不同,其分数的意义便不同。 5、百分位与标准分数的共同之处:将被试的分数在团体内做横向比较,而 发展量表却是与不同发展水平的人做纵向比较。 常模分数的表示方法:转换表和剖析图。(TK 或 XZ) 在效标参照测验中,一种标准是对测验所包括的材料熟练或掌握的程度, 将分数与此种标准比较可以搞清一个人知道什么和能做什么。因为涉及的主要 是测验的内容,所以可以把这种分数叫做内容参照分数。另一个比较标准是外 在效标,即用预期的效标成绩来解释测验分数,因为涉及的是最后来的结果, 所以把这种分数叫做结果参照分数。 效标参照测验及其应用 参照效标测验是格拉赛提出的。 效标参照测验优点:(1)不象常模参照测验那样,使能力强者骄傲自满,能 力差者长期遭受挫折,效标参照测验巧妙地避开了对得分、名次的过分纠缠, 使各人都有自己的奋斗目标和希望。 (2)常模参照测验无法反映出被试的真正能力和水平,甚至对被试到底能做 什么,不能做什么也不清楚。效标参照测验既能发现个人特有的长处,也会找 到问题的症结所在,而常模参照测验就做不到。 (3)从常模参照测验的得分不能得到被试在外在效标上的表现,效标参照测 验则可直接作出解释,有时测验结果的本身可能就是效标。 (4)效标参照测验与教师在教学过程中的自编测验关系更为密切,因而效标 参照测验的理论概念更易为教师接受和应用。 内容参照分数及解释 1、内容参照分数:又叫范围参照,主要是依据被试对某个确定的材料内容 或技能的掌握程度和熟悉程度来表示和解释测验结果。 2、内容参照的表示方法:内容参照的表示方法:掌握分数和正确百分数。 (1)掌握分数:订出一个判别被试是否通过或掌握的最低分数,即最低掌握水平 ,此分数以上,表明被试已达到掌握或熟练水平;此分数以下,表明没有达到这 个水平,需要进一步的学习或采取其他补救措施。(2)正确百分数(更为常见): 是报告内容参照分数的又一个指标,表明被试者在测验中答对题目的百分比, 因而掌握分数的二分法记分来表示掌握或熟练程度更为合适。 正确百分数=答对题目数/总题目数 100 结果参照分数及解释 1、果参照分数:实际上是一个效标分数,即用效标行为的水准来表示测验 的结果,而且也是对被试未来作为的预测。 2、结果参照分数表示法 (1)期望结果的概率:通过一种简单的图表,显示出获得特定测验分数的人 得到每一种效标分数的百分比,即将测验成绩以产生各种不同结果的概率来描 述。 (2)预期的效标分数:将具有不同测验分数的人所可能获得的预期效标分数 用图表显示出来。 测验分数的综合分析 1、根据心理测量的特点进行分析:由于测验误差的影响,被试测验分数会 在一定范围内波动,故应该永远把测验分数视为一个范围而不是一个确定的点 。 2、要考虑测验前的经历和测验时的情景:(1)为了能对测验分数作出有意 义的解释,必须将个人在测验前的经历考虑在内。(2)测验情镜也是一个需要考 虑的因素。 3、要考虑测验的信度和效度:为了对测验分数做出确切的解释,只有常摩 资料是不够的,还必须有测验的信度和效度资料。 4、于来自不同测验的分数不能直接加以比较:为了使不同测验分数可以相 互比较,必须将二者放在统一量表上。具体做法是将两个测验都对同一样本进 行施测,并把两种测验的原始分数都换算成百分等级,然后用该百分等级作为 中介,就可以作出一个等价的原始分数表,另一种是用相同的标准分数作等值 的基础,此种方法叫做线性等值。 报告分数的具体建议 1、不应把测验分数直接告诉被试本人或家长、学校班主任等有关人员,应 告诉的是测验分数的解释和建议。 2、避免使用专业术语。 3、要保证当事人知道这个测验测量或预测什么。 4、要使当事人知道他是和什么团体在进行比较。 5、要使当事人知道如何运用他的分数。 6、要考虑测验分数将给当事人带来什么心理影响。 7、要让当事人积极参与测验分数的解释。 8、测验结果应向无关人员保密。 难度是指项目的难易程度。在能力测验中通常需要一个反映难度水平的指标, 在非能力测验(人格测验)中,类似的指标是“ 通俗性”,即取自相同总体的样本 中,能在答案方向上回答该题的人数。(名词解释) 难度的指标:难度的指标通常以通过率表示,即以答对或通过该题的人数 百分比来表示。 (公式 5-1) 难度的计算 二分法记分的项目:心理测验的项目大多为选择题,通过记 1 分,不通过 记 0 分。当被试人数较多时,可根据测验总成绩将被试分为三组:分数最高的 27%被试为高分组(),分数最低的 27%被试为低分组()中间 46%的被试为中 间组。分别计算高分组和低分组的通过率,以两组通过率的平均值作为每一题 的难度。 由于选择题允许猜测,所以通过率可能因机遇作用而变大。备选答案的数 目越少,机遇的作用越大,越不能真正反映测验的难度。为此,吉尔福特提出 了一个 P 值校正公式。 例题:假定某题有 75%的被试通过,若该题有 5 个备选答案,则校正后 的通过率为: (当有 4 个备选答案时,CP=0.67;有 3 个,CP=0.63;有 2 个, CP=0.54) 非二分记分的项目:如果人为地明确通过每一题的分数线,也可以用公式 5-2 计算难度。但此种方法的缺点在于,采用不同的分数线会得到不同的难度 值,因此不常用。 难度水平的确定 项目难度的确定:进行难度分析的主要目的是为了筛选项目,项目的难度 多高合适,取决于测验的目的、性质以及项目的形式。为了使测验具有更大的 区别力,应选择难度在 0.50 左右的试题比较合适。但是在实际各种中并得非 如此简单。在选择题目时,最好使试题的平均难度接近 0.50,而各题难度在 0.500.20 之间。当测验用于选拔或诊断时,应该比较多地选择难度值接近录 取率的项目。对于选择题来说,P 值一般应大于概率水平。 测验难度的确定:测验的难度直接依赖于组成测验的项目的难度。通过考 察测验分数的分布,可以对测验的难度做出直观检验。 项目区分度的概念:也叫鉴别力,是指测验项目
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 人教版八年级数学上册《角的平分线》同步测试题(附答案)
- 首字母填空(重难词汇100题)-人教版七年级英语上册期末复习(含答案)
- 人教A版高考数学复习讲义:空间点直线平面之间的位置关系
- 训课件-大穿插施工如何执行落地
- 重力式码头课件
- 醉酒驾驶法律知识培训课件
- 醉酒后急救知识培训内容课件
- 统编版五年级道德与法治上册全册教案设计(表格式)
- 实验基础(专练)-高考化学二轮复习考点突破(原卷版)
- 老年人健身知识培训课件
- 新能源装备制造业行业研究报告
- 家博会现场抽奖活动方案
- 古建筑保护和修复工程项目可行性研究报告
- 第1章 勾股定理 问题解决策略 课件 北师大版数学八年级上册
- 三方检测公司管理制度
- 2025至2030年中国特种石墨行业市场发展态势及投资机会研判报告
- 以技术驱动的医院管理人才培养路径
- 自闭症儿童空间设计
- JJF 2216-2025电磁流量计在线校准规范
- 开通港股通的试题及答案
- 诺姆四达人才测评题库
评论
0/150
提交评论