




已阅读5页,还剩1页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
(一)信度是指同一被试在不同时间内用同一测验(或用另一套相等的测验)重复测量,所得结果的一致程度。信度只受随机误差的影响,随机误差越大,信度越低。信度理论定义:传统的信度理论认为,每一个测验的实得分数(X)总是由真实分数(T)和误差(E),两个部份构成的,公式为:X=T+E讨论一组测验分数的特性时,可用方差导标具体分数,公式:(测验实得分数的方差)=(测验真分数的方差)+(测验误差的方差)操作定义:一组测量分数的真分数方差与总方差(实得分数的方差)的比率,或者是真实分数方差占总方差的的百分比。计算公式:由于真实分数的方差是无法统计的,因此公式3-3可转化为:在(书上)图3-1下面的话看一看。2、信度的指标(1)信度系数:大部分情况下,信度是信度系数为指标,它是一种相关系数。理论上说就是真分数方差与实得分数的方差的比值,公式是:(2)测量标准误:信度系数表示一组测量的实得分数与真分数的符合程度,但并没有直接支出个人测量分数的变异量。测量的标准误与信度之间呈反比关系:标准误越小,信度越;标准误越大,信度越低。3、信度与测验分数的解释:(1)解释真实分数与实得分数的相关:信度系数可以解释为总的方差中有多少比例是由真实分数的方差决定的,也就是测验的总变异中真分数造成的变异占百分之几。(2)比较信度可以接受的水平:一个测验究竟信度多高才适合,才让人满意呢?当然,最理想的情况是=1.00,但实际上办不到。一般原则是:当0.70时,测验不能用于对个人作出评价或预测,而且不能作团体比较;当0.700.85时,可用于团体比较;当0.85时,才能用来鉴别或预测个人成绩或作为。(3)解释个人分数的意义:从信度可以解释个人分数的意义,这是测量标准误的应用。它有两个作用:一是估计真实分数的范围;二是了解实得分数再测时可能的变化情形。看书公式3-8.(4)比较不同测验分数的差异:测量标准误和测验信度在评价两个不同测验的分数是否有明显差异时也非常重要。这种比较包括两个人不同分数的差别和同一被试在两个测验上的差别。1、重测信度:又称稳定性系数。他的计算方法是采用重测法,即使用同一测验,在同样条件下对同一组被试前后施测两次测验,求两次得分间的相关系数。最适宜的时距随测验的目的、性质和被试的特点而异,一般是两周到四周较宜,间隔时间最好不超过六个月。重测信度的前提假设是:所测量的特性必须是稳定的;每个人对前一次反应的遗忘程度相同;在时间间隔中没有学习另外的与测验有关的东西。2、复本信度:又称等值性系数。它是以两个等值但题目不同的测验(复本)来测量同一群体,然后求得被试在两个测验上得分的相关系数,这个相关系数就代表了复本信度的高低。复本信度的高低关键取决于复本测验的选择,因而是题目取样问题。同重测信度一样,复本信度也要考虑两个复本实施时间间隔。如果两个复本几乎是在同一时间内施测的,相关系数反映的才是不同复本的关系,而不掺有时间的影响。如果两个复本的施测相隔一段时间,则称稳定与等值系数。稳定与等值系数既考虑了测验在时间上的稳定性,也考虑了不同题目样本反应的一致性,因而是更为严格的信度考察方法,也是应用较为广泛的方法。内部一致性信度包括:分半信度和同质性信度。(1)分半信度:指采用分办法估计所得的信度系数。这种方法估计信度系数只需一种测验形式,实施一次测验。通常是在测验实施后将测验按奇、偶数分为等值的两半,并分别计算每位被试在两半测验上的得分,求出这两半分数的相关系数。1常见的是将测题按其序列号的奇偶分半,这种分法的前提是:测题并非随机排列,而是按某种顺序(如难度)排列;如果随机排列的题目,则必须是所有题目平等的(要么难度相等,要么性质一样);如果测验有多个分量表,应该在分量表内部排好顺序,再把各分量表分两半组合起来求相关。2常用的修正公式是:斯皮尔曼-布朗公式:3、斯皮尔曼-布朗公式为经验公式,他的假设条件是两半测验分数的变异数相等,但实际资料有时未必完全符合这一条件。当假设不成立时,可采用:弗朗那根公式或卢伦公式中的任一一个。(公式见书3-12、3-13)同质性信度:指测验内部所有题目间的一致性。当各个测题的得分有较高的正相关时,不论题目的内容和形式如何,测验即为同质的;若所有题目看起来好像测量的是同一特质,但相关很低或为负相关时,测验即为异质的。此外,对于一些复杂的、异质的心理学变量,采用单一的同质性测验是不行的,因而常常采用若干相对异质的分测验,并使每个分测验内容具有同质性,这样每个分测验就能用来预测异质效标的某一方面。同质性信度的公式主要有:库德-理查逊公式:常用的是K-R20公式,在个各测题难度相同或近似的情况下,还可采用计算更为简便的K-R21公式。克伦巴赫系数(这几个公式在书上好好看看)4、评分者信度:用于测量不同评分者之间所产生的误差。为了衡量评分者之间的信度高低,可随机抽取若干份测验卷,由两位评分者按评分标准分别给分,然后再根据美分测验卷的两个分数计算相关,即得评分者信度。一般要求在成对的受过训练的评分者之间平均一致性达0.90以上,才认为评分是客观的。1、样本的特征:(1)样本团体分数分布的影响:任何相关关系都是受到团体中分数分布的影响,当分布范围增大时,其信度估计就较高;当分布范围减小时,相关系数随之下降,信度值则较低。(2)样本团体异质性的影响:若获得信度的取样团体较为异质的话,往往会高估测验的信度,相反则会低估测验的信度。样本团体平均能力水平的影响:对于不同水平的团体,题目具有不同的难度,每个题目在难度上的微小差异累计起来便会影响信度。2、测验的长度:在一个测验中增加同质的题目,可以使信度提高。测验越长,测验的测题取样或内容取样越有代表性;测验越长,被试的猜测因素影响越小。3、测验的难度:如果一个测验对某团体而言太容易,会使所得分数都集中在高分端;当题目太困难时,得分就会集中在低分端。两种情况均会使信度样本的分数范围变窄,从而使测验变得不够可靠。4、测验的时间间隔:以再测法或复本法求信度,两次测验相隔时间越短,其信度系数越大;间隔时间越久,其它变因介入的可能性越大,受外界的影响越大,信度系数便越低。(二)百分位常模及解释 百分位常模包括百分等级和百分点、四分位数和十分位数。(1)百分等级:是应用最广的表示测验分数的方法。一个测验分数的百分等级是指在常模样本中低于这个分数的人的百分比。其计算分为:未分组资料的百分等级计算;分组资料的百分等级求法。(2)百分点:也称百分位数,与百分等级的计算方法正好相反,百分等级是计算低于某测验分数的人数百分比,而百分点则是计算处于某一百分比例的人对应的测验分数是多少。百分点的计算可根据直线内插法进行。在实际应用中,我们一般既可以由原始分数计算百分等级,又可以由百分等级确定原始分数。通过这样的双向方式编制的原始分数与百分等级对照表,就是百分位常模。3、标准分常模及解释标准分常模:标准分数是将原始分数与平均分数的距离以标准差为单位表示出来的量表。它的基本单位是标准差。(1)线性转换的标准分数:z分数为最典型的线性转换的标准分数。(2)与线性导出分数一样,常态化标准分数也可以被转化成任何方便的形式。当以50为平均数(即加上一个常数50),以10为标准差(乘以一个常数10)来表示时,通常叫做T分数。T分数:T=50+10zT分数这一概念最早由麦克尔于1939年提出,含有纪念推孟和桑代克二氏。标准九分:是另一较知名的标准分数系统,其量表是个9级的分数量表,它是以5为平均数,以2为标准差的一个分数量表。常态化的标准分数还有标准十分(平均数5,标准差1.5)标准二十分(平均数10,标准差3)(三)智商及其意义(1)比率智商:比内-西蒙量表传入美国后,斯坦福大学推孟教授于1916年对其修订而成斯坦福-比内量表。它在心理年龄的基础上,以智商表示测验结果,即以后所说的比率智商。比率智商提出后,普遍被心理学界和医学界所接受。但由于个体智力增长是一个由快到慢再到停止的过程,即心理年龄与实足年龄并不同步增长,所以比率智商并不适合于年龄较大的被试;另外,由于不同年龄组儿童的比率智商分布的情况是不一样的,因而相同的比率智商分数在不同年龄就具有不同意义。基于这种考虑,心理学家韦克斯乐提出了离差智商的概念。(2)离差智商:是一种以年龄组为样本计算而得的标准分数,为使其与传统的比率智商基本一致,韦克斯勒将离差智商的平均数定为100,标准差定为15.所以离差智商建立在统计学的基础之上,它表示的是个体智力在年龄组中所处的位置,因而是表示智力高低的一种理想的指标。由于离差智商的提出,过去曾使用比率智商的许多测验在后来也使用了离差智商,如在1960年修订的斯一比测验中,就使用的是平均数为100,标准差为16的标准分数量表。必须指出,从不同测验获得的离差智商只有当标准差相同或接近时才可以比较,标准差不同,其分数的意义便不同。5、百分位与标准分数的共同之处:将被试的分数在团体内做横向比较,而发展量表却是与不同发展水平的人做纵向比较。难度是指项目的难易程度。在能力测验中通常需要一个反映难度水平的指标,在非能力测验(人格测验)中,类似的指标是“通俗性”,即取自相同总体的样本中,能在答案方向上回答该题的人数。(名词解释)难度的指标:难度的指标通常以通过率表示,即以答对或通过该题的人数百分比来表示。(公式5-1)难度的计算二分法记分的项目:心理测验的项目大多为选择题,通过记1分,不通过记0分。当被试人数较多时,可根据测验总成绩将被试分为三组:分数最高的27%被试为高分组(),分数最低的27%被试为低分组()中间46%的被试为中间组。分别计算高分组和低分组的通过率,以两组通过率的平均值作为每一题的难度。由于选择题允许猜测,所以通过率可能因机遇作用而变大。备选答案的数目越少,机遇的作用越大,越不能真正反映测验的难度。为此,吉尔福特提出了一个P值校正公式。例题:假定某题有75%的被试通过,若该题有5个备选答案,则校正后的通过率为:(当有4个备选答案时,CP=0.67;有3个,CP=0.63;有2个,CP=0.54)非二分记分的项目:如果人为地明确通过每一题的分数线,也可以用公式5-2计算难度。但此种方法的缺点在于,采用不同的分数线会得到不同的难度值,因此不常用。难度水平的确定项目难度的确定:进行难度分析的主要目的是为了筛选项目,项目的难度多高合适,取决于测验的目的、性质以及项目的形式。为了使测验具有更大的区别力,应选择难度在0.50左右的试题比较合适。但是在实际各种中并得非如此简单。在选择题目时,最好使试题的平均难度接近0.50,而各题难度在0.500.20之间。当测验用于选拔或诊断时,应该比较多地选择难度值接近录取率的项目。对于选择题来说,P值一般应大于概率水平。测验难度的确定:测验的难度直接依赖于组成测验的项目的难度。通过考察测验分数的分布,可以对测验的难度做出直观检验。项目区分度的概念:也叫鉴别力,是指测验项目对被试的心理特性的区分能力。(名词解释)项目区分度的估计方法鉴别指数:首先分别计算高分组与低分组在该项目上的通过率,然后用高分组在该项目上的通过率减去低分组在该项目上的通过率。(公式5-7)项目鉴别指数与评价标准鉴别指数项目评价0.40以上很好0.30-0.39良好,修改后会更佳0.20-0.29尚可,但需修改0.19以下差,必须淘汰相关系数:点二列相关:适用于一类变量为二分称名变量,另一类变量为连续变量的成对变量的相关计算。二列相关:适用于两个连续变量,但其中一个变量被人为分成两类。相关:适用于两个变量均为二分称名变量。区分度与难度的关系(1)假如样本中通过某一项目的人数比率为1.00或0,说明高分组与低分组在通过率上不存在差异,因此D为0;假如项目的通过率为0.50,则可能是高分组的所有人都通过了,而低分组却无人通过,这样D的最大值可能达到1.00.(2)为了使整个测验项目的潜在区分度最大,似乎应该使每个项目的难度处于0.50水平,但事实并非如此简单。如果每一个项目的难度均处于0.50,由于项目难度相同,有可能大多趋向于有关的内容或技能,结果造成项目同质性提高。在极端情况下,有可能50%的被试全部通过各项目得满分,另外50%的被试全部为0分,形成U形分布,这样反而降低总分的区分能力。如果
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论