评定量表的编制与标准化评定量表的特征_第1页
评定量表的编制与标准化评定量表的特征_第2页
评定量表的编制与标准化评定量表的特征_第3页
评定量表的编制与标准化评定量表的特征_第4页
评定量表的编制与标准化评定量表的特征_第5页
已阅读5页,还剩9页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、评定量表的编制与标准化评定量表的特征评定量表的主要编制方法评定量表的编制方法因量表的种类和编制者的不同而有所差异。按心理测量学原理,主要有下面四种方法:1推理法早期的评定量表编制者,尤其是早期人格自陈量表的编制者,常用此方法。编制此类量表时,首先要确定所评的内容(某种心理特质或行为)和理论依据,然后推论出能测评这些内容的题目,这些题目组合便构成一评定量表。该方法重视理论根据,但量表的项目却是出自编制者个人的经验推论。量表的项目表面上反映了所评定的内容,实际上可能并不一定测量这些内容,即量表的表面效度并不能保证其真正效度。2.实证法推理法依赖内容效度,而实证法却依据实证效度,即以量表项目与校标间

2、的关系来编写项目。实证法编制量表一般分三个步骤:第一步是挑选一个由具有所评定特质或特征的人组成的校标组以及普通人组成的对照组。例如,我们要评定癌症病人的行为特征,显然癌症病人就是校标组,而对照组则可为良性肿瘤病人。第二步要确定哪些行为特征可以区分癌症病人和良性肿瘤病人,可以通过以下途径获取这方面资料:查阅有关文献及病历档案等;对癌症病人行为进行研究分析;请有经验者列出一些能够反映癌症病人行为特征的陈述语;参考其他测验或评定癌症病人的量表。根据这方面的材料,就可以编写和选择量表项目。第三步是将编好的项目施评于校标组和对照组,将能区分两组人群的项目保留,这些保留下来的项目组合即成为量表。采用实证法

3、编制的量表有较好的实证效度,如果只评定特定的校标人群,结果是合理的。但如用于与校标人群稍微不同的个体,如不同性质癌症或不同病期癌症病人,其结果解释则有其局限性,即结果解释受原始校标的影响。3.同质法所谓同质就是指量表具有较高的一致性,更具体地讲,就是同一量表的所有项目之间具有较高的相关。采用同质法编制量表就是要把量表中没有相关的项目删除,以保证量表各不相同的项目都能测量相同的品质(以心理现象为例,如心理特质或行为特征等)。同质量表的编制按下列步骤进行: (1)对标准样本某一人群施评大量的项目。 (2)采用因素分析或其他相关分析,把项目归为若干同质性类别,将与各类别相关很低的项目,或者各类别都有

4、较高相关的项目删除。(3)对各类别项目的内容进行分析、重新排列、并命名、便得到若干个同质量表(分量表或因子),这些同质量表合起来就是一个完整的评定量表。同质法编制的量表虽有较好的结构效度,但有时难以保证实证效度。4.综合法事实上,现在评定量表编制者大都不是采用某一种方法,而是多种方法的综合。常常采用推理法编写大批项目,用实证法和同质法对这些项目进行筛选和编排。如果量表的目的主要用于预测或作实际决定,项目的筛选则偏重实证法;如果主要用于理论研究,则偏重同质法。这样编制出来的量表既具有理论依据又有实用价值。具体编制一个评定量表时,不管采用哪种方法,都需大量的心理统计技术,这里暂不作介绍,请读者参阅

5、有关心理测量专著。标准化评定量表的特征一个评定量表采用上述的编制方法完成后,只是完成了部分工作,即量表的行为样本标准化工作。这样的量表还需进行一系列标准化过程,量表的编制才算正式完成。编制后的量表能否投人使用,其品质如何,主要根据其标准化特征和程度来衡量。1取样(sampling)心理卫生评定量表就是对所观察的个体心理卫生各个侧面(心理的、社会的、环境的因素)进行评价,评价则需一定的标准(或称标尺),这个标准产生于样本。按传统的测验学理论,对测验或评定的解释是以被测或被评者的所属群体为标准,但在编制测验或量表时无法测量这个群体中所有成员,便只能取样,即以样本代表全体。样本必须有代表性,否则这个

6、测量或量表的信度和效度便不高,结果解释不准,可见取样代表性的意义。如何提高取样的代表性,不仅是要有足够的样本量,同时要能反映能影响所测或所评的品质(以心理为例,如智力、人格、行为等)的所有有关变量(按前例,有年龄、性别、民族、生活地区等等)。取样方法分多种,如随机、整群和分层比例取样等。不管用何方式,都要使样本有足够代表性。应根据群体各变量的分布特点来决定取样方式,若诸变量在群体中分布均匀,随机样本有代表性;在群体中若某一整群所含诸变量能代表全体,则比整群可做样本,上述变量分布均匀和某一整群有足够的代表性一般不多得,那么按分层比例取样是可取的。以取样人群代表全体,再按全体中各变量的人数比例来分

7、配各层人数。因此,在选择测量工具时必须注意编制此工具的样本代表性和所要评估的对象情况是否在样本内。受评者的情况在这些方面与标准样本相应,所测结果与标准样本才有可比性。在临床上,某些评定量表,项目数少,功能单一,仅用于某些特殊人群,或者是自身前后对照研究,虽无标准化样本,但仍具实用性,只不过是使用范围限局限而已。2.常模(norm)常模是一种供比较的标准量数,由标准化样本测试结果计算而来,其形式大致有如下几种: (1)均数是常模的普通形式,一般临床量表大都采用这种形式。某一受评者所得成绩(粗分,或称原原始分)与标准化样本的平均数相比较时,才能确定其成绩的高低。 (2)标准分均数所说明的间题还是有

8、限的。只看均数,不注意分散情况,所得受评者的信息非常有限。如用标准分作常模,便可提供更多的信息。标准分能说明受试者的评定成绩在标准化样本的成绩分布图上居何位置。标准分(Z)=受试者成绩(X)与样本均数(X)之差(即X-X)除以样本成绩标准差(SD)。简化成Z= (X-X)/SD。这样一来,不仅说明受评者的成绩与样本比较在其上或在其下,而且还说明相差几个标准差。许多评定量表采用这种常模或由此衍化出来的其他形式,离差智商就是一种。其计算公式为:离差智商=100+15(X-X)SD。尽管是韦氏智力量表最早采用此形式,但后来有些评定量表结果表达也采用机同形式,只不过意义不同。例如:美国的Vinelan

9、d适应行为量表的适应行为总分(adaptive behavior composite)和我国的儿童适应行为评定量表的适应能力商数(ADQ)就是采用离差智商这种形式。此处与标准分不同之处在于:前者均数为100,而后者均数为0,X-又时在离差智商为100,在标准分为0;此处的离差智商规定标准差为15。T分也是标准分衍化来的一种形式,在评定量表中较常采用,例如MMPI便采用此种常模。T分计算公式:T=50+10(X-X)SD。由标准分衍化而来的其他形式还有标准20,标准10及标准9,都是通过改变均数及标准差值而得。 (3)百分位(Percentile rank,PR)这是另一类常用常模,比标准分应用

10、得早,且更通用。它的优点是不需要统计学的概念便可理解。习惯上将成绩差的排列在下,好的在上,计算出样本分数的各百分位范围。将受试者的成绩与常模相比较,如相当百分位50 (P50),说明此受试者的成绩相当标准化样本的第50位。也就是说,样本中有50的人数,其成绩在他之下,另有50人数的成绩比他要好。又如在P25,说明样本中25的成绩在他之下(或至多和他一样),另有75人数的成绩比他要好。以此类推。均数、标准分及百分位常模之间的关系见图示。 (4)划界分(cut-off score)在评定量表中,特别是某些用于特殊人群的临床量表,由于其样本常常不是正态分布,不具备制定标准分常模的条件,而多采用划界分

11、常模。筛查用量表中也常用此种常模。划界分是指用一具体量数,对评定结果进行划界。如“流调用抑郁量表”(CES-D )采用划界分标准为:总分(15分为无抑郁症状,16-19分为可能有抑郁症状,)20分肯定有抑郁症状。如果某量表对所测查的疾病很敏感,就说明设立的划界分很有效。病人被划人假阴性的人数就很少甚至没有,正常人被划为假阳性的也很少或没有。如果不敏感,则假阳性或假阴性的机会均会增加。除上述常模形式外,还有其他性质的常模,例如年龄常模(按年龄分组建立,在儿童和老年人量表常用)、区域常模和各种疾病诊断常模,等等。从可比性看,常模越特异越有效;从适应性讲,则以通用常模使用方便。3.信度(reliab

12、ility)信度是指测验或量表的可靠性和稳定性的程度,用信度系数(coefficient)来表示,一般说,系数越大,说明一致性高,测得的分数可靠;反之则相反。不同种类的评定量表其信度要求有所不同,一般客观的自陈量表要求较高,而评定异常行为的主观评定量表一般都不太高。信度的高低也与所采用的信度检验方法有关。信度可以从不同方面来说明量表功能的稳定性、不同时间的稳定性、不同评定者的结果稳定性,等等。它们的相应检验方法为: (1)重测信度(test-retest reliabilty)同一组受评者在两次不同时间作同一套量表评定,对两次结果作相关性检验,以估计量表结果的稳定性。 (2)分半信度(spli

13、t-half reliability)将一套量表的各项目按奇、偶数号分成两半,对其评定结果进行相关性检验。由于分半信度检验最好要求量表项目按难度排列,而大多数评定量表均非如此,故其使用有限。 (3)同质性信度(inter-item consistency)所谓同质性信度是指评定量表内部所有项目间的一致性,这里讲的是分数的一致,而不是项目内容或形式的一致。量表内各项目分数相关越高,则量表项目就越同质。最常用的检验同质性信度方法为库德一理查逊公式(KuderRichardson formula 20,K-R20),但K-R20公式只适用于二分法计分题量表,而对多重记分法量表则常用克伦巴赫系数(Cr

14、onbach s S Coefficicient)估计。另外,分半相关法也是估计同质性信度的一种方法。图 正态分布标准分与百分位的关系 (4)评定者信度(inter-rater reliability)数名不同评定者采用同一套量表对相同受评者进行评定,对所得结果进行一致性检验,以估计评定量表评分客观性。对心理测验而言,一般都采用客观性项目,且有一套相当标准化的评分程序,因此由评分引起的误差变异是可以忽略的。而评定量表相当多的是主观项目,且评定者在评分时或多或少掺杂主观判断成分,故评定者之间的评分误差变异难以避免。一般要求在成对的受过训练的评定者之间平均相关系数达到0. 9以上,才认为评分是客观

15、的。其它尚有正复本相关、因素信度、测量标准误等信度检验方法,此处从略。4.效度(validity)所谓效度即有效性,指一个测量工具能够测查出其所要测量的东西的程度,这包括两个意思:一是测查了什么特性,二是测查到何种程度。如一个抑郁评定量表,若评定结果所表明确是受评者的抑郁特性,而且评准了抑郁的严重程度,那么这一抑郁量表的效度就好;反之则不好。评定量表的效度检验方法与心理测验一样,分为三类,即内容效度(Content-related validation )、实证效度(Criterion-related validation )和结构效度(Construct-related validation

16、)。 (1)内容效度指量表项目反映所测量内容的程度。如生活事件评定量表应反映受评者各种日常情景下的精神应激的程度。内容效度通常无理想评估指标,主要通过专家对量表内容的评价和编制量表时严格按预定的定义、行为取样的范畴进行项目筛选来保证。 (2)实证效度也称校标效度,是指一个量表对处于特定情境中的个体的行为进行预测的有效性,也就是对于我们所感兴趣的行为能够预测的程度。例如,用人格自陈量表预测哪种人易患精神疾病。检验实证效度一般是将量表评定结果与某一标准行为(即校标)进行相关检查。如抑郁量表与抑郁症病人的临床典型症状、诊断性量表与临床诊断进行相关分析均属之。如果二者相关程度(或一致性程度)高,则说明

17、实证效度理想;反之则相反。评定量表在心理卫生评估中常常是作为预测个体或群体的健康状态,或者确定影响健康的各种因素,因此这类量表实证效度意义要大于结构效度。 (3)结构效度反映编制的量表所依据理论的程度。如编制一个心理防御机制量表,必定依据有关的心理防御机制理论。同时,所编制的量表是否符合原来预计的理论框架,也可用结构效度来检验。量表的效度研究,不管是在量表编制过程中,还是编制之后都要持续地进行,并且是一项长期的、永无止境的工作。量表的效度材料越丰富,对量表的功能认识就越全面。5.方法的标准化评定量表必须按一定的规则实施,其记分方法和方式、分级的标准、结果的换算也要按一定的规定进行,只有这样,评

18、定结果才具有较高的真实性。因此方法是否标准,在评定量表中具有重要意义,这些方法在后面内容中将详细说明。上述的评定量表的标准化特征,并不是每个量表都要象标准化测验那样应全部具备,有的量表可能多一些,标准化程度要高一些,如标准的客观人格自陈量表;有的可能少些,标准化程度就不那么好,但有一定的标准化比没有要好,其得到的结果也可靠些。至于每个具体量表做了哪些标准化工作,如常模样本、施测方法、信度和效度资料,都应尽可能详细地在量表使用手册上说明。评定量表的基本内容每个具体的评定量表编制后,经过一定的标准化过程,便算完成。不同种类和功能量表,具体内容相差甚远。但从总体而言,包括的基本内容大致相同。1.评定

19、量表的名称量表的名称可以仅指量表的种类,如紧张性生活事件评定量表(SLERS)、症状自评量表(SCL-90);也可以是既表明种类又包括量表的编制者或编制的单位(或单位所在地名),如汉密顿抑郁量表(HAMD)、流行病学研究中心抑郁量表(CES-D)、康奈尔健康量表(CMD等。在研究或临床报告中,首先要写明所使用的量表名称。2.评定量表的项目内容评定量表由若干项目组成,每一个项目或是一种行为或现象的简单名词,或是描述一种心理特质、行为、症状、现象的陈述句。关于项目的编制原则,前面已有详述,但在心理卫生评估中使用的评定量表,其项目内容还应具备以下要求: (1)项目描述应尽量简明,用语准确精练;每一个用词描述一个特别意思,避免使用另外词语表达相同意思;要尽可能少用一般性词语,“平均”、“很好”或“很差”等。 (2)项目的内容,应该能反映所评定内容的特征,但也要有一些非特征的内容,尤其是像评定症状的这类量表,既要包括特异性症状项目,又要有些非特异性症状项目。如果某一量表,其项目只涉及了非常特异但十分罕见的症状,那么便不能很好地评定多数病人的病情。3.评定量表的项目定

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论