西方量表译本的评价和修订_第1页
西方量表译本的评价和修订_第2页
西方量表译本的评价和修订_第3页
西方量表译本的评价和修订_第4页
西方量表译本的评价和修订_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

西方量表译本的评价和修订引言将西方的心理量表译本匆促地用于中国的临床和科研是不适当的。对一个稳定、有效的西方量表进行准确无误的翻译并不必然保证它在中国也是稳定和有效的量表。在心理学和精神病学的跨文化研究中,经常将西方量表翻译后就在中国使用,包括生物心理测量或/社会心理测量的定式检查量表和自我评定量表,其中很多量表继而被应用于临床。但是,这样使用量表译本的研究,其结果往往并不可靠。原因在于中国国内并没有对量表译本进行充分的信、效度检验。为了减少量表的人种和文化偏性,提高它们在中国的临床使用价值,迫切需要用严格的科学方法对量表译本进行评价和修订。本文介绍笔者等在中国使用量表过程中所探索出的评价和修订量表译本的方法。第一步:了解、审定西方,表的发展、评价和使用情况西方国家使用过的量表中有很多质量不高,将这样的量表翻译后引进中国只会扩大其不适应性。在中国使用一个西方量表之前,首先要完全熟悉这一量表在西方的发展和应用情况,尽可能地查阅有关的所有文献,以便正确评价这一工具的质量,然后再决定有无必要进行大量的工作将此量表引进并使之适用于中国。量表必须基于可靠的科学理论。如果编制某一量表的理论本身就不清楚或具有高度的文化偏性,那么此量表多半不适合于中国使用。除此之外,还必须考虑量表编制的全过程,如:编制量表时的原始条目池(itempool)是否全面?确定量表条目时,选择条目的方法是否适当?用来建立常模的样本是否具有代表性?对量表的信、效度是否进行了严格的心理测t分析?如果有关文献没有满意地回答上述问题,那么,此量表还不能用于不同文化背景。Kirshner和Guyatt写了一篇很好的文章(尚未发表),强调区别三大类量表的重要性。(1)差别量表:旨在按照不同基本维度来区别不同的个体(如智力测验、人格测验);(2)预测量表:用来预测个体属于已定类别中某一类的量表(诊断试验、预测自杀行为的量表);(3)评定量表:用来评定某现象纵向变化程度的量表(如评定治疗反应)。由于其心理测童指标要求各有不同,一个量表不可能同时兼备上述三种量表的测定功能。因此,在选用某一西方量表前,应考虑此量表在西方的用途:即用于三种目的中的哪一种,并适用于什么人群?如果在中国使用的目的或计划中的病人对象与西方不同,最好还是选用别的量表或编制新的量表。第二步:量表的翻译和回译一经确定一个量表在西方确实行之有效,而且目的与对象和中国的研究相似,下一步就是翻译这个量表。如果研究的主要目的是比较西方国家和中国的同类病人,那么应力求量表译本与原版之间意思相同,这一要求可通过对量表的翻译和回译来达到(注释1)。如果研究的主要目的是提供一个能在中国临床使用的量表,那么翻译时用词就应力求按照中文的习惯用法,与原文难免有所出人。这样一来,在西方研究结果与中国使用的效度之间,就会出现矛盾。将西方量表进行修订使之适合中国文化的特殊性,可以提高量表在中国使用的效度,但其代价是与西方研究结果的可比性降低。完全不受文化制约的量表是不存在的。在量表被准确无误地翻译后,应该从以下几方面评价量表条目的“表面效度”。如:译本中的特定条目是否与准备测定的概念相关?译文意思是否清楚明确?如果是自评量表,译文的难易水平对填表对象是否适合?条目能否区别不同个体或回答会众口一词?如果翻译后的条目不符合上述标准,在对量表进行初试之前,应对条目进行适当修改。在不改变基本概念的前提下,使条目含义变得清楚、简单和适合文化要求,以便能起到区别不同个体的作用。第三步:对量表进行初试和必要的修订在进行正式研究之前,有必要先行初试并根据初试结果对量表加以修改。初试有助于发现哪些条目含义不清楚、不明确、太复杂或不具区别能力。在正式研究之前就应对这些不理想的条目加以修改。初试人数以20-30人为宜,其受教育程度和临床状况应与将来量表的应用对象相同。应观察受试者在填写量表(或回答定式询问)过程中如何反应,并要求他们解释各条目的含义。如受试者选择某个条目感到犹豫,应该间清犹豫的原因。确定自评量表中不清楚的条目,可行的方法是:在填完每一条目后,要求受试者完成以下步骤:(1)采用三分制来判断受试者对条目理解的难易程度(容易理解、中等、难于理解);(2)要受试者标记出条目中看不懂的词句;(3)如果几乎所有的受试者对某一条目回答的结果都一样,这个条目就肯定应该修改,因为不具备区别能力。西方量表的一种常见情况是在量表中设有肯定和否定问句两种形式的条目,目的在于避免受试者以千篇一律的方式作答,而不仔细思考每一个问题。在中国,对否定问句的否定意味着肯定这种语言表达方式不象英语那样常用,受试者经常误解和错答这些否定问句条目。因此,在翻译量表时,最好将否定句的条目改成肯定间句(尽管有可能引起回答方式千篇一律的弊病)。初试的另一个重要作用是评价量表的格式,对自评量表尤其重要。评价的内容包括:指导语是否清楚?在指导语中要不要举例说明?条目的回答方法是否清楚?条目是否易引起误解?是否有使受试者容易疏忽而漏填的条目?西方量表使用的格式在中国并不一定是最适当的格式,有时需要更详细的指导语和更简单明确的评定方法。为了确保不出现漏填,有的量表甚至需要改变整个格式(注释2)第四步:进行正式研究以评价量表的应用价值完成初试并作适当修改后,便可进行正式研究以确定量表在中国是否具有实用价值。此时,至关重要的是应该对量表的真正用途有明确的概念:是用于判别、预测还是评定?因为研究的设计、对量表性能的评价和修订在很大程度上取决于量表的不同目的。一个特定的量表可以有几种用途,但一次研究只能检验一种用途。”判别量表:差别量表的功用是描述一种基本状态或情况,并根据受试者的情况对不同受试者加以区别。因为没有可检验此类性能的外部标准和金标准(例如:人格、智力、家庭功能),所以量表的使用价值主要取决于量表的结构效度和信度。检验判别量表结构效度的方法之一,是看它能否对两组不同的人群作出判别,并且与其理论基础保持一致。例如,家庭功能量表应能区别违法少年家庭与非违法少年家庭。使新翻译的量表能被接受的最大成功机会(即最大限度地减少过早否定一量表的可能性),是用此量表去测定适合基本理论的尽可能多的不同人群,样本要够大,以避免B类误差(指事实上组间确有显著差异,但经统计学处理却未能发现)。确定样本大小的方法在统计学教科书中有详细介绍〔幻。如果一个量表对样本够大,量表打算测定的特征明显不同的两组人群不能作出判别,那么,此量表没有使用价值,应予放弃。反之则说明此量表具备判别能力。评价判别量表结构效度的方法之二,是与和量表理论有关的外部测量进行比较。如果两者的结果一致,就证实量表的结构效度。例如:一个评价整体健康的量表,在理论上应与过去一年中的患病天数有关,如果真正如此,亦支持量表的结构效度。与量表相关的外部测量越多,量表的结构效度就越好(注释3)一个合适的判别量表不仅应能判别不同的个体,而且在不同时间内应能作同样的判别,也就是说应具有稳定性。这方面的指标是测定重测信度的相关系数(依数据类型选用直线即Pearson相关或等级即Spearman相关)。重测的样本同样应能代表总体。重测的人数越多越好,一般说来,至少应有30人。重测间隔时间根据不同的量表而异,多数可间隔2至4周,有些量表应间隔一年或更久。如果是检查者使用的定式检查量表,还应评价评定者之间的信度,通常采用Kappa值作为指标〔3〕。预测量表预测量表的功用是在已有外部标准或金标准的前提下,将受试者归人不同的类别。常用的预测量表如诊断量表和预测治疗反应、疾病复发、自杀危险性的量表。预测量表就应该具备一些金标准所不具备的优点,如快速、花费少、危险性小、能早期使用等特点,否则就没有实用价值。预测量表与差别量表不同,其结构效度和内部一致性相对并不重要。量表的使用价值取决于信度和“校标效度”(criterionvalidity),即归类的准确性。如果量表的目的是预测混合人群中成员的现行类别(不论每个病人有无特定的诊断),就应该评价量有的“平行效度(concurrentvalidity)—校标效度的一种。具体方法是:用量表测定一个样本,样本成员的目标事件发生率应与量表实际应用时的人群相同,并由不知道量表结果的研究者盲性使用金标准评定同一样本。量表结果与金标准之间的符合率通常用Kappa值或组间相关系数(ICC)评定。如果量表的目的是预测未来事件(如自杀、疾病复发、治疗反应),就应该评价量表的预测效度—属校标效度的另一种。具体方法是:将量表用于一个对量表实际应用人群量具有代表性的样本,并追踪随访一段适当的时间,以观察被预测的事件是否发生。评价其准确能力通常也用Kappa和ICC值。如果量表结果与金标准之间的一致性显著高于机遇巧合,则表明量表具有满意的校标效度。但是,如果所用的样本很大,则Kappa值很小也会有统计学显著性差异。因此,慎重考虑Kappa值的大小和显著性水平是十分重要的。对Kappa值大小的要求意见不一,FliessU,提出:Kappa值大于0.75说明平行效度很好,远远超过机遇巧合,在0.40和0.75之间说明平行效度较好,小于0.40说明平行效度差。在设计评价预测量表的研究时,应该考虑以上因素:所预测的事件越少见,则越需要较大的样本,才能肯定是量表的预测能力超过机遇巧合。预测罕见事件(如一般人群中的自杀行为),样本数目一般达不到这种要求,解决的方法之一是将较多发生此类的事件的人群作为样本(如将重症抑郁病人作为研究预测自杀的样本),但这样一来研究结果的代表性只限于取样人数。一个经常发生的错误是采用临床样本来检验预测量表,并把只对临床样本具有高度敏感性和特异性的量表用作普通人群的筛选工具。然而,预测量表的临床使用价值主要取决于它的阳性预测值和阴性预测值(即指阳性或阴性测验结果是正确的可能性有多大),而不是取决于它的敏感性和特异性。这些预测值易受患病率的影响。例如当结局事件的发生率减少时,量表的阳性预测值明显下降。因此,一个用之于病人群预测结果好的量表并不一定在结局事件发生率很低的人群中有同样好的预测效果(注释4)预测量表的稳定性也是很重要的,不能因时间不同而将同一对象归人不同的类型。有价值的预测量表,其结果应该有显著而稳定的个体间差异,但与判别量表重测信度的评价指标不同,应采用校正机率统计(如Kappa值)而不能用直线相关或等级相关。量表重测的预计间隔时间因量表不同而异,如:有些诊断在几周或几月后有可能更改,这类量表的重测间隔时间应短。疾病复发或自杀的预测通常以年计,因而这类量表的重测间隔时间应适当延长。如果是评定者使用的定式问卷,则应该用Kappa或ICC评价评定者之间的信度。评定量表:评定量表的目的是测量某现象在不同时间内的变化程度。最常见的是设计成定量指标来评定在特定治疗下临床现象变化程度的量表。如汉密顿抑郁评定量表(HDRS)常用来评定抗抑郁药的疗效。评定量表的好坏取决于量表本身的纵向结构效度、信度和敏感性。在结构效度的评价方面,评定量表与判别量表不同。判别量表的结构效度通过同一时点的量表分与外部测量分之间的相关性来评价(也称为横断面结构效度)。而评定量表的结构效度则通过不同时点的量表分的变化与外部测量分的变化之间的相关性来评价(也称为纵向结构效度)。评价纵向结构效度应包括以下几方面:(1)采用够大的样本,在能够引起临床状况发生改变的特殊干预被使用前和使用后进行量表评定;(2)在特殊干预使用前和后,采用另一与量表理论相关的临床状况测量手段,(3)计算量表分前后之差与另一测量分前后之差两者间的直线相关或等级相关系数;(4)如果两者间有显著相关性则表明量表有较好的纵向结构产度。例如:HDRS的纵向结构效度可通过抗抑郁药治疗前后的HDRS评分的变化与大体评定量表分的变化两者的相关来评价。在临床状况稳定不变时,评定量表的个体内部变异应该很小,而在临床状况好转或恶化时,量表的个体内部变化则应该很大。因为评定量表目的不是区别不同的个体,因而不同个体间的差异并不重要。信度的相关系数和Kappa值不如配对测验那样有关。因此,评价评定量表的重测信度时,在重测间隔时间内个体的临床状况不发生变化。对前后两次量表的评分要用配对检验方法来分析(如Wilcoxon秩和检验或配对t检验),如果结果无显著性差异,则说明不同时间的个体内部量表分无明显变化,信度可靠。同理,如果是由评定者使用的定式检查量表,评定者间的信度也应该用配对检验来评价。评定量表还应该具备高度的“敏感性”,即当临床状况仅仅只有非常小的变化时,量表也可以反映出来。如果敏感性低,只能反映出很明显的临床状况变化,那么就需要很大的样本(甚至不可能达到)才能观察到量表分变化的显著性差异。评价量表的敏感性,可使用已知疗效的治疗措施,通过比较治疗前、后量表分的变化来看敏感性如何,一或通过用别的标准来证实病人的好转或恶化的情况,同时观察量表分变化的方向和程度。第五步:甚于初步研究结果对量表进行修订通过初步研究肯定了量表的信、效度后,下一步是利用研究结果对量表进行修订。目的是确定哪些条目不清楚、不稳定或不符合量表的效度。在效、信度的评价方面,三类量表有很大的差异,在如何确定不理想条目的方法面也是如此。多数翻译过来的量表,其条目在西方样本研究后,已根据研究结果作过筛选削减,如果进一步减少条目数量可能使量表对所测内容的综合性评定能力降低。因此,对量表译本中不好的条目来说,需要的往往是修改或替代而不是删除。如果对一个不好的条目有几种可能的修改,难以肯定哪一种最好,可以在下一次修订量表时,将几种可能的修改都纳人研究,分析修改后量表的效、信度时,相互比较,择优选人最后版本。如果定性研究表明量表译本的所测内容中未能包括本文化的重要方面,就应该扩充条目,包括进去。判别量表:判别量表的条目安排原则,是要求包括被测结构所有重要方面的条目,去掉那些降低结构测量精确度的条目。确定判别量表中的不好条目有几种方法,对下列类型的条目要考虑删除:受试者经常难以理解其含义的条目;对不同组别缺乏判别能力的条目;随时间不同而不能保持稳定的条目;与所属分量表评分相关性差的条目,分量表经因子分析(未经旋转),在初始因子矩阵中主要成分负荷值低的条目。条目筛选时,最理想的是使每一条目的外部效度、内部一致性和信度同时得到最大限度的增加,三方面都不满意的条目应该删除。常常有些条目在某一方面较好而在其他方面较差(如某条目对不同组别有很好的判别作用,但与所属分量表评分的相关性却较差),对这样的条目是否需要修改,取决于量表的外部效度、内部一致性或信度三方面哪一方面在当时处于重要地位。对条目的修改应根据条目的主要问题而定:含义不清楚的条目应改写清楚;对组间判别能力差的条目重在增加其判别能力;与所属分量表评分相关性差的条目应改进这方面的相关;不稳定的条目应重新拟写,使其描述的现象更加稳定和具体。预测量表预测量表的条目安排原则,是对目前或将来的一组人群进行正确和稳定的预侧。如果量表内同时包括几种范畴的内容(如诊断量表中含有几种诊断类别),那么,一个特定条目就应该能准确和稳定地预测该条目所代表的类别。因此,预测量表中的条目只强调校标效度和重测信度。根据单个条目的Kappa值可能确定哪些条目不符合要求。对不能正确确定受试者(按照金标准结果)的条目应该修改,以便能准确地区别符合与不符合金标准的人群。对因时而异的不稳定条目也应修改,以便使条目较好地显示出所测现象的客观性和长期稳定性。评定量表:评定量表的条目安排原则,是要求包含能灵敏地反映出临床干预效果变化的所有有关条目。评定量表的条目应具备下述特点:如果临床现象没有变化,对研究对象的评定结果也应该没有变化。而在临床观象有明显的改善或恶化时,对研究对象的评定结果也应该有很大的变化。对每一条目前后评分的配对检验可确定哪些条目需要修改或取代。对给予肯定有效治疗后而评分无明显变化的的条目,或者是评分有明显变化但并无相应的临床现象变化的条目都应该进行修改。评定量表的条目也应该具备敏感性,条目评分的变化应能反映出微小但很重要的临床状况变化。在条目的敏感性方面,具有等级程度(如:“从来没有”、“很少有”、“有时有”、“经常有”、“总是有”)选择的条目要优于只有两极(如:“有”、“无”)选择的条目。有时为了更好地达到评定目的,要将两级评定的量表转换成等级评量表。第六步:用已修订的量表测定另一组人群,量表再次评价并建立具有文化特异性的常模对修订后的量表,应该测定另一组研究对象,并再次评价,结果仍然不好的条目应该取代或修改。要获得一个满意的量表,往往需要多次的修订和再评价。在反复修改的过程中,所用样本对今后实用时的对象人群应具代表性。由于文化差异,一个量表经修订后,在内容和形式方面就会有很大的变化。因此,仍用西方的常模来区分“正常”与“异常”是不适当的。修订工作一旦完成,就应该采用一个很大且有代表性的样本来建立具有文化特异性的常模,并确定效度和信度指标。判别量表:判别量表的常模通常来自于普通人群。在全国不同地区按照年龄、性别、文化程度等比例收集一个大的、且有代表性的样本。如果是自评量表,样本则限制于受教育水平能完成量表填写的人群。因此,常模不适合于这一受教育水平以下的人(注释5)有几种方法可用来确定判别量表的结果属于“异常”:(1)量表分超过“常态”人的均值加减两个标准准差的人;(2)标准化“T”分高于或低于一个人为划界分的人;(3)量表分达到或超过临床患病样本的均值(或其它一些特定百分位数划界分)的人。第1、2种方法最为常用,但因仅机械地从概率的观点来确定异常,不考虑临床的实际情况而存在一些不足。第3种方法从临床角度来讲更为适当,但需要建立一个大的、有代表性的临床患病人群的常模。一旦修订量表定形后,要评价量表理论结构的独立性和同源性。常通过因素分析和内部一致性的评价来完成。内部一致性指标是衡量分量表的条目(如果量表仅仅是测量一个结构,则为整个量表的条目)与基本测定结构是否一致的准确程度。如果基本测定结构具同源性,且条目能特异性地代表此结构,量表的内部一致性就高。反之,如果基本测定结构具异源性,且条目不能特异性地代表此结构,量表的内部一致性就低。用于评价内部一致性的方法有多种,如:分量表中各条目间平均相关系数、Cronbach'salpha(信度系数),theta和omegas,等,这些方法都有赖于分量表中各条目间的平均相关程度。此外还有条目间相关矩阵,分量表的主要成份分析和因素分析方法(注释6)0其中以Cronbach'salpha最为常用。从理论上讲,Cronbach'salpha值应大于0.8,但对于多数研究来说,达到0.6就认为可取。从理论上讲,对一个有代表性的大样本的量表结果进行因素分析,分析结果应具备下列特征:(1)经主成份因素分析,得到的有统计学显著意义的因子数目应与量表的理论测量维度相符;(2)经旋转后,在某一因子中负荷高的条目应与此因子的内容有关;(3)各分量表(维度)在不经旋转的普通因子分析时,得到的第一因子的方差解释值应较大(应>40%)。不符合上述特征的量表可能有几个不同的理论测定结构,或者理论结构具异源性。采用一个与西方类似的中国样本,并与量表的西方因素分析结果进行比较,可以了解因子结构的文化差异。但是,对基于因素分析结果来解释文化差异应持慎重态度,因为不同的取样方法、方法学方面微小的人为因素均可以明显影响因素分析结果。因素分析和内部一致性虽可用于评价量表的结构效度,但对结构效度进行外部测量(即与有理论相关的其他测量方法进行比较)更为重要。预测量表:预测量表的常模样本应来自量表实际应用的人群,制定预测量表的常模需要两个常模样本或将一个大的常模样本分为两半。第一个样本用来获得能最大限度提高预测准确性的预测公式,第二个样本用来评价这一预测公式的效度。用获得预测指标的同一样本来确定量表的指标效度是不适当的。这样会出现量表效度很高但不真实的结果。因为量表的各条目具有不同的预测能力,因此可用第一个样本来计算逻辑斯蒂(logistic)或多元回归方程,以权衡各条目对结果的最佳预测能力。然后根据条目权衡的回归方程重新计算量表分,可得到一个划界分能很好地把存在和不存在指标事件(金标准)的个体区分开来(注释7)。此外,也可用回归方程将每一个体的量表分(或区间)转换成似然率—即结局事件发生的可能性(在一个有限可信区间内发生结局事件的可能性有多大)。对于有多个划界点的量表(如使用树枝状定向的诊断量表),应该确定每一划界点的最佳划界指标。完成上述步骤后,应将预测指标—各条目的权分和划界分用于第二个样本,用Kappa值来评价量表的校标效度(即特定的预测校标校度如何)。同一指标事件在预测指标上的跨文化差异.高度表明在预测金标准时,不同的文化因素是十分重要的。评定量表:因为评定量表是测定个体本身前后的差异而不是个体间的差异,所以凭量表评分不能认为正常或异常,评定量表的“常模”,是通过让一组病人接受肯定有效的标准治疗,并根据量表分变化的程度而制定的。常模样本是指对患有该特定疾患的所有病人具有代表性如(如病期、病情严重程度等)的一大组病人。“常模”是指肯定有效的标准治疗引起量表分变化的均值和标准差。“常模”制定后,可用“常模”来比较其它治疗方法所引起的量表分变化情况。对量表内容和标准治疗引起的量表分变化程度进行跨文化的比较,可以确定症状对治疗反应敏感性的跨文化差异。用于一种以上目的的量表:量表通常可用于一种以上的目的。判别量表和预测量表也可以用于测定不同时间的临床状况变化(与评定量表类似),反之亦然。关键是对不同类型的量表有不同的要求。因此,一个量表不可能对一种以上的目的都具备良好的测定能力。例如,判别量表要能够对不同个体进行明确的判别,但评定量表则要求能够确定个体本身微小的临床状况变化。两极回答方式最适合于判别量表,因为量表要尽可能明确地判别不同的个体。而等级选择回答方式最适合于评定量表,因为量表要尽可能反映出微小的、但非常重要的临床状况变化。对一个量表不能兼备多种良好的测定功能这一间题,没有简单的解决方法。在使用量表译本时,这一不足更为空出,其原因是西方国家在编制量表时,对条目原已作出限制。许多研究人员或者由于不知道这一不足,或者是由于试图编制一个能同时测定多种功能的量表,其结果是使量表缺乏精确性。笔者等认为,可行的最佳解决办法是一次针对一种目的对量表进行评价和修订。在量表被精制能够用于某种目的后,才能评价其它的目的和用途。但是,要使工具能用于第二种目的,增加其实用性,通常需要做进一步的修订,以使其具备测定两种目的、即两个量表的功能。笔者认为,分别测定两种特定功能的两个精确工具比一个测定多种功能的不精确工具要好。结论:使用翻译过来的量表,并不是从编制量表的第一步做起。因为编制一个量表首先要获得与测定现象有关的大条目池,然后从提高量表测定某功能的信、效度出发,对条目进行筛选削减或修订。量表译本中的条目来源于有关研究范畴的西方概念,并通过西方样本的研究加以筛选和削减的。如果在中国编制同一研究范畴的量表,原始条目则来源于可能与本文概念不同的中国概念,并通过中国样本研究后,将筛选得到的条目编制成量表,其条目肯定会与翻译过来的量表有明显的不同。因此,所有西方量表译本都可能存在人种偏差。一般说来犷西方量表译本与中国文化之间的差异性,自评量表和测量心理社会指标的量表比定式检查和测量心理生物指标的量表更为突出。例如:郑氏等人发现汉密顿抑郁评定量表(定式检查量表)中译本具有较好的信、效度,但Beck抑郁问卷(自评量表)中译本的信、效度则不理想。使用定式检查时,检查者可用本文化习惯用语给病人解释条目的含义这样就减少了人种偏差,而自评量表则难以做到这点。与测量心理生物指标的量表相比,测量心理社会指标的量表更有可能含有西方文化特异性的条目,因而文化差异性更大。将来,有可能采用证明有跨文化信、效度的定式检查量表做为“外部标准”,以便修订测量同一结构的自评量表。从理论上讲,每一文化应该从量表编制的第一步开始,编制适应于本文化的健康状况和心理社会方面的量表。但编制一个新量表需要众多研究者长时间齐心协力的工作,中国的研究者很少具备这些条件。目前,中国需要一致的临床和社会文化测量工具的迫切愿望已导致西方量表译本的广泛应用,这些量表译本的最后应用价值将有赖于严格的科学方法进行评价和修订。本文提出了将盈表译本用于中国的评价方法。在中国使用的量表译本(即判别、预测和评定量表)和盆表应用的目标人群首先要符合中国文化特点,然后采用对目标人群具有代表性的样本,对与量表类型有关的特定心理测量性质进行严格的评价。如果不符合本文化特点,则必须对量表进行文化方面的适当修订,随后重新评价。经过反复几次的修订和再评价,产生正式量表,然后制定正式量表的文化特异性常模并进行跨文化比较。注释:1.如果原版量表是英文的,则步骤如下:一个人将是表翻译成中文,另一人(尚未看过原版量表)将中译本回译成英文,并与原版量表比较。将中译本适当修改后,还需进行回译并与原版量表比较,有必要如此反复,直到回译本尽可能接近原版量表。当然,量表翻译的准确程度取决于译者的水平。2.初试也用于评价回答量表的难易程度。如果是自评量表,病人填写要花费多长时间(可能对复杂间题难以理解)?受教育低的人能否完成?如果是定式检查量表,检查时间多长?如果正式研究包括几个问卷和定式检查,完成所有量表需要多长时间?如果初试研究发现受试者时间太长不愿意完成量表或不能保持注意力,研究的设计则必须修改。3.因素分析和内部一致性测验是评价结构效度的方法,对判别量表译本尤为重要,因为对西方量表理论结构的广度通常存在疑问,在修订量表译本的最初阶段,由于样本小和量表中可能含有一些不适当要修改的条目,因子结构和内部,戒限噢不稳定的。比时应用这些分析方法可帮助修订量表,而不是对量表在中国的理论结构下肯定结论。只有在形成正式量表版本并用于大而有代表性的样本之后,才可以用这些方法来评价量表在中国的理论结构。4.要考虑所用金标准的质量或因同时使用量表和金标准而使结果混淆不清的可能性是非常重要的。所谓“金标准”指的是:大家公认是最客观的方法来决定某一现象(如:诊断)是否存在一套标准。在精神病学领域,因为缺乏能肯定疾

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论