多选题与排序题的SPSS处理.doc_第1页
多选题与排序题的SPSS处理.doc_第2页
多选题与排序题的SPSS处理.doc_第3页
多选题与排序题的SPSS处理.doc_第4页
多选题与排序题的SPSS处理.doc_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

多选题和排序题的SPSS处理在问卷设计中,常见的题型包括单选题、多选题、排序题和问答题。其中单选题是最常见的题型,实践中可通过频数统计, 箱型图及各种高级统计方法对其进行分析,流行的统计软件SPSS 中也包含多个用于处理单选题的模块。问答题作为主观题,通常不进行编码和统计分析,只作为定性研究来处理。多选题和排序题是两种常见的题型,多选题的优势是它可以广泛的搜集被访者的态度信息,探索不同人群的态度组合,为进一步编制或修订量表提供依据。排序题可以同时测查被访者对多个选项的态度倾向。SPSS 中虽然有处理多选题的模块“Multiple Response”,但是其功能相对简单,只能对多选题进行一般的频数统计和列联表分析。有些学者对多选题的数据编码提出了改进方法,提高了数据录入转换的效率, 但是对多选题如何进行分析处理研究得不够深入。以下内容将讨论多选题和排序题的分类,以及如何在SPSS 中实现它们的编码和分析过程。一、多选题的处理方法多选题可分为不定项多选题和定项多选题,它们有不同的编码和处理方式。1.不定项多选题这是最常见的多选题方式, 即一道题目有多个选项,每个选项都可以勾选或者不选。例1:你在选购电子产品时,会考虑以下哪些因素:A 价格 B 性能 C 质量 D 保修 E 外观 F 品牌编码:对于这种题型,通常的采用“0-1”编码进行处理, 即为每个选项单独设立一个变量, 本例可设定a1_1,a1_2 到a1_6 共6 个变量,它们代表从A、B 到F共6个备选选项。如果被试的选择为ABD,则在a1_1,a1_2 和a1_4中输入1,其他变量输入0。其他学者也提出了用某些函数或编程方法快速实现数据的录入,但最终都要转换为“0-1”编码的形式。分析:完成编码后,使用SPSS 中的AnalyseMultipleResponse 命令, 再通过Define Sets 来将多个选项合并定义为一个多选题,如例1 中可将6 个变量共同定义为$a1。然后选择AnalyseMultiple ResponseFrequencies可对多选题进行频数统计, 选择AnalyseMultiple ResponseCrosstables 可进行交叉列联表分析。2.定项多择题与不定多选择题相比,唯一区别是固定了要选出的答案个数。例2:你认为在选购电子产品时,最重要的3 个影响因素是什么?1(A) 2(B) 3(D)A 价格 B 性能 C 质量 D 保修 E 外观 F 品牌编码:将题目中的3 个括号定义为3 个变量,如a2n1,a2n2 和a2n3,他们代表最终选出的3 个答案。6 个备选项也要重新编码,如1、2、3、4、5、6 分别代表A、B、C、D、E、F。如果被试的选择为ABD,则在a2n1, a2n2 和a2n3分别输入1、2 和4。图1 显示的是7 个被试答题后的编码情况。图1 定项多选题案例数据分析:完成编码后,使用SPSS 中的AnalyseMultipleResponse 命令, 再通过Define Sets 将a2n1,a2n2 和a2n3 共同定义为$a2,在编码方式(Variable are coded as)中选择分类编码(Categories), 类别从1 到5。然后选择AnalyseMultiple ResponseFrequencies 可对多选题进行频数统计。结果如图2 所示:图2 定项多选题案例处理结果小结:例1 所用的处理方法,其思路是先定选项,后记次数;例2 的处理方法,其思路是先定次序,后填选项。前者是多选题通用的处理方式,包括不定项多选题、定项多选题,甚至一些不常用的限定条件的多选题(如规定答案不能超过3项)等;后者是针对定项选择题的一种特殊的分析方法,具有简便高效的特点,但是通常不适用于其他题型。二、排序题的处理方法1.排序题要求将若干选项按照一定的标准依次排列,可测查被试群体的态度倾向例3: 下列是选购电子产品时需要考虑的若干因素,请按照重要性对他们进行排序。A 价格 B 性能 C 质量 D 保修 E 外观 F 品牌() () () () () ()编码:将题目中的6 个选项定义为6 个变量, 如a3_1,a3_2 到a3_6, 它们代表从A、B 到F 共6 个备选选项。如果某个被试在题中括号内填写的结果为“3,5,1,2,4,6”,即他认为从重要到不重要的次序是:质量、外观、价格、性能、保修、品牌。那么在编码处理时,应将3、5、1、2、4、6 依次填入a3_1,a3_2 到a3_6 的6 个变量中。首先根据各个次序的重要性(权重)对数据进行二次编码,例如次序1、2、3、4、5、6 的重要性依次是10、7、5、2、1,0, 则选择SPSS 中的TransformRecode into SameVariables 命令,将所有变量选入Variables 对话框,点击Ole and New values,将1 填入旧数值,将10 填入新数值,表示排名第一的选项具有10 个单位的重要性, 准备对“1-10” 这一组编码的转换。然后单击Add 健继续对余下的“2-7”、“3-5”、“4-2”、“5-1”、“6-0”五组编码进行输入,单击ContinueOk 可一并完成各组的转换过程。图3 排序题案例数据经过二次编码后,选择DateTranspose 命令,对全部数据进行行列转换。再选择TransformComputeVariables 命令,定义新变量Sum=sum(Var001 to Var007),即可求出各个备选选项的重要性排序。结果如图4 所示:图4 排序题计算结果结果显示:各选项的重要性排序为:BACDEF。2.选择排序题这种题型结合了多选题和排序题的优点, 先从若干备选选项中提取出若干个最重要的选项, 然后再进行排序。与多选题相比,在答案中增加了顺序信息,因此内容更丰富。例4:你认为在选购电子产品时,最重要的3 个影响因素是什么? 请选出并按重要性对它们进行排序:A 价格B 性能C 质量D 保修E 外观F 品牌第1 位(C) 第2 位(D) 第3 位(A)编码:与例3 的方式很相似,但由于未被选择的题项无法参加排序,因此对它们要进行一些处理。将题目中的6 个选项定义为6 个变量,如a4_1,a4_2 到a4_6,它们代表从A、B 到F 共6 个备选选项。如果某个被试的排序的结果为C、D、A,即依次选出的最重要3 个因素是:质量、保修、价格。那么在编码处理时,应将3、0、1、2、0、0 依次填入a3_1,a3_2 到a3_6 的6 个变量中。也就是说:对于被选中并排序的选项,在它对应的变量里面填它的次序;对于未被选中的选项,在它对应的变量里面填0。实际上, 本例中答案选择的结果可表示为另一种更直观的形式,它类似于例3 的样子。例4:你认为在选购电子产品时,最重要的3 个影响因素是什么? 请选出并按重要性对它们进行排序:A 价格B 性能C 质量D 保修E 外观F 品牌() ( ) () () ( ) ( )分析:方法与例3 相同,只是未被选中的选项将不参与二次编码,因为在排序重要性计算中,它们的权重为0。排序题和选择排序题分析思路基本相同: 先定选项,后定次序,最后通过编码将次序转化为权重。在社会调查问卷设计过程中,经常会遇到对相似状况或者原因的排序问题,而这方面问题的处理相对困难也一直是这类题型不能广泛运用的重要原因。但是,毋庸置疑,这类题型的应用无论对相似社会现象的分析,还是对原因的分析,抑或对市场调查中的满意度研究分析都非常重要。一、问题的提出 假定消费者在购买电视的时候,经常会考虑很多因素,比如:价格、质量、品牌、样式、颜色、型号、功能等,假如有90%的消费者对“价格”敏感,50%的消费者要考虑质量,我们会不会得出这样的结论:消费者在购买彩电的过程中,价格因素重于质量因素呢?不一定,因为我们并不知道人们“先”考虑什么,也不知道人们在价格和质量之间考虑的权重大小,更无法将所有因素对比在同一个平面维度上,因为有几个因素,就说明人们在考虑同一个问题的时候有多少维空间。就象在对比顺位的题型中,假定消费者甲认为价格比质量重要,品牌比价格重要,我们不能直接运用形式逻辑的规则得出:品牌比质量重要一样。因为每两个因素的对比都是在一个独立的语义空间下的,跨语义空间的对比在社会生活中没有绝对的含义,只有相对的含义,这就是为什么形式逻辑的推理在社会生活中不能随便运用的原因。 从理论上讲,排序题就是将不同语义空间下的概念放置于一个对比空间中进行的分析。有些学者认为对各个因素分别进行重要性的评价,就可以将人们考虑问题的顺序排列出来。我认为这种思路是错误的。比如我们设计的题型是: 例1:如下购买彩电的因素,您认为它们的重要程度是: 很重要 比较重要 一般 不太重要 不重要 价格 1 2 3 4 5 质量 1 2 3 4 5 品牌 1 2 3 4 5 样式 1 2 3 4 5 颜色 1 2 3 4 5 型号 1 2 3 4 5 功能 1 2 3 4 5 在这种设计的基础上得到的数据,不能直接进行顺序排列,因为这是在七个语义空间下进行的,概念之间的对比没有任何实际意义,同一个人可以将几个概念同时列为“很重要”,我们不能断定其对比意义,用平均人的概念对整体答案取均值更无法产生顺序。因为由部分(个人)可以推及总体(整体),但是产生的整体却无法再还原为部分的时候增加内容(顺序)。顺序只是在同一语境下才能产生出来。不能用整体指标的扩展来推断部分的意义顺序,即不能用没有个体顺序意义的问题结果来推断个体的行为顺序。也就是说,假定上述问题调查结果的均值分别为: 价格1.2、质量1.3、品牌1.25、样式3.1、颜色2.9、型号1.57、功能1.6。 我们不能得到人们在购买彩电时考虑的因素的顺序是:价格、品牌、质量、型号、功能、颜色、样式。如果这样就会得到错误的结论。二、顺序问题的设计 在“关于问卷的题型设计”一文中,笔者总结了六种与顺序有关的题型,在实际应用过程中,“排序题”和“重要程度顺位排序”两种题型最重要,也对顺序问题最有效。还是应用上面的例子,排序题的设计是: 例2:如下因素,在购买彩电时,您认为: (1)价格(2)质量(3)品牌(4)样式(5)颜色(6)型号(7)功能 A最重要的因素是: ( ) B第二重要的因素是:( ) C第三重要的因素是:( ) 应用重要程度顺位排序方法进行的设计是: 例3:如下因素,在购买彩电时,您认为: (1)价格(2)质量(3)品牌(4)样式(5)颜色(6)型号(7)功能 A最重要的因素是: ( ) B比较重要的因素是:( )( )(限选两项) C不太重要的因素是:( )( )(限选两项) D最不重要的因素是:( ) 这两种设计在方法上都是在个体同一个语义空间下收集的资料,在对个体调查的过程中,让个体考虑了顺序的问题,因此得到的资料在整体化(统计分析)后,可以推断个体考虑的总顺序,具有“整体”还原“部分”行为顺序的性质。三、顺序问题的分析方法 有关顺序问题的分析方法在原理上非常简单,就是采用加权的方法进行分析,对于排序题,权重已经基本达成共识,就是对最重要的因素取“3”作为权重,第二重要的取“2”作为权重,第三重要的取“1”作为权重。如上例,假定人们认为价格最重要的比例为25%,认为第二重要的为20%,认为第三重要的为10%,那么价格因素的重要程度及顺序指数为: (25%*3+20%*2+10%*1)/(3+2+1) 这个顺序指数的取值范围在三项排序中介于0-0.5之间,五项排序介于0-0.33之间。 由于人们在分析问题时不习惯于对0-0.5之间的数值进行分析,同时又由于在此类顺序问题中不可能将同一个答案同时放在多个顺序中(对于一个被访者来将,不能将价格同时放在第一、第二、第三重要三个变量或者两个变量上),所以可以用最大权重值作为分母,这就使得顺序指数介于0-1之间了。所以,笔者推荐这种加权方式。如上例,价格因素的顺序指数就可以变为: (25%*3+20%*2+10%*1)/3 对于重要程度顺位排序题的处理,由于这种题型一直以来受到技术分析困难的困扰,所以没有一个对权重的共识。经过多年对此类问题处理的经验,我认为对最重要的因素取“2”,对比较重要的因素取“1”,对不太重要的因素取“-1”,对最不重要的因素取“-2”,这个权重系列简单、明确。还是如上例,假定人们认为价格最重要的比例为25%,认为比较重要的为20%,认为不太重要的为10%,最不重要的为5%,那么价格因素的重要程度及顺序指数为: 25%*2+20%*1-10%*2-5%*1 这个顺序指数的取值范围由于不存在分母,所以这个指数的取值范围介于“-2”-“2”之间,以“0”为中间值。四、顺序问题分析的困难和在SPSS等统计软件下的处理方法 顺序问题的分析在原理上很简单,但是由于无论排序题,还是重要程度顺位填空题都是依据最后计算出来的比例再进行加工处理的,一般情况下在原始数据文件中都不能计算,所以在实际应用过程中,有些人只能计算总体的顺序,而不可能计算各种人群的顺序,比如:不同年龄的、不同性别、不同职业、不同收入的顺序等。更有一些人只依据最重要的因素进行交互分析,从而损失了许多信息。 通过两年的研究,找到了一种在统计软件的原始数据状态进行直接处理的方法,其主要思想就是通过多重数据转换来生成新变量。 这种转换的方法首先就是要理解“0”、“1”编码的性质,如果变量是通过“0”、“1”编码进行的录入,那么这个变量的均值乘以100就是人们选择“1”答案的比例。 同时我们还要理解,一个变量值只有“2”和“0”两个答案时,其均值等于2乘以同样排列“0”“1”变量的均值,同理,“3”“0”、“4”“0”、“5”“0”变量等都具有同样性质。 所以,在对顺序问题进行转换时,首先要将变量转换成“0”“1”变量。如“例2”的设计,假定10个样本的答案分别是: V1 V2 V3(原始变量名) 2 5 1(原始答案数值) 3 4 7(原始答案数值) 2 6 5(原始答案数值) 7 6 2(原始答案数值) 5 2 3(原始答案数值) 1 3 5(原始答案数值) 3 4 5(原始答案数值) 1 6 4(原始答案数值) 5 1 6(原始答案数值) 6 5 7(原始答案数值) 第一步:用RECODE命令将上述答案转换成“0”“1”变量,即: recode v1 v2 v3 (1=1) (else=0) into v101 v102 v103. 由价格因素而转换成的三变量,分别代表价格第一重要,第二重要,第三重要的“0”“1”变量; recode v1 v2 v3 (2=1) (else=0) into v201 v202 v203. 由质量因素而转换成的三变量,分别代表质量第一重要,第二重要,第三重要的“0”“1”变量; recode v1 v2 v3 (3=1) (else=0) into v301 v302 v303. 由品牌因素而转换成的三变量,分别代表品牌第一重要,第二重要,第三重要的“0”“1”变量; recode v1 v2 v3 (4=1) (else=0) into v401 v402 v403. 由样式因素而转换成的三变量,分别代表样式第一重要,第二重要,第三重要的“0”“1”变量; recode v1 v2 v3 (5=1) (else=0) into v501 v502 v503. 由颜色因素而转换成的三变量,分别代表颜色第一重要,第二重要,第三重要的“0”“1”变量; recode v1 v2 v3 (6=1) (else=0) into

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论