调查问卷中多项选择题处理方法探讨.doc_第1页
调查问卷中多项选择题处理方法探讨.doc_第2页
调查问卷中多项选择题处理方法探讨.doc_第3页
调查问卷中多项选择题处理方法探讨.doc_第4页
调查问卷中多项选择题处理方法探讨.doc_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

调查问卷中多项选择题处理方法探讨Treatment Method Discussions Of Multiple-choice Questions In The Questionnaire湖南商学院信息系 (410205) 李灿内容摘要 在各类问卷调查中,多项选择题应用十分普遍,所以对多项选择题如何进行录入和分析就显得十分重要。本文将从实用的角度举例分析对多项选择题答案如何进行数据编码和变量设置,并说明如何使用SPSS统计软件的多重应答处理方法,并对其分析方法加以深入剖析。Abstract: In all kinds of questionnaire investigations, it is very general that multiple-choice questions are used, so how to input and analyze that seems very important to multiple-choice questions. This text analyzes how to set up digital codings and variables for example in terms of practicality, explains how to use multiple response method with SPSS software, and analyzes its analytical method thoroughly . 关键词 多项选择题;多重应答处理过程;多重二分法;多重分类法Keywords: Multiple-choice questions,Multiple Response,Multiple dichotomy method,Multiple category method在各类问卷调查中,多项选择题(或复选题)应用十分普遍。多项选择题的备选项较多,可以多重选择,被调查者的回答结果种类千差万别,这就给调查数据的处理带来了一定难度。在SPSS统计软件中有多重应答处理过程(Multiple Response),即多项选择题处理过程,但有关专著对多项选择题数据文件的建立与分析方法论述得较少或不够实用。本文将从实用的角度举例分析多项选择题答案如何进行数据编码和变量设置,并说明如何使用SPSS统计软件的多重应答处理方法,并对其分析方法加以深入剖析。一、 多项选择题的特点所谓多项选择题,就是指对同一个问题可能有多个候选答案,受访者可以选择其中的若干个,也可以全选或不选,属于多元响应变量资料。本文以在某次婚恋观念调查的两个问卷项目为例来进行介绍: 项目1、您的性别:1-男 2-女 项目2、您想选择哪些择偶标准(任选三项)1-相貌 2-文化水平 3-气质风度 4-志同道合 5-人品 6-家庭收入 7-其他项目2是一个典型的多项选择题,受访者可以选择其中的一项或多项答案。很显然,几个选项反映的是同一个问题的不同侧面。二、 多项选择题的数据编码和变量设置对于多项选择题,根据选择项目的多少和分析目的,一般可以采取以下5种数据编码和变量设置的方法:1、问题只设置1个字符变量。如对项目2只设置1个字符变量a,宽度为7。如某人择偶条件选择了相貌、气质风度和人品,可在变量a中输入字符1010100。如果选择项较多,这种方法不但增加了输入的工作量,而且分析也不方便。2、将几种答案常出现的组合列出来,如项目2只有选择文化水平、志同道合和人品,相貌、文化水平和家庭收入等。只设置1个数值变量,用1、2、3等分别表示各种组合。这种方法虽然可减少数据输入时的工作量,但在输入前要重新对多选答案编码,也不便于用SPSS统计软件灵活作各种统计分析。3、将该问题只设置1个字符变量,但字符变量的宽度和字符变量值的输入方法与上述第1种方法不同。对上述项目2择偶条件选择,可设置一个字符变量。如某人择偶条件同时选择文化水平、志同道合和人品,则可输入字符变量值:245。字符变量值的宽度不一定和多选项的数目一致。如上述择偶条件选择,当调查对象中最多只会同时选择五项,则字符变量值的宽度设置为5。用这种方法建数据文件,可减少输入数据的工作量和差错。如多选题的选择项超过10,可用英文字母表示10以后的选择项。在数据输入完毕后,为了符合不同研究目的和统计方法的要求,可用SPSS for Windows统计软件中的数据转换(Compute)过程和子串选择函数(SUBSTR),将字符串变量中的每个变量值拆开,即每个答案设置一个变量,变量值为0和1。这种数据转换在SPSS统计软件中容易实现。但是此种方法可以用第4方法直接代替,所以本文不作详细介绍。4、多重二分法(multiple dichotomy method),对于多项选择题的每一个选项看作一个变量来定义。0代表没有被选中,1代表被选中。这样,多项选择题中有几个选项,就会变成几个单选变量,这些单选变量的选项都有两个,就是选中和未选,即0或1。如项目2有7个多选项,可将7个选项分别设置1个变量,即该问题分解为7个变量,每个变量设置变量值0和1。0表示“无”,1表示“有”。如上述某人择偶条件,可设置数值变量:a1、a2、a3a7(见表1)。若某人择偶条件同时选择文化水平、志同道合和人品,可在变量a2、a4和a5中分别输入1,a1、 a3、a 6和a7中输入0;也可在变量a1、 a3、a 6和a7中不输入任何数值,当缺失值处理。数据全部输入完毕后,通过变量转换,将缺失值转换为0。如果选择项较多,而被调查者最多只选择其中少数几项时(如项目2),这种方法就有点烦琐,输入数据时容易出错。表1 多项二分法编码表变量名变量标签编码方案a1相貌0-不选 1-选a2文化水平0-不选 1-选a3气质风度0-不选 1-选a4志同道合0-不选 1-选a5人品0-不选 1-选a6家庭收入0-不选 1-选a7其他0-不选 1-选5、多重分类法(multiple category method),多项选择题中有几个选项,就定义几个单选变量。每个变量的选项都一样,都和多项选择题的选项相同。每个变量代表被调查者的一次选择,即记录的是被选中的选项的代码。由于被调查者可能不会全部都选,在数据录入时,一般从这些变量的靠左边的变量开始录入,右边的变量自然就是缺失值。当被调查者对多项选择题中的选项全部选择时,这些变量中都有一个选项代码,此时没有缺失值。如项目2您想选择哪些择偶条件(任选三项),有3个多选项,可将3个选项分别设置3个变量,即该问题分解为3个变量b1、b2、b3,每个变量设置变量值1、2、3、4、5、6和7(见表2)。若某人择偶条件同时选择文化水平、志同道合和人品,可在变量b1输入2、b2中分别输入4, b3中输入5。表2 多重分类法编码表变量名变量标签编码方案b1第一选项1-相貌 2-文化水平 3-气质风度 4-志同道合 5-人品6-家庭收入 7-其他b2第二选项1-相貌 2-文化水平 3-气质风度 4-志同道合 5-人品6-家庭收入 7-其他b3第三选项1-相貌 2-文化水平 3-气质风度 4-志同道合 5-人品6-家庭收入 7-其他以上介绍的几种方法,第4和第5种方法是SPSS统计软件中对多项选择题的标准记录方式。三、多项选择题的数据处理分析过程在SPSS统计软件的多重应答处理过程Multiple Response子菜单包括三个过程,分别是Define Sets,Frequencies和Crosstabs过程。如图1所示。图1 Multiple Response子菜单1、 Define Sets过程,用于多项选择题的定义,它的主对话框如图2所示。图2 Define Sets主对话框其中Set Definition框中列出文件所有的数值型变量,其中的根据多项选择题选项定义的变量,用于多项选择题变量集。其中Variables in Set框是选入需要加入同一个多项选择题变量集的变量系列,这些变量必须为多分类,并按照相同的方式来编码。项目2把Set Definition框中的a1、a2、a3a7放入Variables in Set框。其中Variables Are Coded As单选框组是选择变量集中的变量的编码方式。有两种方式可以选择,分别是dichotomies(多重二分法编码方式)和categories(多重分类法编码方式)。要根据预定义时使用的方法,选择相应的编码方式。若选择dichotomies方式,某个数值表示选中时,相应的数值在右侧框中输入。若选择categories方式,则需要设定取值范围,在该范围内的记录值纳入分析。一般的取值范围是该多项选择题选项的最大和最小代码。项目2应用的是dichotomies(多重二分法编码方式),所以在它右侧框中输入1。其中Name框是输入多项选择题变量集的名称,项目2用的是ZOBZ。其中Lable框是多项选择题变量集定以一个名称标签,项目2用的是择偶标准。其中Mult Response Sets框是已定义好的多项选择题变量集列表,可定义多个,它左侧的三个按钮Add、Change和Remove,分别用于添加、修改和移出变量集的定义。本例项目2单击Add钮,Mult Response Sets框就出现变量集$ZOBZ。最后单击Close按钮,相应的多项选择题变量集就定义完成了。在SPSS统计软件中的多重应答处理过程(Multiple Response),最多可以定义20个多项选择题变量集。2、 Freqencies过程,Multiple Response菜单里的Freqencies过程比较简单,为多项选择题生成频数表,它的主对话框如图3所示。把多项选择题变量集择偶标图3 Freqencies过程主对话框准($ZOBZ)从左边的Mult Response Sets框移入右边的Table for框,其他默认,单击OK钮,多项选择题的频数表就生成了。如表3所示。在本次调查中,对170名受访者的调查结果为:在择偶标准中,居于前三位的分别为:a5(人品)被选率最高29.4%,其次是a3(气质风度)为20.2%,再次是a4(志同道合)为18.0%。表3 多项选择题的频数表$zobz FrequenciesResponsesPercent of CasesNPercent择偶标准a1-相貌499.6%28.8%a2-文化水平6713.1%39.4%a3-气质风度10320.2%60.6%a4-志同道合9218.0%54.1%a5-人品15029.4%88.2%a6-家庭收入407.8%23.5%a7-其他102.0%5.9%Total511100.0%300.6%a Dichotomy group tabulated at value 1. 0 missing cases 170 valid cases 3、 Crosstabs过程,是多重反应列联表分析(Multiple ResponseCrosstabs),可以产生多重交叉列联表,而且可以对单元格进行很细致的分析,它的主对话框如图4所示。其中Mult Response Sets框,显示已经定义好得多项选择题变量集。下方的Define Ranges钮,用于为相应的变量设置取值范围。本例把变量集$ZOBZ放入Colums框,把变量sex放入Rows框,并对性别要定义变量值的范围,单击Define Ranges钮, 定义最小值和定义最大值。对于Option子对话框,本例选择Colums框,把变量sex放入Rows框,并对性别要定义变量值的范围,单击Define图4 Multiple ResponseCrosstabs对话框Ranges钮, 定义最小值为1,定义最大值为2。对于Option子对话框,本例选择了Cell Percengtage(百分比)的Row, Percengtage Based on选择的是Case, 一般选择其默认状况即可。最后单击OK钮,便得到多项选择题的交叉列联表(见表4)。虽然在频数分析中的择偶标准为a5(人品)被选率最高为29.4%,其次是a3(气质风度)为20.2%,再次是a4(志同道合)为18.0%。但是从交叉列联表中却可以看出不同性别的择偶标准差异:在被调查的58名男性中,a5(人品)被选率最高为84.5%(49/58),其次是a3(气质风度)为60.3%(35/58),再次是a1(相貌)为58.6%(34/58)。在被调查的112名女性中,a5(人品)被选率最高为90.2%(101/112),其次是a3(气质风度)为60.7%(68/112),再次是a4(志同道合)为52.7%(59/112)。可以看出,在择偶标准中,男性注重的是人品、气质风度和相貌,女性并不太注重相貌,女性注重的是人品、气质风度和志同道合。表4 多项选择题的交叉列联表sex*$zobz Crosstabulation $ZOBZSEX择偶标准Totala1-相貌a2-文化水平a3-气质风度a4-志同道合a5-人品a6-家庭收入a7-其他性别男Count34163533492558% within sex58.6%27.6%60.3%56.9%84.5%3.4%8.6%女Count15516859101385112% within sex13.4%45.5%60.7%52.7%90.2%33.9%4.5%TotalCount4967103921504010170Percents and totals based on respondents170 valid cases; 0 missing cases四、多项选择题的处理过程讨论 通过以上分析,对于多项选择题的分析目标基本可以达到,但是有些调查不仅要研究多项选择题的组合,还要研究答案的排列情况。如本例中的择偶标准,允许选择3个答案,而且要求被调查者按主次顺序选出答案,如521,即人品最重要,其次是文化水平,再次是相貌。针对此种情况,多项选择题的数据编码和变量设置只能采取第5种方法,即多重分类法(multiple category method),分析结果同样可以有多项选择题的频数表和多项选择题的交叉列联表。但是若想得到每个选项的交叉列联表,有两种方法:一是进入AnalyzeMultiple ResponseCrosstabs(如图4),此时需要把变量sex放入Rows框,把变量b1、b2、b3(b1是择偶标准中最重要的、其次是b2、再次是b3)放入Colums框,单击OK钮即可;二是可以进入AnalyzeDescripitive StatisticsCrosstabs,把变量sex放入Rows框,把变量b1、b2、b3放入Colums框,单击Define Ranges钮, 定义最小值为1,定义最大值为7。单击OK钮即可。对于Option子对话框,本例选择了Cell Percengtage(百分比)的Row, Percengtage Based on选择的是Case。本例把性别与择偶标准按重要性排列由高到低排列的交叉列联表如下:(见表5、表6、表7),从表中可看出不同性别择偶标准的不同。择偶标准按重要性排列由高到低排列的交叉列联表 表5 sex*b1 Crosstabulation $ZOBZSEX择偶标准Totala1-相貌a2-文化水平a3-气质风度a4-志同道合a5-人品a6-家庭收入性别男Count104141218058 % within sex17.2%6.9%24.1%20.7%31.0%.0%女Count38717752112 % within sex2.7%7

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论