SPSS-问卷的数据处理_第1页
SPSS-问卷的数据处理_第2页
SPSS-问卷的数据处理_第3页
SPSS-问卷的数据处理_第4页
SPSS-问卷的数据处理_第5页
已阅读5页,还剩53页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

StatisticalProgramforSocialSciencesSPSSforWindows第一讲SPSS简介及数据编码录入1简介SPSS是StatisticalProgramforSocialSciences的简称,即社会科学统计程序,由美国SPSS公司1970年代推出,迄今已有近30年的历史。是国际著名三大社会科学统计软件包之一〔SAS、SPSS、Statis〕。2进入SPSS之前的准备工作2-1-1数据资料的形式:矩阵式数据数据要求每一横行为一个个案〔Case〕,纵列按变量排列,形成矩阵格式。2-1数据资料的形式及编码编码录入2-1-2编码的概念:根据一定的规那么将研究资料转换为可进行统计分析的数码资料的过程。问题025:您认为打工的外地人对北京市的社会秩序是否有影响?〔单项选择〕1□有很大影响2□有较大影响3□没有影响4□不好说4编码答案2-1-3编码的步骤:1)确定变量;变量:用来反映文意概念的量化形式。在统计中往往指最小的分析单位。编码就是对变量进行编码。变量由两个局部构成:变量名和变量值。要注意区分何为变量,何为变量值。在调查问卷中还要注意区分问题和变量。问题009:您有几个儿子?几个女儿?1□儿子_______人2□女儿________人23问题变量1变量2变量1的值变量2的值2〕制作编码表直接过录0-1编码变量名:一个数据文件中,一个变量只能有一个唯一名称。码位:某一变量在数据文件中占据的栏位码数:某一变量由几位数组成。该变量是数值型〔Numeric〕——如定距、定比,还是字串型〔String〕,如定类、定序。前者在统计中可以做高级运算,后者那么不可以。不适于被访人答复的问题的编码。一般采用7,97,997等。被访人答复不知道时的编码。一般采用8,98,998等。被访人拒绝答复某变量时的编码。一般采用9,99,999等。问卷中出现漏答时的处理编码。一般采用9,99,999等。231000113〕编码:根据编码表对问卷进行编码,而后将编码结果记录在问卷上或编码纸上。2-2数据录入外部式录入内部式录入采用DOS、WPS、CCED等软件,按ASCII码方式录入成文本文件〔*.dat;*.txt〕。这种录入方式的特点是,数据之间没有间隔,录完一个数码后自动后移,录入速度较快。缺点是容易错位。采用SPSS数据编辑器〔SPSSDataEditor〕录入。其优点是不容易错位,缺点是不能自动后移,录入速度慢,数据错误不容易修改。一、按照问卷处理的步骤进行描述

1、数据输入

1〕数据编码在进行问卷调查之后,首先要对问卷资料进行整理,包括对调查所得的各种原始资料进行审查、检验和分类汇总。在完成了资料的根本整理以后,就要开始对资料进行编码。所谓资料的编码就是使用一个规定的数字或字符代表一个种类答复。对资料进行编码,可以使众多的资料简化为一连串数字,使这些资料能输入并存储在计算机中,便于进一步分析研究。例如,我们正在进行一项消费者对某种商品评价的调查,要求被调查者答复以下问题:①消费者的性别。②消费者的职业。③消费者的年龄。④消费者对此商品综合评价分数〔0~10〕。编码说明书如下:编码的含义为:①用数字1代表男性;2代表女性。②根据分析的需要,将消费者的职业分为工人、农民、军人、机关干部、学生、公司职员、教师和其他8大类,并分别用数字1~8代表。③根据分析的需要,将消费者的年龄分为18岁以下、19~30岁、31~45岁、46岁以上四组,并分别用数字1~4代表。④根据分析需要,用数字1~10分别代表消费者对商品评价的。举一个具体例子:消费者甲,男性,职业是农民,年龄为36岁,对商品评价为10分。其编码为10203010。在资料编码中,应把握好以下问题:①正确掌握分类的尺度,防止过细导致过于复杂,或者过粗造成资料信息流失。②为保证每一类答复都有类可归,又防止分类过细,可设置一个“其他”的分类。③每一个问题中的分类应含义明确,防止与其他分类产生交叉。④对错误或疏漏的答复可作为特殊的分类,并指定一个特殊的数字或字符代表,如用0或-1等,而不应将其归入其他类中。但是在多项选择题中就要注意到,不同的题型使用不同的方法进行分析的时候,编码也会有所不同,用二分法进行编码时和用分类法进行编码时就会有所不同,根据对一个题目的拆分内容不同编码也不同,具体的说明在数据录入局部会说明。2〕数据录入编码结束以后,就要把数据录入到电脑中,但是在此之前还需要对变量进行定义。这些在SPSS中都可以在DataView中完成,包括对变量名、变量类型、变量标签、指标签、缺失值和变量尺度等变量的属性进行规定,规定好以后就可以输入问卷数据了。需要特别注意的是字符型变量的录入。字符型变量仍然可以转化为数字录入,但是必须在DataView中对本变量的Value进行规定,用0表示男,1表示女。定义好之后在录入的时候就不必输男或女,只需要输入1或0就可以了。在具体处理各种类型问题的数据录入的时候,情况要区分为单项选择题、多项选择题和开放题型三种情况。①单项选择题:单项选择题情况比较简单,只需要将各题的选项数字录入到所对应的题目序号位置就可以了。但是要注意的是,输入的时候按照一行一份问卷〔即一行一个个案〕,一列一个问题〔即一列一个变量〕进行录入。②多项选择题:多项选择题比单项选择题要复杂,通常的处理方法有如下两种:二分法和分类法。当一个多项选择题没有规定要选多少个选项的时候,对多项选择题的录入采用二分法。二分法要求按照选项来把问题拆开,有几个选项就拆为几个变量,然后每个变量再分别赋值,选择了那么赋值为1,不选那么赋值为0。比方下面的题目,4、〔代表题号〕选择您喜欢的颜色_____〔可以多项选择〕。红色、橙色、黄色、绿色、蓝色、其他。根据二分法,就可以处理成这样:选择您喜欢的颜色?4.1红色:1=有选,0=没选4.2橙色:1=有选,0=没选4.3黄色:1=有选,0=没选4.4缘色:1=有选,0=没选4.5蓝色:1=有选,0=没选4.6其他:1=有选,0=没选这样对这道题进行拆分之后,就可以像处理单项选择题一样来处理多项选择题了。当一个多项选择题规定要了选择的工程数时,就采用分类法。它是多项选择题中要求要选择几个选项,就定义几个单项选择变量。每个变量的选项都和多项选择题的选项相同。每个变量代表被调查者的一次选择,即记录的是被选中的选项的代码。比方,有一道多项选择题〔设为题1〕,请选出三个最喜欢的洗涤剂品牌,1汰渍,2碧浪,3立白,4雕牌,5其他。这时那么设置三个单项选择变量,1.1、1.2、1.3,如果被调查者选择的是汰渍,雕牌和其他,那么变量值1.1取值为1,1.2取值为4,1.3取值为5。不过此时要注意,在对数据进行分析的时候,一定要把这几个变量打包在一个集里,SPSS才能识别这是对多项选择题的处理。关于多项选择题的分析,将在最后一局部的实例中进行详细说明。

量表分析

在社会调查研究中,常常涉及到需要测量一些比较抽象的量,例如“经济地位”、“传统价值观”、“现代化成都”、“生活态度”、“兴趣爱好”等等。这样就需要围绕有关的研究目的或主题设计合理的问卷,那么根据设计出的问题〔这里主要是指量表的设计〕得到的问卷结果数值是否可靠、准确?这就涉及到问卷信度和效度的分析问题,而在SPSS中,可以很方便地进行这一方面的分析。因此,在进行问卷调查前,应先对问卷进行信度和效度的分析。经验上,如果克朗巴哈系数大于0.9,那么认为量表的内在信度很高,如果克朗巴哈系数大于0.8,那么认为是克接受的,如果系数大于0.7,那么认为量表的设计存在一定的问题,但仍有一定的参考价值;如果克朗巴哈系数小于0.7,那么认为量表设计存在很大问题应考虑重新设计。用SPSS进行信度分析时注意的问题:由于综合评价量表中通常包含假设干个子方面,因此,信度分析应针对各个方面主格进行,不可直接对整个量表进行分析。如果某特征下设的多个评估工程并非全部同向,存在反向计分题时,应对它们进行反向处理后再进行信度分析。对于事先设计好的量表进行预测试,就可以用得到的数据在SPSS中进行信度分析,选择菜单项Analyze下的Scale,ReliabilityAnalysis,把参与信度分析的表量选择好,并且选择信度系数和要输出的统计量,就可以对量表进行信度分析了。在进行了信度和效度分析之后,还可以进行问卷的难易度和鉴别度进行分析,这些主要是在进行一些试卷研究的分析中采用的。如果在问卷中有一个题目是以量表的形式出现的,那么分析问卷中的此题可以用因子分析来进行,如现要对远程学习者对教育技术资源的了解和使用情况进行了解,设计一个李克特量表,远程学习者对于教育技术资源的了解和使用。将该量表发放给20人答复,可以得到回收后的原始数据,然后就可以用SPSS进行因子分析的操作,具体操作步骤如下:①录入数据②因子分析〔1〕选择“AnalyzeDataReductionFactor…”命令,将变量“A1”到“A10”选入“Variables”框中〔2〕设置描述性统计量〔3〕设置对因子的抽取选项,即选择因子模型的估计方法,在此题目中选择主成分法

〔4〕设置因子转轴,即选择因子载荷矩阵的旋转方法,在此题目中选择方差最大旋转法

〔5〕设置因子分数,即计算因子得分,并且使用回归法来求因子得分

〔6〕设置因子分析的选项③结果分析当SPSS把结果输出时,就可以对结果进行分析了!

〔1〕KMO及Bartlett’检验

〔2〕对共同度的分析,即公共因子对原始变量的方差奉献〔3〕陡坡图,SPSS中显示出来的图示可以较为直观得保存的因子数目,即当从第几个因素以后,坡线甚为平坦,因而以保存几个因素较为适宜。〔4〕整体解释的变异数——未转轴前的数据〔5〕未转轴的因素矩阵〔6〕转轴后的因素矩阵,旋转后的载荷矩阵就可以明显地看出各个因子了,在此题目分析总A1、A8、A6、A5、A4为因子一,A10、A9、A7为因子二,A3、A2为因子三。题项在其所属的因素层面顺序是按照因素负荷量的上下排列。

〔7〕因素转换矩阵④结果说明

根据因素的特征值和旋转后的因素矩阵,采用了主成份分析法抽取出3个因素作为共同因素,并使用因素转轴方法中的Varimax最大旋转法,转轴后去掉了因素负荷量小于0.1的的系数,按照从大到小的顺序进行排列,使得变量与因素的关系豁然明了。并且可以分析得到,称第一个因子为电脑网络资源因子,第二个因子为互动交流资源因子,第三个因子为录音资源因子。四、问卷分析实例下面对一份问卷进行具体的分析,来表达SPSS在问卷处理中的作用。问卷见下:小学生与电视传播调查问卷[1]一、姓名:二、性别:1、男2、女三、年级:四、年龄

[1]本问卷选自《调查研究中的统计分析法》一书五、在学校和班里是否担任职务?1、少先队干部2、班干部3、课代表4、学习小组长5、其他〔请具体列出〕六、你是否曾经获得荣誉称号?1、区、市级三好学生2、校级三好学生3、区、市级优秀少先队员4、校级优秀少先队员5、班里的学习积极分子6、其他〔请具体列出〕7、未曾获得荣誉称号七、你是否曾在各种比赛中获奖?1、在教学竞赛中获奖2、在英语竞赛中获奖3、在作文竞赛中获奖4、在体育竞赛中获奖〔包括田径、球类、棋类、航模类〕5、在文艺竞赛中获奖〔包括唱歌、舞蹈、戏剧、朗诵、演讲〕6、在摄影竞赛中获奖7、在知识、智力竞赛中获奖8、在书法、绘画、工艺竞赛中获奖9、其他〔请具体列出〕10、未曾获得任何奖八、爸爸的职业〔只选一项〕1、国家干部2、工程技术人员3、社会科学工作者4、医务工作者5、教育工作者6、新闻工作者7、文艺工作者8、体育工作者9、工人〔司机、技术工人等〕10、农民11、解放军12、效劳员13、个体经营者14、司法工作者〔法官、警察〕15、宗教工作者16、合资企业管理人员积案17、其他〔请具体列出九、爸爸的文化程度〔只选一项〕1、大专以上2、高中或中专3、初中4、小学5、不识字或初识字十、妈妈的职业1、国家干部2、工程技术人员3、社会科学工作者4、医务工作者5、教育工作者6、新闻工作者7、文艺工作者8、体育工作者9、工人10、农民11、解放军12、效劳员13、个体经营者14、司法工作者〔法官、警察〕15、宗教工作者16、合资企业管理人员积案17、家庭妇女18、其他〔请具体列出〕十一、妈妈的文化程度:1、大专以上2、高中或中专3、初中4、小学5、不识字或初识字十二、你将来最想从事的职业〔只选一项〕1、国家干部2、工程技术人员3、社会科学工作者4、医务工作者5、教育工作者6、新闻工作者7、文艺工作者8、体育工作者9、工人10、农民11、解放军12、效劳员13、个体经营者14、司法工作者〔法官、警察〕15、宗教工作者16、合资企业管理人员积案17、家庭妇女18、其他〔请具体列出〕十三、你对“将来最想从事的职业”的选择主要受到哪些方面的影响?1、父母的影响2、电视节目的影响3、播送的影响4、报纸和其他书籍的影响5、同学的影响6、老师的影响7、其他影响〔请写明是什么影响〕十四、你认为自己应该有哪些品质和性格?〔最多项选择5项〕勇敢2、幽默3、守纪律4、富有同情心5、乐于请教人6、机制认真8、有礼貌9、听话10、勤奋11、虚心12、坚忍13、敏捷14、独立15、稳健十五、你认为自己最不应该具有以下那些品质和性格?〔最多项选择5项〕胆小2、愚蠢3、不守信用4、迟钝5、懒惰6、猜疑7、欺弱怕强8、没有礼貌9、娇气10、贪心11、依赖性强、12怕动脑筋13、怕困难14、妒忌15、粗心十五、你认为自己最不应该具有以下那些品质和性格?〔最多项选择5项〕胆小2、愚蠢3、不守信用4、迟钝5、懒惰6、猜疑7、欺弱怕强8、没有礼貌9、娇气10、贪心11、依赖性强、12怕动脑筋13、怕困难14、妒忌15、粗心十六、从以下三组人物中每组选出三名〔共九名〕你最佩服的人第一组1、包玉刚2、贝多芬3、机器猫4、冰心5、诺贝尔6、左罗7、李时珍8、斯巴达克9、枣花〔《篱笆、女人和狗》中角色〕10、秦始皇11、张秉贵12、撒切尔夫人13、斯勃克〔《星际旅行》中主角〕14、罗岗〔《渴望》中角色〕15、项羽第二组16、秀兰·邓波尔17、电脑娃娃爸爸18、蔡国庆19、牛顿20、詹天佑21、希曼〔《希曼》中主角〕22、拿破仑23、赵一曼24、纪璇〔《含羞草》中角色〕25、一休26、张思德27、洪秀全28、佩雷斯·德奎利亚尔29、布莱克〔《豪门恩怨》中的石油大亨〕30、苗苗老师〔《老师亲亲我》中主角〕第三组31、马拉多纳32、尹琼〔《豆蔻年华》中女科学家〕33、鞠萍姐姐34、居里夫人35、陈景润36、巴顿将军37、黑猫警长38、张学良39、宋大成40、王进喜41、王安〔美国电脑大王〕42、济公43、周颖〔《公关小姐》中人物〕44、彭德怀45、科克〔《星际旅行》中的船长〕十七、从以下实物中选出你现在最想得到的东西〔可选12种〕第一组1、棉衣2、手表3、摩托车4、漂亮衣裳5、白球鞋6、广告中经常宣传的食品7、一般的运动服8、属于自己的房间9、名牌运动鞋第二组10、书包11、台灯12、打字机13、钢笔14、多功能笔盒15、笔记本16、属于自己的书桌17、计算机或中华学习机18、单放机〔挂在身上的收录机〕第三组19、电子游戏机20、滑冰鞋21、跳绳22、乒乓球拍23、变形金刚24、口琴25、电子琴26、钢琴27、照相机第四组28、《中国少年报》29、电视机30、31、录像机32、一份有助于学习的杂志33、自己喜爱的图书34、收音机35、组合音响36、各种漂亮贺卡37、其他十八、为什么你想得到在十七题中自己选择的实物?〔请在空格中填上你所选择的实物编号,每空可填一项或多项〕1、受电视广告的影响2、受老师影响3、受同学影响4、受家长影响5、受其他广告影响6、受电视节目中的任务影响7、没受任何外界影响,只是自己想要8、其他影响十九、你看电视吗?〔只选一项〕1、不看A家里没电视B自己不想看C家长不让看2、偶尔看〔每星期二天以下〕3、经常看〔每星期三天以上五天以下〕4、天天看二十、你平常喜欢看哪个电视台?请你按喜欢的程度排一个顺序,顺序号码请在各个电视台名称前的空格里。〔〕中央电视台〔二频道〕〔〕中央电视台二台〔八频道〕〔〕中央电视台三台〔十五频道〕〔〕北京电视台一台〔六频道〕〔〕北京电视台二台〔二十一频道〕二十一、你喜欢看哪一类少年儿童节目〔最多项选择五项〕1、外国动画片2、国产动画片3、儿童电视剧4、少儿商品广告讲故事6、少儿歌舞节目7、《学二胡》《学拼音》《少儿英语讲座》等教学节目8、《学学做做》等培养技能节目9、知识竞赛类节目10、木偶剧11、少儿社会活动节目12、儿童电影13、其他二十二、你喝不喝酒?1、喝2、不喝二十三、如果你喝酒,主要受哪方面的影响?〔选三项,请按主次程度排出顺序,不喝酒的不用填〕父母2、兄弟姐妹3、同学4、影响5、电视片6、电视广告7、报纸广告8、街头广告9、风俗习惯10、文学作品〔诗歌等〕二十四、你看了电视上的酒广告后,当时有什么想法?〔选一种〕1、很想立即尝尝这种酒2、无所谓3、希望长大后尝尝这种酒4、反感5、很反感二十五、请列出这学期你期中考试的各科成绩〔如果学校没举行其中考试,请列出上学期期末的各科成绩〕1、语文2、数学3、外语4、政治〔道德品质〕5、自然6、体育7、音乐8、美术〔一〕多项选择题的处理1、二分法设第十三题的编码为Q13,这道题就可以拆分为Q13.1,Q13.2,Q13.3,Q13.4,Q13.5,Q13.6,Q13.7这7个变量,每一个变量的取值为1或0,选择了那么赋值为1,没有选择那么赋值为0。比方一位受访者选择了父母、报纸和其他书籍以及老师的影响,那么这七个变量的取值分别为1、0、0、1、0、1、0。编码录入数据之后,就可以对这些数据像单向选择题一样进行分析了,例如频数分析。2、分类法设第二十三题的编码为Q23,这道题就可以拆分为Q23.1,Q23.2,Q23.3,每个答案的赋值分别为其对应的选项号数,假设有受访者选了父母、同学和电视广告,那么Q23.1取值为1,Q23.2取值为3,Q23.3取值为6。到最后做处理的时候再将这三道题打包在

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论