数据输入过程详解_第1页
数据输入过程详解_第2页
数据输入过程详解_第3页
数据输入过程详解_第4页
数据输入过程详解_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

心理学

实证类毕业论文之统计攻略

数据输入和整理过程详解许昌学院教科院马来祥第一步:设定序号变量第二步:人口学变量的设定第三步:问卷项目代号的设定第四步:数据的输入第五步:输入数据的检查和修正第六步:数据的反向第七步:总分的计算第一步:设定序号变量将原始问卷编号并将序号标注在原始问卷的显要位置建立spss新文档,调整至“变量预览”部分建立第一个字段,即“序号”第一步:选中“变量预览”第二步:在“name”中输入第一个字段:“序号”关于第一步(序号变量设定)的说明在原始问卷上标明序号并输入spss的原因:问卷输入完毕后,如果发现数据出现某些问题,比如某被试的数据输入出现错误。这时便可以根据这个被试的输入序号找到对应的原始问卷,重新核对或改正数据。name后边所有的选项一律采用默认值,不要盲目设定。如type选项,一律采用默认值numeric[数值型]。虽然严格意义上来讲,当变量的数值不可以相加时[如性别、年级等名义和顺序变量],通常应该选择string[字符串],这样可以防止某些运算过程中的误操作。但因为后面要介绍的方差分析要求分组变量的类型必须为numeric,所以在此统一简化要求为“一律采用默认值numeric”。第二步:人口学变量的设定name:性别、年级、婚否、独生、收入等type:统一为默认值“numeric”value:各变量的水平定义成数字。

如性别分两个水平[男和女],将男定义为1,女定义为2;年级分为四个水平[大一到大四],将大一定义为1,大二定义为2,大三定义为3,大四定义为4等。在“序号”后就开始输入人口学变量,如“性别”、“婚否”等type选项和“序号”一样,默认为“numeric”即可。以性别为例,单击“性别”对应的“value”框(默认显示为none)。然后单击其后的小按钮,弹出“ValueLabels”框如果欲将男输入为1,女输入为2。则首先在valuelabels弹框的第一个空白框中输入1,第二个空白框中输入男,点击add;此时下面的大框中会出现1=“男”的字样,上面的两个小框清空重复上面的步骤第一个空白框中输入2,第二个空白框中输入女,点击add;此时下面大框中出现2=“女”,然后点击右上角的ok。因为性别只有男和女两个水平,所以至此我们就设置完毕了。像年级等如果有更多水平,重复此步骤直至将各水平定义完即可关于第二步(人口学变量设定)的说明设置value值的作用:spss输入时为了输入简便,也为了后续运算的方便,我们往往不会直接将性别输入为男和女,而是都将其转换为数字[如男由1来代表,女由2来代表]。如果不进行value设定,那么后续的分析结果将会只显示1和2,而不显示性别。value设定的结果就是虽然输入的是1和2,但分析结果中显示的却是男和女。第三步:问卷项目代号的设定name:a1、a2、a3……b1、b2、b3……c1、c2、c3……我们要输入的问卷不只一份,比如一个研究中可能同时包含焦虑问卷、人格问卷等。每个问卷都有个第1题、第2题等,为了使各问卷的题目在输入时区分开,需要将每份问卷用一个字母代表,字母后面跟着的数字是几,就是这份问卷的第几题。如b2代表第2份问卷的第2题,d18代表第4份问卷的第18题等。人口学变量输完后,就开始输正式的题目。此例子中共有两份问卷,每份问卷有四个题目。name后的type全部取默认值,即numeric,其他设定也全都取默认值。至此,关于变量的设定全部完成!点击dataview选项卡,进入数据输入页面这就是我们在前面所做工作的成果,在variableview选项卡中界定的变量,现在全部显示在spss表格的最上边。第四步:数据的输入spss表格中的每一行就代表一个被试的测量结果,有多少个被试就会有多少行数据。请看如下演示:输入的第一行数据,相关解释:[1]序号为1,代表这是问卷上序号标注为1的那个被试的结果[2]性别为1,代表这位被试是男性[3]婚否为3,代表离婚。[variableview中将已婚赋值为1,未婚赋值为2,离婚赋值为3][4]a1为2,代表此被试在第一份问卷的第1道题上选了2b3为3,代表此被试在第二份问卷的第3道题上选了3以此类推至此,问卷全部输入完毕,共98个被试注意,系统“默认的序号”和我们“输入的序号”绝对是不一样的。当我们按照某个变量如a1排序时,“默认的序号”依然整齐,“输入的序号”却会随被试的排序而变化,这才是真正的被试序号第五步:输入数据的检查和修正输入的错误值会影响总体均数和统计结果,因此有必要在正式分析数据之前,检查输入的数据是否有误。本步骤主要是检查是否存在不合常理的极端值。具体过程:依次点击“analyze”——"Descriptivestatistics"——"Descriptives"(“分析”-“描述数据”-描述)将左侧的变量全选,方法是“左键单击第一个变量,摁住左键不放手,往下拖动,直到最后一个变量”。或者“左键单击第一个变量,然后在摁住shift键的同时点击最后一个变量。”全选后单击这个按钮此时所有的变量都被选入这个框中选入变量后点击此按钮把这两个复选框中的对勾去掉mean即平均数;std.deviation即标准差这两个选项在这一步我们尚且用不到保留这两个复选框中的对勾minimum即最小值maximum即最大值完成后点击continue点击ok,出现下面的运算结果N代表的是每个变量包含的被试数。如果N中的数据小于总被试数,如本数据中共有98名被试,但B2显示只有96名被试的数据,这意味着有2名被试在此题上未作答,或者被试作答了但在输问卷时未输入,或者出现某些输入错误。此时应回到原始数据中确定数据缺失的具体原因,如有必要按序号寻找相应的原始问卷进行修改。如有同学先在excel中输数据,然后导入spss。如果某个被试的数据在excel中错误输入了字符型信息(比如一不小心加了一个顿号,输入为“、5”),而spss中此变量却被设置为数值型,那么导入之后此被试的这个数据便会被清空。检查数据错误主要是看最大值和最小值。在本组数据中我们看到B2题的最大值是33,B4题的最大值是24。已知两个问卷都是4点作答,那么出现33或24这两个选择的可能是不存在的,一般这种情况就是出现了输入错误,如输3的时候不小心按了两次等。发现异常值后,应该回到原始数据中去检查,如有必要还需按序号寻找原始问卷检查。举例:回到原始数据中,找到出现异常值的B2变量,右键单击B2这个标题,在选项中选择sortdescending,即按降序排序降序排序之后,33这个异常值便出现在了最顶端。现在我们可以确定是编号为17的被试在编号为B的问卷上的第2道题上出现了输入错误。下一步,找到编号为17的被试的原始问卷,确定他在这道题上的选择究竟是几,让后在spss数据中直接更正即可。同理:spss文件中的每个异常值都可以用这种与原始问卷相对照的方式得到更正。这就要求我们在将数据输入spss之后,不要急于将原始问卷处理掉,最起码要保留到论文答辩结束之后。注意1:如果我们发现了一个异常的最大值,如本例中的33,这并不意味着在这个变量上仅有33一个异常值,如果还有一个异常值是23,那么统计结果中便不会显示了。但这种情况在降序排序时很容易看出来。注意2:有些同学在排序的时候,如果使用了升序排序,会突然发现自己的数据全没了。其实不是你的数据没了,而是你的数据中包含了大量的空数据行,比如本数据中圆圈所示的部分。[空数据行中每个格的最后都有一个小点]如果空数据行量很大的话,会导致有数据的部分全部移到表格的最后。往下拖动小圈所示的滚动条,在下面一定有你的数据。把这些空数据行全部删掉,一切都搞定了。第六步:数据的反向如果问卷中存在某些反向题,那么正式统计分析之前,还需要将这些反向的数据反过来。切记这一步一定要在统计分析之前进行,否则后续的统计分析错误就大了。假设本数据中a1和b2是需要反向的两个变量(即题目)“transform”——“recode”——“intosamevariables”即在原来的位置直接对需要反向的数据重新赋值在左边的框中选中需要反向的变量(题目),本数据中为a1和b2。选中的方法是按ctrl键的同时,用鼠标左键单击多个变量。然后点击右边的箭头,选入vatiables框需要反向的变量选入后,单击oldandnewvalues。注意:同种类型的反向可以同时进行,如此处的a1和b2的反向方法是一样的。但如果两个问卷的计分方式不同,如一个4点计分,一个5点计分,那么其反向方式也不同,此时需要将每个问卷单独反向。在此输入反向前的值在此输入反向后的值每输入一组反向前、后的值,点击一次“add”按钮,反向规则便进入其后的框中。四点计分题目的反向规则

oldvaluenewvalue

14233241五点计分题目的反向规则oldvaluenewvalue

1524334251反向规则设置完毕后,点击continue按钮点击ok,a1和b2两道题目的数据便反向完成反向前的数据反向后的数据第七步:总分的计算总分指的是问卷的总分(所有题目分数相加的结果)和维度的总分(某问卷中部分题目相加的结果),维度总分和量表总分都需要在统计之前计算清楚。本演示中假设问卷a是焦虑自评问卷,问卷b是自我效能感问卷,以下为总分的计算过程:如果焦虑问卷的得分等于a1+a2+a3+a4的话,此处计算出的总分将会以一列数据的形式出现,首先需要给这列数据取个名字,此处就叫”焦虑得分“。注意:名词最多允许4个汉字选择”a1“,点击右箭头,使其进入”numericexpression“框中,选择”+“,再选择”a2“进入框中,再选择”+“……。按

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论