SPSS分析调查问卷数据的方法_第1页
SPSS分析调查问卷数据的方法_第2页
SPSS分析调查问卷数据的方法_第3页
SPSS分析调查问卷数据的方法_第4页
SPSS分析调查问卷数据的方法_第5页
已阅读5页,还剩78页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、SPSS分析调查问卷数据的方 法 SPSS分析调查问卷数据的方法 SPSS分析调查问卷数据的方法 问卷数据的预处理 SPSS分析调查问卷数据的方法 SPSS分析调查问卷数据的方法分析调查问卷数据的方法 当我们的调查问卷在把调查数据拿回来后, 我们该做的工作就是用相关的统计软件进 行处理,在此,我们以spss为处理软件,来简要 说明一下问卷的处理过程,它的过程大致可 分为四个过程: 下面将从这四个方面来对问卷的处理做详 细的介绍. SPSS分析调查问卷数据的方法 定义变量定义变量 大多数情况下我们需要从头定义变量,在打开SPSS后, 我们可以看到和excel相似的界面,在界面的左下方可 以看到D

2、ata View, Variable View两个标签,只需单击左下 方的Variable View标签就可以切换到变量定义界面开始 定义新变量。 在表格上方可以看到一个变量要设置如下几 项:name(变量名)、type(变量类型)、width(变量值的宽 度)、decimals(小数位) 、label(变量标签) 、Values(定义 具体变量值的标签)、Missing(定义变量缺失值)、 Colomns(定义显示列宽)、Align(定义显示对齐方式)、 Measure(定义变量类型是连续、有序分类还是无序分 类). SPSS分析调查问卷数据的方法 SPSS分析调查问卷数据的方法 调查问卷中

3、的数据编码和录入 SPSS分析调查问卷数据的方法 调查问卷中的数据编码和录入 SPSS分析调查问卷数据的方法 调查问卷中的数据编码和录入 SPSS分析调查问卷数据的方法 调查问卷中的数据编码和录入 SPSS分析调查问卷数据的方法 把一份问卷上面的每一个问题设为一个变量,这样一份问 卷有多少个问题就要有多少个变量与之对应,每一个问题 的答案即为变量的取值.现在我们以问卷第一个问题为例 来说明变量的设置.为了便于说明,可假设此题为: 1.请问你的年龄属于下面哪一个年龄段( )? A:2029 B:3039 C:4049 D:50-59 变量设置可如下变量设置可如下:name即变量名为即变量名为1,

4、type即类型可根据答案的类型设置即类型可根据答案的类型设置,答案我答案我 们可以用们可以用1、2、3、4来代替来代替A、B、C、D,所以我们选择数字型的,即选择所以我们选择数字型的,即选择Numeric, width宽度为宽度为4,decimals即小数位数位为即小数位数位为0(因为答案没有小数点),(因为答案没有小数点),label即变量即变量 标签为标签为“年龄段查询年龄段查询”。Values用于定义具体变量值的标签用于定义具体变量值的标签,单击单击Value框右半部的省框右半部的省 略号,会弹出变量值标签对话框略号,会弹出变量值标签对话框,在第一个文本框里输入在第一个文本框里输入1,第

5、二个输入第二个输入2029,然然 后单击添加即可后单击添加即可.同样道理我们可做如下设置同样道理我们可做如下设置,即即1=2029、2=3039、3=4049、 4=50-59;Missing,用于定义变量缺失值,用于定义变量缺失值,单击单击missing框右侧的省略号,会弹出框右侧的省略号,会弹出 缺失值对话框缺失值对话框,界面上有一列三个单选钮,默认值为最上方的界面上有一列三个单选钮,默认值为最上方的“无缺失值无缺失值”;第二;第二 项为项为“不连续缺失值不连续缺失值”,最多可以定义,最多可以定义3个值;最后一项为个值;最后一项为“缺失值范围加可选的一缺失值范围加可选的一 个缺失值个缺失值

6、”,在此我们不设置缺省值,在此我们不设置缺省值,所以选中第一项如图;所以选中第一项如图;Colomns,定义显示,定义显示 列宽列宽,可自己根据实际情况设置;可自己根据实际情况设置;Align,定义显示对齐方式,定义显示对齐方式,有居左、居右、居中有居左、居右、居中 三种方式;三种方式;Measure,定义变量类型是连续、有序分类还是无序分类。,定义变量类型是连续、有序分类还是无序分类。 SPSS分析调查问卷数据的方法 SPSS分析调查问卷数据的方法 SPSS分析调查问卷数据的方法 开放式题型的设置:诸如你所在的省份是_这样的填空题即 为开放题,设置这些变量的时候只需要将Value 、Miss

7、ing两项不 设置即可. SPSS分析调查问卷数据的方法 数据录入:数据录入:Spss数据录入方式 在spss的数据录入窗口中直接输入就可以了, 几点注意事项: a. 在数据录入窗口,可看到有一个表格,这个表格中的每一行代表一份 问卷,也称为一个个案. b. 在数据录入窗口中,可看到表格上方出现了1、2、3、4、5.的标签 名,这其实是我们在第一步定义变量中,我们为问卷的每一个问题取的变 量名,即1代表第一题,2代表第二题.以次类推.只需要在变量名下面输入 对应问题的答案即可完成问卷的数据录入.比如上述年龄段查询的例题, 如果问卷上勾选了A答案,在1下面输入1就行了(不要忘记我们通常是用1、

8、2、3、4来代替A、B、C、D的). c.一行代表一份问卷,所以有几分问卷,就要有几行的数据. 在数据录入完成后, 要做的关键部分就是 问卷的统计分析了. 1.读取SPSS格式的数据 2.读取Excel等格式的数据 3.读取文本数据(Fixed和Delimiter) 4.读取数据库格式数据(分如下两步) (1)配置ODBC (2)在SPSS中通过ODBC和数据库进行 SPSS分析调查问卷数据的方法 Rich.sav数据 Rich.xls 数据录入数据录入 (rich.sav):福布斯世界富豪排行榜 Rank:排名 Name:姓名 Citizenship:国籍 Region:地区 Age:年龄

9、NetWorth:净财富(10亿美元) Residence :居住地 SPSS分析调查问卷数据的方法 问卷调查数据常用的统计分析方法 频数分析、描述统计分析和列联表分析频数分析、描述统计分析和列联表分析 这是问卷调查最基本、这是问卷调查最基本、 最常用的分析方法。频数分析是描述统计的初步,分门别类的最常用的分析方法。频数分析是描述统计的初步,分门别类的 统计有效样本量,计算其比重。频数分析可以计算的统计量有:统计有效样本量,计算其比重。频数分析可以计算的统计量有: 分位数、中位数、众数等,并可以绘制柱状图、直方图、饼图。分位数、中位数、众数等,并可以绘制柱状图、直方图、饼图。 SPSS分析调查

10、问卷数据的方法 SPSS分析调查问卷数据的方法 SPSS分析调查问卷数据的方法 描述统计分析主要是计算一些 基本的统计量,其中比较 重要的统计量有均值、方差和标准差、峰度、偏度。 SPSS分析调查问卷数据的方法 数据的描述 SPSS分析调查问卷数据的方法 在对数据进行深入加工之前,在对数据进行深入加工之前, 总应该对数据有所印象。总应该对数据有所印象。 可以借助于图形和简单的运算,可以借助于图形和简单的运算, 来了解数据的一些特征。来了解数据的一些特征。 由于数据是从总体中产生的,由于数据是从总体中产生的, 其特征也反映了总体的特征。其特征也反映了总体的特征。 对数据的描述也是对其总体的对数据

11、的描述也是对其总体的 一个近似的描述。一个近似的描述。 SPSS分析调查问卷数据的方法 1如何用图来表示数据?如何用图来表示数据? SPSS分析调查问卷数据的方法 定量变量的图表示定量变量的图表示:1.直方图直方图 对于一个定量变量,比如某个地区对于一个定量变量,比如某个地区 (地区(地区1)测量了)测量了163个高三男生的身个高三男生的身 高(高(S3height1.txt)。)。 用图形来表示这个数据,使人们能够用图形来表示这个数据,使人们能够 看出这个数据的大体分布或看出这个数据的大体分布或“形状形状” 的一个办法是画直方图的一个办法是画直方图(histogram)。 图图1就是利用这个

12、数据由就是利用这个数据由SPSS软件所软件所 画的直方图。画的直方图。 SPSS分析调查问卷数据的方法 图3.1 地区1高三男生身高的直方图 200.0195.0190.0185.0180.0175.0170.0165.0160.0155.0150.0 Std. Dev(标准差)=10.91,Mean(均值)=170.9,N(人数)=163 40 30 20 10 0 该图的横坐标是身高区间,这里每一格代表该图的横坐标是身高区间,这里每一格代表5cm的身高范围(格子的身高范围(格子 宽度因不同的数据性质或要求而定,这里的格子宽度为宽度因不同的数据性质或要求而定,这里的格子宽度为5cm),而),

13、而 纵坐标为各种身高区间的身高的频数。纵坐标为各种身高区间的身高的频数。 直方图直方图 SPSS分析调查问卷数据的方法 定量变量的图表示定量变量的图表示:2.盒型图盒型图 简单一些的是盒形图简单一些的是盒形图(boxplot,又称,又称 箱图、箱线图、盒子图箱图、箱线图、盒子图)。 图图2的左边一个是根据地区的左边一个是根据地区1高三男生高三男生 的身高数据所绘的盒形图;其右边的的身高数据所绘的盒形图;其右边的 图代表另一个地区(地区图代表另一个地区(地区2)的高三)的高三 学生的身高学生的身高(height.txt,height.sav,第三章例第三章例.xls)。 SPSS分析调查问卷数据

14、的方法 175163N = 地区 地区2地区1 高三男生身高 210 200 190 180 170 160 150 140 323259 250 248 5 96 158 盒型图盒型图 盒子的中间横线是数据的中位数盒子的中间横线是数据的中位数(median),封闭盒子的上下两横线,封闭盒子的上下两横线 (边)为上下四分位数(点);按照(边)为上下四分位数(点);按照SPSS的默认选项,如果所有的默认选项,如果所有 样本中的数目都在离四分位点样本中的数目都在离四分位点1.5倍盒子长度之内,则线的端点为倍盒子长度之内,则线的端点为 最大和最小值,否则线长就是最大和最小值,否则线长就是1.5倍的盒

15、子长度(盒子长度称为四倍的盒子长度(盒子长度称为四 分位间距),在其外面的度量单独点出分位间距),在其外面的度量单独点出 SPSS分析调查问卷数据的方法 定量变量的图表示定量变量的图表示:3.茎叶图茎叶图 在直方图和盒形图中,很难恢复数据在直方图和盒形图中,很难恢复数据 的原貌。而另一种图:茎叶图的原貌。而另一种图:茎叶图(stem- and-leafplots)可以恢复数据可以恢复数据 以地区以地区1高三男生身高为例(图高三男生身高为例(图3),), 茎叶图既展示了分布形状又有原始数茎叶图既展示了分布形状又有原始数 据。它象一片带有茎的叶子。茎为较据。它象一片带有茎的叶子。茎为较 大位数的数

16、字,叶为较小位数的数字。大位数的数字,叶为较小位数的数字。 SPSS分析调查问卷数据的方法 茎叶图茎叶图 其中茎叶图中茎的单位为其中茎叶图中茎的单位为10cm,而叶子单位为,而叶子单位为1cm。比如,由于。比如,由于 第一行茎为第一行茎为150cm,因此叶子中的九个数字,因此叶子中的九个数字001223344代表九个数代表九个数 目目150、150、151、152、152、153、153、154、154cm等。每等。每 行左边有一个频数(比如第一行有行左边有一个频数(比如第一行有9个数目,第二行有个数目,第二行有17个等等);个等等); 可以看出最长的一行为从可以看出最长的一行为从165cm到

17、到169cm的一段(有的一段(有35个数)。个数)。 SPSS分析调查问卷数据的方法 定量变量的图表示定量变量的图表示:4.散点图散点图 数据会有两个变量,如美国男士和女数据会有两个变量,如美国男士和女 士初婚年限数据(士初婚年限数据(marriage.txt)。)。 该数据描述了自该数据描述了自1900年到年到1998年男女年男女 第一次婚姻延续的时间。第一次婚姻延续的时间。 这里年份是一个变量,婚姻延续时间这里年份是一个变量,婚姻延续时间 是第二个变量。由于不可能将所有人是第二个变量。由于不可能将所有人 的婚姻年限都给出来,所以每年就取的婚姻年限都给出来,所以每年就取 了一个中间的值了一个

18、中间的值(中位数中位数)作为代表。作为代表。 SPSS分析调查问卷数据的方法200019801960194019201900 28 27 26 25 24 23 22 21 20 女 男 散点图散点图 SPSS分析调查问卷数据的方法 定性变量的图表示:饼图定性变量的图表示:饼图 定性变量(或属性变量,分类变定性变量(或属性变量,分类变 量)不能点出直方图、散点图或量)不能点出直方图、散点图或 茎叶图,但可以描绘出它们各类茎叶图,但可以描绘出它们各类 的比例。的比例。 下面用下面用SPSS绘的图绘的图5(饼图,(饼图,pie chart)表示了说世界各种主要语)表示了说世界各种主要语 言人数的比

19、例言人数的比例(language.txt). SPSS分析调查问卷数据的方法 饼图饼图 SPSS分析调查问卷数据的方法 定性变量的图表示:条形图定性变量的图表示:条形图 而用同样数据画的图而用同样数据画的图6称为条形称为条形 图(图(barchart)。)。 从每一条可以看出讲各种语言从每一条可以看出讲各种语言 的实际人数,而且分别给出了的实际人数,而且分别给出了 每个语种中母语和日常使用的每个语种中母语和日常使用的 人数(在图中并排放置)。条人数(在图中并排放置)。条 形图显示比例不如饼图直观。形图显示比例不如饼图直观。 SPSS分析调查问卷数据的方法 条形图条形图 SPSS分析调查问卷数据

20、的方法 如何用少量数字来概括数据?如何用少量数字来概括数据? 大量的数字既繁琐又不直观;需大量的数字既繁琐又不直观;需 要对数据做人们时间和耐心所允要对数据做人们时间和耐心所允 许的简化许的简化 我们可以用我们可以用 “平均平均”,“差距差距” 或百分比等来概括大量数字。或百分比等来概括大量数字。 由于定性变量主要是计数,比较由于定性变量主要是计数,比较 简单,常用的概括就是比例或百简单,常用的概括就是比例或百 分比。下面主要介绍关于定量变分比。下面主要介绍关于定量变 量的数字描述。量的数字描述。 SPSS分析调查问卷数据的方法37 小结小结 例(rich.sav):福布斯世界富豪排行榜 Ra

21、nk:排名 Name:姓名 Citizenship:国籍 Region:地区 Age:年龄 NetWorth:净财富(10亿美元) Residence :居住地 SPSS分析调查问卷数据的方法38 定量变量的图表示定量变量的图表示 直方图直方图 Age, NetWorth SPSS: GraphsInteractiveHistogram 10.0020.0030.0040.00 NetWorthNetWorth 0 200 400 600 CountCount 40.0060.0080.00 A Ag ge e 0 25 50 75 C Co ou un nt t SPSS分析调查问卷数据的方

22、法39 横坐标横坐标 要研究的变量的取值范围 格子的宽度因数据性质而定 纵坐标纵坐标 频数 百分比 数据分布的简单描述数据分布的简单描述 单峰/双峰 对称/非对称 数据的疏密 SPSS分析调查问卷数据的方法40 盒型图盒型图 不同区域年龄分布 SPSS: GraphsInteractive Boxplot Africa Asia and Pacific Europe North America South America R Re eg gi io on n 25.00 50.00 75.00 100.00 A Ag ge e SPSS分析调查问卷数据的方法41 中间横线中间横线 中位数 封闭

23、盒子的上下两边封闭盒子的上下两边 上下四分位点 线段的端点线段的端点 最大值,最小值(线长小于1.5倍盒长) 离群点离群点(outlier),极端值极端值(extreme) SPSS分析调查问卷数据的方法42 茎叶图茎叶图 欧洲区域富人的年龄 SPSS: AnalyzeDescriptive Statistics Explore Frequency Stem & Leaf 1.00 Extremes (=22) 2.00 3 . 44 9.00 3 . 789999999 18.00 4 . 3344444 14.00 4 . 55555677789999 27.00 5 . 22233333

24、33344444 22.00 5 . 5555666666777888889999 27.00 6 . 2222222333444444 23.00 6 . 55555566678888888899999 16.00 7 . 23333 18.00 7 . 555666677888999999 12.00 8 . 4 7.00 8 . 5566899 2.00 9 . 22 1.00 9 . 5 Stem width: 10.00 Each leaf: 1 case(s) SPSS分析调查问卷数据的方法43 茎的单位茎的单位:10岁 叶的单位:叶的单位:1岁 优点优点 还原原始数据 类似直方图

25、显示数据分布 缺点缺点 无法描述大量数据 不常用 SPSS分析调查问卷数据的方法44 散点图散点图 两个定量变量之间的关系:年龄和财富 SPSS: GraphsInteractive Scatterplot 25.0050.0075.00100.00 A Ag ge e 0.00 10.00 20.00 30.00 40.00 50.00 N N e e t t W W o o r r t t h h SPSS分析调查问卷数据的方法45 定性变量的图表示定性变量的图表示 饼图饼图 Region SPSS: GraphsInteractive Pie 类别不宜过多 Africa Asia and

26、 Pacific Europe North America South America R Re eg gi io on n A A f f r r i i c c a a 0 0 . . 6 6 5 5 % % A A s s i i a a a a n n d d P P a a c c i i f f i i c c 1 1 8 8 . . 4 4 5 5 % % E E u u r r o o p p e e 2 2 6 6 . . 9 9 7 7 % % N N o o r r t t h h A A m m e e r r i i c c a a 5 5 0 0 . . 9 9 7

27、 7 % % S S o o u u t t h h A A m m e e r r i i c c a a 2 2 . . 9 9 7 7 % % SPSS分析调查问卷数据的方法46 条形图条形图 Region SPSS: GraphsInteractive Bar 不同于直方图 Bars show counts Africa Asia and Pacific Europe North America South America RegionRegion 100 200 300 400 CountCount SPSS分析调查问卷数据的方法 2如何用少量数字来概括数据?如何用少量数字来概括数据

28、? 可用少量所谓汇总统计量或概括可用少量所谓汇总统计量或概括 统计量统计量(summarystatistic)来描述来描述 定量变量的数据。定量变量的数据。 这些数字是从样本数据得来的,这些数字是从样本数据得来的, 因而也是样本的函数,因而也是样本的函数, 任何样本的函数,只要不包含总任何样本的函数,只要不包含总 体的未知参数,都称为统计量体的未知参数,都称为统计量 (statistic)。 样本的随机性决定统计量的随机样本的随机性决定统计量的随机 性(统计量也是随机变量)性(统计量也是随机变量) SPSS分析调查问卷数据的方法 2如何用少量数字来概括数据?如何用少量数字来概括数据? 概括统计

29、量经常对应于总体概括统计量经常对应于总体 的无法观测到的某些参数。的无法观测到的某些参数。 这时,统计量可作为这些参这时,统计量可作为这些参 数的估计。一些统计量还可数的估计。一些统计量还可 以用来检验样本和假设的总以用来检验样本和假设的总 体是否一致。体是否一致。 SPSS分析调查问卷数据的方法 2如何用少量数字来概括数据?如何用少量数字来概括数据? 注:一些统计量前面有时加注:一些统计量前面有时加 上上“样本样本”二字,以区别于二字,以区别于 总体的同名参数。如总体的同名参数。如“样本样本 均值均值”和和“样本标准差样本标准差”, 以区别于总体均值和总体标以区别于总体均值和总体标 准差;但

30、在不会混淆时可以准差;但在不会混淆时可以 只说只说“均值均值”和和“标准差标准差”。 SPSS分析调查问卷数据的方法 数据的数据的“位置位置” 数据有位置吗?数据有位置吗? 这里三个数据的位置一样吗?这里三个数据的位置一样吗? SPSS分析调查问卷数据的方法 数据的数据的“位置位置” “位置位置”一般是关于数据中某变量一般是关于数据中某变量 观测值的观测值的“中心位置中心位置”或者数据或者数据 分布的中心(分布的中心(center或或center tendency)。)。 和这种和这种“位置位置”有关的统计量就有关的统计量就 称为位置统计量称为位置统计量(locationstatistic)。

31、 位置统计量当然不一定都是描述位置统计量当然不一定都是描述 “中心中心”了,比如后面要讲的了,比如后面要讲的k百百 分位数(或分位数(或k分位数)。分位数)。 SPSS分析调查问卷数据的方法 数据的数据的“位置位置” 最常用的位置统计量就是小学时所学最常用的位置统计量就是小学时所学 到的算术平均数,它在统计中叫做均到的算术平均数,它在统计中叫做均 值值(mean);严格地说叫做样本均值;严格地说叫做样本均值 (sample mean),以区别于总体均值。,以区别于总体均值。 如果记样本中的观测值为如果记样本中的观测值为x1,xn,则,则 样本均值定义为样本均值定义为 SPSS分析调查问卷数据的

32、方法 (样本样本)中位数中位数(median) 是数据按照大小排列之是数据按照大小排列之 后位于中间的那个数后位于中间的那个数(如如 果样本量为奇数果样本量为奇数),或者,或者 中间两个数目的平均中间两个数目的平均(如如 果样本量为偶数果样本量为偶数)。 由于中位数不易被极端由于中位数不易被极端 值影响,所以中位数比值影响,所以中位数比 均值稳健均值稳健(robust)。 数据的数据的“位置位置” SPSS分析调查问卷数据的方法 上下四分位数(或分 别称为第一四分位数 和第三四分位数, first quantile, third quantile)则分别位于 (按大小排列的)数 据的上下四分之

33、一的 地方。 数据的数据的“位置位置” SPSS分析调查问卷数据的方法 数据的数据的“位置位置” 一般地还称上四分位数为一般地还称上四分位数为75百分位数百分位数 (75 pecentile,有,有75的观测值小于的观测值小于 它),下四分位数为它),下四分位数为25百分位数(有百分位数(有 25的观测值小于它)。的观测值小于它)。 一般地,一般地,k百分位数(百分位数(k-pecentile)意)意 味着有味着有k的观测值小于它。的观测值小于它。 如果令如果令a a=k%,则,则k百分位数也称为百分位数也称为a a 分位数分位数(a a-quantile)。 样本中出现最多的数目,称为众数样

34、本中出现最多的数目,称为众数 (mode) SPSS分析调查问卷数据的方法 数据的数据的“尺度尺度” 这两个数据“胖瘦”一样吗? SPSS分析调查问卷数据的方法 数据的数据的“尺度尺度” 数据中数目的分散程度由尺 度统计量(scale statistic) 来描述。 尺度统计量是描述数据散布, 即描述集中与分散程度或变 化(spread或variability)的 度量。 SPSS分析调查问卷数据的方法 数据的数据的“尺度尺度” 从前面两个高三男生身高数据的盒从前面两个高三男生身高数据的盒 形图。左边的数据平均要高些,但形图。左边的数据平均要高些,但 右边的数据散布范围要小得多。右边的数据散布

35、范围要小得多。 175163N = 地区 地区2地区1 高三男生身高 210 200 190 180 170 160 150 140 323259 250 248 5 96 158 统计中有许多尺度统 计量。一般来说,数 据越分散,尺度统计 量的值越大。 SPSS分析调查问卷数据的方法 数据的数据的“尺度尺度” 极差极差(range);就是极大值和极小值之;就是极大值和极小值之 间的差。间的差。 前面两个高三男生身高数据的极差分前面两个高三男生身高数据的极差分 别为别为50cm和和32cm。 盒形图盒子的长度为两个四分位数之盒形图盒子的长度为两个四分位数之 差,称为四分位数极差或四分位间距差,

36、称为四分位数极差或四分位间距 (interquantilerange);它描述了中间;它描述了中间 半数观测值的散布情况。极差和四分半数观测值的散布情况。极差和四分 位极差实际上各自只依赖于两个值,位极差实际上各自只依赖于两个值, 信息量太少。信息量太少。 SPSS分析调查问卷数据的方法 数据的数据的“尺度尺度” 另一个常用的尺度统计量为(样本)另一个常用的尺度统计量为(样本) 标准差标准差(standard deviation)。度量样。度量样 本中各数值到均值距离的一种平均。本中各数值到均值距离的一种平均。 标准差实际上是方差标准差实际上是方差(variance)的平方的平方 根。如果记样

37、本中的观测值为根。如果记样本中的观测值为x1,xn, 则样本方差为则样本方差为 SPSS分析调查问卷数据的方法 数据的数据的“尺度尺度” 两个均值一样,但右边的要两个均值一样,但右边的要 “胖胖”些,方差为左边的一些,方差为左边的一 倍倍 SPSS分析调查问卷数据的方法 数据的标准得分数据的标准得分 假定两个水平类似的班级(一假定两个水平类似的班级(一 班和二班)上同一门课,班和二班)上同一门课, 但是由于两个任课老师的评分但是由于两个任课老师的评分 标准不同,使得两个班成绩的标准不同,使得两个班成绩的 均值和标准差都不一样均值和标准差都不一样(数据:数据: grade.txt)。 SPSS分

38、析调查问卷数据的方法 数据的标准得分数据的标准得分 一班分数的均值和标准差分别一班分数的均值和标准差分别 为为78.53和和9.43,而二班的均值,而二班的均值 和标准差分别为和标准差分别为70.19和和7.00。 那么得到那么得到90分的一班的张颖是分的一班的张颖是 不是比得到不是比得到82分的二班的刘疏分的二班的刘疏 成绩更好呢?怎么比较才能合成绩更好呢?怎么比较才能合 理呢?理呢? SPSS分析调查问卷数据的方法 数据的标准得分数据的标准得分 虽然这种均值和标准差不同的数据不虽然这种均值和标准差不同的数据不 能够直接比较,但是可以把它们进行能够直接比较,但是可以把它们进行 标准化,再比较

39、标准化后的数据。标准化,再比较标准化后的数据。 一个标准化的方法是把某样本原始观一个标准化的方法是把某样本原始观 测值(亦称得分,测值(亦称得分,score)和该样本均)和该样本均 值之差除以该样本的标准差;得到的值之差除以该样本的标准差;得到的 度量称为标准得分度量称为标准得分(standard score, 又称为又称为z-score)。 SPSS分析调查问卷数据的方法 数据的标准得分数据的标准得分 即,某观测值xi的标准得分定义为 i xx z s SPSS分析调查问卷数据的方法 数据的标准得分数据的标准得分 在我们的例子中,张颖的标准在我们的例子中,张颖的标准 得分为得分为(90-78

40、.53)/9.431.22, 而 刘 疏 的 标 准 得 分 为而 刘 疏 的 标 准 得 分 为 ( 8 2 - 70.19)/71.69。 显然如果两个班级平均水平差显然如果两个班级平均水平差 不多,刘疏的成绩应该优于张不多,刘疏的成绩应该优于张 颖的成绩;这是在标准化之前颖的成绩;这是在标准化之前 的数据中不易看到的。的数据中不易看到的。 SPSS分析调查问卷数据的方法 可以看出,原始数据是在各自的均值附近,而散布也不一可以看出,原始数据是在各自的均值附近,而散布也不一 样。但它们的标准得分则在样。但它们的标准得分则在0 0周围散布,而且散布也差不周围散布,而且散布也差不 多。实际上,任

41、何样本经过这样的标准化后,就都变换成多。实际上,任何样本经过这样的标准化后,就都变换成 均值为均值为0 0、方差为、方差为1 1的样本。标准化后不同样本观测值的比的样本。标准化后不同样本观测值的比 较只有相对意义,没有绝对意义。较只有相对意义,没有绝对意义。 SPSS分析调查问卷数据的方法68 小结小结 统计量统计量:(:(statistic) 样本的函数,不包括总体的未知参数 随机变量(样本的随机性) 作为总体参数的估计 SPSS分析调查问卷数据的方法69 数据的位置(数据的位置(location) 样本均值(sample mean) 中位数(median):稳健 k百分位数(k-perce

42、ntile) 众数(mode):定性变量 SPSS分析调查问卷数据的方法70 SPSS: AnalyzeDescriptive Statistics Explore/Frequencies/Descriptives 例(rich.sav) : Age S St ta at ti is st ti ic cs s Age 743 32 63.3096 64.0000 64.00 44.0000 53.0000 64.0000 74.0000 81.0000 Valid Missing N Mean Median Mode 10 25 50 75 90 Percentiles SPSS分析调查问卷

43、数据的方法71 数据的尺度(数据的尺度(scale) 极差(range) 四分位数极差(interquantile range) 方差(variance) 标准差(standard deviation) 标准误差(standard error) SPSS分析调查问卷数据的方法72 SPSS: AnalyzeDescriptive Statistics Explore/Frequencies/Descriptives 例(rich.sav) : Age S St ta at ti is st ti ic cs s Age 743 32 63.3096 .50599 64.0000 64.00 1

44、3.79230 190.227 75.00 22.00 97.00 44.0000 53.0000 64.0000 74.0000 81.0000 Valid Missing N Mean Std. Error of Mean Median Mode Std. Deviation Variance Range Minimum Maximum 10 25 50 75 90 Percentiles SPSS分析调查问卷数据的方法73 数据的标准得分数据的标准得分 样本原始观测值与样本均值之差除以样本 标准差 新样本:均值0,方差:1 (grade.sav) 数据的变换数据的变换 指数 对数 SPS

45、S分析调查问卷数据的方法74 10097N = 班级 二班一班 得分 110 100 90 80 70 60 50 40 2 1 10097N = 班级 二班一班 标准得分 3 2 1 0 -1 -2 -3 -4 2 1 SPSS分析调查问卷数据的方法75 基本背景调查基本背景调查 样本量:样本量:65 (out of 81) SPSS: AnalyzeDescriptive Statistics Frequencies 学学 院院 23.13.13.1 11.51.54.6 11.51.56.2 46.26.212.3 5686.286.298.5 11.51.5100.0 65100.01

46、00.0 财政金融学院 经济学院 商学院 社会与人口学院 统计学院 信息资源管理学院 Total Valid FrequencyPercentValid Percent Cumulative Percent SPSS分析调查问卷数据的方法76 系系 11.51.51.5 11.51.53.1 11.51.54.6 812.312.316.9 913.813.830.8 11.51.532.3 11.51.533.8 11.51.535.4 34.64.640.0 3756.956.996.9 23.13.1100.0 65100.0100.0 MBA 保险 档案 风险管理与精算 概率论与数理统

47、计 金融 经济学 人口 社会学 统计 卫生统计 Total Valid FrequencyPercentValid Percent Cumulative Percent SPSS分析调查问卷数据的方法77 本科专业本科专业 23.13.13.1 11.51.54.6 11.51.56.2 11.51.57.7 11.51.59.2 11.51.510.8 23.13.113.8 11.51.515.4 11.51.516.9 23.13.120.0 3655.455.475.4 11.51.576.9 11.51.578.5 34.64.683.1 1015.415.498.5 11.51.5100.0 65100.0100.0 保险 档案 风险管理与精算 国际贸易 计算机 经济 精算 贸易经济 人口 社会学 统计 外贸日语 西班牙

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论