描述统计在SPSS下的实现步骤与实例.doc_第1页
描述统计在SPSS下的实现步骤与实例.doc_第2页
描述统计在SPSS下的实现步骤与实例.doc_第3页
描述统计在SPSS下的实现步骤与实例.doc_第4页
描述统计在SPSS下的实现步骤与实例.doc_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

描述统计如何在SPSS下实现SPSS简介。SPSS是世界通用的统计软件包之一,SPSS的应用面广阔,它在经济学、生物学、心理学、医疗卫生、体育、农业、林业、商业、金融等各领域均有广泛的应用。它提供了一种很友好的用户界面,需什么统计功能,直接单击菜单即可。它的基本统计分析功能有:频数分析、描述统计量分析、相关分析、回归分析、因子分析、聚类分析、判别分析、各种统计图形等。一、频数分析:此过程可以方便地对数据按组进行归类整理,形成各变量的不同水平的频数分布表和图形,以便对各变量的数据特征和观测量分布状况有一个概括的认识。频数分布表是描述统计中最常用的方法之一,它还可对数据的分布趋势进行初步分析。例【1】下面对某生产车间50名工人日加工零件数(单位:个)作频数分析:117 122 124 129 139 107 117 130 122 125 108 131 125 117 122 133 126 122 118 108 110 118 123 126 133 134 127 123 118 112 112 134 127 123 119 113 120 123 127 135 137 114 120 128 124 115 139 128 124 121(资料来源:统计学面向21世纪课程教材,袁卫、庞皓、曾五一主编,高等教育出版社,第22页。已录入数据库,见data 02-01)(一)具体操作步骤:1、建立或直接读取数据文件data 02-01。建立数据文件步骤如下:定义变量属性打开SPSS界面后,界面为Data Variable,单击左下角的Varible View,就会显示如图1所示的界面。在表格框内的Name处,输入变量名“零件数”,之后在第二栏Type中选择变量类型Numeric(标准格式),它的系统默认长度为8,小数位数为2。如图2所示。如要更改,单击Type栏的第一行,会出现省略号,再单击省略号,就会出现定义变量类型的对话框,在此窗口中可以在Width处改动变量总长度的默认值,在Decimal处改动小数位 图1 定义变量属性的界面 图2 定义变量属性的界面数的默认值,也可在此窗口改动变量的类型。见图3。另一种方法是直接在图2中的Width和Decimal框中改动。在图2中将滑动条向右拖动之后,会显示出定义变量标签、变量标签值、缺省值、显示列格式、对齐方式、测度类型的列等,可根据需要自行定义。本例除变量名外,其他属性均采用默认值。输入变量值单击图2中左下角的Data View即切换到数据窗口,在此窗口按单元格来输入数据。如图4所示。 数据文件建立好后,本例保存为data02-01。2、按AnalyzeDescriptive StatisticFrequencies顺序单击,打开Frequencies频数 图3 定义变量类型窗口 图4 数据编辑窗口分布主对话框。3、选择“零件数”变量进入Variable框中。如图5所示。4、选中Display frequency tables复选框,要求输出频数分布表。如图5所示。 图5 频数分布复选框 图6 Statistics对话框5、单击【Statistics】按钮,打开Statistics对话框,选择要输出的统计量。如图6所示。Percentile Values栏 选中Quantiles,要求输出四分位数,即显示25%、50%、75%的百分位数。Dispersion离差栏 选中:Std.Deviation 标准差;Variance 方差;Range最大值与最小值之差;Minimum 最小值;Maximum 最大值。Central Tendency中心趋势栏 选中:Mean 算术平均数;Median中位数;Mode众数;Sum算术和。Distrbution分布参数栏 选中:Skewness 显示偏度和偏度的标准误差,正态分布时此值为零,左偏时为正数(数据分布具有一个较长的右尾),右偏时为负数(数据分布具有一个较长的左尾),若此值大于1,则不是正态分布;Kurtosis 显示峰度和峰度的标准差,标准正态分布时此值为0,如果此值大于0,说明数据分布比标准正态峰高,如果此值小于0,说明数据分布比标准正态峰低。Values are group midpoints 复选框 选中该框,则在计算百分位数值和中位数时,假设数据已经分组,且用各组的组中值代表各组数据。6、Continue按钮切换,然后单击【Charts】按钮,打开Charts对话框 选中Histogram项,要求输出直方图,并选中With normal curve复选框,要求输出正态曲线。如图7所示。7、Continue按钮切换,然后单击【Format】按钮,打开Format对话框 选中Ascending Values,按变量值升序排列。如图8所示。8、在主对话框中,单击【OK】按钮,提交运行。 图7 Frequencies: Charts对话框 图8 Frequencies:Format对话框(二)输出结果及分析输出结果如表1、表2、图9所示。表1 日产零件数的统计表Statistics零件数 NValid50Missing0Mean122.9800Std. Error of Mean1.1351Median123.0000Mode122.00Std. Deviation8.0267Variance64.4282Skewness.000Std. Error of Skewness.337Kurtosis-.409Std. Error of Kurtosis.662Range32.00Minimum107.00Maximum139.00Sum6149.00Percentiles25117.666750123.000075127.8000a Calculated from grouped data.b Multiple modes exist. The smallest value is shownc Percentiles are calculated from grouped data.图 9 日产零件数的直方图表2 日产零件数的频数分布表零件数 FrequencyPercentValid PercentCumulative PercentValid107.0012.02.02.0 108.0024.04.06.0 110.0012.02.08.0 112.0024.04.012.0 113.0012.02.014.0 114.0012.02.016.0 115.0012.02.018.0 117.0036.06.024.0 118.0036.06.030.0 119.0012.02.032.0 120.0024.04.036.0 121.0012.02.038.0 122.0048.08.046.0 123.0048.08.054.0 124.0036.06.060.0 125.0024.04.064.0 126.0024.04.068.0 127.0036.06.074.0 128.0024.04.078.0 129.0012.02.080.0 130.0012.02.082.0 131.0012.02.084.0 133.0024.04.088.0 134.0024.04.092.0 135.0012.02.094.0 137.0012.02.096.0 139.0024.04.0100.0 Total50100.0100.0 表1是基本统计量表,从表中可看出,变量值个数为50,缺省值为0,最大值与最小值相差32,25%的分位点为117.5,50%的分位点(即中位点)为123,75%的分位点为128,均值为122.98,众数是122,也即出现频率最大的点是122。表2是频数分布表,表中包括以下几部分:(1)各变量值;(2)各变量值的频数;(3)各变量值所占的百分比(频率);合法值所占的百分比;(4)累积频率;(5)合计图9是带正态曲线的直方图,从图中可以看到工人日生产零件水平近似标准正态分布,大部分工人日水平集中在115.0-127.5之间,生产水平较低和较高的工人数少,且各水平工人数分布较为均匀。从图中可看到数据的分布与偏度、峰度值的结果是一致的。二、描述统计量分析此过程可对变量进行描述统计量分析,计算并列出一系列相应的统计指标,包括平均值、算术和、标准差、最大值、最小值、方差、全距和均值标准误差等,且可将原始数据转换成标准Z分值并存入数据库。Z分值是指某原始数值比其均值高或低多少个标准差单位,高的为正值,低的为负值,相等的为零。案例【2】下面对云南财贸学院80名学生月消费支出(单位:元)作描述统计量分析500 180 400 200 350 600 250 500 380 400 650 400 1200500 200 200 500 500 720 300 300 400 300 350 320 500 800 400 840 400 800 500 450 700 450 800 600 700 550400 500 600 450 300 400 500 500 450 300 600 400 700550 500 450 350 500 500 600 600 450 400 500 400 350 450 500 300 400 350 500 300 350 400 500 500 450 400 400 350(资料来源:2002年9月16日对云南财贸学院学生抽样调查结果。本资料已录入数据库,见data 03-01)(一)具体操作步骤:1、读取数据文件data 03-01。 2、按AnalyzeDescriptive StatisticDescriptives顺序单击,打开Descriptives对话框。 3、选定“月支出”变量进入Variable框中。如图10所示。 4、选中Save standardized values as variables复选框,要求计算变量的标准化值Z值,并保存结果在当前数据集中。如图10所示。 5、单击【Options】按钮,打开Options对话框,选中Mean、Std.Deviation、Minimum、Maximum、Variance 项。如图11所示。图10 Descriptives对话框 图11 Options对话框 图12 保存了z分值的数据集6、Continue按钮切换,然后在主对话框中单击【OK】键,提交运行。(二)、输出结果及分析 输出结果如表3所示表3 大学生月消费支出的描述统计量Descriptive Statistics NMinimumMaximumMeanStd. DeviationVariance月消费支出(元)80180.001200.00468.7500164.950127208.544Valid N (listwise)80 从表3中,可以看到学生月消费支出各统计量的值:有80个观测值;最小值为180元;最大值为1200元;均值为468.75元;标准差为164.9501元,表明每个同学月消费支出与80名同学的平均月消费支出相比,平均相差164.9501元;方差为27208.544元。这时打开原始数据库data 03-01,可以看到多了一列z月支出,这是月支出的z分值,如图12所示,可以将其保存起来作其他分析。三、统计图形SPSS有很多绘图功能,本章仅介绍常用的线图、条形图和圆形图案例【3】用下表中的数据绘制线图表4 19911997年我国城乡居民家庭人均收入 单位:元年 份城镇居民农村居民19911992199319941995199619971700.62026.62577.43496.24283.04838.95160.3708.6784.0921.61221.01577.71926.12091.1(资料来源:统计学面向21世纪课程教材,袁卫、庞皓、曾五一主编,高等教育出版社,第50页)(已录入数据库,见data 03-02)操作步骤 1、读取data03-02。2、按GraphsLine顺序单击,打开Line Charts线图主对话框。如图13所示。 图13 线图主对话框 图14 变量模式多线图对话框3、在线图主对话框中选择Multiple 和Summaries of Separate Variable选项,单击【Define】按钮,打开Define Multiple Line:Summaries of Separate Variable 变量模式多线图对话框,如图14所示。4、选择变量“城镇居民”和“农村居民”进入Lines Represent 框中,选择“时间”进入Category Axis 框中,如图15所示。5、单击【OK】按钮,开始绘制图形。如图16所示。 图15 变量模式多线图对话框 图16 城乡居民家庭人均收入线图从图中可看出,我国城、乡居民家庭人均收入均呈逐年上升的趋势,但二者有差距,城镇居民的家庭人均收入上升速度快于农村,从1993年起这种差距逐年扩大。案例【4】 用案例【3】数据绘制条形图操作步骤1、读取data03-02。 2、按GraphsBar顺序单击,打开Bar Graphs条形图主对话框,如图17所示。 3、在条形图主对话框中选择Clustered 和 Summaries of separate variables项,单击Define按钮,展开Define Clustered Bar:Summaries of separate variables 变量模式分组条形图对话框,如图18所示。 4、 选择变量 “城镇居民”和“农村居民”进入Bar Represent框中,选择“时间”进入Category Axis 框中,如图19所示。 5、单击【OK】按钮,开始绘制图形。如图20所示。 图17 条形图主对话框 图18 变量模式分组条形图对话框图19变量模式分组条形图对话框图20 城乡居民家庭人均收入条形图由图20可以更直观地看出城乡居民家庭人均收入逐年上升的变化趋势及城乡之间收入差距逐年扩大的趋势。案例【5】 用下列资料绘制圆形图1997年我国的国内生产总值为74772.4亿元。其中,第一产业为13968.8亿元,占19%;第二产业为36770.3亿元,占49%;第一产业为24033.3亿元,占32%。(资料来源:统计学面向21世纪课程教材,袁卫、庞皓、曾五一主编,高等教育出版社,第53页)(已录入数据库,见data 03-03)操作步骤 1、读取data03-03。2、按GraphsPie 顺序单击,打开Pie Gharts 对话框,如图21所示。 图21 Pie Gharts 对话框 图22 变量模式圆图对话框3、在Pie Gharts 对话框中选择Summaries of separate variables 选项,单击Define按钮,展开Define Pie: Summaries of separate variables 变量模式圆图对话框,如图22所示。4、选择变量“第一产业”、“第二产业”、“第三产业”进入Slices Represent 框中,如图23所示。 图23 量模式圆图对话框 图24 1997年国内生产总值产业结构圆图5、单击【OK】按钮,开始绘制图形。如图24所示操作练习1、对某行业管理局所属40个企业1999年的产品销售收入(单位:万元)作频数分析。152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 97 88 123 115 119 138 112 146 113 126 (资料来源:统计学面向21世纪课程教材,袁卫、庞皓、曾五一主编,高等教育出版社,第30页)(已录入数据库,见data 03-04)2、对某百货公司连续40天的商品销售额作描述统计量分析。41 25 29 47 38 34 30 38 43 40 46 36 45 37 37 36 45 43 33 44 35 28 46 34 30 37 44 26 38 44 42 36 37 37 49 39 42 32 36 35(资料来源:统计学面向21世纪课程教材,袁卫、庞皓、曾五一主编,高等教育出版社,第30页)(已录入数据库,见data 03-05)3、已知1991-1997年我国的国内生产总值数据如下:年 份国内生产总值(亿元)199119921993199419951996199721617.826638.134634.446622.358260.567885.074772.0其中,在1997年的国内生产总值中,第一产业为13969亿元,第二产业为36770亿元,第三产业为24033亿元。根据1991-1997年的国内生产总值数据,绘制线图和条形图。根据1997年的国内生产总值及其构成数据,绘制圆形图。(资料来源:统计学面向21世纪课程教材,袁卫、庞皓、曾五一主编,高等教育出版社,第55页)(已录入数据库,见data 03-06) 操作练习参考答案1、操作过程参见例【1】销售收入 FrequencyPercentValid PercentCumulative PercentValid87.0012.52.52.5 88.0012.52.55.0 92.0012.52.57.5 95.0012.52.510.0 97.0012.52.512.5 100.0012.52.515.0 103.0025.05.020.0 104.0012.52.522.5 105.0025.05.027.5 107.0012.52.530.0 108.0025.05.035.0 110.0012.52.537.5 112.0012.52.540.0 113.0012.52.542.5 114.0012.52.545.0 115.0025.05.050.0 116.0012.52.552.5 117.0025.05.057.5 118.0012.52.560.0 119.0025.05.065.0 120.0012.52.567.5 123.0012.52.570.0 124.0012.52.572.5 125.0012.52.575.0 126.0012.52.577.5 127.0012.52.580.0 129.0012.52.582.5 135.0012.52.585.0 136.0012.52.587.5 137.0012.52.590.0 138.0012.52.592.5 142.0012.52.595.0 146.0012.52.597.5 152.0012.52.5100.0 Total40100.0100.0 Statistics销售收入(元)NValid40 Missing0Mean 116.1750Std. Error of Mean 2.4599Median 115.6667Mode 103.00Std. Deviation 15.5578Variance 242.0455Skewness .258Std. Error of Skewness .374Kurtosis -.247Std. Error of Kurtosis .733Range 65.00Minimum 87.00Maximum 152.00Sum 4647.00Percentiles25105.0000 50115.6667 75125.5000a Calculated from grouped data.b Multiple modes exist. The smallest value is shownc Percentiles are calculated from grouped data.表Statistics是基本统计量表,从表中可看出,变量值个数为40,缺省值为0,最大值与最小值相差65,25%的分位点为105,50%的分位点(即中位点)为115.6667,75%的分位点为125.5,均值为116.175,众数是103,也即出现频率最大的点是103。在频数分布表中包括以下几部分:(1)各变量值;(2)各变量值的频数;(3)各变量值所占的百分比(频率);合法值所占的百分比;(4)累积频率;(5)合计图3-9是带正态曲线的直方图,从图中可以看到公司每天销售额接近正态分布,大部分公司的销售额水平集中在100-125万元之间,销售水平较低和较高的公司数少。从图中可看到数据的分布与偏度、峰度值的结果是一致的。2、Descriptive Statistics NMinimumMaximumMeanStd. DeviationVariance销售额4025.0049.0037.85005.959535.515Valid N (listwise)40 从表中可以看到企业销售收入各统计量的值:有40个观测值;最小值为25万元;最大值为49万元;均值为37.85万元;标准差为5.9595万元,表明每个企业的销售收入与40个企业的平均销售收入相比,平均相差5.9595万元;方差为35.515万元。3、线图操作步骤:在线图主对话框中选择Simple 和Varibles of Individual Cases选项,单击Define按钮,展开Define Simple Line:Varibles of Individual Cases 观测值模式多线图对话框,然后选则变量“GDP”进入Line Represents 框中,选则变量“时间”进入Variable框中,再单击【OK】键,提交运行。条形图操作步骤:在条形图主对话框中选择Simple和Varibles of Individual Cases 项,单击Define按钮,展开Define Simple Bar:Varibles of Individual Cases 观测值模式简单条形图对话框,然后 选择变量 “GDP”进入Bar Represent框中,选择“时间”进入Varible框中。单击【OK】按钮,提交运行。圆形图操作步骤见例【5】五、相关分析 案例【6】利税与工业总产值关系分析为了了解某市工业总产值与利税额的关系,以便能从工业总产值去预测下年度的税收总额,现收集了1988年1999年12年间的数据如下表: 表5年 份工业总产值x利税总额y1988401.9262.81989854.08226.0819901105.28180.8619911130.40213.5219921708.16580.2719931783.52439.6019942009.60504.9119952361.28575.2519963416.32660.6619973642.40720.9419984647.20766.1619995149.60947.02试用SPSS软件对利税总额与工业总产值作相关与回归分析。解: 操作步骤:1、输数据。将数据输成12行3列,分别记每列变量名为t、x、y。2、绘制散点图,考察该市工业总产值与利税额的关系:(1)选方法:选择菜单GraphsScatter,打开Scatterplot子对话框,单击Simple图形,按Defin键,打开Simple Scatterplot子对话框;(2)定变量:将变量x和y分别放入Xaxis和Yaxis框;(3)得结果:按OK按钮执行,结果见下图。图25 工业总产值x与利税总额y的散点图从图中可以看到,工业总产值与利税总额有线性趋势,至于这种趋势有无统计学意义,还需进行相关分析。3、相关分析:计算相关系数并进行假设检验:(1)选方法:选择菜单AnalyzeCorrelateBivariate;(2)定变量:将变量x和y放入变量Variables框;(3)得结果:按OK按钮执行,结果见下表。Correlations 表6 XYXPearson Correlation1.000.942Sig. (2-tailed).000N1212YPearson Correlation.9421.000Sig. (2-tailed).000. N1212* Correlation is significant at the 0.01 level (2-tailed).从上表可以看出变量X与Y的相关系数为0.942,双尾检验结果P0.01,说明X与Y之间显著相关。4、回归分析建立回归方程并进行假设检验(1)选方法:选择菜单An

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论