描述性统计分析课件_第1页
描述性统计分析课件_第2页
描述性统计分析课件_第3页
描述性统计分析课件_第4页
描述性统计分析课件_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

描述性统计分析,【学习提要】对数据进行统计描述是统计分析中最基本的工作。对于整理好的数据,通过描述性统计分析,可以挖掘出很多统计量的特征。SPSS软件中,描述性统计分析功能主要集中在“DescriptiveStatistics”菜单。具体包括5个过程:Frequencies过程、Descriptives过程、Explore过程、Crosstabs过程和Ratio过程。,4.1描述统计量常见的描述性统计量主要包括以下3类:描述变量集中趋势的统计量、描述变量分布情况的统计量、描述变量离散程度的统计量。通常,综合这三类统计量就能够极为准确和清晰的把握数据的分布特点。,描述变量集中趋势的统计量:均值Mean:表示变量值的平均水平中位数Median:一组数据中处于最中间位置的数众数Mode:一组数据中出现次数最多的数和Sum:某变量的所有变量值之和,描述变量分布情况的统计量偏度Skewness:描述变量分布的对称程度和方向。偏度为0表示对称,大于0表示右偏,小于0表示左偏峰度Kurtosis:描述变量分布的陡峭程度。峰度为0表示陡峭程度和正态分布相同,大于0表示比正态分布陡峭,小于0表示比正态分布平缓,描述变量离散程度的统计量标准差Std.deviation:描述变量关于均值的偏离程度方差Variance:标准差的平方极大值Maximum:某变量所有取值的最大值极小值Minimum:某变量所有取值的最小值全距Range:某变量极大值与极小值之差均值的标准误差S.E.mean:均值的标准误差,在描述性统计分析中,Descriptives过程是连续资料统计描述应用最多的一个过程,他可对变量进行描述性统计分析,计算并列出一系列相应的统计指标。,【界面介绍】选择菜单【Analyze】【DescriptiveStatistics】【Descriptives】,进入基本描述性统计量的分析界面,出现如图所示的窗口。,在Variables(s)框定义要分析的数值型变量,可同时选择多个变量。若需将原始数据的标准正态评分存为新变量,则选择Savestandardizedvaluesasvariables选项。单击【Options】按钮指定计算哪些基本描述性统计量,出现如图所示的窗口。,【实验案例】例4-1测量20台液晶显示器的重量,数据见4-1-1.sav,对其进行描述性统计分析。,4.2频数分布表分析频数分析统计的是每一组中观测点的个数,而不是考虑其实际取值。通过频数分析能够了解变量取值的情况,对于把握数据的分布特征非常有用。当某变量的自然取值是局限在有限的几个数值中,则频数分析就是统计该变量在各个取值点的个数分布情况;如果某变量的取值是在某范围内的离散值,则需要将其取值区域划分为几个取值区间,频数分析就是统计该变量在各个取值区间观测点个数的分布情况。,【界面介绍】选择菜单【Analyze】【DescriptiveStatistics】【Frequencies】,进入频数分析的分析界面,出现如图所示的窗口。将若干频数分析变量选择到Variables(s)框中;选择Displayfrequencytables复项表示在结果中输出频数表。,单击【Statistics】按钮后弹出Statistics子对话框。,单击【Charts】按钮后弹出Charts子对话框。,单击【Format】按钮,弹出Format子对话框。该对话框用于定义输出频数表的格式,在实际中,我们一般采用默认格式。,例4-2已知有某地110名10岁女生身高数据,数据见文件4-2-1.sav,请编制频数表。,4.3探索性分析Explore过程可对变量进行更为深入详尽的描述性统计分析,主要用于对资料的性质、分布特点等完全不清楚时,故又称之为探索性分析。它在一般描述性统计指标的基础上,增加有关数据其他特征的文字与图形描述,如茎叶图、箱图等,显得更加详细、全面,有助于用户制定继续分析的方案。,【界面介绍】选择菜单【Analyze】【DescriptiveStatistics】【Explore】,进入探索性分析界面,出现如图所示的窗口。,(2)单击【Statistics】按钮,弹出Statistics子对话框,如图所示。该项用于选择所需要的描述统计量。,(3)单击【Plots】按钮,弹出Plots子对话框。该项用于选择所需要的统计图。,(4)单击【Options】按钮,在弹出的子对话框中选择对缺失值的处理方式,可以是不分析有任一缺失值的记录(Excludecaseslistwise)、不分析计算某统计量时有缺失值的记录(Excludecasespairwise),或报告缺失值(Reportvalues)。,例4-3已知有某地城市和农村各55名10岁女生身高数据,数据见文件4-2-1.sav,请利用Explore过程分组分析。,4.4列联表分析通过频数分析能够掌握单个变量的数据分布情况。在实际分析过程中,不仅要了解单变量的分布特征,还要分析多个变量不同取值下的分布,掌握多变量的联合分布特征,进而分析变量之间的相互影响和关系。当问题涉及多个变量时,采用单纯的频数分析方法显然不够,这时,我们需要借助交叉分组下的频数分析,又称为列联表分析。,列联表分析的主要任务有两个:第一,根据收集到的样本数据,产生二维或多维交叉列联表。交叉列联表是两个或多个以上变量交叉分组后形成的频数分布表。第二,在交叉列联表的基础上,分析两两变量之间是否具有独立性或一定的相关性。对交叉列联表中的行变量和列变量之间关系进行分析是列联表分析的第二个任务。在列联表基础上做进一步分析,可以得到行变量和列变量之间是否有联系、联系的紧密程度如何等更深层次的信息。,【界面介绍】选择菜单【Analyze】【DescriptiveStatistics】【Crosstabs】,进入列联表分析界面。,【实验案例】例4-4调查339名45岁以上吸烟习惯与患肺癌的关系,数据见4-4-1.sav。试问吸烟者与不吸烟者患肺癌的概率是否有所不同。,4.5相对比描述相对比描述用于对两变量间变量值对比变化的描述分析,适用于定距型变量。在实际问题中,研究者有时除了希望了解变量自身的统计特征外,还希望得到两个变量相对比之间的统计描述。通常,这可以通过对两个变量做除法形成一个新变量,然后分析新变量的统计特征来得到(如均值、中位数、标准差、全距等)。SPSS的Ratio过程除了能够完成上述分析外,还提供了其他相对比描述指标,大致属于集中趋势描述指标(CentralTendency)和离散程度描述指标(Dispersion)的范畴。,指标的具体含义如下:加权比例均值(Weightedmean)加权比例均值属于集中趋势描述指标,是两变量均值的比。平均绝对离差(AAD,AverageAbsoluteDispersion)AAD用于对比率变量离散程度的描述。式中,是比率数,M是比率变量的中位数。,离散系数(COD,CoefficientofDispersion)COD也用于对比率变量离散程度的描述,其数学定义为:相关价格微分(PRD,Price-relatedDifferential)PRD也用于对比率变量离散程度的描述,是比率均值与加权比率均值的比。,变异系数(COV,CoefficientofVariation)COV用于对比率变量离散程度的描述,分为基于均值的变异系数(MeancenteredCOV)和基于中位数的变异系数(MediancenteredCOV)。基于均值的变异系数是通常意义下的变异系数,是标准差除以均值;基于中位数的变异系数数学定义为:,【界面介绍】选择菜单【Analyze】【DescriptiveStatistics】【Ratio】,进入比率分析界面,出现所示的窗口。,将相对比中作分子的变量选入Numerator框中。将相对比中作分母的变量选入Denominator框中。将分组变量选入GroupVariable框中。选择Sortbygroupvariables选项表示选择分组变量的排序方式。选择Displayresult选项表示显示结果。选择Sa

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论