连续变量的描述统计.ppt_第1页
连续变量的描述统计.ppt_第2页
连续变量的描述统计.ppt_第3页
连续变量的描述统计.ppt_第4页
连续变量的描述统计.ppt_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

SPSS统计分析基础教程,北京理工大学珠海学院,吴浩然,1.连续变量的统计描述概述,2.集中趋势的描述指标,3.离散趋势的描述指标,4.实例操作,Part2:第四章连续变量的描述统计,学习要求,学习要求,4.1连续变量的统计描述概述,统计描述的工具,统计图,统计表,统计描述指标,数据分布的特征,连续变量统计描述的常用指标,均值,众数,中位数,极差,四分位差,方差,统计描述指标,集中趋势,离散趋势,4.2集中趋势的描述指标,一组数据向其中心值靠拢的倾向和程度;测度集中趋势就是寻找数据一般水平的代表值或中心值;,集中趋势测度均值,集中趋势的测度值之一;最常用的测度值;一组数据的均衡点所在;设一组数据为:x1,x2,xn,简单算术平均数的计算公式为:,集中趋势测度中位数,集中趋势的测度值之一;排序后处于中间位置上的值:,Me,集中趋势测度众数,集中趋势的测度值之一;出现次数最多的变量值;,数据类型与集中趋势测度值,4.3离中趋势的描述指标,数据分布的另一个重要特征;离中趋势的各测度值是对数据离散程度所作的描述;反映各变量值远离其中心值的程度从另一个侧面,从令一侧面说明了集中趋势测度值的代表程度;,离中趋势测度极差,离散程度的测度值之一;一组数据的最大值与最小值之差,计算公式为:R=max(xi)-min(xi),离中趋势测度方差,离散程度最常用的测度值;反映了各变量值与均值的平均差异;计算公式:,离中趋势测度四分位差,离中趋势的测度值之一;排序后处于75%和25%位置上的值的差QUQL:,数据类型与离中趋势测度值,4.4数据分布的形状测度,峰度,偏态,数据分布的形状测度偏态,数据分布偏斜程度的测度;计算公式:偏态系数=0为对称分布;偏态系数0为右偏分布;偏态系数0为左偏分布。,算例,【例】已知2007年我国农村居民家庭按纯收入分组的有关数据如下表。试计算偏态系数。,计算过程,计算结果,根据上表数据计算得:,将计算结果代入公式得:,结论:偏态系数为正值,说明农村居民家庭纯收入的分布为右偏分布。,农村居民家庭纯收入数据的直方图,结论:说明农村居民家庭纯收入的分布为右偏分布,即收入较少的家庭占据多数,而收入较高的家庭则占少数。,数据分布的形状测度峰度,数据分布扁平程度的测度;计算公式:峰度系数=3扁平程度适中;峰度系数3为尖峰分布。,4.5连续变量的统计描述实例操作,【例】:某班30名学生统计学期末考试成绩如下,试对该考试进行统计描述分析。117122124129107117130122110118123126127123118112100125117122126122118108112127123119113120,描述统计过程,SPSS软件中用于连续变量统计描述的工具主要有Frequencies、Descriptive、Explore三大过程。,Frequencies过程,频数分布表是描述性统计中最常用的方法之一,Frequencies过程就是专门为产生频数表而设计的。Frequencies过程不仅可以产生详细的频数表,还可以按要求给出百分位点的数值,以及常用的条图、圆图等统计图。,统计学成绩,【例】:某班30名学生统计学期末考试成绩如下,试对该考试进行分析。,主对话框,选择要分析的变量,选定频数表格式,做统计图,定义需计算的统计量,Statistics子对话框,结果输出表格,Frequencies过程的表格输出不仅主要有均值、中位数、众数、标准差等等常用的描述统计指标。,Charts子对话框,条图,正态曲线,直方图,饼图,Charts子对话框主要是定义输出的图形类型:条图、饼图、直方图。,结果输出直方图,Format子对话框,限制分组数,选择两个以上变量作频数表,定义频数表排列顺序,Format子对话框主要是定义输出频数表的格式。,Descriptive过程,它可对变量进行描述性统计分析,计算并列出一系列相应的统计指标,这和其他过程相比并无不同。该过程可将原始数据转换成标准正态分值,并以变量的形式存入数据库供以后分析。,主对话框,选择要分析的变量,Options子对话框,Options子对话框主要是选择需要输出的描述统计指标:均值、中位数、众数、标准差等等。,结果输出表格,Explore过程,可对变量进行更深入详尽的描述性统计分析,主要用于对资料的性质、分布特点等完全不清楚时,故又称为探索性分析。在常用的描述性统计指标的基础上,它增加了有关数据详细分布特征的文字与图形描述,如茎叶图、箱式图等。,主对话框,选入所需分析变量,选定分组变量,选定标签变量,选定结果中包括的内容,Statistics子对话框,所有以上两个过程有的指标,集中趋势,输出5个最大与最小值,百分位数,Plots子对话框,箱式图的绘制方式,茎叶图和直方图,正态图和正态检验,判断离散程度是否相同(比较合适的变量变换方法),结果输出表格,结果输出表格,结果输出-直方图,结果输出箱图,离群点,最小值,最大值,中位数,上四分位数,下四分位数,小结,本章主要阐述SP

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论