《SPSS描述统计》PPT课件.ppt_第1页
《SPSS描述统计》PPT课件.ppt_第2页
《SPSS描述统计》PPT课件.ppt_第3页
《SPSS描述统计》PPT课件.ppt_第4页
《SPSS描述统计》PPT课件.ppt_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据转换(Transform),Compute 计算产生变量,数据转换(Transform),Compute 利用函数进行计算,描述性统计分析,1统计量介绍 2频数分析 3描述统计量 4数据探索 5比率统计分析,SPSS基本统计分析是进行其他统计分析的基础和前提。通过基本统计方法的学习,可以对要分析数据的总体特征有比较准确的把握,从而有助于选择其他更为深入的统计分析方法。 本节课主要介绍如何在SPSS中进行平均数、中位数、众数、方差、百分位、频数、峰度、偏度、探索分析、交叉联列表分析、多选项分析、基本统计报表制作等的操作。,基本统计量介绍,集中趋势 均值(Mean) 中位数(Median) 众数(Mode) 百分数(四分位数Quartiles等) 离散趋势 样本方差(Variance) 样本标准差(Std.deviation) 均值标准差(Stand Error of Mean) 极差(Range),分布形态 偏度(Skewness) 峰度(Kutosis),定义:峰度是描述某变量所有取值分布形态陡缓程度的统计量。这个统计量是与正态分布相比较的量,峰度为0表示其数据分布与正态分布的陡缓程度相同;峰度大于0表示比正态分布高峰要更加陡峭,为尖顶峰;峰度小于0表示比正态分布的高峰要平坦,为平顶峰。具体的计算公式为,定义:偏度也是描述数据分布形态的,它是描述某变量取值分布对称性的统计量。具体的计算公式为,这个统计量是与正态分布相比较的量,偏度为0表示其数据分布形态与正态分布偏度x相同;偏度大于0表示正偏差数值较大,为正偏或右偏,即有一条长尾巴拖在右边;偏度小于0表示负偏差数值大,为负偏或左偏,有一条长尾拖在左边。而偏度的绝对值数值越大表示分布形态的偏斜程度越大。,扁平分布,尖峰分布,峰态,左偏分布,右偏分布,与标准正态分布比较!,偏态,扁平分布,尖峰分布,扁平分布,尖峰分布,左偏分布,扁平分布,尖峰分布,右偏分布,左偏分布,扁平分布,尖峰分布,频数分析,频数分析目的和主要功能 频数就是一个变量在各个变量值上取值的个案数,基本统计分析往往从频数分析开始。通过频数分析能够了解变量取值的状况,对把握数据的分布特征是非常有用的。 例如,调查消费者拥有数码产品的数量,首先分析受访者的总人数、家庭收入情况、受教育程度、性别等,获取样本是否具有总体代表性、抽样是否存在系统偏差等信息。这些可以通过频数分析来实现,经过频数分析可以得到如下结果: (1)频数分布表:该表中包含频数、各频数占总样本数的百分比、有效百分比、累计百分比。 (2)统计图:用统计图形展示变量的取值状况,频数分析中提供的统计图形可以是条形图、饼图或者直方图。,新建数据库或打开已有数据库,Analyze Descriptive statistics Frequencies 使左侧源变量栏进入右侧variable(s)栏 单击statistics 选择统计指标 continue chat 选择要输出的图形 continue format 选择要输出的格式 continue OK,频数分析(frequencies),(1)候选变量框 列出数据文件中所有的变量 (2)Variables框 从候选变量框中选择要分析的变量 移入此框中,可同时选择多个变量, 此时,SPSS就将分别产生多张 频数表或统计图形。 (3)Display frequency tables复选框 此复选框设置是否显示频数表, 系统默认选中,表示要显示频数表。,图4-1,频数分析过程的操作界面,频数分析过程的操作界面,(4)Statistics按钮 单击该按钮会弹出新的对话框, 该对话框主要用于确定将要在 输出结果中出现的统计量, 选中统计量前的复选框表示 输出该统计量。 (5)Charts按钮 用于确定将输出的图形类型 和图形取值。 (6)Format按钮 定义输出频数表的格式,图4-1,频数分析,例:测量100名健康成人的血清蛋白总含量,形成数据serum(克/升),使用频数分析了解这一数据的统计特征。,SPSS的操作步骤,1、菜单中点分析/描述统计/频率,进入频率对话框,频数分析,SPSS的操作步骤,2、将变量选入变量窗口,再点击统计量,进行设置,完成后点继续返回,SPSS的操作步骤,2、在频率主对话框中分别进入图表和格式进行设置,完成后点继续返回,最后点确定,SPSS的输出结果,该教学案例数据解析,均值(平均值、平均数)表示的是某变量所有取值的集中趋势或平均水平。例如,学生某门学科的平均成绩、公司员工的平均收入、某班级学生的平均身高等。 计算公式如下。,总体平均数:若一组数据X1,X2,XN,代表一个大小为N的有限总体,则其总体平均数为,样本平均数:若一组数据x1,x2,xn,代表一个大小为n的有限样本,则其样本平均数为,中值是在一组数据中居于中间的数(特别注意的地方是:这组数据之前已经经过升序排列!),即在这组数据中,有一半的数据比它大,有一半的数据比它小。如果这组数据包含偶数个数字,中值是位于中间的两个数的平均值。 10 20 40 50 70 10 20 30 40 50 60,百分位数分析:比如,假设某个考生在入学考试中的语文部分的原始分数为54分。相对于参加同一考试的其他学生来说,他的成绩如何并不容易知道。但是如果原始分数54分恰好对应的是第70百分位数,我们就能知道大约70的学生的考分比他低,而约30的学生考分比他高。,众数(Mode)统计学名词,在统计分布上具有明显集中趋势点的数值,代表数据的一般水平(众数可以不存在或多于一个)。 修正定义:是一组数据中出现次数最多的数值,叫众数,有时众数在一组数中有好几个。用M表示。 理性理解:简单的说,就是一组数据中占比例最多的那个数。 /view/170875.htm,定义:全距也称为极差,是数据的最大值与最小值之间的绝对差。在相同样本容量情况下的两组数据,全距大的一组数据要比全距小的一组数据更为分散。 计算公式:最大值最小值。,4.3 描述性分析,描述性分析主要用于输出变量的各类描述性统计量的值,通过上一节的学习可知,频数分析同样可以做到,都是以计算数值型单变量的统计量为主。描述性统计分析没有图形功能,也不能生成频数表,但描述性分析可以将原始数据转换成标准正态评分值,并以变量形式存入数据文件中,以便后续分析时应用。,变量标准化:将原始数据转化成标准常态评分值,采用以下公式:,其中,为变量的第i个观测值,,为变量均值,为变量标准差。,在多元统计分析中,对均值差异较大的变量,采用变量标准化后的数据进行分析,可以消除均值差异带来的影响。,在处理试验数据时,因素在不同水平下的均值一般情况下都有差异,就是在同一水平下进行多次不同的试验,由于随机误差的存在,试验数据波动也不小.,描述统计量,例:调查记录了130名正常男性血液中的红细胞数(RBC,万/mm),用描述统计量查看该数据的统计特征。,SPSS的操作步骤,1、菜单中点分析/描述统计/描述,进入描述对话框,2、将变量算入变量窗口,进入选项对话框进行设置,完成后点继续,并确定,SPSS的输出结果,数据编辑窗口中,在原变量右侧多了一列由原变量标准化产生的“Z+原变量名” 的列,3 数据探索,数据中隐含的统计规律尚不清楚时,可以对数据进行考察和探索,也可找出异常值。 例;调查记录了97名幼儿的编号、性别、月龄、体重、身高、坐高、胸围、头围、左眼视力、右眼视力、年龄、血检数据。要求对身高进行探索分析。,SPSS的操作步骤,1、菜单中点分析/描述统计/探索,进入探索对话框 2、分别将身高和性别变量选入因变量和因子列表,打开统计量窗口进行设置,完成后点继续返回,SPSS的操作步骤,3、分别打开绘制和选项对话框,对所输出图形以及缺失值处理进行设置,完成后点继续返回,并点确定,SPSS的输出结果,SPSS的输出结果,SPSS的输出结果,箱线图(Boxplot)也称箱须图(Box-whisker Plot),是利用数据中的五个统计量:最小值、第一四分位数、中位数、第三四分位数与最大值来描述数据的一种方法,它也可以粗略地看出数据是否具有有对称性,分布的分散程度等信息,特别可以用于对几个样本的比较,SPSS的输出结果,茎叶分析,茎叶图理解,茎叶图利用原始数据以图形的形式表现了分布的形状,图中包括频数(Frequency)、茎(Stem)和叶(Leaf)3部分 ,右图中的下方说明中给出了本图的茎宽为10,每片叶子代表一个数据。对应图中的第一行数据,从左到右依次为:频数为6,茎为0,有6片叶子。也就是指第一组里包含6个数据,其近似值为:6、6、7、7、7、7,图4-10 出生率茎叶图,出生率 Stem-and-Leaf Plot Frequency Stem & Leaf 6.00 0 . 667777 5.00 0 . 99999 7.00 1 . 0011111 7.00 1 . 2222333 5.00 1 . 44555 1.00 1 . 7 Stem width: 10.00 Each leaf: 1 case(s),4 比率统计,将两个连续型变量之比的指标进行描述统计分析,反映对比关系的一致性。 例:仍用上节中的97名幼儿的数据,按年龄变量分组,对坐高和身高进行比率统计分析。,SPSS的操作步骤,1、菜单中点分析/描述统计/比率,进入比率对话框 2、分别将坐高、身高和年龄选入分子、分母,和组变量窗口,打开统计量窗口进行设置,完成后点继续返回,SPSS的输出结果,QQ图分析数据,QQ图

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论