第四章 描述性统计分析_第1页
第四章 描述性统计分析_第2页
第四章 描述性统计分析_第3页
第四章 描述性统计分析_第4页
第四章 描述性统计分析_第5页
已阅读5页,还剩46页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1,第四章,描述性统计分析,2,主要内容,4.1 基本描述性统计量的定义及计算 4.2 频数分析 4.3 描述性分析 4.4 探索性分析 4.5 交叉列联表分析 4.6 多选项分析,3,4.1 基本描述性统计量的定义及计算,1描述集中趋势的统计量 均值(Mean) 众数(Mode) 中位数(Median) 总和(Sum) 百分位数(Percentile Value),4,4.1 基本描述性统计量的定义及计算,2描述离散趋势的统计量 样本方差(Variance) 样本标准差(Std. deviation) 极差(Range) 均值标准误差(Standard Error of Mean),5,4.

2、1 基本描述性统计量的定义及计算,3描述总体分布形态的统计量 偏度(Skewness) 峰度(Kurtosis),6,主要内容,4.1 基本描述性统计量的定义及计算 4.2 频数分析 4.3 描述性分析 4.4 探索性分析 4.5 交叉列联表分析 4.6 多选项分析,7,4.2 频数分析,1频数分析目的和主要功能 频数就是一个变量在各个变量值上取值的个案数,基本统计分析往往从频数分析开始。通过频数分析能够了解变量取值的状况,对把握数据的分布特征是非常有用的。 例如,调查消费者拥有数码产品的数量,首先分析受访者的总人数、家庭收入情况、受教育程度、性别等,获取样本是否具有总体代表性、抽样是否存在系

3、统偏差等信息。这些可以通过频数分析来实现,经过频数分析可以得到如下结果: (1)频数分布表:该表中包含频数、各频数占总样本数的百分比、有效百分比、累计百分比。 (2)统计图:用统计图形展示变量的取值状况,频数分析中提供的统计图形可以是条形图、饼图或者直方图。,8,4.2 频数分析,2频数分析过程的操作界面 (1)候选变量框 列出数据文件中所有的变量 (2)Variables框 从候选变量框中选择要分析的变量 移入此框中,可同时选择多个变量, 此时,SPSS就将分别产生多张 频数表或统计图形。 (3)Display frequency tables复选框 此复选框设置是否显示频数表, 系统默认选

4、中,表示要显示频数表。,图4-1,9,4.2 频数分析,2频数分析过程的操作界面 (4)Statistics按钮 单击该按钮会弹出新的对话框, 该对话框主要用于确定将要在 输出结果中出现的统计量, 选中统计量前的复选框表示 输出该统计量。 (5)Charts按钮 用于确定将输出的图形类型 和图形取值。 (6)Format按钮 定义输出频数表的格式,图4-1,10,4.2 频数分析,3实例分析 【例4-1】以下是调查问卷中针对被调查人设置的两个问题: 1、您的家庭月收入大约是:(请包括所有工资、奖金、津贴等在内,以人民币为单位)单选 500-1000.11000-199922000-299933

5、000-39994 4000-499955000-599966000-699977000-79998 8000-899999000-99991010000及以上11 2、 您的教育程度:(指您受过的最高或正在接受的教育程度)单选 没有受过正式教育/小学.1初中2高中/中专/技校3 大专/大学非本科/高职高专4大学本科5研究生及以上.6 从问卷中收集到的数据如表4.1所示,图4-1,11,4.2 频数分析,3实例分析 试对收集到的数据进行频数分析,表4.1,12,4.2 频数分析,3实例分析 第1步 数据组织; 根据表4.1生成SPSS数据文件,建2个变量:“收入”、“教育”, 数据文件的格式同

6、表4.1类似。 第2步 打开主对话框; 选择Analyze Descriptive Statistics Frequencies,打开同图4-1一样的频数分析主对话框。 第3步 确定要输出的统计量; 单击Statistics按钮,在Statistics子对话框中选择Mode(众数)统计量。 第4步 确定要输出的统计图形; 单击Charts按钮,在Charts子对话框中选择Histograms (直方图) 运行结果及分析。,13,4.2 频数分析,3实例分析 运行结果及分析。,图4-2 变量“教育”的直方图,表4.2 变量“教育”的频数分布表,14,主要内容,4.1 基本描述性统计量的定义及计算

7、 4.2 频数分析 4.3 描述性分析 4.4 探索性分析 4.5 交叉列联表分析 4.6 多选项分析,15,4.3 描述性分析,1描述性分析目的和主要功能 描述性分析主要用于输出变量的各类描述性统计量的值,通过上一节的学习可知,频数分析同样可以做到,都是以计算数值型单变量的统计量为主。描述性统计分析没有图形功能,也不能生成频数表,但描述性分析可以将原始数据转换成标准正态评分值,并以变量形式存入数据文件中,以便后续分析时应用。,16,4.3 描述性分析,2描述性分析的操作界面,列出数据文件中的变量,从中选择要作描述性分析的变量,将需作描述性分析的变量选入此框中,可同时选择多个变量,此时,SPS

8、S就将分别产生多个变量的描述性分析结果,点击Option按钮设置需计算的描述性统计量。,图4-3,17,4.3 描述性分析,3实例分析 书P100【例4-2】 选择“身高”变量作描述性分析,选定要计算的统计量后,运算得到表4.3所示的结果 表4.3,18,主要内容,4.1 基本描述性统计量的定义及计算 4.2 频数分析 4.3 描述性分析 4.4 探索性分析 4.5 交叉列联表分析 4.6 多选项分析,19,4.4 探索性分析,1探索性分析目的和主要功能 与前面介绍的两种分析方法相比,探索性分析更加强大,它是对数据的探索和考察,可以对变量进行更为深入详尽的统计分析。在进行统计分析前,通常需要寻

9、求和确定适合所研究的问题的统计方法, SPSS提供的探索性分析是解决此类问题的有效办法。 探索性分析提供了很多关于数据的概括分析和图表直观描述的方法,不仅对个案数据有效,而且还可以针对分组个案。在输出常用描述性统计量的基础之上,探索性分析增加了有关数据详细分布特征的文字与图形表述,如茎叶图、箱图等,显得更加详细、完整,还可以以方差齐性为目的的变量交换提供线索,有助于用户制定更进一步分析的方案。,20,4.4 探索性分析,2探索性分析的操作界面,(1)Depend List框 选择待分析的变量,可以同时选择多个变量。注意:选择的变量必须是数值型变量,(2)Factor List框 选择分组变量,

10、根据该变量的取值不同,分组分析Dependlist框中的变量。可以不选,也可以多选。,(3)statistics按钮:设置输出的统计量; Plots按钮:设置输出的图形; Option按钮:设置缺失值的处理。,图4-4,21,4.4 探索性分析,3实例分析 【例4-3】表4.4是2007年各地区人口出生率和死亡率的统计数据,试对其作探索性分析并做是否服从正态分布的检验。 表4.4各地区人口自然变动情况,22,4.4 探索性分析,3实例分析 第1步 数据组织; 根据表4.4生成SPSS数据文件,建2个变量:“出生率”、“死亡率”, 数据文件的格式 第2步 打开主对话框; 选择Analyze De

11、scriptive Statistics Explore,选择变量“出生率”、“死亡率”移入“Dependent List”文本框中。,23,4.4 探索性分析,3实例分析 第3步 确定探索性分析的描述统计量; 单击Statistics按钮,在Statistics子对话框(图4-5)中选择Descriptives 复选框、M-estimators复选框,单击Continue返回主对话框。,图4-5,24,4.4 探索性分析,3实例分析 第4步 确定探索性分析输出的统计图形; 单击Plots按钮,在如图4-6的Plots子对话框中选择“Dependents together”(不同因变量显示在一

12、个箱图中)、“Stem-and-leaf”(茎叶图)、Normality Plots with tests(正态分布检测统计图)。单击Continue返回主对话框。,图4-6,25,4.4 探索性分析,3实例分析 结果分析,表4.5 描述性统计量,26,4.4 探索性分析,3实例分析 结果分析,表4.6 M估计值,27,4.4 探索性分析,3实例分析 结果分析 分别利用Kolmogorov-Smimov检验和Shapiro-Wilk检验两种方法来确定变量是否服从正态分布。其中,Statistic表示检验统计量的值,df代表自由度,Sig.表示显著性水平。一般来说,Sig.0.05则代表接受零假

13、设,即接受变量服从正态分布的假设。本例中,两个变量的两种方法的Sig.值均大于0.05,因此两个变量均服从正态分布。,表4.7 正态检验结果,28,4.4 探索性分析,3实例分析 结果分析,图4-7 箱图,29,4.4 探索性分析,3实例分析 结果分析,图4-8 出生率QQ趋势图,Q-Q图可以用来检验数据是否服从某种分布,在Q-Q图中,检验数据是否较好地服从给定分布的标准有两个:看Q-Q图上的数据点与直线的重合度;Q-Q趋势图上的点是否关于直线Y=0在较小的范围内上下波动。,30,4.4 探索性分析,3实例分析 结果分析,图4-9 出生率QQ图,31,4.4 探索性分析,3实例分析 结果分析

14、茎叶图利用原始数据以图形的形式表现了分布的形状,图中包括频数(Frequency)、茎(Stem)和叶(Leaf)3部分 ,右图中的下方说明中给出了本图的茎宽为10,每片叶子代表一个数据。对应图中的第一行数据,从左到右依次为:频数为6,茎为0,有6片叶子。也就是指第一组里包含6个数据,其近似值为:6、6、7、7、7、7,图4-10 出生率茎叶图,出生率Stem-and-LeafPlot FrequencyStem (2)利用频数分析或者列联表分组下的频数分析方法进行分析。,45,4.6 多选项分析,2多选项问题的分解方法 (1)多选项二分法(Multiple Dichotomies Metho

15、d) ; (2)多选项分类法(Multiple Category Method),46,4.6 多选项分析,3实例分析 【例4-5】对50个消费者进行调查,拥有的数码产品的种类,有如下的选项: (1)数码相机 (2)数码摄像机 (3)MP3 (4)DVD机 可多选,试按性别统计拥有各种数码产品的数量。 第1步 分解多选项问题,定义多选项变量集;,47,4.6 多选项分析,3实例分析 第1步 分解多选项问题,定义多选项变量集; (1)分解多选项 按照二分法分解多选项问题,表4.9为此多选项问题的二分法记录表,其中性别1为男性,2为女性,其他数据中的1表示拥有该产品,0表示没有。,表4.9,48,

16、4.6 多选项分析,3实例分析 (2)定义多选项变量集,选择Analyze Multiple Response Define Sets ,弹出图4-14所示的对话框,在此对话框中定义多选项变量集。 从最左边的列表框中选择四种产品对应的变量,添加到Variables in Set文本框中,选择默认的变量分解方法即二分法,并将Dichotomies Counted value设为1,变量集命名为“dp”,变量集标签为“数码产品”。做好以上准备后,Add按钮被激活,单击该按钮,将定义好的数据集添加到Multiple Response Sets列表中,在该列表中出现名为“$dp”的多变量数据集名称。,图4-14,49,4.6 多选项分析,3实例分析 第2步 进行多选项交叉分组下的频数分析 选择Analyze Multiple Re

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论