下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、2020/7/22,第7章,基本统计分析,2020/7/22,本章内容,SPSS 统计分析功能概述 SPSS 数值分析过程 基本统计分析概述 7.1 一维频数分布表Frequencies 7.2 描述统计分析过程Descriptives 7.3 探索分析 Explore 7.4 多维频数分布表(交叉表,列联表) 7.5 OLAP报告摘要表OLAP Cubes 补充: Reports的其他分析过程 练习题,2020/7/22,SPSS 统计分析功能概述,有了数据,可以利用SPSS的各种分析方法进行分析,但选择何种统计分析方法,即调用哪个统计分析过程,是得到正确分析结果的关键。 SPSS有数字分析
2、和作图分析两类方法,2020/7/22,SPSS 数值分析过程,SPSS 数值统计分析过程均在Analyze菜单中,包括: a、基本统计分析 :Reports, Descriptive Statistics b、均值比较与检验 :Compare Means d、方差分析:ANOVA Models b、相关分析:Correlate e、回归分析 :Regression f、聚类与判别:Classify g、因子分析:Data Reduction h、非参数检验:Nonparametric Tests 等等,2020/7/22,基本统计分析概述,基本统计分析是进行其他更深入的统计分析的前提,通过基
3、本统计分析,用户可以对分析数据的总体特征有比较准确的把握,从而选择更为深入的分析方法对分析对象进行研究。 在SPSS的Analyze菜单中包括了一系列统计分析过程。其中Reports和Descriptive Statistics命令项中包括的功能是对单变量的描述统计分析。 Descriptive Statistics包括的统计功能有: Frequencies:频数分析 Descriptives:描述统计量分析 Explore:探索分析 Crosstabs:多维频数分布交叉表(列联表) Reports包括的统计功能有: OLAP Cubes:OLAP报告摘要表 Case Summaries:观测
4、量列表 Report Summaries in Row:行形式输出报告 Report Summaries in Columns:列形式输出报告,2020/7/22,7.1 一维频数分布表Frequencies,1、了解变量的取值分布情况对整体把握数据的特征是非常有利的。 2、求分类(定类、定序)变量的频数和作Bar图 3、求定距变量(连续变量)的分布情况和作直方图Histogram 比Descriptives 多百分位,在Statistics选项(见Excel第三章 数据描述与分析)和 Format选项) 4、对连续变量进行分组(recode)后再求频数,如老中青(35, 60)的比例,文化程
5、度(中学、大学及以上)的人数及比例等 5、Analyze + Descriptive Statistics + Frequencies 6、例子p105-106:对1991年美国社会调查情况数据 (data07-01)进行统计处理。分析不同年龄(age变量)和最高受教育年限(educ变量)各水平的频数分布情况。,2020/7/22,7.2 描述统计分析过程Descriptives,1、功能:了解数据的基本统计特征和对指定的变量值进行标准化处理(标准化后的新变量的均值为0,标准差为1,目的是为了消除各变量间变量值在数量级上的差异,从而增强数据间的可比性)。 2、描述统计分析过程通过平均值(Mea
6、n)、 算术和(Sum) 、标准差(Std Dev) 、最大值(Maximum) 、最小值(Minimum) 、方差(Variance)、范围(Range)、平均数标准误(S.E. Mean)等统计量对变量进行描述。 3、一般是求定距变量的描述统计量,从中分析差异性(max,min) 4、 Analyze +Descriptive Statistics+Descriptives 5、例子:1985年美国联邦调查局对50个州各种犯罪情况调查的数据(data07-02)进行描述统计分析 50个州总的情况 不同地区region的情况(2种方法:Split File+ Descriptives, 第8
7、章的Means),2020/7/22,7.3 探索分析 Explore,1. 考察数据的奇异性和分布特征 奇异性:数据的过大或过小(找出、分析原因、是否剔除) 分布特征:数据是否来自正态分布总体 考察方法:统计量和统计图形(箱图、茎叶图(频数、茎和叶)、方差齐次性检验Spread vs level图) 2. 一般是考察定距变量 3. Analyze + Descriptive Statistics + Explore 因(分析)变量(Dependent List):定距变量 分组变量(Factor List):分类变量 标识变量(Label Cases by):为方便查找输出观测量如id 4.
8、例子p112:考察银行数据(data07-03)中的不同性别的工资情况,2020/7/22,7.4 多维频数分布表(交叉表,列联表),二维或多维交叉频数表(列联表),分析事物(变量)之间的相互影响和关系 Analyze + Descriptive Statistics + Crosstabs 行变量(Row):需分类变量 列变量(Column):需分类变量 分层变量(Layer):条件(若有,需分类变量) Statistics选项: Chi-square复选项及其四种检验结果 Correlations复选项:相关系数 例子: 银行数据(data07-03)中:如求男女的民族分布情况,可得到白种
9、人多,男性多的结论(注意cell选项,一般选频数和百分比),如求每一工种的男女分布情况(人数) P118:1991年美国社会调查情况数据(data07-01) :男女对生活的认识。,2020/7/22,7.5 OLAP报告摘要表OLAP Cubes,OLAP(Online Analytical Processing)在线分析处理过程以分组变量为基础,计算各组的总计、均值和其他统计量。而输出的报告摘要则是指每个组中所包含的各种变量的统计信息。 Analyze + Reports + OLAP Cubes Summary Variables:要进行统计汇总的数值型变量 Grouping Varia
10、bles:分组变量(分类变量),注意:此分组变量在实际的运算过程中并不发挥分组的功能,而是确定进入统计的观测量的范围。如选择数学成绩作为摘要分析变量,而性别作为分组变量,要计算数学平均成绩,则结果中显示的并不是男生的数学平均成绩和女生的数学平均成绩,而是所有男女生观测量的数学成绩的总平均值。即所有性别有值(非Missing Value)的Case,才参与分析计算 Statistics选项:Sum和、Number of Cases观测量数目、Mean均值、Median中位数、Maximum最大等等 例子p122:1991年美国社会调查情况数据(data07-01) :对不同种族race的孩子ch
11、ilds和教育educ情况进行报告摘要分析。,2020/7/22,补充: Reports的其他分析过程,Reports的其他分析过程有: Case Summaries:观测值摘要分析 Report Summaries in Row:行形式输出报告 Report Summaries in Columns:列形式输出报告,2020/7/22,Case Summaries:观测量列表,察看或打印所需要的变量值 Analyze + Reports + Case Summaries Variables:要显示的变量名 Grouping Variables:分组变量(分类变量) 结果显示:多行或单行,20
12、20/7/22,行形式输出报告,Summary 按行,如:sum、mean、max、min、count、std dev、 variance、percentage(above,below,inside)等 菜单: Analyze + Reports + Report Summaries in Rows Data Column:报告变量 Break Column:分组变量及其Summary(多个交叉) Report:可对全部数据进行描述统计(Grand Total) Display Cases:是否显示每一个观测量,2020/7/22,列形式输出报告,Summary 按列,如: sum、mean、max、min、count、std dev、 variance、percentage(above,below,inside)等 菜单: Analyze + Reports + Report Summaries in Columns Data Column:报告变量 一一对应的Summary I
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 生物材料对退行性关节炎症细胞因子的影响-洞察与解读
- 二维材料防火性能调控-洞察与解读
- 胶囊载药量与患者依从性的相关性研究-洞察与解读
- 基于纳米材料的自愈织物研究-洞察与解读
- 温度和湿度对油墨印刷色彩稳定性的影响研究-洞察与解读
- 2026年河北省黄骅市高一数学上册期末考试模拟考试卷及参考答案(综合卷)
- 2026年山东省栖霞市高一数学上册期末考试模拟检测卷附参考答案(模拟题)
- 2026年江苏省海门市高一数学上册期末考试模拟检测卷附参考答案【培优B卷】
- 2025年高校成果转化管理岗笔试题(附答案)
- 2025年高级审计师实务真题及答案解析
- YDT 5102-2024 通信线路工程技术规范
- 化工和危险化学品生产经营单位二十条重大隐患判定标准释义(中化协)
- 教师读书分享《给教师的建议》课件
- 摩托车分类与类型
- 2023年湖北省高中学业水平合格性考试地理试卷真题
- 菌毒种管理流程图
- 糖尿病酮症酸中毒的护理应急预案及处理流程
- 前处理方式对新冠病毒痰液及粪便样本核酸检测的影响分析
- 华为软件开发行为规范方案
- 铸造工艺及工装设计
- GB/T 12642-2013工业机器人性能规范及其试验方法
评论
0/150
提交评论