版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、,SPSS统计分析从基础到实践(第2版)联系Email:,第2讲描述性统计分析,统计分析方法必须明确三点:干什么的?怎么用,哪里才能用?结果是什么意思?,2.1描述性统计分析概述,描述集中趋势的统计量,描述离散程度统计量,描述变量分布情况统计量,【DescriptiveStatistics】子菜单Frequencies:产生变量值的频数分布表,并可计算常见描述性统计量和绘制相对应的统计图。Descriptives:计算一般的描述性统计量。Explore:探索性分析,使用户能够从大量的分析结果之中挖掘到所需要的统计信息。,Crosstabs:对分类变量进行统计推断,包括卡方检验、确切概率等,是S
2、PSS重要的过程。Ratio:计算两个变量相对比的统计量特征。P-PPlots:绘制P-P图,检验数据服从的分布情况。Q-QPlots:绘制Q-Q图,检验数据服从的分布情况,2.2频数分析Frequencies,频数分析简介频数分析表是描述性统计中最常用的方法之一,它主要包括以下几点功能:1、产生详细的频数表2、按要求给出某个分位点3、绘制常用的条图、饼图等统计图适用范围:更适用于对分类变量以及不服从正态分布的连续性变量进行描述。,学生身高频数表:已知有某地120名12岁男童身高数据,编制其传统的简易频数表。执行【Analyze】/【DescriptiveStatistics】/【Freque
3、ncies】命令,弹出如下所示对话框,结果解读1、频数表,2、描述性统计量3、直方图问题:以上3个结果分别用来说明什么问题?,2.3基础统计分析Descriptive,Descriptive简介Descriptive过程是连续资料统计描述应用最多的一个过程。对变量进行描述性统计分析,计算并列出一系列相应的统计指标。这与其它过程相比并无不同。这个过程有一个特殊的功能,可将原始数据转换成标准正态分布评分值,并以变量形势存入数据库供以后分析。,学生身高频数表执行【Analyze】/【DescriptiveStatistics】/【Explore】命令,弹出如下对话框,结果解读1、描述性分析表,2、标
4、准正态分布变化Z变换(标准正态变换):其中表变量的均值,S表变量的标准差。如果选择该项,则数据文件中将自动生成一列名为“Z原变量名”的新变量。,变换前变换后问题:标准正态分布变化后的数据有什么作用?,2.4探索性分析Explore,与前面介绍的两个过程相比,【Explore】过程更加强大。它除了可以计算常见描述性统计量之外,还可以给出一些简单的检验结果和图形,有助于用户进一步地分析数据。适用范围:对资料的性质,分布特点等完全不清楚的时候,补充:假设检验,定义:假设检验是数理统计学中根据一定假设条件由样本推断总体的一种方法。它是根据原资料作出一个总体指标是否等于某一个数值,某一随机变量是否服从某
5、种概率分布的假设,然后利用样本资料采用一定的统计方法计算出有关检验的统计量,依据一定的概率原则,以较小的风险来判断估计数值与总体数值(或者估计分布与实际分布)是否存在显著差异,是否应当接受原假设选择的一种检验方法。,基本思想:概率反证法(1)为了检验一个零假设(即虚拟假设)是否成立,先假定它是成立的,然后看接受这个假设之后,是否会导致不合理结果。如果结果是合理的,就接受它;如不合理,则否定原假设。(2)所谓导致不合理结果,就是看是否在一次观察中,出现小概率事件。通常把出现小概率事件的概率记为0.01或者0.05,即显著性水平。问题:能否通过直观的描述假设检验的基本思想?,一般步骤:(1)根据问
6、题的需要对所研究的总体作某种假设,记作H0(2)选取合适的统计量,这个统计量的选取要使得在假设H0成立时,其分布为已知。(3)由实测的样本,计算出统计量的值。(4)计算并根据预先给定的显著性水平进行检验,作出拒绝或接受假设H0的判断。,学生身高的探索性分析执行【Analyze】/【DescriptiveStatistics】/【Explore】命令,弹出如图所示对话框,结果解读1、描述性统计分析表其中,5%TrimmedMean:去掉5极端数之后的均值。,2、M均值估计检验异常数据。,3、分位点表其中TukeysHinges表示的是绘制箱图时所用的分位点数据,它的计算方法和一般的百分位数略有不
7、同。,4、极值表5、正态性检验,6、方差齐次性检验,7、茎叶图茎叶图包括频数(Frequency)、茎(Stem)和叶(Leaf)3部分。,8、QQ图和QQ去势图问题:各种图形是用来做什么的?正态性检验和方差齐次性检验方法的作用分别是什么?,2.5列联表分析Crosstabs,1、四格卡方检验的基本思想在分类资料统计分析中我们常会遇到这样的资料,如两组大白鼠在不同致癌剂作用下的发癌率如下表,问两组发癌率有无差别?-处理发癌数未发癌数合计发癌率%-甲组52197173.24乙组3934292.86-合计912211380.33-卡方检验的统计量是卡方值,它是每个格子实际频数A与理论频数T差值平方
8、与理论频数之比的累计和。每个格子中的理论频数T是在假定两组的发癌率相等(均等于两组合计的发癌率)的情况下计算出来的,如第一行第一列的理论频数为71*91/113=57.18,故卡方值越大,说明实际频数与理论频数的差别越明显,两组发癌率不同的可能性越大。,2、卡方检验方法的适用条件,吸烟习惯与患病率的关系调查339名50岁以上吸烟习惯与患慢性气管炎病的关系,如上表所示。试问吸烟者与不吸烟者慢性气管炎患病率是否有所不同。数据的预处理:WEIGHTCASE,执行【Analyze】/【DescriptiveStatistics】/【Crosstabs】命令,弹出如图所示对话框,结果解读1、列联表2、卡方检验结果,3、条图,2.6相对比描述Ratio,在实际问题中,研究者有时除了希望了解变量自身的统计特征,还希望得到两个变量相对比之间的统计描述。法一:通过对两个变量作除法形成一个新变量,然后分析新变量的统计特征来得到。法二:直接通过【Ratio】过程来分析两个变量之间的相对比关系,并且可以得到多于第一种方法的信息。,各地区城乡居民消费水平比较已知有2005年
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025云南玉溪数字资产管理有限公司市场化选聘中层管理人员笔试历年参考题库附带答案详解
- 2026年全国保安员资格考试全真模拟试卷及答案(共九套)
- 2025中国建筑一局(集团)有限公司俄罗斯公司商务管理岗招聘1人笔试历年参考题库附带答案详解
- 2026四年级上《角的度量》知识点梳理
- 2026 五年级上册《自然景观词汇积累》课件
- 2026 七年级下册《篮球传切配合练习》课件
- 扬州公证委托书
- 选拔活动委托书
- 高频客户分层运营方案
- 毛发护理喷雾陈列定量补货规范
- 2025广西金融职业技术学院辅导员招聘考试真题
- 2026江苏航运职业技术学院招聘14人备考题库带答案详解(完整版)
- 2026北京市政府投资引导基金管理有限公司招聘笔试参考题库及答案解析
- 2026中粮集团春季校园招聘笔试参考题库及答案解析
- 贵州省2026年中考模拟物理试题四套附答案
- 客户沟通与谈判技巧培训
- 2025~2026学年陕西省西安市未央区统编版三年级上册期中考试语文试卷
- 【《基于PLC的加热反应炉控制系统设计》16000字(论文)】
- 新能源公司安全管理制度
- 【《阿里巴巴并购优酷土豆的并购背景及定价情况案例分析》10000字】
- 2026年科技前沿人工智能领域笔试模拟题
评论
0/150
提交评论