版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第五章描述性统计分析第五章描述性统计分析1描述性统计只对统计数据的结构和总体情况进行描述,并不能深入了解统计数据的内部规律。Spss的许多模块都可完成描述性统计分析,但专门为该目的而设计的几个模块则集中在descriptivestatistics菜单中,他们就是计算各种统计量或绘制统计图来实现描述功能。描述性统计只对统计数据的结构和总体情况进行描述,并不能深入了2descriptivestatistics菜单主要内容(1)频数分布表分析(Frequencies):其特色就是产生频数表,对分类数据和定量资料都适用。(2)统计描述分析(Descriptive)进行一般性描述,适用于服从正态分布的定量资料。(3)Explore过程:用于对数据分布状况不清楚时的探索性分析,它会杂七杂八给出一大堆可能用到的统计指标和统计图,让研究者参考。(4)Crosstabs过程则完成计数资料和等级资料的统计描述和一般的统计检验我们常用的X2检验也在其中完成(5)Ratio过程;用于对两个连续性变量计算相对比指标,它可以计算出一系列非常专业的相对比描述指标。descriptivestatistics菜单主要内容(13常用的描述统计量集中趋势指标(centraltendency):均数(means)众数(mode),中位数(median),总和(sum),离散趋势指标:标准差(standarddeviation),方差等,最大值、最小值等。其中标准差方差只适用正态分布。
百分位数指标(percentile):包括四分位数,各个百分位数等,适用于任何分布类型资料。分布指标(distribution):偏度系数(Skewness)和峰度系数(Kurtosis),反映了数据偏离正态分布的程度其它:M统计量(M-estimators)、极端值(outlier)等,主要用于对存在异常值的数据进行描述;标准误(S.E.mean),标准误则反映了样本均数的波动程度。常用的描述统计量集中趋势指标(centraltendenc4描述集中趋势的统计量(1)均值(mean):表示某变量所有变量值集中趋势或平均水平的统计量。适用于定距数据。特点:利用了全部数据,易受极端值的影响。(2)众数(mode)(在frequency菜单中计算)一组数据中出现频数最多的变量值。(例:服装尺码)适用于各类数据,主要用于定类数据。特点:众数可能不唯一,不受极端值的影响。描述集中趋势的统计量5计算描述统计量描述离散程度的统计量(1)标准差(standarddeviation--StdDev)(2)方差(variance)(3)极差(range):最大值(minimum)-最小值(minimum)极差很小表明所有数据几乎集中在一起应用于相同样本容量的两组数据离散程度比较计算描述统计量6计算描述统计量描述对称程度的统计量偏度(skewness):描述某变量所有变量值分布形态的偏斜程度和方向的统计量.偏度为0表示对称;大于0表示正偏差大(右偏),频数最大的值比均值小,极值大于均值;小于0表示负偏差大(左偏)。Σ=−=niiSDxx133/)(1-n1Skewness计算描述统计量7计算描述统计量描述陡峭程度的统计量峰度(kurtosis):描述某变量所有变量值分布形态陡缓程度的统计量。峭度为0表示与正态分布峭度相同。大于0表示比正态分布陡,尖峰。小于0表示比正态分布缓;平峰。其他:标准误差(S.E.mean)计算描述统计量85.1frequencies过程频数分布表是描述性统计中最常用的方法之一,Frequencies过程就是专门为产生频数表而设计的,它不仅可以产生单变量详细的频数表,显示文件中指定变量特定值发生的频数,还可以获得某些描述统计量或按要求给出某百分位点的数值以及常用的条图、圆图等统计图。5.1frequencies过程频数分布表是描述性统计中95.1.1对话框界面及各部分选项说明【Displayfrequencytables复选框】确定是否在结果中输出频数表。【Statistics钮】单击后弹出Statistics对话框,用于定义需要计算的其他描述统计量。5.1.1对话框界面及各部分选项说明10
分布指标百分位数指标集中趋势指标离散趋势指标计算百分数时选此项
11图形参数选择对话框
返回图形参数选择对话框返回12【Charts钮】弹出Charts对话框,用于设定所做的统计图。Charttype单选钮组定义统计图类型,有四种选择:无、条图(Barchart)、圆图(Piechart)、直方图Histogram),其中直方图还可以选择是否加上正态曲线(Withnormalcurve)。ChartValues单选钮组定义是按照频数还是按百分比做图(即影响纵坐标刻度)。【Format钮】弹出Format对话框,用于定义输出频数表的格式,不过用处不大,一般不管。【Charts钮】弹出Charts对话框,用于设定所做的统计13
5.1.2分析实例一例6.1某地101例健康男子血清总胆固醇值测定结果存在文件danguchun.sav中,请绘制频数表、直方图,计算均数、标准差、中位数M、p2.5和p97.5。5.1.2分析实例一14操作过程如下:1.Analyze==>DescriptiveStatistics==>Frequencies2.Variables框:选入X3.单击Statistics钮:4.选中Mean、Std.deviation、Median复选框5.单击Percentiles:输入2.5:单击Add:输入97.5:单击Add:6.单击Continue钮7.单击Charts钮:8.选中Barcharts9.单击Continue钮10.单击OK操作过程如下:15结果解释最上方为表格名称,左上方为分析变量名,可见样本量N为101例,缺失值0例,均数Mean=4.69,中位数Median=4.61,标准STD=0.8616,P2.5=3.04,P97.5=6.45。结果解释最上方为表格名称,16系统对变量x作频数分布表(此处只列出了开头部分)Vaild右侧为原始值,Frequency为频数,Percent为各组频数占总例数的百分比(包括缺失记录在内),Validpercent为各组频数占总例数的有效百分比,CumPercent为各组频数占总例数的累积百分比。系统对变量x作频数分布表(此处只列出了开头部分)175.2Descriptives过程Descriptives过程是连续资料统计描述应用最多的一个过程,他可对变量进行描述性统计分析,计算并列出一系列相应的统计指标。这和其他过程相比并无不同。但该过程还有个特殊功能就是可将原始数据转换成标准正态评分值并以变量的形式存入数据库供以后分析。5.2Descriptives过程Descriptiv18确定是否将原始数据的标准正态变换结果存为新变量。选入需要描述的变量,可选入多个确定是否将原始数选入需要描述的19变量列表顺序字母顺序均数升序均数降序。
统计分析与Spss应用第五章(描述性统计分析)ppt课件20一个典型的Descriptives过程结果统计表最上方为表格名称,左下方为分析变量名,可见样本量N为101例;均数:Mean=4.6995,最大值:Maximum=7.22,标准差:STD=0.8616,最小值:Minimum=2.70。一个典型的Descriptives过程结果统计表最上方为表215.3Explore过程主要用于对资料数据的性质、分布状况等完全不清楚时的进行分析,故称探索性分析。在常用的描述性统计指标的基础上,它又增加了有关数据详细分布特征的文字与图形描述,如茎叶图、箱式图等,显得更加详细全面。还可以为以方差齐性为目的的变量变换提供线索,有助于用户制定继续分析的方案。5.3Explore过程主要用于对资料数据的性质、分布状22选入需要分析的变量选入分组变量选择一个变量,他的取值将作为每条记录的标签
选择所需要的描述统计量
选择所需要的统计图
选缺失值的处理方式选入需要分析的变量选入分组变量选择一个变量,他的取值选择23Statistics对话框Descriptives复选框:输出均数、中位数、众数、5%修正均数、标准误、方差、标准差、最小值、最大值、全距、四分位全距、峰度系数、峰度系数的标准误、偏度系数、偏度系数的标准误及指定的均数可信区间。M-estimators复选框:作中心趋势的粗略最大似然确定,该统计量是用哪个迭代法计算出来的,输出四个(Huber,Andrew,Hampel,Tukey)不同权重的最大似然确定数。其中huber法适用于数据接近正态分布的情况,另三种适合数据中有许多异常值时。Outliers复选框:输出五个最大值与五个最小值。Percentiles复选框:输出第5%、10%、25%、50%、75%、90%、95%位数。Statistics对话框24统计分析与Spss应用第五章(描述性统计分析)ppt课件25血清总胆固醇Stem-and-LeafPlotFrequencyStem&Leaf1.002.78.003.001233349.003.55668999924.004.00000111122233333334444425.004.555555666667777777778889917.005.011111112223333349.005.5567788896.006.1123331.006.51.00Extremes(>=7.2)Stemwidth:1.00Eachleaf:1case(s)茎叶图,整数位为茎,小数位为叶。这样可以非常直观的看出数据的分布范围及形态血清总胆固醇Stem-and-LeafPlot茎叶图,整26统计分析与Spss应用第五章(描述性统计分析)ppt课件275.4交叉表分析过程crosstabs
返回5.4交叉表分析过程crosstabs返回28
交叉表分析主对话框
返回交叉表分析主对话框返回29选择统计量对话框
返回选择统计量对话框返回30精确检验对话框
返回精确检验对话框返回31显示单元格值对话框
返回显示单元格值对话框返回32格式对话框
返回格式对话框返回33卡方检验
返回卡方检验返回34观测量统计处理摘要
返回观测量统计处理摘要返回35交叉表及卡方检验结果
返回交叉表及卡方检验结果返回36分析实例1、分析不同性别的受访者的工资水平与订阅报纸的比例之间是否存在差异。使用的数据文件为data05-05,“inccat”变量为工资分类情况、“News”变量为报纸订阅情况,“gender”变量为性别。
返回分析实例1、分析不同性别的受访者的工资水平与订阅报纸的比例之37操作步骤(1)读取数据文件data05-08,按Analyze→DescriptiveStatistics→Crosstabs的顺序打开Crosstabs主对话框。(2)将变量“
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 刑诉法主观题真题及解析2026年附答案
- 2026云南曲靖市马龙区科学技术协会公益性岗位招聘1人备考题库及答案详解参考
- 2026四川资阳市安岳县县属国有企业招聘25人备考题库附答案详解(培优a卷)
- 2026广东广州南沙人力资源发展有限公司招聘实习教师备考题库附答案详解(轻巧夺冠)
- 2026国家生物信息中心应用发展部王前飞科研单元招聘1人备考题库(北京)及答案详解(网校专用)
- 2026重庆安诚财产保险股份有限公司招聘15人备考题库及答案详解(网校专用)
- 2026云南省商务领域第一批“银龄工程师”招募46人备考题库附答案详解(b卷)
- 2026北京保障房中心社会招聘13人备考题库附答案详解(能力提升)
- 2026海南省医学科学院基础医学院招聘学系主任备考题库及答案详解(有一套)
- 2026中国宁波国际合作有限责任公司招聘备考题库及参考答案详解
- 智联招聘测评题库及答案
- 苯课件高二下学期化学人教版选择性必修3
- 2025年四川省凉山州中考生物试卷真题(含答案解析)
- 物业sop管理制度
- (完整版)钢结构厂房施工组织设计(含土建)
- 儿童免疫性血小板减少护理
- CJ/T 107-2013城市公共汽、电车候车亭
- 企业esg报告范本
- 一体化污水处理设备采购安装及运维 投标方案(技术方案)
- 财务报表分析(第3版)-岳虹版-习题参考答案
- 中建地下通道基坑支护与土方开挖
评论
0/150
提交评论