版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
制作人:夏怡凡第4章SPSS基本统计分析主要内容:引言介绍基本统计分析的重要性和主要内容;频数分析介绍如何对数据的频数分布进行把握;计算基本描述统计量进一步描述更为精确的数据分布特征;列联表分析描述多个变量之间是否存在相关关系;多选项分析对应处理问卷种多选的问题;比率分析描述两变量间比率的变化(新增功能)。引言:基本数据分析的重要地位和作用数据处理通常都是从基本统计分析入手的;能够使分析者掌握数据的基本统计特征;把握数据的整体分布形态;对以后的分析起到重要的指导和参考作用。引言(续):基本统计分析内容编制单个变量频数分析表;计算单个变量的描述统计量以及在不同分组下的描述统计量;编制多个变量的交叉频数分析表并分析各变量关系;其他探索性分析;数据的多选项分析。引言(续):采用的常用方法往往采用两种方式实现上述分析功能;数值计算,通过数值准确的反映数据的统计特征;图形绘制,通过图形直观的反映数据的分布特点;数值计算和图形绘制使混合使用的,相辅相成。4.1频数分析:4.1.1目的和基本任务通过频数分析能够了解变量取值的状况,把握分布特征;SPSS中的频数分布表;频数即变量值落在某个区间中的次数;百分比即各频数占总样本数的百分比;有效百分比即各频数占总有效样本数的百分比;累计百分比即各百分比逐级累加起来的结果。4.1.1目的和基本任务(续)频数分析中的常用统计图,最为直接的数据刻画方式;条形图(BarChart):用条形的高度和长短表示频数分布的图形,适用定序和定类变量的分析;饼图(PieChart):用圆形和圆内扇形面积表示频数百分比,圆内扇形既可以表示频数也可以表示百分比;直方图(Histograms):用矩形面积表示频数分布变化,试用与定距变量的分析,可以附加正态曲线4.1.2频数分析的基本操作Analyze菜单DescriptiveStatisticsFrequencies如下窗口1.4.1.2频数分析的基本操作(续)OKPasteCancelResetHelpStatistics…Charts…Format…Variable(s)Displayfrequencytables4.1.2频数分析的基本操作(续)CancelHelpContinueNoneBarChartPieChartHistogramsChartTypeWithnormalcurvePercentagesFrequenciesChartValues4.1.2频数分析的基本操作(续)2.将若干频数分析变量选入Variable(s)框中;单击Charts…选择绘制统计图形;结果会显示在输出窗口中。4.1.3频数分析的扩展功能SPSS还能做进一步的扩展功能:计算分位数;计算其他描述统计量;频数分布表格式的定义;格式表格即操作AscendingValuesDescendingValuesAscendingCountsDescendingCountsOrderbyOrganizeoutputbyvariablesComparevariablesMultipleVariablesCancelHelpContinueSuppresstableswithmorethan18categories格式的参数说明即操作调整频数分布表中数据输出顺序(orderby)按值的升序或者降序输出;按频数的升序或者降序输出;压缩频数分布表如果变量取值太多或者区间太多,就需要压缩分布表;系统默认大于10不输出,可以修改。举例操作:居民储蓄调查数据频数分析分析户口和就业的基本情况;分析储户一次存(取)款金额的分布,并对城镇储户和农村储户进行比较。结果结果图4.2计算基本描述统计量4.2.1基本描述统计量常见的基本描述统计量分为三类:刻画集中趋势的描述统计量;刻画离散程度的描述统计量;刻画分布形态的描述统计量;综合三类统计量能够极为准确和清晰的把握数据分布的特点。4.2.1.1刻画集中趋势的描述统计量集中趋势是指一组数据向某一中心值靠拢的倾向;表现集中趋势的统计量主要有均值:数学定义中位数:众数:4.2.1.2刻画离散程度的描述统计量离散程度是指一组数据远离其中心值的程度;刻画离散程度的常见统计量主要有样本标准差:数学定义样本方差:数学定义全距:样本最大最小值的差4.2.1.3刻画分布形态的描述统计量分布形态是指数据分布是否对称,偏斜程度,陡缓程度;刻画分布形态的常见统计量主要有偏度:数学定义峰度:数学定义4.2.2计算基本描述统计量的基本操作Analyze菜单DescriptiveStatisticsDiscriptives如下窗口1.4.2.2描述统计量的基本操作(续)OKPasteCancelResetHelpOptions…Variable(s)Savestandardizedvaluesasvariables4.2.2描述统计量的基本操作(续)将需要计算的数值型变量选入Variable(s)框中;单击Option…按钮指定计算哪些基本统计量,出现如下图对话框指定输出顺序:4.2.2描述统计量的基本操作(续)CancelHelpContinueDespersionAlphabeticVariablelistDisplayOrderMeanSumRangeS.E.meanStd.deviationMinVarianceMaxDistributionKurtosisSkewnessAscendingmeansDescendingmeans4.2.3描述统计量的基本操作举例计算存(取)款金额的基本描述统计量,并对城镇储户和农村储户进行比较;分析储户一次存(取)款数量是否存在不均衡现象。4.3交叉分组下的频数分析
4.3.1目的和基本任务目的:分析多个变量不同取值下的分布;掌握多变量的联合分布;分析变量之间的相互影响和关系;例子:居民储蓄问题的分析目的和任务(续)列联表分析的两大基本任务;列联表分析的两大任务;根据收集到的数据,产生二维或者多维的交叉列联表;在交叉列联表的基础上,对两两变量是否存在相关性进行分析。4.3.2交叉列联表的主要内容交叉列联表是两个或两个以上的变量交叉分组后形成的频数分布表;交叉列联表是由行列构成,行列分别代替一个变量,分别代表行变量和列变量;行列标题是两个变量的值,表格中是观测频数和各种百分比;行列还有边缘分布;列联表的例子:文化程度Total本科专科高中初中职称高级工程师1113工程师134助理工程师2136无技术职称33Total4453164.3.3列联表行列变量间关系的分析分析行变量和列变量的关系,是列联表分析的第二个任务;可以得到行变量和列变量是否有联系,联系的紧密程度等更深层的信息;这种关系,有时候是明显的,有时候是隐藏的,可以通过卡方检验得到。4.3.3.1交叉列表的卡方检验卡方检验属于假设检验的内容,主要步骤为:建立零假设;选择和计算检验统计量,这里选择的是皮尔逊卡方统计量;确立显著性水平和临界值;结论和决策,卡方值越大,独立性存在的可能越小,如果大于临界值,则认为不独立。4.3.3.2交叉列联表卡方检验的说明列联表中不应该有期望频数小于1的单元格,也不应该有大量期望频数小于5的单元格;样本量不宜过大。4.3.4交叉分组下频数分析的操作Analyze菜单DescriptiveStatisticsCrosstab如下窗口1.操作图OKPasteCancelResetHelpStatistics…Cells…Format…Row(s)Displayclusteredbarchartscolumn(s)Layer1ofPreviousNext…SuppresstablesExact…所有data数据中的变量行变量列变量绘制多维列联表时的控制变量4.3.4列联表分析基本操作(续)点击cells进入设置框,主要设置列联表中显示那些内容,内容主要有:Observed表示实际观测到的频数;Expected表示两变量独立时期望的频数;Percentage表示在表格中分别显示行、列和总共的百分比;Residuals表示是否标准化数据;4.3.4列联表分析基本操作(续)CancelHelpContinueCountsColumnRowPercentagesObservedExpectedResidualsUnstandardizedTotalstandardizedAdj.standardized4.3.4列联表分析基本操作(续)点击Format进入设置框,主要设置输出的排列顺序,按升序还是降序排列;点击statistics确定按那种方法分析行变量和列变量的关系:Chi-square表示卡方分布检验;4.3.4列联表的基本操作(续)CancelHelpContinueNominalChi-squareCorrelationslambdaContingencycoefficientPhiandCrameVNorminalbyIntervalEtaUncertaintycoefficientKendall’stau-bGammaSomers‘dKendall’stau-cOrdinal。。。。。。……应用举例目标一:分析城镇和农村对未来收入状况的变化趋势是否持一致态度;目标二:分析城镇和农村对储蓄是否合算的认同是否一致。4.3.5.1
农村和城市储户对“变化趋势”是否持相同态度户口和未来收入情况做列联表,要求列联表每一格输出百分比、期望频数、剩余、标准化剩余;利用卡方检验法,对态度是否一致进行检验;请看下表中的结果:结果分析整体情况:城市农村人口分别为200,82,城镇人占多数,大部分人认为收入会基本不变;对不同类储户进行分析,不同类的储户,无论是城市还是农村储户,都认为收入会基本不变对不同看法的进行分析,在认为收入会增加的样本中,城市户口占多,认为不变的城乡差异缩小,认为收入会减少的农村多于城市;总体上将:城镇和农村看法不同。卡方检验结果城镇和农村储户对储蓄是否合算的看法是否一致结果如下图表,显著性如果定成0.05,差异显著4.3.6SPSS中列联表分析的其他方法SPSS还提供了其他变量间相关关系的检验办法;方法大致分为四类:适用于两定类变量的方法(Nominal框);适用于两定序变量的方法(Ordinal框);适用于一定类变量,一定距变量的方法(Eta)其他方法4.3.6.1适用于两定类变量的方法Phi系数;列联系数;Gramer’sV系数;4.3.6.2适用于两序变量的方法Kendall’stau-b系数;Kendall’stau-c系数;Gamma系数;4.3.6.3适用于一定类变量,一定距变量的方法4.3.6.4其他方法Eta系数4.4多选项分析SPSS中的多选项分析是针对问卷调查中的多选项问题的;多选项分析从问卷给出的若干个可选问题选择一个以上的答案;步骤一般是第一将多选项问题分解;第二是利用前面频数分析等方法进行分析。4.4.1多选项分析的目的4.4.1.1多选项问题的分解多选项问题答案不止一个,虽然可以用一个变量存储,但是不支持分析;对一个多选项问题仅设置一个SPSS变量在数据处理和分析中是行不通的;将一个问题分解为多个问题,对应设置多个SPSS变量,分别存储可能出现的答案;对一个多选项问题的分析就转化为多个问题的分析。4.4.4.2多选项问题分解的方法第一、多选项问
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 心脏起搏器术后抗凝患者内镜止血方案
- 心脏代谢疾病的护理管理策略优化
- 心肌再生疗法的联合用药策略
- 微创神经外科手术老年患者麻醉质量控制
- 微创神经术中血流动力学波动的预测模型
- 微创缝合技术对硬脑膜修补术后癫痫的预防作用
- 微创机器人手术:精准与温度的协同进化
- 微创手术术后高钠血症的纠正策略
- 循证医学视角下中医药疗效评价新路径
- 影像组学指导个体化肺癌手术策略制定
- 家电以旧换新风险管控与应对策略
- 2024年1月浙江省高考英语试题卷附答案
- 腾讯隐私计算方案
- 四川省宜宾市2023-2024学年高二物理第一学期期末联考试题含解析
- 医务科年度工作计划
- 提高污水管道安装一次验收合格率(QC成果样板)
- 碳纤维粘贴加固检验批质量验收记录
- CRF中国REITs指数之不动产资本化率调研报告第三期-
- GB/T 6003.1-2022试验筛技术要求和检验第1部分:金属丝编织网试验筛
- YY/T 1269-2015血液透析和相关治疗用水处理设备常规控制要求
- GB/T 17619-1998机动车电子电器组件的电磁辐射抗扰性限值和测量方法
评论
0/150
提交评论