第五章 SPSS基本统计分析.ppt

上传人：m*** IP属地：河南上传时间：2020-01-27 格式：PPT 页数：109 大小：1.28MB 积分：20 举报 版权申诉

已阅读5页，还剩104页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第四章 SPSS基本统计分析描述性统计分析描述性统计分析是统计分析的第一步做好这第一步是下面进行正确统计推断的先决条件 SPSS的许多模块均可完成描述性分析但专门为该目的而设计的几个模块则集中在DescriptiveStatistics菜单中包括 Frequencies 频数分析过程特色是产生频数表主要针对分类变量 Descriptives 数据描述过程进行一般性的统计描述主要针对数值型变量 Explore 数据探察过程用于对数据概况不清时的探索性分析Crosstabs 多维频数分布交叉表分析列联表分析 Ratiostatistics 比率分析 4 1频数分析 4 1 1频数分析的目的和基本任务1 目的基本统计分析往往从频数分析开始通过频数分析能够了解变量取值的状况对把握数据的分布特征是非常有用的 2 基本任务 1 频数分析的第一个基本任务是编制频数分布表频数 Frequency 即变量值落在某个区间或某个类别中的次数百分比 Percent 即各频数占总样本数的百分比有效百分比 ValidPercent 即各频数占有效样本数的百分比这里有效样本数总样本缺失样本数累计百分比 CumulativePercent 即各百分比逐级累加起来的结果最终取值为100 2 频数分析的第二个任务是绘制统计图条形图 BarChart 用宽度相同的条形的高度或长短来表示频数分布变化的图形适用于定序和定类变量的分析饼图 PieChart 用圆形及圆内扇形的面积来表示频数百分比变化的图形以利于研究事物内在结构组成等问题直方图 Histograms 用矩形的面积来表示频数分布变化的图形适用于定距型变量的分析注变量的计量尺度 a定类 CategoryScale 只能计次b定序 OrdinalScale 计次排序c定距 IntervalScale 计次排序加减d定比 RatioScale 计次排序加减乘除 4 1 2频数分析的基本操作 1 选择菜单Analyze DescriptiveStatistics Frequencies 2 将若干频数分析变量选择到Variable s 框中 3 单击Chart按钮选择绘制统计图形在ChartValues框中选择条形图中纵坐标或饼图中扇形面积的含义其中Frequencies表示频数 Percentages表示百分比输出百分位数输出四分位数显示25 50 75 的百分位数将数据平均分为所设定的相等等份可输入2 100的整数如键入4则输出第25 50 75百分位数自定义百分位数可输入0 100的整数离散趋势分布形态栏集中趋势栏输出统计量对话框 4 1 3SPSS频数分析的扩展功能1 计算分位数 PercentileValues 分位数是变量在不同分位点上的取值分位点在0 100之间一般使用较多的是四分位点 Quartiles 即将所有数据按升序排序后平均等分成四份各分位点依次是25 50 75 于是四分位数便分别是25 50 75 点所对应的变量值此外还有八分位数十六分位数等 SPSS提供了计算任意分位数的功能用户可以指定将数据等分为n份 Cutpointsfornequalgroups 还可以直接指定分位点 Percentile 2 计算其他基本描述统计量SPSS频数分析还能够计算其他基本统计量其中包括描述集中趋势 CentralTendency 的基本统计量描述离散程度 Dispersion 的基本统计量描述分布形态 Distribution 的基本统计量等 Format对话框控制频数表输出的分类数量默认为10 多变量框中可设定多变量表格输出的格式设置频数表输出的格式选择频数表中排列顺序按变量升序排列此为默认按变量降序排列按变量各种取值发生的频数的升序排列按变量各种取值发生的频数的降序排列 3 频数分布表格式 Format 的定义 1 调整频数分布表中数据的输出顺序 Orderby 频数分布表中的内容的输出顺序可以按变量值的升序输出 Ascendingvalues 按变量值的降序输出 Descendingvalues 按频数的升序输出 Ascendingcounts 按频数的降序输出 Descendingcounts 2 multiplevariables单选框组如果选择了两个以上变量作频数表则comparevariables可以将所有变量的结果在同一个频数表过程输出结果中显示便于互相比较 organizeoutputbyvariables则将结果在不同的频数表过程输出结果中显示每一个变量一张表 3 压缩频数分布表 Suppresstableswithmorethanncategories 如果变量取值的个数或取值区间的个数太多频数分布表将很庞大此时可以压缩它 SPSS默认如果变量取值的个数或取值区间的个数大于10 则不输出相应的频数分布表应用中可以修改该值 4 2计算基本描述统计量 4 2 1基本描述统计量常见的基本描述统计量有三大类刻画集中趋势的统计量刻画离中趋势的统计量刻画分布形态的统计量 1 刻画集中趋势的描述统计量集中趋势是指一组数据向某一中心值靠拢的倾向 1 均值 Mean 即算术平均数是反映某变量所有取值的集中趋势或平均水平的指标如某企业职工的平均月收入其计算公式为 2 中位数 Median 即一组数据按升序排序后处于中间位置上的数据值如评价社会的老龄化程度时可用中位数 3 众数 Mode 即一组数据中出现次数最多的数据值如生产鞋的厂商在制定各种型号鞋的生产计划时应该运用众数 2 刻画离散程度的描述统计量离散程度是指一组数据远离其中心值的程度如果数据都紧密地集中在中心值的周围数据的离散程度较小说明这个中心值对数据的代表性好相反如果数据仅是比较松散地分布在中心值的周围数据的离散程度较大则此中心值说明数据特征是不具有代表性的常见的刻画离散程度的描述统计量如下 1 全距 Range 也称极差是数据的最大值 Maximum 与最小值 Minimum 之间的绝对离差 2 方差 Variance 也是表示变量取值离散程度的统计量是各变量值与算数平均数离差平方的算术平均数其计算公式为 3 标准差 StandardDeviation StdDev 表示变量取值距离均值的平均离散程度的统计量其计算公式为标准差值越大说明变量值之间的差异越大距均值这个中心值的离散趋势越大 4 均值标准误差 StandardErrorofMean 描述样本均值与总体均值之间的平均差异程度的统计量其计算公式为其中为总体标准差 n为样本单位数 3 刻画分布形态的描述统计量数据的分布形态主要指数据分布是否对称偏斜程度如何分布陡峭程度等刻画分布形态的统计量主要有两种 1 偏度 Skewness 描述变量取值分布形态对称性的统计量其计算公式为当分布为对称分布时正负总偏差相等偏度值等于0 当分布为不对称分布时正负总偏差不相等偏度值大于0或小于0 偏度值大于0表示正偏差值大称为正偏或右偏偏度值小于0表示负偏差值大称为负偏或左偏偏度绝对值越大表示数据分布形态的偏斜程度越大 2 峰度 Kurtosis 描述变量取值分布形态陡峭程度的统计量其计算公式为当数据分布与标准正态分布的陡峭程度相同时峰度值等于0 峰度大于0表示数据的分布比标准正态分布更陡峭为尖峰分布峰度小于0表示数据的分布比标准正态分布平缓为平峰分布 4 2 2计算基本描述统计量的操作 1 选择菜单Analyze DescriptiveStatistics Descriptives 出现如下窗口 2 将需计算的数值型变量选择到Variable s 框中 3 单击Option按钮指定计算哪些基本描述统计量出现如下窗口 Options对话框基本统计量当Variables框中有多个变量时此框确定其输出顺序按Variables框中的排列顺序输出按各变量的字母顺序输出按均值的升序排列按均值的降序排列分布在上面窗口中用户可以指定分析多变量时结果输出的次序 DisplayOrder 其中 Variablelist表示按变量在数据窗口中从左到右的次序输出 Alphabetic表示按字母顺序输出 AscendingMeans表示按均值升序输出 DescendingMeans表示按均值降序输出至此 SPSS便自动计算所选变量的基本描述统计量并显示到输出窗口中 4 3交叉分组下的频数分析 4 3 1目的和基本任务1 目的交叉分组下的频数分析又称列联表分析通过前面的频数分析能够掌握单个变量的数据分布情况在实际分析中不仅要了解单个变量的分布特征还要分析多个变量不同取值下的分布进而分析变量之间的相互影响和关系对于这种涉及两个或两个以上变量分布情况的研究通常要利用交叉分组下的频数分析来完成 2 基本任务 1 根据收集到的样本数据产生二维或多维交叉列联表 2 在交叉列联表的基础上对两两变量间是否存在一定的相关性进行分析 4 3 2交叉列联表的主要内容编制交叉列联表是交叉分组下频数分析的第一个任务交叉列联表是两个或两个以上的变量交叉分组后形成的频数分布表例职工基本情况数据按职称和文化程度编制的二维交叉列联表见下页表上表中的职称变量称为行变量 Row 文化程度称为列变量 Column 行标题和列标题分别是两个变量的变量值或分组值表格中间是观测频数 ObservedCounts 和各种百分比 16名职工中本科专科高中初中的人数分别为4 4 5 3 构成的分布称为交叉列联表的列边缘分布高级工程师工程师助理工程师无技术职称的人数分别为3 4 6 3 构成的分布称为交叉列联表的行边缘分布 4个本科学历职工中各职称的人数分别是1 1 2等这些频数构成的分布称为条件分布即在行变量列变量取值条件下的列变量行变量的分布在交叉列联表中除了频数外还引进了各种百分比例如表中第一行中的33 3 33 3 33 3 分别是高级工程师3人中各学历人数所占的比例称为行百分比 Rowpercentage 一行的百分比总和为100 表中第一列的25 0 25 0 50 0 分别是本科学历4人中各职称人数所占的比例称为列百分比 Columnpercentage 一列的列百分比总和为100 表中的6 3 6 3 12 5 等分别是总人数16人中各交叉组中人数所占的百分比称为总百分比 Totalpercentage 所有格子中的总百分比之和也为100 4 3 3交叉分组下的频数分析的基本操作 1 菜单选项Analyze DescriptiveStatistics Crosstabs 出现窗口如下该框中的变量作为分布表中的行变量和列变量该框中的变量作为控制变量决定频数分布表中的层可有多个控制变量显示每一组中各变量的分类条形图只输出统计量不输出多维列联表 Crosstabs对话框 2 如果进行二维列联表分析则将行变量选择到Row s 框中将列变量选择到Column s 框中如果Row s 和Column s 框中有多个变量名 SPSS会将行列变量一一配对后产生多张二维列联表如果进行三维或多维列联表分析则将其他变量作为控制变量选到Layer框中多控制变量间可以是同层次的也可以是逐层叠加的可通过Previous或Next按钮确定控制变量间的层次关系 3 选择Displayclusteredbarcharts选项指定绘制各变量交叉分组下频数分布条形图 Suppresstables表示不输出列联表在仅分析行列变量间关系时可选择该选项 4 单击Cells按钮指定列联表单元格中的输出内容窗口如下 Crosstabs的CellDisplay对话框选择在列联表中输出的统计量包括观测量数百分比残差输出观测量的实际数量如果行和列变量在统计上是独立的或不相关的那么会在单元格中输出期望的观测值的数量输出单元格中观测量的数目占整行全部观测量数目的百分比输出单元格中观测值的数目占整列全部观测量数目的百分比输出单元格中观测量的数目占全部观测量数目的百分比计算非标准化残差计算标准化残差计算调整后残差 SPSS默认列联表单元格中只输出观测频数 Observed 为便于分析通常还应指定输出Percentage框中的行百分比 Row 列百分比 Column 总百分比 Total Counts框中的Expected表示输出期望频数 Residuals框中的各个选项表示在各个单元格中输出剩余其中 Unstandardized为非标准化剩余定义为观测频数期望频数 Standardized为标准化剩余又称Pearson剩余定义为 5 单击Format按钮指定列联表各单元格的输出排列顺序 Ascending表示以行变量取值的升序排列是SPSS默认项 Descending表示以行变量取值的降序排列 6 单击Statistics按钮指定用哪种方法分析行变量和列变量间的关系窗口如下其中 Chi Square为卡方检验 4 3 4交叉列联表行列变量间关系的分析对交叉列联表中的行变量和列变量之间关系进行分析是交叉分组下频数分析的第二个任务为了理解行列变量之间的关系可以从分析两个极端的例子出发 1 年龄与工资收入的交叉列联表一 2 年龄与工资收入交叉列联表二表一中表示年龄与工资收入呈正相关关系表二表示年龄与工资收入呈负相关关系但大多数情况下观测频数分散在列联表的各个单元格中不容易直接发现行列变量之间的关系强弱程度此时就要借助非参数检验方法通常用的方法是卡方检验交叉列联表的卡方检验卡方检验属假设检验的范畴步骤如下 1 建立原假设在列联表分析中卡方检验的原假设为行变量与列变量独立 2 选择和计算检验统计量列联表分析卡方检验统计量是Pearson卡方统计量其数学定义为其中 r为列联表的行数 c为列联表的列数为观察频数为期望频数 ExpectedCount 期望频数的计算方法是其中 RT是指定单元格所在行的观测频数合计 CT是指定单元格所在列的观测频数合计 n是观测频数的合计期望频数的分布反映的是行列变量互不相干下的分布例如具有本科学历的高级工程师的期望频数是0 75的计算公式是3 4 16 0 75 这里期望频数可以理解为总共16个职工的学历分布是25 25 31 3 18 8 如果遵从这种学历的总体比例关系高级职称三人的学历分布也应为25 25 31 3 18 8 于是期望频数为3 25 3 25 3 31 3 3 18 8 同理可以理解总共16个职工的职称分布为18 8 25 37 5 18 8 本科学历4人的期望频数分别为4 18 8 4 25 4 37 5 4 18 8 卡方统计量观测值的大小取决于两个因素第一列联表的单元格子数第二观测频数与期望频数的总差值在列联表确定的情况下卡方统计量观测值的大小取决于观测频数与期望频数的总差值当总差值越大时卡方值也就越大实际分布与期望分布的差距越大表明行列变量之间越相关反之表明行列变量之间越独立那么在统计上卡方统计量的观测值究竟达到什么程度才能断定行列变量不独立呢由于该检验中的pearson卡方统计量近似服从卡方分布因此可依据卡方理论找到某自由度和显著性水平下的卡方值即卡方临界值 3 确定显著性水平 SignificantLevel 和临界值显著性水平是指原假设为真却将其拒绝的风险即弃真的概率通常设为0 05或0 01 在卡方检验中由于卡方统计量服从自由度为行数 1 列数 1 的卡方分布因此在行列数目和显著性水平确定时卡方临界值是可唯一确定的 4 结论和决策对统计推断做决策通常有两种方式根据统计量观测值和临界值比较的结果进行决策如果卡方观测值大于临界值则认为实际分布与期望分布之间的差距显著可以拒绝原假设断定列联表的行列变量间不独立存在相关关系反之接受原假设根据统计量观测值的概率p值和显著性水平比较的结果进行决策如果p值小于等于则认为卡方观测值出现的概率是很小的拒绝原假设断定列联表的行列变量间不独立存在依存关系反之接受原假设什么是P值是一个概率值如果原假设为真 P 值是抽样分布中大于或小于样本统计量的概率被称为观察到的或实测的显著性水平双侧检验的P值左侧检验的P值右侧检验的P值利用P值进行检验决策准则若p 值不拒绝H0若p 值拒绝H0 5 3 5交叉分组下的频数分析应用举例利用居民储蓄调查数据进行分析实现以下目标 1 分析城镇和农村储户对未来收入状况的变化趋势是否持相同的态度 2 分析城镇和农村储户对什么合算的认同是否一致分析 1 该问题列联表的行变量为户口列变量为未来收入状况在列联表中输出各种百分比期望频数剩余标准化剩余显示各交叉分组下频数分布柱形图并利用卡方检验方法对城镇和农村储户对该问题的态度是否一致进行分析 2 该问题列联表的行变量为户口列变量为什么合算在列联表的基础上进行卡方检验 5 3 6SPSS中列联表分析的其他方法对列联表中行列变量的分析除上述卡方检验方法之外 SPSS还提供了其他测度变量间相关关系的检验方法包括适用于两定类变量的方法 Nominal框中列出的方法属该类方法适用于两定序变量的方法 Ordinal框中列出的方法属该类方法适用于一定类变量一定距变量的方法 Nominalbyinterval框中的Eta方法属该类方法其他方法 5 4多选项分析频数分析和交叉分析多选项问题的概念多选项问题是根据实际调查的需要要求被调查者从问卷给出的若干个可选答案中选择一个以上的答案目前市场研究或许多领域对某事物评价的研究中常常遇到这样的问题可以选多个分为限选和不限选限选如在11种工作种类中选你喜欢的最多可选4种 Var1 Var4 求所有人喜欢各种工作的频数或频率不限选如在所列的20种电器中你家所拥有的电器不限选 Var1 Var20 求所有被调查家庭拥有各种电器的频数或频率 5 4 1多选项问题的分解多选项二分法及其编码 multipledichotomiesmethod 多选项二分法是将多选项问题中的每一个答案设为一个SPSS变量每个变量值有0或1两个取值分别表示选择了该答案和不选择该答案如对下面问题有9个可能的答案每个可选择的答案由一个变量表示每个变量的值只能有表明是和否的两个代码0或者1 左边的表格为向顾客发放的颜色调查在选择服装时您喜欢什么颜色作为主体颜色在答案的中打可多选这是一组问题每个问题均有两个答案回答者只能选择其中一种在建立数据文件时变量名使用相同的变量主名后面加以不同序号组成本组问题的9个变量名可以是color1 color9 而答案的编码规则为回答是变量值为1 回答否变量值为0 其他值为缺失值多选项分类法及其编码 multiplecategorymethod 多选项分类法中首先应估计多选项问题最多可能出现的答案个数然后为每个答案设置一个SPSS变量变量取值为多选项问题中的所有可选答案如上面有关选择服装的主体颜色您可以选择喜欢的三种在提供的10种答案前上选择 1 红2 橙3 黄4 绿5 青6 蓝7 紫8 黑9 白10说不清这是一个问题可以有三个答案在建立数据文件时要建立三个变量color1 color3表示回答者选择的三个颜色如选择结果为1 红 6 蓝 8 黑则变量color1的值为1 变量color2的值为6 变量color3的值为8 如果采用多选二分法则有6个选项故应设6个变量运用0 1编码方法编码即 1 0 1 0 1 1 如果采用多选分类法则编码为1 3 5 6 0 0 1356 问题2 择业中考虑的主要因素多选 1经济收入2专业对口3发展前途4地理区位5个人爱好6风险大小7劳动强度8社会福利9其他编码应为 1 0 1 1 1 0 1 1 0 或1 3 4 5 7 8 0 0 0 136 问题3 您择业中考虑的主要因素有限选三项 1经济收入2专业对口3发展前途4地理区位5个人爱好6风险大小7劳动强度8社会福利9社会地位10其他因为限选三项故应设三个变量编码依次为1 3 6 5 4 2多选项分析的基本操作首先将每个题的若干答案组成一个综合变量即变量集 Set 然后对综合变量的各种取值进行分析只有通过定义多选项变量集 spss才能确定应对哪些变量取相同值的个案数进行累加多选项分析在SPSS中是通过Analyze MultipleResponse中的各项功能实现的 1 DefineSets 1 从左边的变量中将多选变量集的变量选择到variablesinsets框中建立多选二分变量集或多选分类变量集 2 在variablesarecodedas框中指定多选变量集中的变量是按照那种方法编码的 Dichotomies表示以多选二分法编码并在countedvalue中输入用哪个数值来表示选中该选项 categories表示以多选分类法编码并在range框中输入变量取值的最小值和最大值 3 为多选项变量集命名系统会自动在该名字前加字符 4 单击add按钮将定义好的多选项变量集加到multresponsesets框中 Spss可以定义多个多选项变量集 2 Frequencies 对多选变量集进行频数分析从multresponsesets中把待分析的多选项变量集选择到tablesfor框中 3 Crosstabs 对多选变量集与其他变量集或与原基本变量进行交叉表分析 1 选择列联表的行变量并定义取值范围 2 选择列联表的列变量并定义取值范围 3 选择列联表的控制变量并定义取值范围 4 单击option按钮选择列联表的输出内容和计算方法 Matchvariableacrossresponsesets选项表示如果列联表的行列变量均为多选项变量集时第一个变量集的第一个变量与第二个变量集的第一个变量作交叉分组依次类推结果中注意PctofResponses 占总回答数的和PctofCase 占总个案数的区别 5 4 3多选项分析的应用举例利用居民储蓄调查数据进行分析实现以下两个分析目标 1 分析储户的储蓄目的 2 分析不同年龄段储户的储蓄目的分析 1 为进行多选项分析首先定义名为cxmd的多选项变量集其中包括a7 1 a7 2 a7 3三个变量然后对多选项变量集进行频数分析 2 对不同年龄段储户储蓄目的进行分析采用多选项交叉分组下的频数分析 5 5探索分析Explore 1 分析目的和方法奇异性数据过大或过小找出分析原因是否剔除分布特征数据是否来自正态总体考察方法统计量和统计图形箱式图茎叶图 QQ图 2 一般是考察定距变量3 Analyze DescriptiveStatistics Explore分析变量 DependentList 数值型变量分组变量 FactorList 分类变量标识变量 LabelCasesby 用某变量的值作为观察值得标识如id 选择一个或多个变量进入Dependent框作为分析变量单击OK可获得分析变量的一系列基本统计量和图形此作为分组变量可以是字符变量对分析变量的分析将按该变量的观测值进行分组分析可有多个分组变量这时会按多个变量的交叉组合进行分组该框中的变量作为标识符在输出诸如异常值时用该变量进行标识只允许有一个标识符可同时输出基本统计量和图形只输出基本统计量只输出图形 Explore主对话框输出基本统计量均值的置信区间可键入1 99 的任意值根据该值算出置信区间的上下限给出中心趋势的最大似然比的稳健估计量当数据分布均匀且两尾较长或当数据中存在极端值时可给出比均值或中位数更合理的估计输出最大和最小的5个数且在输出窗口中加以标明输出5 10 25 50 75 90 和95 的百分位数 Statistics对话框 Statistics子对话框用于选择需要的描述统计量 descriptives 输出均值中位数众数 5 修正均值估计标准误方差标准差最小值最大值全距四分位差峰度系数及其标准误偏度系数及其标准误及指定的均值置信区间 m estmators 做集中趋势的最大稳健估计该统计量是利用迭代方法计算出来的受异常值的影响要小得多如果该估计量离均值较远则说明数据可能存在异常值此时宜用该估计量替代均值以反映集中趋势一共会输出四种m估计量其中huber适用于数据接近正态分布时另三种则适用于数据中有许多异常值的情况 outliers 输出五个最大值和五个最小值 percentiles 输出第5 10 25 50 75 90 95 分位数 plots子对话框用于选择需要的统计图 boxplots复选框确定箱式图的绘制方式可以分组绘制 factorlevelstogether 也可以不分组绘制 dependentstogether 或者不绘制 none descriptive复选框可以选择绘制茎叶图 stem and leaf 和直方图 histogram normalityplotwithtest 绘制正态分布图 QQ图并进行变量是否符合正态分布的检验茎叶图 stem and leaf 1 用于显示未分组的原始数据的分布2 由茎和叶两部分构成其图形是由数字组成的3 以该组数据的高位数值作树茎低位数字作树叶4 树叶上只保留一位数字5 茎叶图类似于横置的直方图但又有区别直方图可观察一组数据的分布状况但没有给出具体的数值茎叶图既能给出数据的分布状况又能给出每一个原始数值保留了原始数据的信息6 图的下方会标示出茎宽和实际值的倍数每行的茎和叶组成的数字再乘以茎宽即得到实际数据的近似值如茎宽为10 则图中的2 3代表23 同样在图的下方也会标示出每片叶子代表的记录数未分组数据茎叶图练习利用居民储蓄调查数据对一次存款金额变量进行探索性分析 5 6比率分析 5 6 1比率分析的目的和主要指标比率分析用于对两变量间变量值比率变化的描述分析适用于数值型变量例如根据1999年各地区保险业务情况的数据分析各地区财产保险业务的保费收入占全部业务保费收入的比例情况通常的分析可以生成各个地区财产保险业务的保费收入占全部业务保费收入的比率变量然后对该比率变量计算基本描述统计量如均值中位数标准差全距等进而刻画比率变量的集中趋势和离散程度 SPSS的比率分析除能够完成上述分析外还提供了其他相对比描述指标大致也属于集中趋势描述指标和离散程度描述指标的范畴具体包括 1 加权比率均值 Weightedmean 两变量均值的比属集中趋势描述指标 2 AAD AverageAbsoluteDeviation 平均绝对离差是对比率变量离散程度的描述计算公式为其中是比率数 M是比率变量的中位数 N为样本数相对数或平均数计算平均数的计算相对数或平均数用Y表示有Y a b a b为总量指标求各期Y的平均一般不能采用简单算术平均法即因为各期数据Yi的对比基础bi不同它们对全期总平均水平的影响作用应轻重有别计算公式 1 分别计算其分子分母的平均数2 对比得上式实质上等于对各期Y加权算术平均 3 COD CoefficientofDispersion 离散系数也是对比率变量离散程度的描述计算公式为 4 PRD Price relatedDifferential 相关价格微分是比率均值与加权比率均值的比也是比率变量离散程度的描述 5 COV变异系数用于对比率变量离散程度的描述分为基于均值的变异系数 MeancenteredCOV 和中位数的变异系数 MediancenteredCOV 前者是通常意义下的变异系数是标准差除以均值后者定义为 5 6 2比率分析的基本步骤 1 选择菜单Analyze DescriptiveStatistics Radio 出现窗口 2 将比率变量的分子选择到Numerator框中将比率变量的分母选到Denominator框中 3 如果做不同组间的比率比较则将分组变量选择到GroupVariable框中 4 单击Statistics按钮指定输出哪些关于比率的描述统计量出现如下窗口至此 SPSS将自动计算比率变量并将相关指标输出到输出窗口中报表中的描述性统计分析 casesummaries 过程 casesummaries过程用于按指定的分组变量的不同水平进行交叉描述性统计分析 Analyze report casesummary进入 variables框选择需要进行分析的变量可多选 groupingvariables框选择用于分组的变量如果选择了多个分组变量则系统会按各个变量的不同取值的交叉组合对汇总变量进行分析 Displaycase 用于确定是否输出详细的记录列表下面的三个复选框用于选择具体的输出方式 Statistics子对话框用于选择一些常用的统计量 title子对话框 title框用于定义输出表格的标题默认标题为casesummaries caption框用于给输出表格加上注解文字 subheadingsfortotals 用于选择是否给每个分组均显示所计算统计量的名称 excludecasewithmissingvalueslistwise 用于选择是否在分析中删除带有缺失值的变量 missingstatisticsappearas 用于输出一个字符串用于在输出结果中表示缺失值报表中的描述性统计分析举例 1 对居民储蓄调查数据中的居民存款金额按照户口和职业进行分类汇总得到均值中位数及标准差分析可以使用splitfile过程然后使用descriptive过程来完成但是我们用这里的casesummary过程一步就能完成表格中的描述性统计分析 Basictables过程 Basictables过程可对定类资料或定量资料进行各种复杂格式的描述菜单操作 Analyze tables Basictablessummaries框选择需要进行汇总的变量可以是定类变量也可以是定距变量可以选入多个但所有变量只能使用同样的汇总指标 subgroups框用于定义分组汇总时的分组情况表格中的描述性统计分析 Basictables过程 down框选入分行汇总变量表格中的汇总指标按照该变量的不同取值分行输出可以选入多个 across框选入分列汇总变量 separatetable框选入分层汇总变量 allcombination 默认选项所有分组变量按照选入顺序依次嵌套 eachseparately 所有分组变量分别输出分组统计结果只是放在同一个表格中表格中的描述性统计分析 Basictables过程 statistics子对话框 percentilecutpoint框选中percentile统计量时可用用于选择分界百分位点 format框用于设置各种统计量的显示格式 label框用于设定各种统计量的显示标签默认为统计量名称可以更改为中文 sortingbycellcount框选择是否按照表中的频数顺序输出表格中的描述性统计分析 Basictables过程 layout子对话框用于设定各种标题标签的显示方式 summaryvariablelables框用于选择汇总变量标签的显示方式可以在左侧顶部和分不同表格输出中选择 statisticslables框用于选择统计量标签的显示方式 groupinsummaryvariabledimension框如果在前面将汇总变量和分组变量选在了同一方向显示则可在此处选择是将汇总变量是与各亚组之下还是将分则变量值与汇总变量之下 lablegroupswithvaluelablesonly框如果选中该框则各分组的变量名标签将被省略他们将用数值标签或数值本身来表示表格中的描述性统计分析 Basictables过程 totals子对话框选择是否进行汇总以及设定汇总标签 totalsovereachgroupvariable框要求给出每一分组的汇总结果缺失值将不纳入汇总分析可在下方的lable框中更改分组汇总标签 table margintotals框为表格的每一个维度生成汇总结果缺失值将不纳入汇总分析 format子对话框表格中的描述性统计分析 Basictables过程 format子对话框 emptycellappearance框选择无频数单元格的表示方式默认为空可改为用零表示 missingstatisticsappearas框选择对缺失值的表示方式默认为小数点可更改为十个字符长度内的任意字符串表格中的描述性统计分析 Basictables过程例如将收入情况和未来收入情况按照户口和职业进行频数统计表格中的描述性统计分析 generaltables过程 Basictables过程已经为我们提供了非常强大的制表能力但它只能分别对定量资料或分类资料进行汇总而且对于多选题数据无能为力 generaltables则可以解决以上问题菜单操作 Analyze tables generaltablesstatisticslablesappear 选择统计量标签的显示方式表格中的描述性统计分析 generaltables过程 acrossthetop 每个统计量单独占一列标签在列顶部显示 downtheside 每个统计量单独占一行标签在行首显示 inthelayer 每个统计量单独占一页标签在页首显示 rows框选入行变量这些变量实际上就是需要进行汇总分析的变量可选入多个使用右边的选择框对汇总指标加以定义 columns框选入列变量类似于分组变量可选多个 layers框选入分层汇总变量表格中的描述性统计分析 generaltables过程 selectedvariable框组用于对行列变量的汇总指标显示标签组合方式加以定义 definescell 定类变量issummarized 定距变量omitlable 在结果中不输出选中的变量名或标签 nest与unnest 当同一个框中选入多个变量时可用用于选择和更改变量间的组合方式前者为嵌套后者为分别输出 editstatistics 对行变量需要计算的汇总指标加以定义 inser

人人文库> 全部分类> 生活休闲 > 科普知识

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

第五章 SPSS基本统计分析.ppt

文档简介

温馨提示

最新文档

评论

第五章 SPSS基本统计分析.ppt

文档简介

温馨提示

最新文档

评论

相关文档