SPSS第四章基本统计分析PPT课件.ppt_第1页
SPSS第四章基本统计分析PPT课件.ppt_第2页
SPSS第四章基本统计分析PPT课件.ppt_第3页
SPSS第四章基本统计分析PPT课件.ppt_第4页
SPSS第四章基本统计分析PPT课件.ppt_第5页
已阅读5页,还剩78页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

制作人 夏怡凡 第4章SPSS基本统计分析 1 主要内容 引言介绍基本统计分析的重要性和主要内容 频数分析介绍如何对数据的频数分布进行把握 计算基本描述统计量进一步描述更为精确的数据分布特征 列联表分析描述多个变量之间是否存在相关关系 多选项分析对应处理问卷种多选的问题 比率分析描述两变量间比率的变化 新增功能 2 引言 基本数据分析的重要地位和作用 数据处理通常都是从基本统计分析入手的 能够使分析者掌握数据的基本统计特征 把握数据的整体分布形态 对以后的分析起到重要的指导和参考作用 3 引言 续 基本统计分析内容 编制单个变量频数分析表 计算单个变量的描述统计量以及在不同分组下的描述统计量 编制多个变量的交叉频数分析表并分析各变量关系 其他探索性分析 数据的多选项分析 4 引言 续 采用的常用方法 往往采用两种方式实现上述分析功能 数值计算 通过数值准确的反映数据的统计特征 图形绘制 通过图形直观的反映数据的分布特点 数值计算和图形绘制使混合使用的 相辅相成 5 4 1频数分析 4 1 1目的和基本任务 通过频数分析能够了解变量取值的状况 把握分布特征 SPSS中的频数分布表 频数即变量值落在某个区间中的次数 百分比即各频数占总样本数的百分比 有效百分比即各频数占总有效样本数的百分比 累计百分比即各百分比逐级累加起来的结果 6 4 1 1目的和基本任务 续 频数分析中的常用统计图 最为直接的数据刻画方式 条形图 BarChart 用条形的高度和长短表示频数分布的图形 适用定序和定类变量的分析 饼图 PieChart 用圆形和圆内扇形面积表示频数百分比 圆内扇形既可以表示频数也可以表示百分比 直方图 Histograms 用矩形面积表示频数分布变化 试用与定距变量的分析 可以附加正态曲线 7 4 1 2频数分析的基本操作 Analyze菜单 DescriptiveStatistics Frequencies 如下窗口 1 8 4 1 2频数分析的基本操作 续 OK Paste Cancel Reset Help Statistics Charts Format Variable s Displayfrequencytables 9 4 1 2频数分析的基本操作 续 Cancel Help Continue None BarChart PieChart Histograms ChartType Withnormalcurve Percentages Frequencies ChartValues 10 4 1 2频数分析的基本操作 续 2 将若干频数分析变量选入Variable s 框中 单击Charts 选择绘制统计图形 结果会显示在输出窗口中 11 4 1 3频数分析的扩展功能 SPSS还能做进一步的扩展功能 计算分位数 计算其他描述统计量 频数分布表格式的定义 12 格式表格即操作 AscendingValues DescendingValues AscendingCounts DescendingCounts Orderby Organizeoutputbyvariables Comparevariables MultipleVariables Cancel Help Continue Suppresstableswithmorethan 18 categories 13 格式的参数说明即操作 调整频数分布表中数据输出顺序 orderby 按值的升序或者降序输出 按频数的升序或者降序输出 压缩频数分布表如果变量取值太多或者区间太多 就需要压缩分布表 系统默认大于10不输出 可以修改 14 举例操作 居民储蓄调查数据频数分析 分析户口和就业的基本情况 分析储户一次存 取 款金额的分布 并对城镇储户和农村储户进行比较 15 结果 16 17 结果图 18 19 4 2计算基本描述统计量4 2 1基本描述统计量 常见的基本描述统计量分为三类 刻画集中趋势的描述统计量 刻画离散程度的描述统计量 刻画分布形态的描述统计量 综合三类统计量能够极为准确和清晰的把握数据分布的特点 20 4 2 1 1刻画集中趋势的描述统计量 集中趋势是指一组数据向某一中心值靠拢的倾向 表现集中趋势的统计量主要有均值 数学定义中位数 众数 21 4 2 1 2刻画离散程度的描述统计量 离散程度是指一组数据远离其中心值的程度 刻画离散程度的常见统计量主要有样本标准差 数学定义样本方差 数学定义全距 样本最大最小值的差 22 4 2 1 3刻画分布形态的描述统计量 分布形态是指数据分布是否对称 偏斜程度 陡缓程度 刻画分布形态的常见统计量主要有偏度 数学定义峰度 数学定义 23 4 2 2计算基本描述统计量的基本操作 Analyze菜单 DescriptiveStatistics Discriptives 如下窗口 1 24 4 2 2描述统计量的基本操作 续 OK Paste Cancel Reset Help Options Variable s Savestandardizedvaluesasvariables 25 4 2 2描述统计量的基本操作 续 将需要计算的数值型变量选入Variable s 框中 单击Option 按钮指定计算哪些基本统计量 出现如下图对话框指定输出顺序 26 4 2 2描述统计量的基本操作 续 Cancel Help Continue Despersion Alphabetic Variablelist DisplayOrder Mean Sum Range S E mean Std deviation Min Variance Max Distribution Kurtosis Skewness Ascendingmeans Descendingmeans 27 4 2 3描述统计量的基本操作举例 计算存 取 款金额的基本描述统计量 并对城镇储户和农村储户进行比较 分析储户一次存 取 款数量是否存在不均衡现象 28 29 30 4 3交叉分组下的频数分析4 3 1目的和基本任务 目的 分析多个变量不同取值下的分布 掌握多变量的联合分布 分析变量之间的相互影响和关系 例子 居民储蓄问题的分析 31 目的和任务 续 列联表分析的两大基本任务 列联表分析的两大任务 根据收集到的数据 产生二维或者多维的交叉列联表 在交叉列联表的基础上 对两两变量是否存在相关性进行分析 32 4 3 2交叉列联表的主要内容 交叉列联表是两个或两个以上的变量交叉分组后形成的频数分布表 交叉列联表是由行列构成 行列分别代替一个变量 分别代表行变量和列变量 行列标题是两个变量的值 表格中是观测频数和各种百分比 行列还有边缘分布 33 列联表的例子 34 4 3 3列联表行列变量间关系的分析 分析行变量和列变量的关系 是列联表分析的第二个任务 可以得到行变量和列变量是否有联系 联系的紧密程度等更深层的信息 这种关系 有时候是明显的 有时候是隐藏的 可以通过卡方检验得到 35 4 3 3 1交叉列表的卡方检验 卡方检验属于假设检验的内容 主要步骤为 建立零假设 选择和计算检验统计量 这里选择的是皮尔逊卡方统计量 确立显著性水平和临界值 结论和决策 卡方值越大 独立性存在的可能越小 如果大于临界值 则认为不独立 36 4 3 3 2交叉列联表卡方检验的说明 列联表中不应该有期望频数小于1的单元格 也不应该有大量期望频数小于5的单元格 样本量不宜过大 37 4 3 4交叉分组下频数分析的操作 Analyze菜单 DescriptiveStatistics Crosstab 如下窗口 1 38 操作图 OK Paste Cancel Reset Help Statistics Cells Format Row s Displayclusteredbarcharts column s Layer1of Previous Next Suppresstables Exact 所有data数据中的变量 行变量 列变量 绘制多维列联表时的控制变量 39 4 3 4列联表分析基本操作 续 点击cells进入设置框 主要设置列联表中显示那些内容 内容主要有 Observed表示实际观测到的频数 Expected表示两变量独立时期望的频数 Percentage表示在表格中分别显示行 列和总共的百分比 Residuals表示是否标准化数据 40 4 3 4列联表分析基本操作 续 Cancel Help Continue Counts Column Row Percentages Observed Expected Residuals Unstandardized Total standardized Adj standardized 41 2020 1 27 42 4 3 4列联表分析基本操作 续 点击Format进入设置框 主要设置输出的排列顺序 按升序还是降序排列 点击statistics确定按那种方法分析行变量和列变量的关系 Chi square表示卡方分布检验 43 4 3 4列联表的基本操作 续 Cancel Help Continue Nominal Chi square Correlations lambda Contingencycoefficient PhiandCrameV NorminalbyInterval Eta Uncertaintycoefficient Kendall stau b Gamma Somers d Kendall stau c Ordinal 44 应用举例 目标一 分析城镇和农村对未来收入状况的变化趋势是否持一致态度 目标二 分析城镇和农村对储蓄是否合算的认同是否一致 45 4 3 5 1农村和城市储户对 变化趋势 是否持相同态度 户口和未来收入情况做列联表 要求列联表每一格输出百分比 期望频数 剩余 标准化剩余 利用卡方检验法 对态度是否一致进行检验 请看下表中的结果 46 47 48 49 结果分析 整体情况 城市农村人口分别为200 82 城镇人占多数 大部分人认为收入会基本不变 对不同类储户进行分析 不同类的储户 无论是城市还是农村储户 都认为收入会基本不变对不同看法的进行分析 在认为收入会增加的样本中 城市户口占多 认为不变的城乡差异缩小 认为收入会减少的农村多于城市 总体上将 城镇和农村看法不同 50 卡方检验结果 51 城镇和农村储户对储蓄是否合算的看法是否一致 结果如下图表 显著性如果定成0 05 差异显著 52 53 54 4 3 6SPSS中列联表分析的其他方法 SPSS还提供了其他变量间相关关系的检验办法 方法大致分为四类 适用于两定类变量的方法 Nominal框 适用于两定序变量的方法 Ordinal框 适用于一定类变量 一定距变量的方法 Eta 其他方法 55 4 3 6 1适用于两定类变量的方法 Phi系数 列联系数 Gramer sV系数 56 4 3 6 2适用于两序变量的方法 Kendall stau b系数 Kendall stau c系数 Gamma系数 57 4 3 6 3适用于一定类变量 一定距变量的方法 4 3 6 4其他方法 Eta系数 58 4 4多选项分析 SPSS中的多选项分析是针对问卷调查中的多选项问题的 多选项分析从问卷给出的若干个可选问题选择一个以上的答案 步骤一般是第一将多选项问题分解 第二是利用前面频数分析等方法进行分析 4 4 1多选项分析的目的 59 4 4 1 1多选项问题的分解 多选项问题答案不止一个 虽然可以用一个变量存储 但是不支持分析 对一个多选项问题仅设置一个SPSS变量在数据处理和分析中是行不通的 将一个问题分解为多个问题 对应设置多个SPSS变量 分别存储可能出现的答案 对一个多选项问题的分析就转化为多个问题的分析 60 4 4 4 2多选项问题分解的方法 第一 多选项问题的二分法 第二 多选项问题的分类法 二分法是将多选项问题的每个答案设为一个SPSS变量 每个变量只有0和1两个取值 多选项分类法首先应估计问题最多可能出现的答案个数 为每个答案设置为一个SPSS变量 变量取值为多选项问题中的可选答案 61 4 4 1 2对多选项问题做普通频数分析的困难 如果只对一个变量进行频数分析 得不到多选项变量得整体情况 只能得到分变量的情况 只有几个变量同时考虑才能才能全面体现所有多选项问题 但这在SPSS中难以实现 如何综合考虑几个变量的情况直接获得问题的数据表格 多选项分析可以解决这个问题 62 4 4 2多选项分析的基本操作 第一步 按照多选项二分法或者多项分类法将多选项问题分解成为多个问题 对应设置SPSS变量 第二步 选用多选项频数分析或者多选项交叉分组下频数分析的方法分析数据 为实现第二步 必须首先定义多变量集 下面是定义多变量集的操作 63 Analyze菜单 MultipleResponse DefineSets 如下窗口 1 定义多选项变量的基本操作 64 操作图 Close Help Add Variable s inSet DichotomiesCountedValue CategoriesRange 所有data数据中的变量 用于多变量分析得变量 though VariablesAreCodedAs Name Label Change Remove Mul ResponseSets 65 窗口说明 将进入多选项变量集的变量选择到Variablesinsets框中 在Variablearecodedas框中选择分解方法 第一个是二分法 下面的是分类法 为多选项变量集命名 单击add将定义好的多选项变量集加到MultResponseSets框中 重复上述操作可以定义多个多选项变量集 66 多选项频数分析的基本操作 Analyze菜单 MultipleResponse Frequencies 如下窗口 1 67 OK Paste Cancel Reset Help Table s for Excludecaseslikewisewithindichotomies MultResponseSets 按照第一步定义好的多选项变量集 Excludecaseslikewisewithincategories 要进行分析的多选项变量集 MissingValues 用二分法处理缺失数据 用分类法处理缺失数据 2 68 多选项交叉分组下的频数分析的基本操作 Analyze菜单 MultipleResponse Crosstabs 如下窗口 1 69 操作图 OK Paste Cancel Reset Help DefineRanges Format Row s column s Layer s 所有data数据中的变量 行变量 列变量 绘制多选项变量集列联表时的控制变量 MultResponseSet s 按照第一步定义好的多选项变量集 70 操作说明 选行变量并定义取值范围 也可选择多选项变量集为行变量 选列变量并定义取值范围 也可选择多选项变量集为列变量 选择控制变量并定义取值范围 可选多选项变量集为控制变量 单击Option进入下面对话框 71 计算变量在下图中 Cancel Help Continue CellPercentages Excludecaseslikewisewithincategories Excludecaseslikewisewithindichotomies MissingValues Matchvariablesacrossresponsesets Row Column Total Cases Responses Percentagesbasedon 72 4 4 3多选项分析的应用举例 数据仍然是居民储蓄调查数据 分析要达到的目的是 分析储户的储蓄目的 分析不同年龄段储户的储蓄目的 前者是简单的频数统计 适合用频数分析做 后者要求找出年龄和目的关系 适合用列联表做 73 目标一分析结果 Group RESULTTPctofPctofCategorylabelCodeCountResponsesCases1657 723 02516 018 1317921 263 54526 218 45161 95 76344 012 178810 431 28769 027 09556 519 51010712 737 91112014 242 6 Totalresponses843100 0298 90missingcases 282validcases 74 结果分析 储蓄的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论