SPSS描述统计PPT课件.ppt_第1页
SPSS描述统计PPT课件.ppt_第2页
SPSS描述统计PPT课件.ppt_第3页
SPSS描述统计PPT课件.ppt_第4页
SPSS描述统计PPT课件.ppt_第5页
已阅读5页,还剩174页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第3章统计描述 2020 2 4 1 2020 2 4 2 2020 2 4 3 SPSS基本统计分析是进行其他统计分析的基础和前提 通过基本统计方法的学习 可以对要分析数据的总体特征有比较准确的把握 从而有助于选择其他更为深入的统计分析方法 本章主要介绍如何在SPSS中进行平均数 中位数 众数 方差 百分位 频数 峰度 偏度 探索分析 交叉联列表分析 多选项分析 基本统计报表制作等的操作 2020 2 4 4 3 1均值 Mean 和均值标准误差 S E mean 3 1 1统计学上的定义和计算公式 定义 均值 平均值 平均数 表示的是某变量所有取值的集中趋势或平均水平 例如 学生某门学科的平均成绩 公司员工的平均收入 某班级学生的平均身高等 计算公式如下 2020 2 4 5 总体平均数 若一组数据X1 X2 XN 代表一个大小为N的有限总体 则其总体平均数为 2020 2 4 6 样本平均数 若一组数据x1 x2 xn 代表一个大小为n的有限样本 则其样本平均数为 2020 2 4 7 样本数据来自总体 样本的统计描述量可以反映总体数据的特征 但由于抽样等原因 使得样本数据不一定能够完全准确地反映总体 它可能与总体的真实值之间存在一定的差异 进行不同次抽样 会得到若干个不同的样本均值 它们与总体均值存在着不同的差异 均值标准误差 StandardErrorofMean S E mean 就是描述这些样本均值与总体均值之间平均差异程度的统计量 2020 2 4 8 3 1 2SPSS中实现过程 研究问题求某班级学生在一次数学测验中的平均成绩 数据如表3 1所示 表3 1某班级的数学成绩 2020 2 4 9 实现步骤 图3 1在菜单中选择 Frequencies 命令 2020 2 4 10 图3 2 Frequencies 对话框 一 2020 2 4 11 图3 3 Frequencies Statistics 对话框 一 2020 2 4 12 3 1 3结果和讨论 2020 2 4 13 3 2中位数 Median 3 2 1统计学上的定义和计算公式 定义 把一组数据按递增或递减的顺序排列 处于中间位置上的变量值就是中位数 它是一种位置代表值 所以不会受到极端数值的影响 具有较高的稳健性 2020 2 4 14 计算公式 一个大小为的数列 要求其中位数 首先应把该数列按大小顺序排列好 如果为奇数 那么该数列的中位数就是位置上的数 如果N为偶数 中位数则是该数列中第与第 1位置上两个数值的平均数 2020 2 4 15 3 2 2SPSS中实现过程 研究问题求某班级学生身高的中位数 数据如表3 2所示 表3 2某班级学生的身高 2020 2 4 16 实现步骤 图3 4 Frequencies Statistics 对话框 二 2020 2 4 17 3 2 3结果和讨论 2020 2 4 18 3 3众数 Mode 3 3 1统计学上的定义和计算公式 定义 众数是指一组数据中 出现次数最多的那个变量值 众数在描述数据集中趋势方面有一定的意义 例如 制鞋厂可以根据消费者所需鞋的尺码的众数来安排生产 计算公式 手工计算众数比较麻烦 需要统计数据的次数分布 2020 2 4 19 3 3 2SPSS中实现过程 研究问题求某医院当天出生新生儿的体重的众数 数据如表3 3所示 表3 3新生儿的体重 2020 2 4 20 实现步骤 图3 5 Frequencies Statistics 对话框 三 2020 2 4 21 3 3 3结果和讨论 2020 2 4 22 3 4 1统计学上的定义和计算公式 3 4全距 Range 定义 全距也称为极差 是数据的最大值与最小值之间的绝对差 在相同样本容量情况下的两组数据 全距大的一组数据要比全距小的一组数据更为分散 计算公式 最大值 最小值 2020 2 4 23 3 4 2SPSS中实现过程 研究问题求某班级学生数学成绩的全距 数据如表3 4所示 表3 4某班级的数学成绩 2020 2 4 24 实现步骤 图3 6 Frequencies Statistics 对话框 四 2020 2 4 25 3 4 3结果和讨论 2020 2 4 26 3 5 1统计学上的定义和计算公式 3 5方差 Variance 和标准差 StandardDeviation 定义 方差是所有变量值与平均数偏差平方的平均值 它表示了一组数据分布的离散程度的平均值 标准差是方差的平方根 它表示了一组数据关于平均数的平均离散程度 方差和标准差越大 说明变量值之间的差异越大 距离平均数这个 中心 的离散趋势越大 2020 2 4 27 2020 2 4 28 3 5 2SPSS中实现过程 研究问题求某班级学生数学成绩的方差和标准差 数据如表3 1所示 2020 2 4 29 实现步骤 图3 7在菜单中选择 Descriptives 命令 2020 2 4 30 图3 8 Descriptives 对话框 一 2020 2 4 31 图3 9 Descriptives Options 对话框 一 2020 2 4 32 3 5 3结果和讨论 2020 2 4 33 3 6四分位数 Quartiles 十分位数 Deciles 和百分位数 Percentiles 3 6 1统计学上的定义 定义 四分位数是将一组个案由小到大 或由大到小 排序后 用3个点将全部数据分为四等份 与3个点上相对应的变量称为四分位数 分别记为Q1 第一四分位数 Q2 第二四分位数 Q3 第三四分位数 其中 Q3到Q1之间的距离的一半又称为四分位差 记为Q 四分位差越小 说明中间的数据越集中 四分位数越大 则意味着中间部分的数据越分散 2020 2 4 34 十分位数是将一组数据由小到大 或由大到小 排序后 用9个点将全部数据分为十等份 与9个点位置上相对应的变量称为十分位数 分别记为D1 D2 D9 表示10 的数据落在D1下 20 的数据落在D2下 90 落在D9下 2020 2 4 35 百分位数是将一组数据由小到大 或由大到小 排序后分割为100等份 与99个分割点位置上相对应的变量称为百分位数 分别记为P1 P2 P99 表示1 的数据落在P1下 2 的数据落在P2下 99 落在P99下 2020 2 4 36 3 6 2SPSS中实现过程 研究问题1求某班级学生数学成绩的四分位数 数据如表3 1所示 2020 2 4 37 实现步骤 图3 10 Frequencies Statistics 对话框 五 2020 2 4 38 研究问题2测量54个某种机械零件的重量 克 求零件重量的D6 数据如表3 5所示 表3 5零件的重量 2020 2 4 39 实现步骤 图3 11 Frequencies Statistics 对话框 六 2020 2 4 40 图3 12 Frequencies Statistics 对话框 七 2020 2 4 41 研究问题3测量出54个某种机械零件的重量 克 求零件重量的P37 数据如表3 5所示 2020 2 4 42 实现步骤 图3 12 Frequencies Statistics 对话框 七 2020 2 4 43 3 6 3结果和讨论 研究问题1的程序运行结果如下表所示 2020 2 4 44 研究问题2的程序运行结果如下表所示 2020 2 4 45 研究问题3的程序运行结果如下表所示 2020 2 4 46 3 7频数 Frequency 3 7 1统计学上的定义和计算公式 定义 频数就是一个变量在各个变量值上取值的个案数 如要了解学生某次考试的成绩情况 需要计算出学生所有分数取值 以及每个分数取值有多少个人 这就需要用到频数分析 2020 2 4 47 变量的频数分析正是实现上述分析的最好手段 它可以使人们非常清楚地了解变量取值的分布情况 2020 2 4 48 3 7 2SPSS中实现过程 研究问题10个学生在某次数学 语文 化学考试中成绩如表3 6所示 试求学生在3门课程上的频数分布 2020 2 4 49 表3 6学生成绩 2020 2 4 50 实现步骤 图3 13 Frequencies 对话框 二 2020 2 4 51 3 7 3结果和讨论 程序运行结果如下表所示 2020 2 4 52 3 8峰度 Kurtosis 3 8 1统计学上的定义和计算公式 定义 峰度是描述某变量所有取值分布形态陡缓程度的统计量 这个统计量是与正态分布相比较的量 峰度为0表示其数据分布与正态分布的陡缓程度相同 峰度大于0表示比正态分布高峰要更加陡峭 为尖顶峰 峰度小于0表示比正态分布的高峰要平坦 为平顶峰 具体的计算公式为 2020 2 4 53 3 8 2SPSS中实现过程 研究问题某班级40个学生的年龄分布如表3 7所示 试求学生年龄峰度 表3 7学生年龄 2020 2 4 54 实现步骤 图3 14在Data菜单中选择 WeightCases 命令 2020 2 4 55 3 8 3结果和讨论 2020 2 4 56 3 9偏度 Skewness 3 9 1统计学上的定义和计算公式 定义 偏度也是描述数据分布形态的 它是描述某变量取值分布对称性的统计量 具体的计算公式为 2020 2 4 57 这个统计量是与正态分布相比较的量 偏度为0表示其数据分布形态与正态分布偏度x相同 偏度大于0表示正偏差数值较大 为正偏或右偏 即有一条长尾巴拖在右边 偏度小于0表示负偏差数值大 为负偏或左偏 有一条长尾拖在左边 而偏度的绝对值数值越大表示分布形态的偏斜程度越大 2020 2 4 58 3 9 2SPSS中实现过程 研究问题某班级41个学生的身高分布如表3 8所示 试求学生身高分布偏度 表3 8学生身高 2020 2 4 59 实现步骤 图3 17 Frequencies Statistics 对话框 九 2020 2 4 60 3 9 3结果和讨论 2020 2 4 61 3 10标准化Z分数及其线性转换 3 10 1统计学上的定义和计算公式 2020 2 4 62 2020 2 4 63 3 10 2SPSS中实现过程 研究问题1求某班级学生数学成绩的Z分数 数据如表3 1所示 2020 2 4 64 实现步骤 图3 18 Descriptives 对话框 二 2020 2 4 65 图3 19 Descriptives Options 对话框 二 2020 2 4 66 图3 20数据编辑窗口 2020 2 4 67 研究问题2从图3 20中可以看到学生数学成绩的Z分数有正有负 而且小数点位数较多 因此可以把它线性转换为T分数 2020 2 4 68 实现步骤 图3 21在菜单中选择 ComputeVariable 命令 2020 2 4 69 图3 22 ComputeVariable 对话框 2020 2 4 70 图3 23 ComputeVariable Type 对话框 2020 2 4 71 图3 24数据编辑窗口 2020 2 4 72 3 10 3结果和讨论 从Z分数 图3 20 和T分数 图3 24 的结果中可以看出此班级学生数学成绩的T分数比之前的Z分数简洁多了 比较起来一目了然 2020 2 4 73 3 11探索分析 3 11 1统计学上的定义和计算公式 定义 调用此过程可对变量进行更为深入详尽的描述性统计分析 故称之为探索分析 它在一般描述性统计指标的基础上 增加有关数据其他特征的文字与图形描述 显得更加细致与全面 有助于用户思考对数据进行进一步分析的方案 2020 2 4 74 1 探索分析的内容包括下面几个方面 检查数据是否有错误 过大或过小的数据均有可能是奇异值 影响点或错误数据 要找出这样的数据 并分析原因 然后决定是否从分析中删除这些数据 因为奇异值和影响点往往对分析的影响较大 不能真实反映数据的总体特征 2020 2 4 75 对数据规律的初步观察 通过初步观察获得数据的一些内部规律 例如 两个变量间是否线性相关 2020 2 4 76 2 探索分析的考察方法 探索分析一般通过数据文件在分组与不分组的情况下 获得常用统计量和图形 一般以图形方式输出 直观帮助用户确定奇异值 影响点 进行假设检验 以及确定用户要使用的某种统计方式是否合适 2020 2 4 77 3 正态分布检验 常用的正态分布检验是Q Q图 本例中进行了正态分布检验 2020 2 4 78 4 方差齐次性检验 对数据分析不仅需要进行正态分布检验 有时候还需要比较各个分组的方差是否相同 这就要进行方差齐次性检验 例如 在进行独立右边的T检验之前 就需要事先确定两个数据的方差是否相同 2020 2 4 79 如果通过分析发现各个方差不同 还需要对数据进行方差分析 那么就需要对数据进行转换使得方差尽可能相同 在探索分析中可以使用Levene检验 2020 2 4 80 Levene检验对数据进行方差齐次性检验时 不强求数据必须服从正态分布 它先计算出各个观测值减去组内均值的差 然后再通过这些差值的绝对值进行单因素方差分析 如果得到显著性水平小于0 05 那么就可以拒绝方差相同的假设 2020 2 4 81 3 11 2SPSS中实现过程 研究问题20名10岁少儿的身高 cm 资料 数据如表3 9所示 试作探索性分析 2020 2 4 82 表3 9身高数据 2020 2 4 83 实现步骤 图3 25在菜单中选择 Explore 命令 2020 2 4 84 图3 26 Explore 对话框 2020 2 4 85 图3 27 Explore Statistics 对话框 2020 2 4 86 图3 28 Explore Plots 对话框 2020 2 4 87 图3 29 Explore Options 对话框 2020 2 4 88 3 11 3结果和讨论 在结果输出窗口中将看到如下统计数据 1 首先输出如下个案观察量摘要表 如下表所示 2020 2 4 89 2020 2 4 90 2 然后输出如下表格 2020 2 4 91 3 接着输出如下4个不同权重下作中心趋势的粗略最大似然确定数 2020 2 4 92 4 再接着输出百分位数 也是分组后的百分位数 如下表所示 2020 2 4 93 5 分别输出两个组中的最大5个数和最小5个数 并且包括这些值对应的ID 如下表所示 2020 2 4 94 6 输出方差齐次性检验结果 2020 2 4 95 7 系统还进行数据的茎叶情形描述 图3 30男孩身高的茎叶图 2020 2 4 96 图3 31女孩身高的茎叶图 2020 2 4 97 8 系统输出箱图 如图3 32所示 图3 32箱图 2020 2 4 98 9 输出Spreadvs Level图 如图3 33所示 图3 33Spreadvs Level图 2020 2 4 99 10 输出身高正态概率图 NormalQ QPlotof身高 如图3 34所示 图3 34男孩身高变量的正态概率图 2020 2 4 100 图3 35女孩身高变量的正态概率图 2020 2 4 101 11 输出离散正态概率图 DetrendedNormalQ QPlotof身高 男孩身高如图3 36所示 女孩身高如图3 37所示 横坐标是身高 纵坐标是和正态分布的偏离 2020 2 4 102 图3 36男孩身高离散正态概率图 2020 2 4 103 图3 37女孩身高离散正态概率图 2020 2 4 104 3 12交叉列联表分析 3 12 1统计学上的定义和计算公式 定义 前面的分析都是对单个变量的数据分布情况进行分析 但在实际分析中 还需要掌握多个变量在不同取值情况下的数据分布情况 从而进一步深入分析变量之间的相互影响和关系 这种分析就称为交叉列联表分析 2020 2 4 105 交叉列联表分析除了列出交叉分组下的频数分布外 还需要分析两个变量之间是否具有独立性或一定的相关性 要获得变量之间的相关性 仅仅靠频数分布的数据是不够的 还需要借助一些变量间相关程度的统计量和一些非参数检验的方法 2020 2 4 106 常用的衡量变量间相关程度的统计量是简单相关系数 参见本书有关章节 但在交叉列联表分析中 由于行列变量往往不是连续变量 不符合计算简单相关系数的前提条件 因此需要根据变量的性质 选择其他的相关系数 如Kendall等级相关系数 Eta值等 2020 2 4 107 SPSS提供了多种适用于不同相关系数的相关关系 这些检验的零假设是 行和列变量之间彼此独立 不存在显著的相关关系 SPSS将自动给出检验的相伴概率 如果相伴概率小于显著性水平0 05 那么应拒绝零假设 认为行列变量之间彼此相关 2020 2 4 108 计算公式如下 1 卡方统计量检验是常用的检验行列变量之间是否相关的方法 交叉列联表的卡方检验零假设是 行列变量之间独立 计算公式为 2020 2 4 109 卡方统计量服从 行数 1 列数 1 个自由度的卡方统计 SPSS在自动计算卡方统计量后 还会给出相应的相关概率 2020 2 4 110 2 Contingencycoefficient 列联系数 用于名义变量之间的相关系数计算 计算公式由卡方统计量修改而得 公式为其中 N为样本系数 2020 2 4 111 3 PhiandCramer sV 系数 用于名义变量之间的相关系数计算 计算公式由卡方统计量修改而得 公式为数值界于0 1之间 其中K为行数和列数较小的实际数 2020 2 4 112 3 12 2SPSS中实现过程 研究问题用两个班级学生进行两个感冒疫苗的试验 两个班级学生患感冒结果如表3 10所示 问两个班级学生的患病比例有无差别 2020 2 4 113 表3 10两班级学生的患病情况 2020 2 4 114 实现步骤 图3 38 WeightCases 对话框 2020 2 4 115 图3 39在菜单中选择 Crosstabs 命令 2020 2 4 116 图3 40 Crosstabs 对话框 2020 2 4 117 图3 41 Crosstabs Statistics 对话框 2020 2 4 118 图3 42 Crosstabs CellDisplay 对话框 2020 2 4 119 图3 43 Crosstabs TableFormat 对话框 2020 2 4 120 3 12 3结果和讨论 1 先输出如下个案处理摘要表 2020 2 4 121 2 下面所示表格是 班级 变量和 患病 变量的交叉列联表结果表格 2020 2 4 122 3 交叉分组下频数分布图形 如图3 44所示 2020 2 4 123 4 输出卡方统计结果表 2020 2 4 124 5 输出相对危险度表格如下所示 2020 2 4 125 3 13多选项分析 3 13 1统计学上的定义和计算公式 定义 多选项分析是对多选项问题的分析方法 所谓多选项问题 就是一个问题的答案都是顺序变量或名义变量 并且允许选择的答案可以有多种组合 对于多选项问题 分解 编码方案 的方法有两种 2020 2 4 126 1 多选项二分法 MultipleDichotomiesMethod 这种方法将每个可能的答案设置为一个SPSS变量 变量的取值有两个 分别表示选中或没选中 这种方法的缺点是需要的变量数比较多 比如一道题目有6个选项 则一道多选题目就需要用6个变量来表示 好处是比较简单 2020 2 4 127 2 多选项分类法 MultipleCategoryMethod 多选项分类法首先估计多选项问题可能出现的答案个数 比如一个多选题 如果最多有3个答案 那么就设置3个SPSS变量 分别用来存放3个可能的答案 如果某个案的答案只有两个 那么第3个SPSS变量取值为缺失值 2020 2 4 128 采用多选项分类法 进行普通的频数分析或交叉列联表分析有时候不能达到我们的要求 比如 我们要了解某选项的选中次数 就需要将3个变量中该选项的次数都累加起来 而不仅仅是一个变量中该选项的累加 2020 2 4 129 针对这种情况 SPSS提供了多选项分析方法 专门针对多选项问题 SPSS在处理的过程中会自动地将3个变量中相同答案的频率累加起来 2020 2 4 130 3 13 2SPSS中实现过程 研究问题1某商场对6种品牌的电视机进行消费者满意度调查 随机调查了20位消费者 让他们选出最满意的3个电视机品牌 收集到相应的数据 如表3 11所示 试用多选项二分法利用SPSS对该问题进行分析 包括频数分析和交叉列联表分析 2020 2 4 131 表3 1120名消费者调查情况 2020 2 4 132 实现步骤 图3 45在菜单中选择 DefineVariableSets 命令 2020 2 4 133 图3 46 DefineMultipleResponseSets 对话框 一 2020 2 4 134 图3 47在菜单中选择 Frequencies 命令 2020 2 4 135 图3 48 MultipleResponseFrequencies 对话框 一 2020 2 4 136 图3 49 MultipleResponseCrosstabs 对话框 一 2020 2 4 137 图3 50 MultipleResponseCrosstabs DefineVariable 对话框 2020 2 4 138 图3 51 MultipleResponseCrosstabs Options 对话框 一 2020 2 4 139 研究问题2上面实现过程是采用多选项二分法 本例采用多选项分类法对该问题进行分析 在本次调查中 每个被调查人最多选择3个品牌 因此有3个变量 用来保存每个被调查人的选择 数据表格如3 12所示 2020 2 4 140 表3 1220名消费者调查情况 2020 2 4 141 图3 52 DefineMultipleResponseSets 对话框 二 实现步骤 2020 2 4 142 图3 53 MultipleResponseFrequencies 对话框 二 2020 2 4 143 图3 54 MultipleResponseCrosstabs 对话框 二 2020 2 4 144 图3 55 MultipleResponseCrosstabs options 对话框 二 2020 2 4 145 3 13 3结果和讨论 上面分别采用了多选项二分法 研究问题1 和多选项分类法 研究问题2 对问题进行分析 2020 2 4 146 1 多选项二分法频数分析结果如下表所示 2020 2 4 147 2 下面所示结果表格是多选项二分法的交叉列联表结果表格 2020 2 4 148 下面说明研究问题2的结果 1 多选项分类法频数分析结果如下表所示 2020 2 4 149 2 多选项分类法的交叉列联表结果表格如下表所示 2020 2 4 150 1 4 2SPSS的数据编辑窗口 SPSS主界面主要有两个 一个是SPSS数据编辑窗口 另一个是SPSS输出窗口 数据编辑窗口由标题栏 菜单栏 工具栏 编辑栏 变量名栏 内容区 窗口切换标签页和状态栏组成 如图1 2所示 2020 2 4 151 3 14基本统计分析的报表制作 3 14 1报表分类 本章上面各节讨论了SPSS的一些基本统计功能 SPSS还提供了这些基本统计分析的报表制作功能 根据报表制作的侧重点不同 可以分为以下3种 2020 2 4 152 1 个案简明统计报表 CasesSummary 2 行形式报表 ReportSummariesinRows 3 列形式报表 ReportSummariesinColumns 2020 2 4 153 3 14 2SPSS中实现过程 研究问题1 个案简明统计报表某公司两个部门共有20名员工 收集到员工的基本工资 奖金和分红信息 生成个案简明统计报表 数据如表3 13所示 2020 2 4 154 表3 1320名员工的收入 2020 2 4 155 图3 56在菜单中选择 CaseSummaries 命令 实现步骤 2020 2 4 156 图3 57 S

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论