




已阅读5页,还剩301页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
SPSS16实用教程 第3章统计描述 SPSS基本统计分析是进行其他统计分析的基础和前提 通过基本统计方法的学习 可以对要分析数据的总体特征有比较准确的把握 从而有助于选择其他更为深入的统计分析方法 本章主要介绍如何在SPSS中进行平均数 中位数 众数 方差 百分位 频数 峰度 偏度 探索分析 交叉联列表分析 多选项分析 基本统计报表制作等的操作 3 1均值 Mean 和均值标准误差 S E mean 3 1 1统计学上的定义和计算公式 定义 均值 平均值 平均数 表示的是某变量所有取值的集中趋势或平均水平 例如 学生某门学科的平均成绩 公司员工的平均收入 某班级学生的平均身高等 计算公式如下 总体平均数 若一组数据X1 X2 XN 代表一个大小为N的有限总体 则其总体平均数为 样本平均数 若一组数据x1 x2 xn 代表一个大小为n的有限样本 则其样本平均数为 样本数据来自总体 样本的统计描述量可以反映总体数据的特征 但由于抽样等原因 使得样本数据不一定能够完全准确地反映总体 它可能与总体的真实值之间存在一定的差异 进行不同次抽样 会得到若干个不同的样本均值 它们与总体均值存在着不同的差异 均值标准误差 StandardErrorofMean S E mean 就是描述这些样本均值与总体均值之间平均差异程度的统计量 3 1 2SPSS中实现过程 研究问题求某班级学生在一次数学测验中的平均成绩 数据如表3 1所示 表3 1某班级的数学成绩 实现步骤 图3 1在菜单中选择 Frequencies 命令 图3 2 Frequencies 对话框 一 图3 3 Frequencies Statistics 对话框 一 3 1 3结果和讨论 3 2中位数 Median 3 2 1统计学上的定义和计算公式 定义 把一组数据按递增或递减的顺序排列 处于中间位置上的变量值就是中位数 它是一种位置代表值 所以不会受到极端数值的影响 具有较高的稳健性 计算公式 一个大小为的数列 要求其中位数 首先应把该数列按大小顺序排列好 如果为奇数 那么该数列的中位数就是位置上的数 如果N为偶数 中位数则是该数列中第与第 1位置上两个数值的平均数 3 2 2SPSS中实现过程 研究问题求某班级学生身高的中位数 数据如表3 2所示 表3 2某班级学生的身高 实现步骤 图3 4 Frequencies Statistics 对话框 二 3 2 3结果和讨论 3 3众数 Mode 3 3 1统计学上的定义和计算公式 定义 众数是指一组数据中 出现次数最多的那个变量值 众数在描述数据集中趋势方面有一定的意义 例如 制鞋厂可以根据消费者所需鞋的尺码的众数来安排生产 计算公式 手工计算众数比较麻烦 需要统计数据的次数分布 3 3 2SPSS中实现过程 研究问题求某医院当天出生新生儿的体重的众数 数据如表3 3所示 表3 3新生儿的体重 实现步骤 图3 5 Frequencies Statistics 对话框 三 3 3 3结果和讨论 3 4 1统计学上的定义和计算公式 3 4全距 Range 定义 全距也称为极差 是数据的最大值与最小值之间的绝对差 在相同样本容量情况下的两组数据 全距大的一组数据要比全距小的一组数据更为分散 计算公式 最大值 最小值 3 4 2SPSS中实现过程 研究问题求某班级学生数学成绩的全距 数据如表3 4所示 表3 4某班级的数学成绩 实现步骤 图3 6 Frequencies Statistics 对话框 四 3 4 3结果和讨论 3 5 1统计学上的定义和计算公式 3 5方差 Variance 和标准差 StandardDeviation 定义 方差是所有变量值与平均数偏差平方的平均值 它表示了一组数据分布的离散程度的平均值 标准差是方差的平方根 它表示了一组数据关于平均数的平均离散程度 方差和标准差越大 说明变量值之间的差异越大 距离平均数这个 中心 的离散趋势越大 3 5 2SPSS中实现过程 研究问题求某班级学生数学成绩的方差和标准差 数据如表3 1所示 实现步骤 图3 7在菜单中选择 Descriptives 命令 图3 8 Descriptives 对话框 一 图3 9 Descriptives Options 对话框 一 3 5 3结果和讨论 3 6四分位数 Quartiles 十分位数 Deciles 和百分位数 Percentiles 3 6 1统计学上的定义 定义 四分位数是将一组个案由小到大 或由大到小 排序后 用3个点将全部数据分为四等份 与3个点上相对应的变量称为四分位数 分别记为Q1 第一四分位数 Q2 第二四分位数 Q3 第三四分位数 其中 Q3到Q1之间的距离的一半又称为四分位差 记为Q 四分位差越小 说明中间的数据越集中 四分位数越大 则意味着中间部分的数据越分散 十分位数是将一组数据由小到大 或由大到小 排序后 用9个点将全部数据分为十等份 与9个点位置上相对应的变量称为十分位数 分别记为D1 D2 D9 表示10 的数据落在D1下 20 的数据落在D2下 90 落在D9下 百分位数是将一组数据由小到大 或由大到小 排序后分割为100等份 与99个分割点位置上相对应的变量称为百分位数 分别记为P1 P2 P99 表示1 的数据落在P1下 2 的数据落在P2下 99 落在P99下 3 6 2SPSS中实现过程 研究问题1求某班级学生数学成绩的四分位数 数据如表3 1所示 实现步骤 图3 10 Frequencies Statistics 对话框 五 研究问题2测量54个某种机械零件的重量 克 求零件重量的D6 数据如表3 5所示 表3 5零件的重量 实现步骤 图3 11 Frequencies Statistics 对话框 六 图3 12 Frequencies Statistics 对话框 七 研究问题3测量出54个某种机械零件的重量 克 求零件重量的P37 数据如表3 5所示 实现步骤 图3 12 Frequencies Statistics 对话框 七 3 6 3结果和讨论 研究问题1的程序运行结果如下表所示 研究问题2的程序运行结果如下表所示 研究问题3的程序运行结果如下表所示 3 7频数 Frequency 3 7 1统计学上的定义和计算公式 定义 频数就是一个变量在各个变量值上取值的个案数 如要了解学生某次考试的成绩情况 需要计算出学生所有分数取值 以及每个分数取值有多少个人 这就需要用到频数分析 变量的频数分析正是实现上述分析的最好手段 它可以使人们非常清楚地了解变量取值的分布情况 3 7 2SPSS中实现过程 研究问题10个学生在某次数学 语文 化学考试中成绩如表3 6所示 试求学生在3门课程上的频数分布 表3 6学生成绩 实现步骤 图3 13 Frequencies 对话框 二 3 7 3结果和讨论 程序运行结果如下表所示 3 8峰度 Kurtosis 3 8 1统计学上的定义和计算公式 定义 峰度是描述某变量所有取值分布形态陡缓程度的统计量 这个统计量是与正态分布相比较的量 峰度为0表示其数据分布与正态分布的陡缓程度相同 峰度大于0表示比正态分布高峰要更加陡峭 为尖顶峰 峰度小于0表示比正态分布的高峰要平坦 为平顶峰 具体的计算公式为 3 8 2SPSS中实现过程 研究问题某班级40个学生的年龄分布如表3 7所示 试求学生年龄峰度 表3 7学生年龄 实现步骤 图3 14在Data菜单中选择 WeightCases 命令 3 8 3结果和讨论 3 9偏度 Skewness 3 9 1统计学上的定义和计算公式 定义 偏度也是描述数据分布形态的 它是描述某变量取值分布对称性的统计量 具体的计算公式为 这个统计量是与正态分布相比较的量 偏度为0表示其数据分布形态与正态分布偏度x相同 偏度大于0表示正偏差数值较大 为正偏或右偏 即有一条长尾巴拖在右边 偏度小于0表示负偏差数值大 为负偏或左偏 有一条长尾拖在左边 而偏度的绝对值数值越大表示分布形态的偏斜程度越大 3 9 2SPSS中实现过程 研究问题某班级41个学生的身高分布如表3 8所示 试求学生身高分布偏度 表3 8学生身高 实现步骤 图3 17 Frequencies Statistics 对话框 九 3 9 3结果和讨论 3 10标准化Z分数及其线性转换 3 10 1统计学上的定义和计算公式 3 10 2SPSS中实现过程 研究问题1求某班级学生数学成绩的Z分数 数据如表3 1所示 实现步骤 图3 18 Descriptives 对话框 二 图3 19 Descriptives Options 对话框 二 图3 20数据编辑窗口 研究问题2从图3 20中可以看到学生数学成绩的Z分数有正有负 而且小数点位数较多 因此可以把它线性转换为T分数 实现步骤 图3 21在菜单中选择 ComputeVariable 命令 图3 22 ComputeVariable 对话框 图3 23 ComputeVariable Type 对话框 图3 24数据编辑窗口 3 10 3结果和讨论 从Z分数 图3 20 和T分数 图3 24 的结果中可以看出此班级学生数学成绩的T分数比之前的Z分数简洁多了 比较起来一目了然 3 11探索分析 3 11 1统计学上的定义和计算公式 定义 调用此过程可对变量进行更为深入详尽的描述性统计分析 故称之为探索分析 它在一般描述性统计指标的基础上 增加有关数据其他特征的文字与图形描述 显得更加细致与全面 有助于用户思考对数据进行进一步分析的方案 1 探索分析的内容包括下面几个方面 检查数据是否有错误 过大或过小的数据均有可能是奇异值 影响点或错误数据 要找出这样的数据 并分析原因 然后决定是否从分析中删除这些数据 因为奇异值和影响点往往对分析的影响较大 不能真实反映数据的总体特征 对数据规律的初步观察 通过初步观察获得数据的一些内部规律 例如 两个变量间是否线性相关 2 探索分析的考察方法 探索分析一般通过数据文件在分组与不分组的情况下 获得常用统计量和图形 一般以图形方式输出 直观帮助用户确定奇异值 影响点 进行假设检验 以及确定用户要使用的某种统计方式是否合适 3 正态分布检验 常用的正态分布检验是Q Q图 本例中进行了正态分布检验 4 方差齐次性检验 对数据分析不仅需要进行正态分布检验 有时候还需要比较各个分组的方差是否相同 这就要进行方差齐次性检验 例如 在进行独立右边的T检验之前 就需要事先确定两个数据的方差是否相同 如果通过分析发现各个方差不同 还需要对数据进行方差分析 那么就需要对数据进行转换使得方差尽可能相同 在探索分析中可以使用Levene检验 Levene检验对数据进行方差齐次性检验时 不强求数据必须服从正态分布 它先计算出各个观测值减去组内均值的差 然后再通过这些差值的绝对值进行单因素方差分析 如果得到显著性水平小于0 05 那么就可以拒绝方差相同的假设 3 11 2SPSS中实现过程 研究问题20名10岁少儿的身高 cm 资料 数据如表3 9所示 试作探索性分析 表3 9身高数据 实现步骤 图3 25在菜单中选择 Explore 命令 图3 26 Explore 对话框 图3 27 Explore Statistics 对话框 图3 28 Explore Plots 对话框 图3 29 Explore Options 对话框 3 11 3结果和讨论 在结果输出窗口中将看到如下统计数据 1 首先输出如下个案观察量摘要表 如下表所示 2 然后输出如下表格 3 接着输出如下4个不同权重下作中心趋势的粗略最大似然确定数 4 再接着输出百分位数 也是分组后的百分位数 如下表所示 5 分别输出两个组中的最大5个数和最小5个数 并且包括这些值对应的ID 如下表所示 6 输出方差齐次性检验结果 7 系统还进行数据的茎叶情形描述 图3 30男孩身高的茎叶图 图3 31女孩身高的茎叶图 8 系统输出箱图 如图3 32所示 图3 32箱图 9 输出Spreadvs Level图 如图3 33所示 图3 33Spreadvs Level图 10 输出身高正态概率图 NormalQ QPlotof身高 如图3 34所示 图3 34男孩身高变量的正态概率图 图3 35女孩身高变量的正态概率图 11 输出离散正态概率图 DetrendedNormalQ QPlotof身高 男孩身高如图3 36所示 女孩身高如图3 37所示 横坐标是身高 纵坐标是和正态分布的偏离 图3 36男孩身高离散正态概率图 图3 37女孩身高离散正态概率图 3 12交叉列联表分析 3 12 1统计学上的定义和计算公式 定义 前面的分析都是对单个变量的数据分布情况进行分析 但在实际分析中 还需要掌握多个变量在不同取值情况下的数据分布情况 从而进一步深入分析变量之间的相互影响和关系 这种分析就称为交叉列联表分析 列联表的例子 交叉列联表分析除了列出交叉分组下的频数分布外 还需要分析两个变量之间是否具有独立性或一定的相关性 要获得变量之间的相关性 仅仅靠频数分布的数据是不够的 还需要借助一些变量间相关程度的统计量和一些非参数检验的方法 常用的衡量变量间相关程度的统计量是简单相关系数 参见本书有关章节 但在交叉列联表分析中 由于行列变量往往不是连续变量 不符合计算简单相关系数的前提条件 因此需要根据变量的性质 选择其他的相关系数 如Kendall等级相关系数 Eta值等 SPSS提供了多种适用于不同相关系数的相关关系 这些检验的零假设是 行和列变量之间彼此独立 不存在显著的相关关系 SPSS将自动给出检验的相伴概率 如果相伴概率小于显著性水平0 05 那么应拒绝零假设 认为行列变量之间彼此相关 计算公式如下 1 卡方统计量检验是常用的检验行列变量之间是否相关的方法 交叉列联表的卡方检验零假设是 行列变量之间独立 计算公式为 卡方统计量服从 行数 1 列数 1 个自由度的卡方统计 SPSS在自动计算卡方统计量后 还会给出相应的相关概率 2 Contingencycoefficient 列联系数 用于名义变量之间的相关系数计算 计算公式由卡方统计量修改而得 公式为其中 N为样本系数 3 PhiandCramer sV 系数 用于名义变量之间的相关系数计算 计算公式由卡方统计量修改而得 公式为数值界于0 1之间 其中K为行数和列数较小的实际数 3 12 2SPSS中实现过程 研究问题用两个班级学生进行两个感冒疫苗的试验 两个班级学生患感冒结果如表3 10所示 问两个班级学生的患病比例有无差别 表3 10两班级学生的患病情况 实现步骤 图3 38 WeightCases 对话框 图3 39在菜单中选择 Crosstabs 命令 图3 40 Crosstabs 对话框 图3 41 Crosstabs Statistics 对话框 图3 42 Crosstabs CellDisplay 对话框 图3 43 Crosstabs TableFormat 对话框 3 12 3结果和讨论 1 先输出如下个案处理摘要表 2 下面所示表格是 班级 变量和 患病 变量的交叉列联表结果表格 3 交叉分组下频数分布图形 如图3 44所示 4 输出卡方统计结果表 5 输出相对危险度表格如下所示 3 13多选项分析 3 13 1统计学上的定义和计算公式 定义 多选项分析是对多选项问题的分析方法 所谓多选项问题 就是一个问题的答案都是顺序变量或名义变量 并且允许选择的答案可以有多种组合 对于多选项问题 分解 编码方案 的方法有两种 1 多选项二分法 MultipleDichotomiesMethod 这种方法将每个可能的答案设置为一个SPSS变量 变量的取值有两个 分别表示选中或没选中 这种方法的缺点是需要的变量数比较多 比如一道题目有6个选项 则一道多选题目就需要用6个变量来表示 好处是比较简单 2 多选项分类法 MultipleCategoryMethod 多选项分类法首先估计多选项问题可能出现的答案个数 比如一个多选题 如果最多有3个答案 那么就设置3个SPSS变量 分别用来存放3个可能的答案 如果某个案的答案只有两个 那么第3个SPSS变量取值为缺失值 采用多选项分类法 进行普通的频数分析或交叉列联表分析有时候不能达到我们的要求 比如 我们要了解某选项的选中次数 就需要将3个变量中该选项的次数都累加起来 而不仅仅是一个变量中该选项的累加 针对这种情况 SPSS提供了多选项分析方法 专门针对多选项问题 SPSS在处理的过程中会自动地将3个变量中相同答案的频率累加起来 3 13 2SPSS中实现过程 研究问题1某商场对6种品牌的电视机进行消费者满意度调查 随机调查了20位消费者 让他们选出最满意的3个电视机品牌 收集到相应的数据 如表3 11所示 试用多选项二分法利用SPSS对该问题进行分析 包括频数分析和交叉列联表分析 表3 1120名消费者调查情况 实现步骤 图3 45在菜单中选择 DefineVariableSets 命令 图3 46 DefineMultipleResponseSets 对话框 一 图3 47在菜单中选择 Frequencies 命令 图3 48 MultipleResponseFrequencies 对话框 一 图3 49 MultipleResponseCrosstabs 对话框 一 图3 50 MultipleResponseCrosstabs DefineVariable 对话框 图3 51 MultipleResponseCrosstabs Options 对话框 一 研究问题2上面实现过程是采用多选项二分法 本例采用多选项分类法对该问题进行分析 在本次调查中 每个被调查人最多选择3个品牌 因此有3个变量 用来保存每个被调查人的选择 数据表格如3 12所示 表3 1220名消费者调查情况 图3 52 DefineMultipleResponseSets 对话框 二 实现步骤 图3 53 MultipleResponseFrequencies 对话框 二 图3 54 MultipleResponseCrosstabs 对话框 二 图3 55 MultipleResponseCrosstabs options 对话框 二 3 13 3结果和讨论 上面分别采用了多选项二分法 研究问题1 和多选项分类法 研究问题2 对问题进行分析 1 多选项二分法频数分析结果如下表所示 2 下面所示结果表格是多选项二分法的交叉列联表结果表格 下面说明研究问题2的结果 1 多选项分类法频数分析结果如下表所示 2 多选项分类法的交叉列联表结果表格如下表所示 1 4 2SPSS的数据编辑窗口 SPSS主界面主要有两个 一个是SPSS数据编辑窗口 另一个是SPSS输出窗口 数据编辑窗口由标题栏 菜单栏 工具栏 编辑栏 变量名栏 内容区 窗口切换标签页和状态栏组成 如图1 2所示 3 14基本统计分析的报表制作 3 14 1报表分类 本章上面各节讨论了SPSS的一些基本统计功能 SPSS还提供了这些基本统计分析的报表制作功能 根据报表制作的侧重点不同 可以分为以下3种 1 个案简明统计报表 CasesSummary 2 行形式报表 ReportSummariesinRows 3 列形式报表 ReportSummariesinColumns 3 14 2SPSS中实现过程 研究问题1 个案简明统计报表某公司两个部门共有20名员工 收集到员工的基本工资 奖金和分红信息 生成个案简明统计报表 数据如表3 13所示 表3 1320名员工的收入 图3 56在菜单中选择 CaseSummaries 命令 实现步骤 图3 57 SummarizeCases 对话框 图3 58 SummaryReport Statistics 对话框 图3 59 Options 对话框 研究问题2 行形式报表仍用研究问题1中的例子 数据见表3 13 图3 60 ReportSummariesinRows 对话框 实现步骤 图3 61 Report DataColumnsfor基本工资 对话框 图3 62 Report SummaryLinesfor部门 对话框 图3 63 Report BreakOptionsfor部门 对话框 图3 64 Report FinalSummaryLines 对话框 图3 65 Report Options 对话框 图3 66 Report Layout 对话框 图3 67 Report Title s 对话框 研究问题3 列形式报表某公司两个部门共有20名员工 收集到员工的基本工资 奖金和分红信息 数据见表3 13 生成列形式报表 图3 68 Report SummariesinColumns 对话框 实现步骤 图3 69 Report SummaryLinesfor基本工资 对话框 图3 70 Report SummaryColumns 对话框 3 14 3结果和讨论 上面分别采用了个案简明统计报表 行形式报表 列形式报表3种报告形式对两个部门的员工收入情况进行了分析 1 个案简明统计报表结果如下表所示 2 行形式报表结果如下表所示 3 列形式报表结果如下表所示 小结 描述性统计是进行其他统计分析的基础和前提 利用这些基本统计方法 可以对要分析数据的总体特征有比较准确的把握 同时也为更深入的分析提供了依据 小结 Frequencies命令可用于数字型或字符型变量的统计分析 如均值 标准差 最小值 最大值 众数 中位数 方差 全距等14种统计量 探索分析可对变量进行更为深入详尽的描述性统计分析 有助于用户思考对数据进行进一步分析的方案 SPSS统计软件与应用 你为什么要学SPSS 听说 这个很有用 因为 我们是研究型人才 1 新课改前后学生的成绩有无显著提高 教育学 2 根据学生成绩分优差班是否会使差班学生成绩更差 教育管理 3 启蒙班和普通班的孩子智力开发程度一样吗 学前教育 谁能回答这些问题 你喜欢数字吗 数字 可以很无聊 圆周率 3 141592653589793238462643383279 复杂的计算 1 x sqrt x 2 1 dx 1 x x sqrt 1 1 x 2 dx电话号码 135745455115945641123数字 也可以很可爱 你知道今天中午大家怎么吃饭吗 数字 也可以很可爱 你知道什么人用手机上网吗 数字 也可以很可爱 你知道哪个微博最火吗 谁能帮你实现这个转换 什么是SPSS StatisticsPackageforSocialScience社会科学统计软件包StatisticalProductandServiceSolutions统计产品与服务解决方案PASW PredictiveAnalyticsSoftware预测统计分析软件 SPSS的发展历程 1968年 斯坦福大学三位学生创建了SPSS1984年 推出用于个人电脑的SPSS PC 1992年 推出Windows版本 之后版本不断升级 自SPSS11 0起 SPSS全称改为 StatisticalProductandServiceSolutions 2003年 SPSS11 52009年主流版本 16 0 17 02009年 SPSS被IBM公司收购 SPSS更名为PASW PredictiveAnalyticsSoftware 即传说中的18 0 除了SPSS呢 SAS 专业人员用 可编制和调用子程序 EXCEL 非专业人员用 选项不够充分 SPSS的优点 操作简单 除了数据录入及部分命令程序等少数输入工作需要键盘键入外 大多数操作可通过 菜单 按钮 和 对话框 来完成 无须编程 具有第四代语言的特点 告诉系统要做什么 无需告诉怎样做 注 可以编程 功能强大 具有完整的数据输入 编辑 统计分析 报表 图形制作等功能 方便的数据接口 能够读取及输出多种格式的文件 如 xls txt 灵活的功能模块组合 SPSSforWindows软件分为若干功能模块 用户可以根据自己的分析需要和计算机的实际配置情况灵活选择 针对向强 SPSS可以针对初学者 熟练者及精通者都比较适用 第一代机器语言010101011第二代汇编语言ESP PUSHAX第三代高级语言if else第四代4GL图形窗口对话框 课外补充 什么是第四代语言 SPSS的作用 给数字做X光检查 一 前期处理数值的录入 合并 转换 排序 二 描述统计集中性 离散性 分布情况 三 差异检验两种数值的差异程度 多组数值的差异程度四 编制量表信度检验 效度检验 因素分析 五 非参数检验计数或等级数据的分析 这些基础知识能帮你走得更远 概率与数理统计 心理与教育统计 教育科学研究方法 计算机基础 学SPSS 最重要的是 细心 数据准确 符号无误 程序清楚 步步存盘 信心 说实话 spss 真的很好学 练习 课外独立上机操作 差之毫厘 谬以千里 一 认识SPSS的两个窗口DataviewVariableview二 基本的数据录入 第一讲 数据 变量 基础知识 变量 简单地说 也就是你要研究的具体问题 如教学方法 人际关系 智力 成绩等等 自变量 因变量 数据 因为我们要研究好多人 所以每个人在每一个变量上都会有一个数据 如10个学生的3门课考试成绩 就有30个数据 基本数据录入范例 变量设置 数据录入 推荐的参考书 吴明隆 SPSS统计应用实务 科学出版社 2003年版 28元 推荐的参考书 卢纹岱 SPSSFORWINDOWS统计分析 第2版 电子工业出版社 2002年版 49元 推荐的参考书 张文彤 SPSS11统计分析教程 高级篇 北京希望电子出版社 2002年版 40元 SPSS16实用教程 第1章SPSS简介 社会科学统计软件包 StatisticalPackagefortheSocialScience SPSS 是世界著名的统计分析软件之一 经近40年的发展 在全球已拥有大量的用户 目前 SPSS使用Windows的窗口方式展示各种管理和分析数据的方法 可方便地用于特定的科研统计 本章概要介绍SPSS的发展 主要版本 运行方式 启动与退出以及帮助系统的使用 1 1SPSS的发展 1968年 3位美国斯坦福大学的学生开发了最早的SPSS系统 并基于这一系统于1975年在芝加哥合伙成立了SPSS公司 SPSS的基本功能包括数据管理 统计分析 图表分析 输出管理等 SPSS名为社会学统计软件包 这是为了强调其社会科学应用的一面 因为社会科学研究中的许多现象都是随机的 要使用统计学和概率论的定理来进行研究 1 2SPSS的版本 到目前为止 SPSS已成为适合于DOS Windows UNIX Macintosh及OS 2等多种操作系统使用的产品 国内常用的是其适用于DOS和Windows的版本 SPSSforDOS通常称为SPSS PC 现已较少使用 本书以运行于Windows9X NT 2000 XP上的SPSS16 0forWindows标准版为例 并在本书后面的内容中简称为SPSS 1 3SPSS的运行方式 SPSS主要有3种运行方式 1 批处理方式2 完全窗口菜单运行方式3 程序运行方式 图1 1命令 Syntax 窗口 1 4 1启动SPSS 1 4SPSS的启动 主界面和退出 SPSS安装完毕后 系统会自动在Windows菜单中创建快捷方式 1 4 2SPSS的数据编辑窗口 SPSS主界面主要有两个 一个是SPSS数据编辑窗口 另一个是SPSS输出窗口 数据编辑窗口由标题栏 菜单栏 工具栏 编辑栏 变量名栏 内容区 窗口切换标签页和状态栏组成 如图1 2所示 图1 2数据编辑窗口 该窗口下方有两个标签 DataView 数据视图 和 VariableView 变量视图 如果使用过电子表格 如MicrosoftExcel等 那么数据编辑窗口中 DataView 所对应表格许多功能应该已经熟悉 但是它和一般的电子表格处理软件还有以下区别 1 一个列对应一个变量 即每一列代表一个变量 Variable 或一个被观测量的特征 例如问卷上的每一项就是一个变量 2 行是观测 即每一行代表一个个体 一个观测 一个样品 在SPSS中称为事件 Case 例如 问卷上的每一个人就是一个观测 3 单元包含值 即每个单元包括一个观测中的单个变量值 单元 Cell 是观测和变量的交叉 4 数据文件是一张长方形的二维表 数据文件的范围是由观测和变量的数目决定的 可以在任一单元中输入数据 如果在定义好的数据文件边界以外键入数据 SPSS将数据长方形延长到可包括那个单元和文件边界之间的任何行和列 1 4 3SPSS结果输出窗口 SPSS结果输出窗口名为Viewer 它是显示和管理SPSS统计分析结果 报表及图形的窗口 读者可以将此窗口中的内容以结果文件 spo的形式保存 图1 3结果输出窗口 结果输出部分分成左右两个部分 左边部分是索引输出区 用于显示已有的分析结果标题和内容索引 右边部分是各个分析的具体结果 称为详解输出区 这和Word的文档结构视图十分类似 输出区是详解输出区的一个视图 以简洁的方式反映出详解输出区中各个内容项 便于用户查找操作结果 可以对详解输出区中的表格进行编辑等操作 1 4 4退出SPSS 选择数据编辑窗口的 File 菜单中的 Exit 命令 或单击标题栏上的 关闭 按钮退出SPSS 1 5 1Help菜单中的topics命令 1 5SPSS的帮助系统 在运行SPSS的任何时候 单击 Help 菜单中的 topics 命令 会弹出帮助主题窗口 如图1 4所示 在其中选择相关的命令 即可得到所需的各种帮助 图1 4帮助主题窗口 1 5 2Help菜单中的tutorial命令 选择 Help 菜单中的 tutorial 命令 则弹出浏览器形式的帮助文件窗口 如图1 5所示 在该窗口下面有4个按钮 分别对应 目录索引 帮助主页 前进 后退 功能 图1 5帮助窗口 1 5 3各种对话框中的Help按钮 利用各种对话框中的 Help 按钮 可以直接获得SPSS相应命令的帮助 这是最简单也是最有效的获取帮助的方式 1 5 4有关统计方法指导 SPSS对一些基本模块中的统计提供了StatisticsCoach帮助 也就是 手把手 式的指导 小结 SPSS是在当前社会经济分析中应用最广泛的软件之一 继SPSS13 0之后 SPSS公司又推出了SPSS16 0 这是一个功能更加强大 设计更加人性化的版本 小结 SPSS的主界面有两个 一个是SPSS数据编辑窗口 一个是SPSS结果输出窗口 数据编辑窗口主要包括数据的编辑和统计分析 结果输出窗口主要的功能是显示和管理SPSS的各种统计分析的结果 SPSS的帮助系统可提供各种丰富详尽的在线帮助 第十一章绘制统计图 统计图是用点的位置 线段的升降 直条的长短或面积的大小等来表达资料的内容 它可以把资料所反映的变化趋势 数量多少 分布状态和相互关系等形象直观地表现出来 以便于读者的阅读 比较和分析 本章将介绍SPSS在绘制常用统计图方面的功能 由于计算机绘图具有快速 清晰 规范 可修正以保证准确无误等特点 故在论文 报告等写作中有着十分重要的应用价值 直条图 主要功能调用Graphs菜单的Bar过程 可绘制直条图 直条图用直条的长短来表示非连续性资料 该资料可以是绝对数 也可以是相对数 的数量大小 研究血压状态与冠心病各临床型发生情况的关系 分析资料如下所示 试绘制统计图 定义变量名 年龄标化发生率为RATE 冠心病临床型为DISEASE 血压状态为BP RATE按原数据输入 DISEASE按冠状动脉机能不全 1 猝死 2 心绞痛 3 心肌梗塞 4输入 BP按正常 1 临界 2 异常 3输入 选Graphs菜单的Bar 过程 弹出BarChart定义选项框 在定义选项框的下方有一数据类型栏 系统提供3种数据类型 Summariesforgroupsofcases 以组为单位体现数据 Summariesofseparatevariables 以变量为单位体现数据 Valuesofindividualcases 以观察样例为单位体现数据 大多数情形下 统计图都是以组为单位的形式来体现数据的 在定义选项框的上方有3种直条图可选 Simple为单一直条图 Clustered为复式直条图 Stacked为堆积式直条图 本例选复式直条图 点击Define钮 弹出DefineClusteredBar SummariesforGroupsofCases对话框 在左侧的变量列表中选rate点击 钮使之进入BarsRepresent栏的Othersnmmaryfunction选项的Variable框 选disease点击 钮使之进入CategoryAxis框 选bp点击 钮使之进入DefineClustersby框 点击Titles 钮 弹出Titles对话框 在Title栏内输入 血压状态与冠心病各临床型年龄标化发生率的关系 点击Continue钮返回DefineClusteredChart SummariesforGroupsofCases对话框 再点击OK钮即完成 系统在统计图编辑窗口中输出直条图 由于在原始数据库中 为了输入的方便 分组采用简单的1 2 3 等数字表示 故体现在统计图中的分组条目会让读者感到不理解 为此 用户可点击窗口上端工具栏中的Edit钮 对统计图进行编辑 用户欲在图中的哪一部位 如 标题 纵横轴的尺度与标目 统计图的色彩或花纹 等等 进行编辑 只须将鼠标箭头指向这一部位并双击鼠标左键 系统即弹出相应的编辑对话框 编辑过程简便易行 用户不妨一试 本章对此内容的介绍从略 线图 调用Graphs菜单的Line过程 可绘制线图 线图是用线条的上下波动形式 反映连续性的相对数资料的变化趋势 非连续性的资料一般不用线图表现 某地调查居民心理问题的存在现状 资料如下表所示 试绘制线图比较不同性别和年龄组的居民心理问题检出情况 定义变量名 心理问题检出率为RATE 年龄分组为AGE 性别为SEX AGE与SEX可定义为字符变量 RATE按原数据输入 AGE按分组情况分别输入15 25 35 45 55 65 75 SEX是男的输入M 女的输入F 选Graphs菜单的Line 过程 弹出LineChart定义选项框 有3种线图可选 Simple为单一线图 Multiple为多条线图 Drop line为落点线图 本例选多条线图 点击Define钮 弹出DefineMultipleLine SummariesforGroupsofCases对话框 在左侧的变量列表中选rate点击 钮使之进入LinesRepresent栏的Othersnmmaryfunction选项的Variable框 选age点击 钮使之进入CategoryAxis框 选sex点击 钮使之进入DefineLinesby框 点击Titles 钮 弹出Titles对话框 在Title栏内输入 某地男女性年龄别心理问题检出率比较 点击Continue钮返回DefineMultipleLine SummariesforGroupsofCases对话框 再点击OK钮即完成 区域图 调用Graphs菜单的Area过程 可绘制区域图 实际上区域图是用面积来表现连续性的频数分布资料 面积越大 频数越多 反之亦然 在某城市抽样研究20 49岁已婚育龄妇女的避孕现状 频数分布资料参见下表 试绘制区域图 定义变量名 避孕有无的人数为NUMBER 年龄分组为AGE 避孕现状为CONTRA AGE与CONTRA可定义为字符变量 NUMBER按实际人数输入 有无避孕的人数全部输入变量NUMBER中 AGE按分组情况分别输入20 25 30 35 40 45 CONTRA有的输入Y 无的输入N 选Graphs菜单的Area 过程 弹出AreaChart定义选项框 有2种线图可选 Simple为简单区域图 Stacked为堆积区域图 本例选堆积区域图 点击Define钮 弹出DefineStackedArea SummariesforGroupsofCases对话框 在左侧的变量列表中选number点击 钮使之进入AreasRepresent栏的Othersnmmaryfunction选项的Variable框 选age点击 钮使之进入CategoryAxis框 选contra点击 钮使之进入DefineAreasby框 点击Titles 钮 弹出Titles对话框 在Title栏内输入 某市已婚育龄妇女避孕状况分析 点击Continue钮返回DefineStackedArea SummariesforGroupsofCases对话框 再点击OK钮即完成 构成图 调用Graphs菜单的Pie过程 可绘制构成图 构成图也称馅饼图 用一个圆来表现百分构成 读者可根据圆中各个扇形面积的大小 判断某一部分在全部中所占比例的多少 某年某医院用中草药治疗182例慢性支气管炎患者 其疗效如下所示 试绘制构成图 定义变量名 百分构成资料为DATA 构成部分的名称为TEXT TEXT定义为字符变量 DATA按实际百分数输入 TEXT依次输入1 2 3 4 选Graphs菜单的Pie 过程 弹出PieChart定义选项框 构成图仅有一种 故直接点击Define钮 弹出DefinePie SummariesforGroupsofCases对话框 在左侧的变量列表中选data点击 钮使之进入SlicesRepresent栏的Othersnmmaryfunction选项的Variable框 选text点击 钮使之进入DefineSlicesby框 点击Titles 钮 弹出Titles对话框 在Title栏内输入 中草药治疗慢性支气管炎效果构成图 点击Continue钮返回DefinePie SummariesforGroupsofCases对话框 再点击OK钮即完成 高低区域图 调用Graphs菜单的High Low过程 可绘制高低区域图 高低区域图用于表现多种形式的数据区域 如一组测定值的范围 最小值 最大值 95 可信区间值 低限 高限 1 96 SD 低值 均值 高值 等 形象直观 为了解水体污染情况 某市测定三种水源中放射性元素锶 90Sr 的含量 10 2Bq L 1 资料如下 试绘制高低区域图 定义变量名 数据的变量名为DATA 将范围的低值与高值以及均值一并输入 设一变量为CAT 用于定义低值 高值和均值 低值为1 高值为2 均值为3 水源点变量名为GROUP 依次输入1 2 3 选Graphs菜单的High Low 过程 弹出High LowChart定义选项框 高低区域图有5种 即 SimpleHigh Low Close 简单线型高低区域图 ClusteredHigh Low Close 复式线型高低区域图 SimpleRangeBar 简单直条型高低区域图 ClusteredRangeBar 复式直条型高低区域图 DifferenceLine 差异线区域图 本例选用简单线型高低区域图 然后点击Define钮 弹出DefineSimpleHigh Low Close SummariesforGroupsofCases对话框 在左侧的变量列表中选data点击 钮使之进入BarsRepresent栏的Othersnmmaryfunction选项的Variable框 选cat点击 钮使之进入CategoryAxis框 选group点击 钮使之进入DefineHigh Low Closeby框 点击Titles 钮 弹出Titles对话框 在Title栏内输入 某市测定不同水体放射性元素锶的含量比较 点击Continue钮返回DefineSimpleHigh Low Close SummariesforGroupsofCases对话框 再点击OK钮即完成 直条构成线图 调用Graphs菜单的Pareto过程 可绘制直条构成线图 又称佩尔托图 直条构成线图是直条图与构成图的结合 它用直条的长短表现各组绝对数的多少 同时用线段的逐渐上升趋势表现各组百分构成比接近100 00 的过程 随访1000名20 25岁的男性一年 分季节考察其感冒发生情况 结果如下 试绘制直条构成线图 定义变量名 各季节病例数的变量名为DATA 输入具体数字 季节的变量名为SEASON 依次输入1 2 3 4 百分构成不必建立变量 也不必输入数据 系统会自动生成 选Graphs菜单的Pareto 过程 弹出ParetoChart定义选项框 有2种直条构成线图可选 Simple为单一直条构成线图 Stacked为堆积式直条构成线图 本例选用单一直条构成线图 然后点击Define钮 弹出DefineSimplePareto SummariesforGroupsofCases对话框 在左侧的变量列表中选data点击 钮使之进入Sumsofvariable框 选season点击 钮使之进入CategoryAxis框 点击Titles 钮 弹出Titles对话框 在Title栏内输入 1000名20 25岁男性各季节感冒发生人数分析 点击Continue钮返回DefineSimplePareto SummariesforGroupsofCases对话框 再点击OK钮即完成 质量控制图 调用Graphs菜单的Control过程 可绘制质量控制图 质量控制图是进行质量控制的常用工具 可提示工作过程中所发生的变化及其趋势 从而提醒人们的警觉与注意 以便分析原因 采取解决对策 对一种标准试液中某物质含量测平行样5次 结果如下 试绘制质量控制图以便对准确度与精确度进行评价 定义变量名 平行样数据的变量名为DATA 将测定数据一并输入 设一变量为GROUP 用于定义测定次序 依次输入1 2 3 4 5 均数和极差的数据不必输入 系统会自动生成 选Graphs菜单的Control 过程 弹出ControlChart定义选项框 有5种质量控制图可选 X Bar R s 均数控制图和极差 标准差 控制图 均数控制图又称图 用于控制重复测定的准确度 极差控制图又称R图 用于控制例数较少时重复测定的精确度 标准差控制图又称s图 用于控制例数较多时重复测定的精确度 Individuals MovingRange 个值控制图 根据容许区间的原理绘制 适用于单个测定值的控制 p np 率的控制图 根据率的二项分布原理绘制 适用于率的控制 c u 数量控制图 根据组中非一致测定值绘制 各组例数相等时用u图 不相等时用c图 适用于属性资料的质量控制 本例选用X Bar R s 选项框的下方为数据类型选择栏 DataOrganization Casesareunits表示数据文件中各观察样例只是一个值 其分组需要再定义 Casesaresubgroups表示数据文件中各观察样例本身就是一个组 点击Define钮 弹出X Bar R s CasesAreUnits对话框 在左侧的变量列表中选data点击 钮使之进入Pr
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论