统计分析与spss的应用_第1页
统计分析与spss的应用_第2页
统计分析与spss的应用_第3页
统计分析与spss的应用_第4页
统计分析与spss的应用_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计分析与 SPSS 的应用第 1 章 SPSS 统计分析软件概述常用的统计软件:SAS、SPSS、TSP、STATISTICA 、EViews、MINITAB、Excel 等。1.1 SPSS 使用基础数 据 编 辑 窗 口 是 SPSS 的 主 程 序 窗 口 , 在 软 件 启 动 时 自 动 打 开 , 并 一 直 保 持 打 开状 态 直 到 退 出 SPSS。 在 运 行 时 只 能 打 开 一 个 数 据 编 辑 窗 口 , 它 是 由 数 据 视 图 和变 量 视 图 组 成 的 。主 要 功 能 是 : 定 义 数 据 结 构 、 录 入 编 辑 和 管 理 待 分 析 的 数 据 。结 果 输 出 窗 口 , 主 要 功 能 是 显 示 管 理 SPSS 统 计 分 析 结 果 、 报 表 和 图 形 , 与 数据 编 辑 窗 口 不 同 的 是 : 结 果 输 出 窗 口 允 许 同 时 创 建 和 打 开 多 个 窗 口 , 目 的 是 将 同 一 批 数 据 的 不 同 分 析 结 果 指 定 输 出 到 不同 的 输 出 窗 口 。1.2 SPSS 的基本运行方式SPSS 的三种基本运行方式是:完全窗口菜单运行方式、程序运行方式、混合运行方式。完全窗口菜单运行方式:所有的分析操作通过菜单、按钮、输入对话框等方式完成。适合一般的统计分析人员和 SPSS 初学者。程序运行方式:首先根据分析需要,将数据分析的步骤手工编写成 SPSS 命令程序,然后将编写好的程序一次性提交给计算机执行。适合大规模的统计分析工作。 混合运行方式:完全窗口菜单运行方式和程序运行方式的综合。1.3 利用 SPSS 进行数据分析的基本步骤一、数据分析的基本步骤1、明确数据分析的目标2、正确收集数据3、加工整理数据4、选择恰当的统计分析方法进行探索分析5、读懂统计分析结果二、利用 SPSS 进行数据分析的一般步骤1、SPSS 数据的准备阶段在数据编辑窗口中定义 SPSS 数据的结构,录入和修改 SPSS 数据等。2、SPSS 数据的加工整理阶段对数据编辑窗口中的数据进行必要的预处理。3、SPSS 数据的分析阶段选择正确的统计分析方法,对数据编辑窗口中的数据进行分析建模。4、SPSS 分析结果的阅读和解释阶段读懂 SPSS 结果输出窗口中的分析结果,明确其统计含义,并结合应用背景知识做出切合实际的合理解释。第 2 章 SPSS 数据文件的建立和管理2.1 SPSS 数据文件一、SPSS 数据文件的特点有结构也有内容,只能在 SPSS 软件中才能打开。建立 SPSS 数据文件应该完成两项任务,第一,描述 SPSS 数据的结构;第二,录入编辑 SPSS 的数据内容。二、SPSS 数据的基本组织方式原始数据的组织方式:原始的调查问卷数据,或是一些基本的统计指标。行:个案;列:变量计数数据的组织方式:经过分组汇总后的计数数据(行:变量的一个分组)2.2 SPSS 数据的结构和定义方法一、变量名变量访问和分析的唯一标识,在 定 义 变 量 名 时 , 字 符 个 数 不 多 于 8 个 , 首 字 符 应以 英 文 字 母 开 头 , 不 能 含 有 :“! ? *”, 下 划 线 、 圆 点 不 能 作 为 变 量 名 的 最 后 一个 字 母 , 不 区 分 大 小 写 字 母 , 不 能 与 内 部 特 定 符 号 相 同 。二、数据类型、列宽、小数位宽1、 数值型2、 字符型3、 日期型三、变量名标签总长度可达 120 个字符,可增加变量名的可视性和统计分析结果的可读性。四、变量值标签对定序型数据和定类型数据是必不可少的。五、缺失数据数据中明显错误或明显不合理的数据以及漏填的数据都可以看出缺失数据。注意:字符型变量中的空格或空不是系统缺失值。六、计量尺度三类:定距型数据、定序型数据、定类型数据。2.3 SPSS 数据的录入与编辑 2.4 SPSS 数据的保存 2.5 读取其他格式的数据文件一、SPSS 支持的数据格式:SPSS 文件格式(sav) 、Excel 文件格式(xls ) 、dbase 数据文件格式(dbf ) 、文本格式文件等。SAS 文件格式(sas7bdat)二、扩展名:sav:SPSS 数据文件; spo:SPSS 结果文件;sps:SPSS 语句程序文件2.6 SPSS 数据文件合并一、纵向合并【Data】 【Merge File】 【Add Cases 】将 数 据 编 辑 窗 口 中 的 数 据 与 另 一 个 SPSS 数 据 文 件 中 的 数 据 文 件 中 的 数 据 进 行 首尾 对 接 , 在 不 同 数 据 文 件 中 数 据 含 义 相 同 的 数 据 项 最 好 起 相 同 的 变 量 名 , 含 义 不 同 的最 好 不 要 同 名 , 否 则 会 出 差 错 。二 、 横 向 合 并 【Data】 【Merge File】 【Add Variables】将 数 据 编 辑 窗 口 中 的 数 据 与 另 一 个 SPSS 数 据 文 件 中 的 数 据 文 件 中 的 数 据 进 行 左右 对 接 , 两 个 数 据 文 件 应 该 至 少 要 有 一 个 名 称 相 同 的 变 量 作 为 关 键 变 量 ; 两 个 文 件都 必 须 事 先 按 照 关 键 变 量 进 行 升 序 排 序 。第 3 章 SPSS 数据的预处理预 处 理 的 功 能 有 : 数 据 的 排 序 、 变 量 计 算 、 数 据 选 取 、 计 数 、 分 类 汇 总 、 数 组 分 组其 他 功 能 : 数 据 转 置 、 加 权 处 理 、 数 据 拆 分 、 SPSS 变 量 集数 据 的 预 加 工 处 理 是 服 务 于 数 据 分 析 和 建 模 的 , 需 要 解 决 的 问 题 有 :1、 缺 失 值 和 异 常 数 据 的 处 理2、 数 据 的 转 换 处 理3、 数 据 抽 样4、 选 取 变 量3.1 数 据 的 排 序【Data】 【Sort Cases】数 据 排 序 在 数 据 分 析 过 程 中 有 很 重 要 的 作 用 :1、 便 于 数 据 的 浏 览 , 有 助 于 了 解 数 据 的 取 值 状 况 、 缺 失 值 数 量 的 多 少 等 。2、 快 捷 找 到 数 据 的 最 大 值 和 最 小 值 , 计 算 全 距 , 初 步 把 握 和 比 较 数 据 离 散 程 度 。3、 快 捷 地 发 现 数 据 的 异 常 值 , 为 进 一 步 明 确 它 们 是 否 对 分 析 产 生 重 要 影 响 提 供 帮 助 。注 意 : 1、 数 据 的 排 序 不 是 只 对 某 一 列 变 量 排 序 , 而 是 整 行 数 据 排 序 , 排 序 之 后 , 原有 的 数 据 次 序 必 然 被 打 乱 。2、 多 重 排 序 中 指 定 排 序 变 量 的 次 序 很 关 键 , 先 指 定 的 变 量 优 于 后 指 定 变 量 。3.2 变 量 计 算【 Transform】 【 Compute】一 、 算 术 表 达 式由 常 量 、 变 量 、 算 术 运 算 符 、 圆 括 号 、 函 数 等 组 成 的 式 子 。运 算 的 先 后 顺 序 : 先 计 算 乘 方 , 再 计 算 乘 除 , 最 后 计 算 加 减 。 在 同 级 运 算 中 , 按从 左 到 右 的 顺 序 进 行 计 算 , 通 过 圆 括 号 改 变 原 有 的 计 算 顺 序 。二 、 条 件 表 达 式1、 简 单 条 件 表 达 式关 系 运 算 符 、 常 量 、 变 量 以 及 算 术 表 达 式 等 组 成 。2、 复 合 表 达 式 ( 逻 辑 表 达 式 )逻 辑 运 算 符 、 圆 括 号 、 简 单 条 件 表 达 式三 、 SPSS 函 数算 术 函 数 、 统 计 函 数 、 分 布 函 数 、 逻 辑 函 数 、 字 符 函 数 、 缺 失 值 函 数 、 日 期 函 数和 其 他 函 数 。3.3 数 据 选 取【 Data】 【 Select cases】1、 按 指 定 条 件 选 取2、 随 机 选 取 ( 近 似 选 取 和 精 确 选 取 )3、 选 取 某 一 区 域 内 的 样 本4、 通 过 过 来 变 量 选 取3.4 计 数 :【 Transform】 【 Count】3.5 分 类 汇 总 :【 Data】 【 Aggregate】3.6 数 据 分 组 : 【 Transform】 【 Recode】 【 Into Different Variables】第 4 章 SPSS 基本统计分析4.1 频 数 分 析频 数 分 析 的 基 本 任 务 和 内 容 :1、 编 制 频 数 分 布 表 , 内 容 : 频 数 、 百 分 比 、 有 效 百 分 比 、 累 计 百 分 比 。2、 绘 制 统 计 图 , 内 容 : 柱 形 图 或 条 形 图 、 饼 图 、 直 方 图柱 形 图 或 条 形 图 : 适用于定序和定类变量的分析,用宽度相同的条形的高度或长短来表示频数分布变化的图形。饼 图 : 用 圆 形 及 圆 内 扇 形 面 积 来 表 示 频 数 百 分 比 变 化 的 图 形 。直方图:适用于定距型变量的分析,用矩形的面积来表示频数分布变化的图形,可以在直方图上附加正态分布曲线,便于与正态分布的比较。【A nalyze】 【D escriptive Statistics】 【F requencies】频数分布表的第一列显示频数分析变量的变量值,第二列是相应变量值的频数,第三列是百分比,第四列是有效百分比,第五列是累计百分比。如果变量中无缺失数据,则频数分布表中的百分比与有效百分比相同。在 SPSS 频数分析中,虽然 SPSS 给出的频数分布表是完整的,但如果变量是定类变量,那么累计百分比的内容是不应采纳的,原因是定类变量的累计百分比是没有意义的。4.2 计 算 基 本 描 述 统 计 量一、刻画集中趋势的描述统计量均值、中位数、众数、总和二、刻画离散程度的描述统计量样本标准差、样本方差、全距四、 刻画分布形态的描述统计量1、偏度系数:偏度是描述变量取值分布形态对称性的统计量,当分布是对称分布时,正负总偏差相等,偏度值为 0,偏度大于 0 表示正偏差值较大,为正偏或称右偏,直方图中有一条长尾拖在右边,偏度绝对值越大,表示数据分布形态的偏斜程度越大,另外,SPSS 还计算偏度标准误差。2、峰度系数:峰度是描述变量取值分布形态陡缓程度的统计量,当数据分布与标准正态的陡缓程度相同时,峰度值等于 0,峰度值小于 0 表示数据的分布比标准正态分布平缓,成为平峰分布,另外,SPSS 还计算峰度标准误差。4.3 交 叉 分 组 下 的 频 数 分 析4.4 多 选 项 分 析4.5 比 率 分 析用于对两变量间变量值比率变化的描述分析,适用于定距型变量。1、 加权比率均值:属于集中趋势描述指标,是两变量均值的比。2、 ADD 平均绝对离差:用于对比率变量离散程度的描述。3、 COD 离散系数:用于对比率变量离散程度的描述。4、 PRD 相关价格微分:用于对比率变量离散程度的描述,是比率均值与加权比率均值的比。5、 COV 变异系数:分别基于均值的变异系数和中位数的变异系数。第 5 章 SPSS 的参数检验5.1 参数检验概述基本步骤:1、提出原假设2、选择检验统计量3、计算检验统计量观测值发生的概率4、给出显著性水平 ,并作出统计决策5.2 单样本 t 检验命令: 【 Analyze】 【 Compare Means】 【 One-Samples T Test】前提条件:1、研究的问题仅涉及一个总体,2、样本来自的总体应服从或近似服从正态分布。5.3 两独立样本 t 检验命 令 : 【 Analyze】 【 Compare Means】 【 Independent-Samples T Test】 ,前提条件:1、样本来自的总体应服从或近似服从正态分布。2、两样本相互独立,即从一个总体中抽取一组样本对从另一总体中抽取一组样本没有任何影响,两组样本的样本数可以不等。5.3 两配对样本 t 检验命 令 : 【 Analyze】 【 Compare Means】 【 Paired-Samples T Test】前提条件:要求样本是配对的,在前后两种状态下某属性的不种不同的特征,也可以是对某事物两个不同侧面的描述。抽样不是相互独立,而是互相关联的。两组样本的样本数要相同,先后顺序是一一对应的,不能随意更改。知识点:1、进行参数检验的最终结果是判断要接受原假设还是拒绝原假设,经过分析之后得到检验统计量的概率 P 值,如果 P 值小于显著性水平 ,则认为如果在此时拒绝原假设犯错误的可能性小于显著性水平 ,其概率低于预先控制的水平,不太可能会发生,可以拒绝原假设,反之,则认为如果在此时拒绝原假设犯错误的可能性大于显著性水平,其概率高于预先控制的水平,很有可能发生,不应拒绝原假设。2、单样本 t 检验是对总体均值的假设检验, ,研究中只涉及到一个总体,原假设是:总体均值与检验值之间不存在显著性差异。3、两独立样本 t 检验是利用来自两个总体的独立样本,推断两个总体的均值是否存在显著性差异。4、在进行两独立样本 t 检验之前,要求将两组样本数据存放在一个 SPSS 变量中,即存放在一个 SPSS 变量列上,为区分哪些样本来自哪个总体,还应定义一个存放总体标识的标识变量,实验中应对两总体的标识值进行分别定义。5、在两独立样本 t 检验结果中,先看 F 检验,即对两总体方差进行检验,根据 P 值判断两总体的方差是否有显著性差异。若 F 检验的 P 值大于 ,两方差没有显著性差异,在进行两总体均值检验时,应看第一行【Equal variances assumed】的结果,再判断t 检验 P 值与 的大小;反之,如果 F 检验的 P 值小于 ,认为两方差有显著性差异,在进行两总体均值检验时,应看第二行【Equal not variances assumed】的结果,再进行t 检验。6、两配对样本 t 检验是利用来自两个总体的配对样本,推断两个总体的均值是否存在显著性差异。它要求样本是配对的,即在个案的前后两种状态下某属性的两种不同特征,或者是某事物两个不同侧面的描述,抽样不是相互独立的,而是相互关联的。第 6 章 SPSS 的方差分析6.1 方差分析概述两个基本假设前提:1、 观测变量各总体应服从正态分布。2、 观测变量各总体的方差应相同。6.2、单因素方差分析一、明确观测变量和控制变量二、剖析观测变量的方差三、比较观测变量总离差平方和各部分的比例基本步骤:1、提出原假设2、选择检验统计量3、计算检验统计量的观测值和概率 P 值4、给定显著性水平 ,并作出决策命令:【Analyze】 【Compare Means】【One-Way ANOVA 】进一步分析:一、方差齐性检验:【Option 】二、多重比较检验:【Post Hoc】1、LSD 方法: 最小显著性差异法,适用于各总体方差相等的情况,没有对犯第一类错误的概率加以有效的控制。2、Bonferroni 方法:修正差别检验法,对犯第一类错误的概率进行了有效控制。3、Turkey 方法: 杜奇法,仅适用于各水平下观测值个数相等的情况,适用于各总体方差相等的情况,有对犯第一类错误的概率加以有效的控制。4、Scheffe 方法: 差别检验法,较 Turkey 方法不灵敏。5、S-N-K 方法: 一种有效的划分相似子集的方法,适用于各水平下观测值个数相等的情况。知识点:LSD方法的检验敏感度是其中最高的,高的敏感度会使拒绝原假设的可能性增大,与低敏感度的方法相比,犯第一类错误的可能性会比较高。三、其他检验1、先验对比检验 2、趋势检验6.3 多因素方差分析命令:【Analyze】 【General Linear Model】【Univariate】进一步分析:1、 多因素方差分析的非饱和模型【 Model】2、 多因素方差分析的其他功能:均值检验(多重比较检验【Post Hoc】和对比检验【Contrast】 )控制变量交互作用的图形分析【Plots】6.4 协方差分析 协方差分析将人为很难控制的因素作为协变量,并在排除协变量后,分析控制变量对观测变量的作用。 在协方差分析中,作为协变量的变量一般是定距变量,并要求多个协变量之间无交互作用,且观测变量与协变量之间有显著的线性关系。第 8 章 SPSS 的相关分析8.1 SPSS 的相关分析相关分析是分析客观事物之间关系的数量分析方法,关系有两种:函数关系和统计关系。8.2 绘制散点图命令:【Graph】 【Scatter】 通过散点图能够直观发现变量间的统计关系以及强弱程度和数据对的可能走向。 当样本量比较大时,散点图的点很密集,在一定程度上影响了图形的观察效果,可以对散点图进行适当的调整,在其基础上绘制葵花式散点图,葵花式散点图通常将集中在一起的数据点的中心作为“花心” ,以“花瓣”的多少表示“花心”周围数据点的多少。8.3 计算相关系数一、利用相关系数进行变量间的线性关系的分析通常需要完成以下两大步骤:第一,计算样本相关系数 r-10,负相关:r0.8,线性关系较弱:r100 时多重共线性很严重。9.5 线性回归分析的基本操作 9.6 线性回归分析的应用举例【Analyze】【Regression 】【Liner】知识点:1、在一元线性回归方程中,t 检验和 F 检验的结果时一致的,多元中不是一致的,甚至有时还会出现相反的结果。但回归方程的拟合优度越高,回归方程的显著性检验也会越显著。2、多元线性回归分析中,如果引入的解释变量较少,回归方程将无法很好解释说明被解释变量的变化,但也并非引入的解释变量越多越好,这些变量之间可能存在多重共线性,要采取一些策略对解释变量引入回归方程加以控制和筛选。9.7 曲线估计变量之间的非线性可以划分为:本质线性和本质非线性命令:【Analyze】 【Regression】【Curve Estimation】常见的本质现在模型:二次曲线:Quadratic复合曲线:Compound增长曲线:Growth对数曲线:Logarithmic三次曲线:CubicS 曲线:S 指数曲线:Exponential逆曲线:Inverse逻辑曲线:Logistic第 10 章 SPSS 的聚类分析10.1 聚类分析的一般问题“亲疏程度”的度量方法:一般有两个角度:第一,个体间的相似程度;第二,个体间的差异程度。一、定距型变量个体间距离的计算方式:1、欧式距离(Euclidean distance)EUCLID(x,y)=2、平方欧式距离(Squared Euclidean distance)SEUCLID(x,y)=3、切比雪夫距离(Chebychev) CHEBYCHEV(x,y)= 4、Block 距离5、明考斯基距离(Minkowski)MINKOWSKI(x,y)= 6、夹角余弦距离(Cosine)CONSINE(x,y)= 7、用户自定义距离(Customized) CUSTOMIZED(x,y)= 二、计算变量个体间距离的计算公式: 1、卡方距离(Chi-Square measure)CHISQ(x, y)= 2、Phi 方(Phi-Square measure) PHISQ(x,y)= 三、二值变量个体间距离的计算公式1、简单匹配系数(Simple Mat

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论