SPSS基础入门.ppt

上传人：y*** IP属地：广东上传时间：2020-01-25 格式：PPT 页数：85 大小：4.55MB 积分：30 举报 版权申诉

已阅读5页，还剩80页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

SPSS基础入门基于spss16 0 报告人张淑洁目录 CONTENTS 2 SPSS软件概述 3 4 SPSS为IBM公司推出的一系列用于统计学分析运算数据挖掘预测分析和决策支持任务的软件产品及相关服务的总称有Windows和MacOSX等版本最初软件全称为社会科学统计软件包 SolutionsStatisticalPackagefortheSocialSciences 但是随着SPSS产品服务领域的扩大和服务深度的增加正式将英文全称更改为统计产品与服务解决方案 StatisticalProductandServiceSolutions 5 SPSS是世界上最早的统计分析软件由美国斯坦福大学的三位研究生NormanH Nie C Hadlai Tex Hull和DaleH Bent于1968年研究开发成功同时成立了SPSS公司并于1975年成立法人组织在芝加哥组建了SPSS总部 2009年7月28日 IBM公司宣布将用12亿美元现金收购统计分析软件提供商SPSS公司如今SPSS已出至版本22 0 而且更名为IBMSPSS 迄今 SPSS公司已有40余年的成长历史数据录入统计分析 SPSS统计分析过程包括描述性统计均值比较一般线性模型相关分析回归分析对数线性模型聚类分析数据简化生存分析时间序列分析多重响应等几大类结果呈现 SPSS操作入门 8 数据编辑窗口SPSSDataEditor 结果管理窗口SPSSOutputViewer 数据录入 11 12 数据录入 1 2 3 姓名性别成绩地区时间营业额身高体重智力定义变量名变量名变量标签值变量的储存类型缺失值变量的测量尺度指定每个变量的各种属性变量名不能与SPSS保留字相同 SPSS的保留字有ALL END BY EQ GE GT LE LT NE NOT OR TO WITH 录入数据 13 01 第一 02 第二一个观测占一行一个变量占一列 Name 变量名变量名必须以字母汉字及开头总长度不超过8个字符共容纳4个汉字或8个英文字母英文字母不区别大小写最后一个字符不能是句号 Type 变量类型变量类型有8种最常用的是Numeric数值型变量其它常用的类型有 String字符型 Date日期型 Comma逗号型隔3位数加一个逗号等 Width 变量所占的宽度 Decimals 小数点后位数 Label 变量标签关于变量涵义的详细说明 Values 变量值标签关于变量各个取值的涵义说明 Missing 缺失值的处理方式 Columns 变量在DateView中所显示的列宽默认列宽为8 Align 数据对齐格式默认为右对齐 Measure 数据的测度方式名义尺度定序尺度和等间距尺度三种默认为等间距尺度示例1 将下面的数据按要求录入到SPSS中要求姓名字符型宽度8 小数点0 列宽8 左对齐称名变量性别数字型宽度8 小数点0 1代表男 2代表女列宽8 左对齐称名变量期末成绩数字型宽度10 小数点1 列宽8 右对齐等比变量 SPSS中可以直接读入许多常用格式的数据文件选择菜单File OpenData或直接单击快捷键工具栏上的快捷按钮系统就会弹出OpenFile对话框单击文件类型列表框在里面能够看到可以直接打开的数据文件格式示例2 数据分析及结果解读 17 18 Frequencies 频数分布 Descriptives 一般性描述 Explore 探索性分析 Crosstabs 交叉列表调用此过程可对变量进行描述性统计分析计算并列出一系列相应的统计指标且可将原始数据转换成标准Z分值并存入数据库所谓Z分值是指某原始数值比其均值高或低多少个标准差单位高的为正值低的为负值相等的为零调用此过程可对变量进行更为深入详尽的描述性统计分析故称之为探索性统计它在一般描述性统计指标的基础上增加有关数据其它特征的文字与图形描述显得更加细致与全面有助于用户思考对数据进行进一步分析的方案调用此过程可进行计数资料和某些等级资料的交叉表分析在分析中可对二维至多维交叉表资料进行统计描述和x2检验并计算相应的百分数调用此过程可进行频数分布表的分析频数分布表是描述性统计中最常用的方法之一此外还可对数据的分布趋势进行初步分析 19 示例2 待分析的变量是否显示频数表定义需要计算的统计量定义需要绘制的统计图频数分布表 Frequencies 定义表格百分位数分布特征描述离散趋势集中趋势 Frequencies 定义统计量统计图类型直方图加上正态曲线以频数绘制条图或饼图 Frequencies 定义统计图无图形条图饼图直方图以构成比绘制条图或饼图频数表排列次序 Frequencies 定义表格按数值升序按数值降序按频数升序按频数降序 Frequencies 结果解释 Frequencies 结果解释 Frequencies 结果解释是否保存标准变换后的数据一般性描述 Descriptives Descriptives 定义统计量 Descriptives 结果解释 Descriptives 结果解释此外系统以z成绩为变量名将原始数据转换成标准z分值存放在原数据库中新变量具有均值为0 标准差为1的特征亦即变量的标准化过程探索性分析 Explore 两者均有统计量图分组变量列表待分析变量列表 Explore 定义统计量 Descriptives 输出均数均数的95 可信区间去掉5 极端值的均数中位数方差标准差最小值最大值全距四分位数间距偏度系数峰度系数 M estimators 作中心趋势的粗略最大似然确定输出四个不同权重的最大似然确定数 Outliers 输出五个最大值与五个最小值 Percentiles 输出第5 10 25 50 75 90 95 位数箱图绘制方式茎叶图正态性检验正态分布图 Explore 定义统计图直方图 Excludecaselistwise 不分析有任一缺失值的记录Excludecasepairwise 不分析计算某统计量时有缺失值的记录Reportvalues 报告缺失值缺失值的处理方式 Explore 缺失值的处理 Explore 结果解释原始数据的基本情况男性有效数据4 缺失0 合计4 女性有效数据6 缺失0 合计6 Explore 结果解释 Explore 结果解释左面为箱图图中方箱为四分位数中心粗线为中位数两端线为最大值与最小值交叉列表 Crosstabs 行列 Crosstabs 定义统计量 X2检验 Crosstabs 定义交叉表内容实际观察数理论数行百分数列百分数合计百分数残差 Crosstabs 结果解释 Crosstabs 结果解释红底数字为实际观察值黄底数字为列百分数 Crosstabs 结果解释单因素方差分析单因变量的单因素方差分析主要解决多于两个总体样本或变量间均值的比较问题是一种对多个大于两个总体样本的均值是否存在显著差异的检验方法其目的也是对不同的总体的数据的均值之间的差异是否显著进行检验单因素方差分析的应用条件在不同的水平因素变量取不同值下各总体应当服从方差相等的正态分布示例3 某企业需要一种零件现有三个不同的地区的企业生产的同种零件可供选择为了比较这三个零件的强度是否相同每个地区的企业抽出6件产品进行强度测试其值如表所示假设每个企业零件的强度值服从正态分布试检验这三个地区企业的零件强度是否存在显著差异解首先建立假设H0 三个地区的零件强度无显著差异 H1 三个地区的零件强度有显著差异 1 单击Analyze CompareMeans One WayANOVA 打开One WayANOVA对话框 2 从左框中选择因变量零件强度进入Dependentlist框内选择因素变量地区进入Factor框内点击OK就可以得到方差分析下表 3 单击Option按纽打开Option对话框如图所示在Option选项中选择输出项主要有不同水平下样本方差的齐性检验缺失值的处理方式及均值的图形本例中选择Homogeneityofvariancetest进行不同水平间方差齐性的检验以及Descriptive基本统计描述在MissingValue栏中选择系统默认项完成所有选择后返回主对话框然后单击OK 就可以得到三个地区零件强度分析表方差齐性检验 Sig值大于0 05 符合方差齐性假设由于F统计量值的P值明显小于显著性水平0 05 故拒绝假设H0 认为这三个地区的零件强度有显著差异 4 如果需要将水平间两两比较可以单击PostHoc按纽打开多重比较对话框在该对话框中列出了许多多重比较检验涉及到许多的数理统计方法在实际中只选用其中常用的方法即可对话框下部的Significancelevel表示显著性水平默认值是0 05 也可以根据需要重新输入其它值如果满足在水平间方差相等的条件常用LSD least significantdifference最小显著性差异法表示用t检验完成各组均值间的配对比较当方差不等的情况下可以选择Tamhane sT2 用t检验进行各组均值间的配对比较从表可以看出地区2与地区3之间的差异是非常显著的 p 0 05 双因素方差分析单因变量的双因素方差分析是对观察的现象因变量受两个因素或变量的影响进行分析检验不同水平组合之间对因变量的影响是否显著双因素方差分析应用条件因变量和协变量必须是数值型变量且因变量来自或近似来自正态总体因素变量是分类变量变量可以是数值型或字符型的各水平下的总体假设服从正态分布而且假设各水平下的方差是相等的双因素方差分析过程可以分析出每一个因素的作用各因素之间的交互作用检验各总体间方差是否相等还能够对因素的各水平间均值差异进行比较等示例4 右表是某商品S在不同地区和不同时期的销售量表已知数据服从正态分布则要检验地区因素及时间因素对销售量的影响是否显著由于销售量受地区和时间两个因素的影响这是一个双因素方差分析的问题 1 单击Analyze GenerallinearModel Univariate 打开Univariate主对话框 2 选择要分析的变量销售量进入DependentVariable框中选择因素变量地区和时期进入FixedFactor框中 3 单击Model按纽选择分析模型得到Model对话框如图所示在Specify框中指定模型类型 Custom选项为自定义模型本例选择此项并激活下面的各项操作先从左边框中选择因素变量进入Model框中然后选择效应类型一般不考虑交互作用时选择主效应Main 考虑交互作用时选择交互作用Interaction 可以通过单击BuildTerm下面的小菜单完成本例中选择主效应 4 从表中数据可以看出 F值对应概率P值都小于显著性水平0 05 这说明地区和时期对销售量的影响都是显著的 5 如果需要进行图形展示可单击Plots按纽打开图形对话框如图所示 1 在Factor框中选择因素变量进入横坐标HorizontalAxis框内然后单击add按纽可以得到该因素不同水平的因变量均值的分布 2 如果要了解两个因素变量的交互作用将一个因素变量送入横坐标后将另一个因素变量送入SeparateLines分线框中然后单击add按纽就可以输出反映两个因素变量的交互图本例中选择地区为横坐标 6 如需要将因素A各水平间均值进行两两比较单击PostHoc按纽打开PostHocMultiple多重比较对话框如图所示从Factor框中选择因素变量进入PostHocTestfor框中然后选择多重比较方法本例中各组方差相等选择LSD方法 7 单击Options按纽打开Univariate Options对话框从中选择需要输出的显著性水平默认值为0 05 在进行所有的选择后单击OK 就可以得到输出结果由多重比较LSD表中得到不同地区销售量的比较表两个因素变量地区和时期的折线之间无交叉因此两个因素之间基本上没有交互作用相关分析与回归模型的建立与分析相关分析和回归分析是统计分析方法中最重要内容之一是多元统计分析方法的基础相关分析和回归分析主要用于研究和分析变量之间的相关关系在变量之间寻求合适的函数关系式特别是线性表达式对变量之间的相关关系进行分析 Correlate 其中包括简单相关分析 Bivariate 和偏相关分析 Partial 建立因变量和自变量之间回归模型 Regression 其中包括线性回归分析 Linear 和曲线估计 CurveEstimation 数据条件参与分析的变量数据是数值型变量或有序变量相关分析在SPSS中可以通过Analyze菜单进行相关分析 Correlate Correlate菜单如图所示简单相关分析两个变量之间的相关关系称简单相关关系有两种方法可以反映简单相关关系一是通过散点图直观地显示变量之间关系二是通过相关系数准确地反映两变量的关系程度 1 散点图SPSS软件的绘图命令集中在Graphs菜单 2 相关系数示例5 打开数据库后单击Analyze Correlate Bivariate打开Bivariate对话框见图所示从左边的变量框中选择需要考察的两个变量进入Variables框内从CorrelationCoefficients栏内选择相关系数的种类有Pearson相关系数 Kendall s一致性系数和Spearman等级相关系数从检验栏内选择检验方式有双侧检验和单侧检验两种单击Options按纽选择输出项和缺失值的处理方式本例中选择输出基本统计描述单击OK 可以得到相关分析的结果线性回归分析线性回归是统计分析方法中最常用的方法之一如果所研究的现象有若干个影响因素且这些因素对现象的综合影响是线性的则可以使用线性回归的方法建立现象因变量与影响因素自变量之间的线性函数关系式线性回归模型假设条件与模型的各种检验1 线性回归的假设理论 1 正态性假设即所研究的变量均服从正态分布 2 等方差假设即各变量总体的方差是相等的 3 独立性假设即各变量之间是相互独立的 4 残差项无自相关性即误差项之间互不相关 Cov i j 0 2 线性回归模型的检验项目 1 回归系数的检验 t检验 2 回归方程的检验 F检验 3 拟合程度判定可决系数R2 4 D W检验残差项是否自相关 5 共线性检验多元线性回归 6 残差图示分析判断异方差性和残差序列自相关 3 线性回归分析的具体步骤SPSS软件中进行线性回归分析的选择项为Analyze Regression Linear 仍然用示例5的数据考察网络成瘾与社会支持孤独之间的相关关系建立网络成瘾对于相关因素的线性回归模型具体操作步骤如下 1 打开数据文件单击Analyze Regression Linear打开Linear对话框如图所示 2 从左边框中选择因变量进入Dependent框内选择一个或多个自变量进入Independent框内从Method框内下拉式菜单中选择回归分析方法有强行进入法 Enter 消去法 Remove 向前选择法 Forward 向后剔除法 Backward 及逐步回归法 Stepwise 五种本例中选择Enter方法 3 单击Statistics 打开LinearRegression Statistics对话框可以选择输出的统计量如图所示 RegressionCoefficients栏回归系数选项栏 Estimates 系统默认输出回归系数的相关统计量包括回归系数回归系数标准误标准化回归系数回归系数检验统计量 t值及相应的检验统计量概率的P值 sig 本例中只选择此项 Confidenceintervals 输出每一个非标准化回归系数95 的置信区间 Covariancematrix 输出协方差矩阵 Modelfit是默认项能够输出复相关系数R R2及R2修正值估计值的标准误方差分析表 Rsquaredchange 引入或剔除一个变量时 R2的变化 Descriptives 基本统计描述 PartandPartialcorrelations 相关系数及偏相关系数 Collinearitydiagnostics 共线性诊断主要对于多元回归模型分析各自变量的之间的共线性的统计量包括容忍度和方差膨胀因子特征值条件指数等本例中选择上面所有的统计项 Residuals残差栏Durbin Watson D W检验 Casewisediagnostics 奇异值诊断有两个选项 Outliersoutside standarddeviations 奇异值判据默认项标准差 3 Allcase输出所有观测量的残差值本例中选择D W检验及奇异值诊断选择标准差为

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

SPSS基础入门.ppt

文档简介

温馨提示

最新文档

评论

SPSS基础入门.ppt

文档简介

温馨提示

最新文档

评论

相关文档