spss软件部分常用分析和实例.ppt_第1页
spss软件部分常用分析和实例.ppt_第2页
spss软件部分常用分析和实例.ppt_第3页
spss软件部分常用分析和实例.ppt_第4页
spss软件部分常用分析和实例.ppt_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

SPSS软件常用分析方法和实例 SPSS StatisticalPackagefortheSocialScience 是世界著名的统计学分析软件之一 1968年开发 1980年代前后得以普遍应用 基本功能 数据管理 数据分析 图表分析 输出管理等分析方法 描述性统计 均值比较 一般线性模型 相关分析 回归分析 对数线性模型 聚类分析 数据简化 生存分析 时间序列分析 多重响应分析 常用分析方法 主要是针对 描述性统计相关分析因子分析回归分析聚类分析版本为SPSS11 5 SPSS数据管理1变量的定义安装SPSS之后 运行程序 出现类似EXCEL界面 见下图1 SPSS的主界面 然后进行变量的定义过程 点击SPSS主界面左下角VariableView 转入变量浏览界面 见图2根据需要分别对其定义界面从左到右分别为变量名 类型 宽度 小数点位数 变量标签等 实例1 株洲地区蔬菜样品重金属元素含量数据分析 单位 mg kg 具体操作点击作下角VariableView 转入变量浏览界面 在第1列依次应定义的变量分别为 送样号 类型必须为字符型 As Cd Cu Hg Mn Pb Se Zn 第2列为类型 送样号 定义为字符型 点击类型中的string 其它可默认 第3列为宽度 字节数 第4列为小数点位数 本例中 小数点位数可设为3 等等 见图3 图3变量性质定义 DefineVariableproperties对其逐个定义 但不方便 变量的定义还可选择菜单Data 2 数据的输入输入方法主要有 逐个输入将数据逐个输入到相应的空白表格当中 并进行保存 复制粘贴可将word或EXCEL中编辑好的数据表格相应的粘贴到SPSS的相应空白表格中 然后进行保存 具体操作 变量定义后 进行数据输入和保存 进行逐个键入 效率低 进行复制粘贴 可将相应的表格中的数据对应的粘贴到SPSS的表格内 然后保存 见图4 图4数据的输入 数据分析 Analyze 介绍常用的分析方法 描述性统计 DescriptivesStatistics 相关分析 Correlate 因子分析 Factor 回归分析 Linear 聚类分析 Classifiy 1 描述性统计 DescriptivesStatistics SPSS的许多模块均可完成描述性分析 但专门为该目的而设计的几个模块则集中在DescriptiveStatistics菜单中 最常用的是列在最前面的四个过程 Frequencies产生频数表 Descriptives进行一般性的统计描述 Explore对数据概况不清时的探索性分析 Crosstabs完成计数资料和等级资料的统计描述和一般的统计检验 我们常用的X2检验也在其中完成 首先 需要知道数据的基本情况 如均数 标准差 最大值 最小值 极距 方差等多个常用统计量 这个过程可在Frequencies过程和Descriptives过程中实现 操作过程 仍以实例1为例 对其进行常用统计量进行分析 通过Frequencies过程实现 点击Analyze DescriptivesStatistics Frequencies出现其对话框 如图5 分别将各个变量As Cd Cu Hg Mn Pb Se Zn导入右侧的空白框内 选定要统计的变量 图4图5Frequencies对话框 接着对数据的常用统计量进行选定 点击图5的Statistics钮 可见如图5对话框 图5图6 Cutpointsfor equalgroups 或直接指定某个百分位数 Percentiles Centraltendency复选框组于定义描述集中趋势的一组指标 均数 Mean 中位数 Median 众数 Mode 总和 Sum PercentileValues复选框组定义需要输出的百分位数 可计算四分位数 Quartiles 每组指定百分位输出当前百分位数 Distribution复选框组 定义描述分布特征的两个指标 偏度系数 Skewness 和峰度系数 Kurtosis Valuesaregroupmidpoints复选框当你输出的数据是分组频数数据 并且具体数值是组中值时 选中该复选框以通知SPSS 免得它犯错误 Dispersion复选框组定义描述离散趋势指标 标准差 Std devi ation 方差 Vari ance 全距 Range 最小值 Minimum 最大值 Maximum 标准误 S E mean 可根据需要选用Centraltendency复选框组和Dispersion复选框组中的描述性统计量 如本例中假设需要对最大值 最小值 均数 方差 标准误 全距等进行统计 可在如上的Maximum Minimum Mean Variance S E mean Range前的小白格子点击选中 即可 如图6 点击Continue返回上个对话框 点击OK 程序运行 出现SPSS程序的结果输出界面 如图7 运行结果窗口 图7是SPSS实现Frequencies这一过程的输出界面 从中可以看出需要的统计量计算结果 如均值 Mean As0 271800 Cd33 25667 Cu1 791667 标准误差 Std ErrorofMean As0 699953 Cd5 294950 其它统计量依次 2 相关分析 Correlate 现实中经常要遇到分析两个或多个变量间关系的情况 有时是希望了解变量间联系的密切程度 有时则是要了解某个变量对另一个变量的影响强度 前者用我们要说的相关分析来实现 后者用回归分析来实现 SPSS的相关分析功能被集中在Statistics菜单的Correlate子菜单中 一般包括以下三个过程 Bivariate过程此过程用于进行两个 多个变量间的参数 非参数相关分析 如果是多个变量 则给出两两相关的分析结果 Partial过程如果需要进行相关分析的两个变量其取值均受到其他变量的影响 就可以利用偏相关分析对其他变量进行控制 输出控制其他变量影响后的相关系数 这种分析思想和协方差分析非常类似 Distances过程调用此过程可对同一变量内部各观察单位间的数值或各个不同变量间进行距离相关分析 主要分析方法有变量之间的相似性测量分析 不相似分析 个案之间的相似性分析和不相似性分析 实际操作 针对实例1 对其各变量间数据进行距离分析 实现步骤 Analyze Correlate Distances出现对话框如下图8 然后将各个变量转入右边对话框内 图8距离相关分析对话框 接着根据需要选择个案间距离还是变量间距离 本例选择变量间距离计算 在 BetweenVariables 前点中 见图8 选用相似分析还是不相似分析 本例选用相似类比 Similarities 见图8 图8距离相关分析对话框 点击OK 出现如下的分析结果 见图9 从中可以看到各个变量间的关系 但一般情况下 相关分析多采用Bivariate过程 图9距离相关分析分析结果输出窗口 3 因子分析 Factor 在对事物的多个变量进行大量的观察 收集大量的数据加以分析时 发现多数情况下 许多变量之间存在一定的相关关系 因此 有可能用较少的综合指标分析存在于各变量中的各类信息 而各综合指标之间彼此是不相关的 代表各类信息的综合指标称为因子 因子分析就是用少数几个因子来描述许多指标或因素之间的联系 以较少几个因子反映原资料的大部分信息的统计学方法 现结合实例1进行因子分析过程 Analyze DataReduction Factor 在弹出的对话框中 将变量As Cd Cu Hg Mn Pb Se Zn分别转入右侧的空白框内 点击 Descriptive 弹出对话框 选中 KMOandBarttett stestofsphericity 表示用KMO检验和巴特利球形检验 见图10 图10Descriptive对话框 Kaiser给出的一个KMO的标准为 0 9 KMO 非常适合 0 8 KMO 0 9 适合 0 7 KMO 0 8 一般 0 6 KMO 0 7 不太适合 KMO 0 5 不适合 本例中此对话框全部选中 点击Continue 返回上个对话框 点击 Extraction 弹出其对话框 选择因子提取方法 如图11 一般采用主成分分析法 Principalcomponents Extrac框下Eigenvaluesover内空格填入剔除的水平 即特征值 一般为1 本列中填入1 点击Continue返回上一对话框 图11Extraction其对话框 点击 Rotation 弹出其对话框 此对话框主要是对因子进行旋转方法的选择 其中Varimax为方差极大法旋转 有称正较旋转 此对话框中选定方法可根据需要选择 本例中选择None 点击Continue返回上一对话框 点击OK 程序运行 出现计算结果 现就运行结果的主要窗口说明如下 如表2为KMO检验和巴特利球形检验结果 从检验结果来看 KMO值为0 694 根据统计学Ksiser给出的标准 KMO值略小于0 7 介于因子分析的 一般 和 不太适合 之间 Bartlett球度检验给出的相伴概率为0 000 小于显著水平0 05 因此拒绝Bartlett球度检验的零假设 认为适合与因子分析 表2KMO检验和巴特利球形检验结果 如表3是因子分析后因子提取的结果 窗口从第二列开始其代表意义分别为 因子变量的方差贡献 特征值 它是衡量因子重要程度的指标 第三列为因子变量的方差贡献率 第四列为因子变量的累计方差贡献率 第五到第八是提取后的因子变量信息 从表2中可以看出特征值大于1的共有两个因子 4 005和2 492 两个因子可解释总信息量的81 209 表3因子分析结果窗口 表3是因子得分矩阵 这是根据回归算法计算出来的因子得分函数的系数 根据这个表格可以得到因子得分函数 F1 0 568X1 0 003X2 0 927X3 0 257X4 0 971X5 0 930X6 0 060X7 0 972X8F2 0 619X1 0 584X2 0 186X3 0 872X4 0 120X5 0 126X6 0 965X7 0 113X8 表3因子得分矩阵表 因子分析是对现实生活中众多的相关 重叠信息进行合并和综合 它以最少的信息丢失将原始的众多变量和指标变成较少的几个综合变量 并利于分析判定 在研究中 因子分析得到的结果常常用于综合判定 有时还利用综合得分加以判定 如综合判断 aF1 bF2 cF3 4 聚类分析 Classifiy 聚类分析是一种探索性的分析 在分类的过程中 人们不必事先给出一个分类的标准 聚类分析能够从样本数据出发 自动进行分类 聚类分析所使用的方法的不同 常常会得到不同的结论 聚类分析主要有快速聚类分析方法和层次聚类分析方法 其中层次聚类方法主要有R型聚类和Q型聚类 现结合实例1 对其进行聚类分析 采用方法为层次聚类中的R型聚类 Analyze Classify HierarchicalCluster 弹出对话框 然后将变量As Cd Cu Hg Mn Pb Se Zn分别转入右侧的空白框内 本列为R型聚类 因此选择Cluster框中的Variables 见图12 图12层次聚类分析对话框 单击 Method 出现其对话框 图13 本例选中类间平均连锁法 Between grouposlinkage 以及Interval框中的SquaredEuclideandistance项 欧氏距离平方 单击Continue返回上个对话框 图13Method对话框 单击 Plots 打开其对话框 图14 本例选中 Dendrogram 项 表示输出聚类的树型图 表示将各类之间的距离重新转换为0 25之间 然后在近似地表示在图上 Icicle框表示输出冰柱图 Orientation框表示表示输出方向 单击Continue 返回对话框 图14Plots对话框 单击 Statistics 打开其对话框 图15 选中 Agglomerationmatrix 项 表示输出层次聚类分所西的凝聚状态表 ClusterMembership复选框中选中 Singlesolution 表示希望将数据聚类分为几类 本例中写入3 表示将样本分为3类 单击Continue按钮返回上一对话框 图15Statistics对话框 单击OK SPSS运行 现将运行结果主要窗口解释如下 表4为层次聚类的纵向冰柱图 冰柱图一般从最后一行开始观察 如下表 Hg和Se用 X 连接 表示首先二者聚类 其次为Hg和As用 X 连接 表示接着与As聚类 依次类推 接着为Cu和Se Mn和Cu等等 表4层次聚类冰柱图 图15为层次聚类树型图 从图中可以看出各个类之间的距离在25的坐标内 从图中可以看出 Zn与其它元素的距离较大 在折合为0 25的坐标时 从图里很难看出Hg Se As Cu Mn Pb距离差异和聚类的先后顺序 但树型图可以直观的显示整个聚类过程 图15层次聚类树型图 5 回归分析 linear 回归分析是处理两个及两个以上变量间线性依存关系的统计方法 在许多领域都普遍应用 回归分析主要有一元线性回归分析 多元线性回归分析 非线性回归分析 曲线估计等等 操作实例 结合实例1 对其进行多元线性回归 试图建立以As为应变量 其它元素为自变量的多元线性方程 Regression liner 系统弹出线性回归对话框 如图16 现在分别对各个部分进行简要说明 图16线性回归对话框 Dependent框内为应变量 本例中填入As Independent框为自变量 本例填入Cd Cu Hg Mn Pb Se Zn等自变量 Block按钮组作为对自变量顺序的调整 不同的顺序 其方程系数也不同 Method下拉列表 用于选择对自变量的选入方法 有Enter 强行进入法 Stepwise 逐步法 Remove 强制剔除法 Backward 向后法 Forward 向前法 五种 本例选用常用的Enter法 Statistics框表示对样本数据进行筛选 挑选满足一定条件的样本数据进行线性回归分析

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论