SPSS第四讲PPT课件.ppt_第1页
SPSS第四讲PPT课件.ppt_第2页
SPSS第四讲PPT课件.ppt_第3页
SPSS第四讲PPT课件.ppt_第4页
SPSS第四讲PPT课件.ppt_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

SPSS第四讲 相关分析和回归分析 1 2 3 第一节相关分析 一 预备知识研究变量间密切程度的一种常用统计方法1 线性相关分析 研究两个变量间线性关系的程度 用相关系数r来描述 2 偏相关分析 它描述的是当控制了一个或几个另外的变量的影响条件下两个变量间的相关性 如控制年龄和工作经验的影响 估计工资收入与受教育水平之间的相关关系 4 相关系数的计算有三种 Pearson Spearman和KendallPearson相关系数 对定距变量的数据进行计算Spearman和Kendall相关系数 对分类变量的数据或变量值的分布明显非正态或分布不明时 计算时先对离散数据进行排序或对定距变量值排 求 秩 5 三 相关分析的SPSS过程在Analyze Correlate下的三个子菜单 1 Bivariate 相关分析 计算指定的两个变量间的相关关系 可选择Pearson相关 Spearman和Kendall相关 同时对相关系数进行检验 检验的零假设为 相关系数为0 不相关 给出相关系数为0的概率2 Partial 偏相关分析 计算两个变量间在控制了其他变量的影响下的相关关系 对相关系数也进行检验 检验的零假设为 相关系数为03 Distance 相似性测度 对变量或观测量进行相似性或不相似性测度 6 二 Bivariate过程 主要功能调用此过程可对变量进行相关关系的分析 计算有关的统计指标 以判断变量之间相互关系的密切程度 调用该过程命令时 系统输出的是变量间两两相关的相关系数 7 例 某地区10名健康儿童头发和全血中的硒含量 1000ppm 如下 试作发硒与血硒的相关分析 8 数据准备激活数据管理窗口 定义变量名 发硒为X 血硒为Y 按顺序输入相应数值 建立数据库 9 绘图 绘制散点图 大致判断两变量之间的关系Graphs LegacyDialogs scatter simplescatter 10 统计分析激活Analyze菜单选Correlate中的Bivariate 命令项 弹出BivariateCorrelation对话框 在对话框左侧的变量列表中选x y 点击 钮使之进入Variables框 再在CorrelationCoefficients框中选择相关系数的类型 共有三种 Pearson为通常所指的相关系数 r Kendell stau b为非参数资料的相关系数 Spearman为非正态分布资料的Pearson相关系数替代值 本例选用Pearson项 在TestofSignificance框中可选相关系数的单侧 One tailed 或双侧 Two tailed 检验 本例选双侧检验 11 相关系数的类型 相关系数检验方式 是否显示检验概率 如果有3个以上变量 输出两两变量的相关系数 12 13 Correlations 结果解释 在结果输出窗口中将看到XY两两对应的相关系数及其双侧检验的概率 本例r 0 872 P 0 001 相关分析表 相关系数检验概率样本量 14 三 Partial过程 主要功能调用此过程可对变量进行偏相关分析 在偏相关分析中 系统可按用户的要求对两相关变量之外的某一或某些影响相关的其他变量进行控制 输出控制其他变量影响后的相关系数 例 某地29名13岁男童身高 cm 体重 kg 和肺活量 ml 的数据如下表 试对该资料作控制体重影响作用的身高与肺活量相关分析 15 16 数据准备激活数据管理窗口 定义变量名 身高为height 体重为weight 肺活量为vc 按顺序输入相应数值 建立数据库 绘制散点图 大致判断两变量之间的关系Graphs LegacyDialogs scatter matrixscatter 17 统计分析激活Analyze菜单选Correlate中的Partial 命令项 弹出PartialCorrelations对话框 现欲在控制体重的影响下对变量身高与肺活量进行偏相关分析 故在对话框左侧的变量列表中选变量height vc 点击 钮使之进入Variables框 选要控制的变量weight 点击 钮使之进入Controllingfor框中 在TestofSignificance框中选双侧检验 然后点击OK钮即可 18 控制变量列表 19 20 PartialCorr 结果解释在结果输出窗口中将看到如下统计数据 控制体重的影响后 身高与肺活量的相关系数为0 269 经检验P 0 167 故身高与肺活量的线性相关不存在 21 结果比较控制体重的影响后 身高与肺活量的相关系数为0 269 经检验P 0 167 故身高与肺活量的线性相关不存在 如果不控制体重的影响 则身高与肺活量的相关系数为0 5884 P为0 001 可见身高与肺活量的相关是由与体重协同作用而产生的 22 问题的解决 寻找控制银行不良贷款的因素 23 一 预备知识 一 概念寻求有关联 相关 的变量之间的关系主要内容 从一组样本数据出发 确定这些变量间的定量关系式对这些关系式的可信度进行各种统计检验从影响某一变量的诸多变量中 判断哪些变量的影响显著 哪些不显著利用求得的关系式进行预测和控制 第二节回归分析 24 二 回归分析的模型按是否线性分 线性回归模型和非线性回归模型按自变量个数分 简单的一元回归 多元回归基本的步骤 利用SPSS得到模型关系式 是否是我们所要的 要看回归方程的显著性检验 F检验 和回归系数b的显著性检验 T检验 还要看拟合程度R2 相关系数的平方 一元回归用RSquare 多元回归用AdjustedRSquare 2020 2 4 25 26 27 三 回归分析的过程在回归过程中包括 Linear 线性回归CurveEstimation 曲线估计BinaryLogistic 二分变量逻辑回归MultinomialLogistic 多分变量逻辑回归Ordinal序回归Probit 概率单位回归Nonlinear 非线性回归WeightEstimation 加权估计2 StageLeastsquares 二段最小平方法OptimalScaling最优编码回归我们只讲前面2个简单的 一般教科书的讲法 28 二 Linear过程 主要功能调用此过程可完成二元或多元的线性回归分析 在多元线性回归分析中 用户还可根据需要 选用不同筛选自变量的方法 如 逐步法 向前法 向后法等 29 例 某医师测得10名3岁儿童的身高 cm 体重 kg 和体表面积 cm2 资料如下 试用多元回归方法确定以身高 体重为自变量 体表面积为因变量的回归方程 30 数据准备激活数据管理窗口 定义变量名 体表面积为Y 保留3位小数 身高 体重分别为X1 X2 1位小数 输入原始数据 结果如图所示 31 32 统计分析激活Analyze菜单选Regression中的Linear 项 弹出LinearRegression对话框 从对话框左侧的变量列表中选y 点击 钮使之进入Dependent框 选x1 x2 点击 钮使之进入Indepentdent s 框 在Method处下拉菜单 共有5个选项 Enter 全部入选法 Stepwise 逐步法 Remove 强制剔除法 Backward 向后法 Forward 向前法 本例选用Enter法 点击OK钮即完成分析 33 因变量 自变量列表 统计分析 34 用户还可点击Statistics 钮选择是否作变量的描述性统计 回归方程因变量的可信区间估计等分析 点击Plots 钮选择是否作变量分布图 本例要求对标准化Y预测值作变量分布图 点击Save 钮选择对回归分析的有关结果是否作保存 点击Options 钮选择变量入选与剔除的 值和缺失值的处理方法 35 Regression 变量进入方式 回归模型拟合度表 拟合度 F检验值 检验概率a接受H0 36 结果显示本例以X1 X2为自变量 Y为因变量 采用全部入选法enter建立回归方程 回归方程的复相关系数为0 950 决定系数 即R2 为0 902 调整后的R2为0 874 经方差分析 F 32 145 P 0 0000 回归方程有效 回归方程为Y 2 856 0 069X1 0 184X2 回归系数表 系数值 系数检验值 检验概率越小 越显著 0 475 0 919 3 234 37 课堂练习1 地区经济发展水平与人口预期寿命的回归分析 1 写出人均GDP与人口预期寿命的线性回归方程 2 检验回归方程是否显著 3 检验各回归系数是否显著 4 解释各回归系数的实际意义 资料来源 国家统计局 38 三 CurveEstimation过程 主要功能 调用此过程可完成下列有关曲线拟合的功能 39 非线性回归 实例 例 为研究生产率与废品率之间的关系 记录数据如下表 试拟合适当的模型 40 生产率与废品率的散点图 41 数据准备激活数据管理窗口 定义变量名 废品率为Y 生产率为X 输入原始数据 统计分析激活Analyze菜单选Regression中的CurveEstimation 项 弹出CurveEstimation对话框 从对话框左侧的变量列表中选y 点击 钮使之进入Dependent框 选x 点击 钮使之进入Indepentdent s 框 在Model框内选择所需的曲线模型 本例选择Linear模型和Exponential模型 即指数曲线 点击DisplayANOVAtable按钮 要求输出方差分析结果 再点击OK钮即可 42 模型类型 是否显示方差分析表 是否对模型作图 43 Linear 回归系数表 方差分析表 回归模型拟合度表 y 0 1x 44 Exponential 002 y e x 45 结果解释用线性模型 y 0 1x 有y 2 628 0 002x 用指数模型 y e x 有lny 4 003 0 002

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论