数学在地学中的应用实习二回归分析_第1页
数学在地学中的应用实习二回归分析_第2页
数学在地学中的应用实习二回归分析_第3页
免费预览已结束,剩余7页可下载查看

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、地球科学与学院中国地质大学(北京)遥感与地学信息教研室数学在地学中的应用实习二、回归分析及其检验一、回归分析实验目的:1. 实现一元及多元回归模型的计算与检验;2. 掌握查看并分析计算结果的方法;1. 一元回归分析 打开“实习二”文件夹中“陈永富.sav”文件。 点击“分析”菜单à“回归”à“线性”,进入“线性回归” “年均湿度”为自变量。框。选择“河流湿地面积”为因变量,“进入”是 SPSS 默认方法,表示变量强行进入回归方程,常用于一元线性回归分析中。“删除”是从回归方程中提出所选变量A“向前”表示向前筛选策略:解释变量 不断进入回归方程的过程。首先,选择与被解释变量具

2、有最高线性相关系数的变量进入方程,并进行回归方程的各种检验;然后,在剩余的变量中寻找与被解释变量偏相关系数最高且通过检验的变量进入回归方程,并对新建立的回归方程进行各种检验;这个过程一直重复,直到再也没有可进入方程的变量为止。WLS 权重:采用加权最小二乘法替代普通最小二乘“逐步”表示逐步筛选策略:在向前筛选策略的基础上结合向后筛选策略。在每个变量进入方程后再次“向后”表示向后筛选策略:变量不断剔除出回归方程的过程。首先所有 变量全部引入回归方程,并对回归方程进行各种检验;然后,在回归系数显著性检验不显著的一个或多个变量中,剔除 t 检验值最小的变量,并重新建立回归方程和进行各种检验;如果新建

3、回归方程中所有变量的回归系数检验都显著,则回归方程建立结束。否则按上述方法再一次剔除最不显著的变量,直到再也没有可剔除的变量为止。法估计回归参数, 是否存在应该剔除出方程的变量。因并指定一个变量 此,逐步筛选策略在引入变量的每一作为权重变量。个阶段都提供了再剔除不显著变量地球科学与学院中国地质大学(北京)遥感与地学信息教研室 选择“进入”方法进行分析à点击“统计量”,进入“线性回归:统计量”窗口,按下图所示选择统计量à点击“继续”,返回“线性回归”窗口。估计:系统默认输出,输出与回归系数相关的统计量。包括回归系数(偏回归系数)、回归系数标准误差、标准化回归系数、回归系数显著

4、性检验的 t模型拟合度:系统默认输出项,输出系数、调整的系数、回归方程的标准误差、回归方程显著性F 检验的方程分析表。统计量和概率 p 值,各解释变量的度。R 方变化:输出每个解释变量进入方程后引起的判定系数的变化和F 值的变化量。置信区间:输出每个非标准化回归系数 95%的置信区间。部分相关和偏相关性:输出方程中各解释变量与被解释变量间的简单相关、偏相关系数。协方差矩阵:输出方程中各解释变量间相关系数、协方差及各回归系数的方差。描述性:输出各解释变量和被解释变量的均值、标准差、相关系数矩阵及单侧检验概率值 p。表示输出DW 检验值。共线性诊断:进行多重共线性分析,输出各个解释变量的度、方差膨

5、胀因子、特征值、条件指标、方差比例等。个案诊断,表示输出标准化残差绝对值大于 3(SPSS 默认值)的样本数据的相关信息。包括值、残差、杠杆值等。性回归”窗口中选择“绘制”,进入“线性回归:图”窗口,该窗口内容可以对变量残差序列进行分析。按照下图所示选择绘图变量à点击“继续”,返回“线性回归”窗口。被解释变量(因变量)标准化值标准化残差剔除残差调整的值学生化残差剔除学生化残差性回归”窗口中选择“保存”,进入“线性回归:保存”框。该步骤可设置回归分析的某些结果以 SPSS 变量的形式保存到数据编辑窗口中,并可同时生成.xml 格式的文件,便于分析结果的网络发布。按照下图对统计量进行选择

6、后,点击“继续”,返回“线性回归”窗口未标准化标准化调整的值值值值的均值标准误差 保存剔除第i 个样本后统计量的变化量。保存均值或值 95%(默认)置信区间的上限值和下限值性回归”窗口中,点击“确定”,得到分析结果。地球科学与学院中国地质大学(北京)遥感与地学信息教研室2.一元回归结果分析相关系数:自变量和因变量的相关系数为 0.674。由于单尾检验结果 p 值=0.001<0.05,说明检验统计量(两个变量的相关系数)的概率小于给定的显著性水平,认为两个变量之间相关性是显著的。相关系数的检验结果回归方程的拟合优度检验。回归方程的拟合优度检验(判定系数)回归方程的显著性检验回归方程的显著

7、性检验回归系数计算及显著性检验:01回归系数的显著性检验写出回归方程为:河流湿地面积* = 8343.235 + 1653.407 × 年均湿度地球科学与学院中国地质大学(北京)遥感与地学信息教研室二、多元回归分析1.多元回归分析(进入策略)仍然使用 “陈永富.sav”数据文件实现本部分实习内容。点击“分析”菜单à“回归”à“线性”,进入“线性回归”框。在框中,选择“河流湿地面积”作为因变量;“年均温度”、“年降水量”、“年蒸发量”“年均湿度”、“人口数”、“奶产量”、“人均收入”作为自变量,构建回归方程。点击“统计量”,进入“线性回归:统计量”框,按照下图勾选统

8、计量。与一元回归分析相比,勾选共线性诊断,可以实现变量是否具有多重共线性的检查à点击“继续”返回“线性回归”框。点击“绘制”à进入“线性回归:图”框。按下图选择好变量并勾选所要进行的绘图后,点击“继续”返回“线性回归”框。依次绘制被解释变量和各个解释变量的散点图绘制标准化残差序列的直方图绘制标准化残差序列的正态分布累计概率图性回归”框中点击确定,进行回归计算。2.查看多元回归分析结果(进入策略) 相关系数:“相关性表格”中列出了各个解释变量与被解释变量的 Pearson 相关系数。从相关系数数值上来分析,人口数对河流湿地面积的影响最大,且为负相关关系;其次为人均收入、奶产量

9、、年均地球科学与学院中国地质大学(北京)遥感与地学信息教研室湿度、年均温度、年降水量;年蒸发量与河流湿地面积的相关性极小。从显著性检验结果来看,除“年蒸发量”(Sig=0.491>0.05)与被解释变量的相关关系不显著之外,其余各变量均通过了显著性检验,即各变量与河流湿地面积具有显著的相关关系。回归方程的拟合优度检验。回归方程的决定系数(调整后)=0.84,说明回归方程具有较好的拟合优度。另:R(即决定系数的平方根)即为因变量与自变量之间的复相关系数。回归方程的显著性检验。回归方程的 F 检验的 P 值为 0.000<95%的置信度,因此回归方程式显著的。回归系数的显著性检验。本例

10、中,大多数回归系数的检验结果为不显著。地球科学与学院中国地质大学(北京)遥感与地学信息教研室得到回归方程为:河流湿地面积*=-29317.3762278.234×年均温度+0.556×年降水量+36.386×年蒸发量+384.329×人口数-1028.830×奶产量-2.499×人均收入。.266×年均湿度多重共线性检验。即检验自变量之间是否存在近似的线性关系,换句话说,某个自变量能近似的用其他自变量的线性函数来描述。多重共线性会致使回归方程显著,而大部分回归系数不显著;或者回归系数的符号与理论或预期不符。因此,不排除多重共

11、线性的问题,多元回归分析是多重共线性可以通过以下几种方式确认:确的。ØØ显著性检验:回归方程显著而多个回归系数不显著,认为可能存在共线性。多重共线性的确认可以通过做出自变量的相关系数矩阵,如果相关系数超过 0.9 的变量在分析时将会存在多重共线性(例如本例中人口数与人均收入的相关系数达到 0.912),在 0.8 以上可能会有问题。但这种方法只能作为共线性的初步,并不全面。Ø容差:或称为度。指把某一个自变量当做因变量,用其他自变量对其进行回归时,得到的残差比例,大小用 1-R2 来表示。该指标越小,说明该自变量被其他自变量严重。当容差小于 0.1 时,认为存在严重

12、的共线性。得越精确,共线性也就越ØØ方差膨胀因子(VIF):即度的倒数。当方差膨胀因子大于 10 时认为具有严重的共线性。特征值:多个维度的特征值约为 0,证明存在多重共线性。原理是对所有的自变量进行主成分分析。如果每个自变量通过正交变换后自成一个维度,则说明自变量是正交的,也就是不相关的,自然 是不存在共线的问题。但本例中,多个维度的特征值约等于 0,说明这些维度在统计意义上是不存在的,变量矢量大多指向第一和第二维度的方向,说明自变量间存在共线性。Ø方差比例:如果多个变量在同一个主成分中方差均较大(贡献的信息量都很多),则说明这几个变量在这个主成分(方向)上存在

13、较多的共同信息,也就是说这几个变量存在较多的共线性。Ø条件索引:大于 30 的时候提示存在多重共线性。综上,本例中自变量之间具有较强的多重共线性。地球科学与学院中国地质大学(北京)遥感与地学信息教研室3.逐步回归分析点击“分析”菜单à“回归”à“线性”,进入“线性回归”框。在框中,选择“河流湿地面积”作为因变量;“年均温度”、“年降水量”、“年蒸发量”“年均湿度”、“人口数”、“奶产量”、“人均收入”作为自变量,构建回归方程。选择“逐步”方法进行分析à点击“统计量”,进入“线性回归:统计量”窗口,按下图所示选择统计量,勾选“R 方变化”以方便查看每个解释

14、变量进入或方程后得到的决定系数à点击“继续”,返回“线性回归”窗口。性回归”窗口中选择“绘制”,进入“线性回归:图”窗口,按照下图所示选择绘图变量,选择标准化残差为 Y 轴、标准化值为 X 轴,以方便查看残差的分布情况à点击“继续”,返回“线性回归”窗口。点击“选项”à进入“线性回归:选项”框。如果一个变量的 F 检验概率小于或等于“进入”栏里设置的值(0.05),那么这个变量将被选入回归方程中;当回归方程中变量的 F 值检验概率大于“删除”栏里设置的值,则该变量将从回归方程中被剔除。由此可见,设置 F 检验概率时,应使“进入”值小于“删除”值à保留默认

15、设置,点击“继续”返回“线性回归”框。地球科学与学院中国地质大学(北京)遥感与地学信息教研室性回归”框中点击确定,进行回归计算。4. 查看逐步回归分析结果 进入/剔除回归方程的变量情况。地球科学与学院中国地质大学(北京)遥感与地学信息教研室 回归方程的拟合优度检验。表中了每一次进入/剔除回归方程时得到的决定系数(其中第 5 次选用了全部自变量),通过不断对回归方程进行调整(至第 4 次),决定系数越来越高,标准误差越来越小,说明回归方程的拟合优度越来越好。 回归方程的显著性检验。回归方程的 F 检验的 P 值为 0.000<95%的置信度,因此回归方程式显著的。地球科学与学院中国地质大学(北京

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论