已阅读5页,还剩1页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第六章 地理系统要素的逐步回归分析 地理系统是一个要素众多、联系复杂的大系统。各个因素之间存在错综复杂的关系。在水文、气象、地震等预报工作中,以及进行人文地理、经济地理要素分析的时候,常需选出对y研究变量 (即因变量或预报量)有影响的因子(即自变量)。虽然可以从理论分析方面,选出一些对y有影响的自变量。但由于变量y构成的复杂性,这些因子对y的关系究竟如何,不是单凭理论分析就可判定的。其中可能有些对y有显著影响,有些则影响很小。为了避免遗漏对y有显著影响的因子,所以在初选因子时往往考虑的面较广,拟定的因子也比较多,有时可达几十个。于是就提出一个问题:如何在这许多因子中,选出对y影响最大的一些因子,从而建立对这批地理数据称之为“最优”的线性回归方程呢?这就是本章所要解决的问题。1最优回归方程的选择 所谓最优回归方程,是指以下两个意义。一方面,一般地回归方程中包含的变量越多,回归平方和就越大,剩余平方和就越小;另一方面,一个合理的回归方程应该只包含显著的因子,而不应包含不显著的因子。因为因子数量过多,获取和计算工作量增大,并且如果回归方程中包含有对y根本不起作用或起很小作用的变量,剩余平方和并不会由于这些变量而减少多少,相反的由于(剩余)自由度的减少,剩余方差倒有可能反而增大,同时,这些对y影响不显著的变量也会影响回归方程的稳定性而使预报效果降低。综合以上两个方面,所谓最优的回归方程就是包含所有对y显著的变量而不包含对y不显著变量的回归方程。选择最优回归方程几种不同的方法。1. 从所有可能的变量组合的回归方程中挑选最优者共有个方程 n个变量情况下对每个方程及自变量作显著性检验,然后从中挑选所有的变量全部显著,且剩余均方和较小方程。2从包含全部变量的回归方程中逐次剔除不显著的因子 剔去不显著因子中偏回归平方和最小的那个因子3从一个自变量开始,把变量逐个引入回归方程先计算各因子与 y 的相关系数,将绝对值最大的一个因子引入方程,对回归平方和进行显著性检验,余下的因子中与y 的偏相关系数(除去已引入的因子的影响后,二者间的相关系数)最大的那个,经检验结果是显著的,引入到方程,依次类推。 4结合方法3与方法2 采用这种方法时,首先将对因变量关系最密切的自变量引入,然后在剩下的变量中再选取与因变关系较为密切的变量“引入”下一个变量以前,对已引入的变量先进行检查,看是否可以剔除。若检查结果,不能剔除,则再引入较为重要的新变量。一般在引入第三个变量之前,就要先考虑剔除变量的问题,这是因为引入新变量后原有变量的作用可能减小而需要剔除。例如,当引入第二个较为重要的新变量时,第一个变量就可能不起作用,需要剔除。故在引入第三个变量之前就需要检验并剔除那个已变得不重要的变量,然后再引入新的变量。 因此采用逐步回归方法可以保证最终引入回归式的变量都是对因变量关系密切,即有显著意义的变量。2“引入”和“剔除”变量的标准 “引入”和“剔除”变量的标准可以根据变量的方差贡献来确定。 设在逐步回归的第步已有个自变量引入回归方程,则回归方程为: 这时相应的总平方和可分解成回归平方和剩余平方和二部分,即 注意,这里和符号中的脚标,表示已引入的变量数(而不是第个变量)。 若下一步,即第步引入变量,则有回归方程为: 这时=+ (2) 因为总平方和不变,所以变量引入后,回归平方和从增加到,而剩余平方和则从减少到。因此由变量引起的平方和的变化为: -=- (3)更确切地说,表示由于引入变量后回归平方和的增加量(或相应为剩余平方和的减少量),通常称之为对的方差贡献。可用以衡量对所起作用的大小。 因此检验是否可以引入时,采用如下统计量: (4)式中为剩余平方和的自由度,其中为已引入的变变量数。 变量对作用是否显著,可用上述统计量进行检验。在给定的显著性水平下确定临界值,当计算的统计量值时表明引入的自变量有显著意义的,否则当时,引入的变量就没有意义。 同样,若第步为剔除变量时,则有回归方程: 故:+ (5) 因为总平方和不变,所以变量剔除后回归平方和从减少为,而剩余平方和从增加到。这时变量剔除后回归平方和的减少量(或剩余平方和的增加量)为: -=- (6) 因此检验变量是否可以剔除时,采用如下统计量: (7)式中是剩余平方和的自由度。 同样,在给定水平下确定临界值,当统计量时,则说明对的作用不显著可以剔除。3 协方差分析概率论上协方差定义:称为随机变量X与Y的协方差,记为 ,即,协方差分析是把方差分析和回归分析结合起来的一种统计方法,它用于比较一个变量Y在一个或几个因素不同水平上的差异,但Y受这一个或几个因素影响的同时,还受到另一个变量X的影响,而且X变量取值难以人为控制,不能作为方差分析中的一个因素处理。此时如果X与Y之间可以建立回归关系,则可用回归分析的方法排除X对Y的影响,然后再用方差分析的方法对个因素水平的影响作出统计推断协方差分析,我们称Y为因变量,X为协变量。例如动物饲养中的饲料试验,同窝及初始体重相同最理想,事实上这不可能做到,为消除初始体重对增重的影响,用回归分析校正初始体重不一致,再用方差分析方法比较其他因素如饲料种类、数量对增重的影响。作业题:假定某市某个时期对某种消费品的销售量为y,居民可支配收入为,该类消费品的价格指数为,社会保有量为,其他消费品的价格指数,试研究该市对这种消费品的需求函数。原始数据如下:n居民可支配收入该类消费品的价格指数社会保有量其他消费品的价格指数销售量y182.992.017.194.08.4288.993.021.396.09.6399.996.025.197.010.44105.394.029.097.011.45117.7100.034.0100.012.26131.0101.0
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025版心脏病常见症状及护理要点
- FMECAFMEA故障模式影响分析课件
- 肝硬化常见症状及护理方法培训
- 营养风险的筛查评估表
- 有关说的几种方式训练
- 病理科组织切片技术实操指南
- 2025年电力交易员笔试题含答案
- 2025年证券从业之金融市场基础知识考试题库含答案
- 人工智能训练师高级理论A卷题库及答案
- 绿化工程维护养护方案
- 挂耳咖啡、胶囊咖啡、饮料生产项目可行性研究报告写作模板-拿地备案
- 青海省民间信仰管理办法
- 科研中心绩效管理办法
- 2020-2025年中国羊肉汤行业发展潜力分析及投资方向研究报告
- 2025年河北大学版(2024)小学信息科技三年级(全一册)教学设计(附目录 P179)
- 胃镜取异物护理查房
- 常用镇痛药讲课件
- 婴儿喂养记录表
- 眼科医疗安全管理制度
- 初三中考备考家长会课件
- 2025电焊安全考试题库及答案
评论
0/150
提交评论