




已阅读5页,还剩38页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第五章地理系统要素间的相关分析与回归分析 地理系统由各个要素组成 各要素之间存在着相互联系 相互影响和相互制约 为了定量地研究各要素之间的数量关系 常用相关分析法和回归分析法来确定它们之间的关系和性质 并概括成数学模型 进而作出地理预测 第五章地理系统要素间的相关分析与回归分析 1地理要素间的相关分析一 地理相关的意义所谓相关 是指两个或两个以上的变量间相互关系是否密切 相关分析仅限于测定两个或两个以上的变量间相关程度和性质 而地理相关则是指应用相关分析法来研究各地理要素间的相互关系和联系强度 在地理系统中 各要素间存在着各种不同的关系 一种是确定性的关系 即函数关系 这在地理系统中比较少见 因为很多地理要素的变化具有随机性的缘故 另一种关系是相关关系 即要素间既存在较密切的关系 但又不能由一个要素的值精确地求出另一个要素的值 还有一种情况 是各要素之间完全没有任何关系 如图5 1所示 第五章地理系统要素间的相关分析与回归分析 从图中可以看出 若设x y为两种地理要素 第一种情况 若y严格随x变化而变化 如 a 所示 所有观测点均落在直线或曲线上 则称为完全相关或函数关系 第二种情况 若观测点落在直线或曲线两旁 如 b 所示 则称为统计相关 第三种情况 若观测点分布散乱 则两种地理要素完全无关 相互独立 第五章地理系统要素间的相关分析与回归分析 二 地理相关程度的度量方法计量地理学中用不同的指标来度量不同类型的地理相关的程度 一 简单直线相关程度的度量一般情况下 当两个地理要素间为直线相关时 需要分析其相关程度和相关方向 所谓相关程度指两者关系的密切程度 而相关方向可分为正相关与负相关 前者指两个要素间呈同方向变化 而后者相反 这两者可用一个共同的指标度量 就是相关系数 1 一般常用的相关系数 r 计算公式其中 第五章地理系统要素间的相关分析与回归分析 上式计算出的相关系数 具有下列三点性质 1 相关系数的分布范围 介于 1与 1之间 2 当相关系数为正值时 表示两个要素之间为正相关 相关系数为负值时 表示两个要素之间为负相关 3 相关系数的绝对值越大 表示两个要素间相关程度越密切 例1 北京市多年各月平均气温与5cm深的平均地温 数据如表5 1所示 依据相关系数的计算公式可得 0 9995 由此可见 北京市的各月平均气温与5cm的平均地温呈正相关 而且相关极为密切 第五章地理系统要素间的相关分析与回归分析 2 顺序 等级 相关系数 rs 计算公式顺序相关不但适用于数量资料的相关分析 而且适用于质的资料 表示两个要素顺序间直线相关程度和方向的系数 称为顺序相关系数 当使用两个要素间的数值计算相关系数不方便时 可用顺序相关系数的计算公式来求得 例2 现仍以北京市各月平均气温与5cm平均地温为例 列成表5 2说明其计算过程 首先将表中两个要素的观测值按大小顺序排列起来 最大值排为1号 依次类推 将两个要素的顺序号相减 即为d 将其平方求和并带入上面公式 即可得到两者的顺序相关系数rs 第五章地理系统要素间的相关分析与回归分析 第五章地理系统要素间的相关分析与回归分析 二 简单非线性相关程度的度量表示简单非线性相关程度的统计量 通常用相关指数Ryx来度量 相关指数的性质如下 1 相关指数的分布范围介于0到1之间 2 相关指数的数值越大 两个要素间的曲线相关程度越密切 3 相关指数必大于或至少等于用同一批资料所求得的相关系数的绝对值 第五章地理系统要素间的相关分析与回归分析 三 多要素相关与相关矩阵对于多个地理要素 则可计算出各要素两两之间的相关系数 并构成相关矩阵 例3 现给出世界上自然植被的生产量与水热资源的原始地理数据 表5 3 利用相关系数公式得到其相关矩阵 形式如下所示 第五章地理系统要素间的相关分析与回归分析 三 相关系数的显著性检验为了判定我们所计算出来的相关系数是否有意义 通常还要进一步对相关系数作显著性检验 为了使用上方面 前人已经制出了相关系数检验表 附录二 其中n表示所使用资料的个数 自由度f为n 2 为信度 对计算出的相关系数进行显著性检验证明要素间相关程度是显著的之后 就可以对其进行进一步的回归分析了 第五章地理系统要素间的相关分析与回归分析 2地理要素间的回归分析一 地理回归分析的意义和作用地理系统各要素之间的相互关系 可通过大量的观测 试验或实验取得一定的地理数据 然后用数理统计的方法 寻找出隐藏在随机性后面的统计规律 而用回归方程来表达 地理回归分析主要是研究地理要素之间联系的数学表达式 有自变量与因变量之分 从而可由自变量的取值来预测 延长或插补和控制因变量的取值 所以它有地理预测的性质 地理回归分析的主要内容包括 1 由一组地理数据确定这些要素间的定量数学表达式 即回归模型 2 利用回归模型 根据自变量的值来预测或控制因变量的取值 第五章地理系统要素间的相关分析与回归分析 二 一元地理回归模型的建立一元地理回归是要解决两个要素间的定量关系 由于两个要素之间的数量关系类型的差别 一元地理回归包括线性回归模型和非线性回归模型分述如下 一 一元线性地理回归模型的建立假设有两个要素 变量 x和y x为自变量 y为因变量 x可以是降水量 蒸发量 土壤中的有机质含量等 y可以是河流径流量 土壤含水量等 假定一元线性模型结构为 yi A Bxi i式中 A B为待定参数 i 1 2 n 而 xi yi 为n组观测数据 i为随机变量 参数A B一般总是未知的 需根据观测值采用最小二乘法来估计 第五章地理系统要素间的相关分析与回归分析 设a和b分别为参数A和B的最小二乘估计值 于是便得到了一元线性回归模型为上式代表x和y之间关系的最佳拟和直线 通常称为回归直线 它满足y的实际观测值与回归值之间的误差平方和最小 这就是最小二乘法 1 参数a和b的最小二乘估计根据最小二乘原理 可得a b的计算公式如下 第五章地理系统要素间的相关分析与回归分析 2 一元线性地理回归模型的具体建立方法与步骤建立一元线性地理回归模型 就是用已有的地理数据来确定a和b的值 现仍以北京市各月平均气温x与5cm平均地温y为例 建立一元线性地理回归模型的过程如下 1 将表中的各项数据代入相应的计算公式 得到a b的数值 2 当参数a与b求出后 便可得出一元线性地理回归模型如下 第五章地理系统要素间的相关分析与回归分析 3 一元线性地理回归模型的效果检验当一元线性地理回归模型求出来以后 它的效果如何 它所揭示的地理规律性强不强 用它来进行地理预测精度如何 所有这些问题都需要进一步作出分析 1 回归模型估计的误差由线性回归模型所得到的y的估计值往往与实测值y不完全一致 它们之间的误差称为估计误差 以标准差的形式表示为在实际地理问题中 只要比较S与允许的偏差即可 第五章地理系统要素间的相关分析与回归分析 2 回归模型的显著性检验观测值yi与其平均值 y的差异可用离差平方和来表示 记为S总 它又可以进行如下的分解 上式右侧的第一项是所有观测点yi与回归值的残差平方和 表示除了x对y的线性影响以外的一切因素对y的变异影响 故称为剩余平方和 记作Q 第二项反映了在y的总偏差中 由x与y的线性关系引起的y的变化分布 故称为回归平方和 记作U 故有 S总 U Q 第五章地理系统要素间的相关分析与回归分析 一个回归效果的好坏取决于U在总离差平方和中的比例或者U与Q的比值 若取前者则有 从U与Q比值的大小来考虑 可利用如下的F检验方法 根据前人的研究 统计量F U Q n 2 符合第一自由度为1 第二自由度为n 2的F分布 根据前面学习的F 检验方法 即可对回归模型的显著性进行检验 第五章地理系统要素间的相关分析与回归分析 二 一元非线性地理回归模型的建立在许多实际地理问题中 有时两个要素之间的关系并不是线性关系 而是某种非线性关系 这时我们选择适当的类型曲线比配直线更符合地理实际情况 例如 我国武夷山南坡地形高度与年降水量之间的关系 玉米产量与耗水量之间的关系等等 对于这一类地理问题 首先需要选配曲线 确定曲线的类型 然后再化曲线回归模型为直线回归模型处理 第五章地理系统要素间的相关分析与回归分析 1 选配曲线的基本方法根据理论分析 过去的经验或观测数据的分布趋势与特点 来确定两个要素之间的曲线类型及其函数形式 从而求非线性地理回归模型的过程及其方法 叫做曲线选配 一般是先通过变量变化 把非线性函数关系化为线性关系 再采用线性回归的方法确定参数 当曲线的函数类型确定后 下一步就是求函数中的参数a和b 确定参数的办法仍然是最小二乘法 第五章地理系统要素间的相关分析与回归分析 2 地理上常见的非线性回归模型的建立方法在地理问题上 较常见的曲线类型有 幂函数型 指数函数型 对数函数型等 下面说明不同类型的非线性地理回归模型的建立方法与步骤 1 幂函数型两个地理要素之间的幂函数表达式为y axb对上式两边取常用对数或自然对数 得lny lna blnx令Y lny A lna X lnx 则上式为Y A bX这样就将曲线模型转化成线性模型了 第五章地理系统要素间的相关分析与回归分析 例如 长白山北麓熔岩台地地貌形态的变化 见表5 6 即呈幂函数曲线型 设x表示各地点距白头山天池火口壁的距离 km y为熔岩台地各地点的海拔高度 m 幂函数回归模型和拟和图如图5 4所示 第五章地理系统要素间的相关分析与回归分析 2 指数函数型两个地理要素之间的指数函数表达式为y aebx或y ae bx y abx然后对上式两边取常用对数或自然对数 则得lny lna lnb x令Y lny A lna B lnb则上式为Y A Bx这样指数函数模型就转化成线性模型了 第五章地理系统要素间的相关分析与回归分析 例如 长白山北麓地形高度对年降水量的影响 即按指数规律递增 见表5 7和图5 5所示 由图中模型可知 长白山北坡的年降水量是按指数规律增加的 其相关指数达0 9992 第五章地理系统要素间的相关分析与回归分析 3 对数函数型两个地理要素之间的对数函数关系表达式为y a blnx令X lnx 上式可直接转化为直线方程如下 Y a bX例如 当土壤湿度为最大田间持水量的50 60 雨强为1 0 2 0mm min时 淋溶和退化黑钙土区的地形坡度对径流系数的影响 即符合对数规律 见表5 8和图5 6 径流系数随地形坡度的增加按对数律递增 相关指数达0 9986 当地形坡度为零度时 该区域径流系数为0 45 当地形坡度平均每增加1度时 该区径流系数平均增加0 08 第五章地理系统要素间的相关分析与回归分析 图表说明如下 第五章地理系统要素间的相关分析与回归分析 3 一元非线性回归模型的效果检验在选配曲线的回归过程中 首先遇到的问题就是曲线类型的选择 因为曲线类型选择恰当 不仅对揭示出要素间的内在规律具有重要意义 而且对于减少剩余误差 提高回归模型的效果更具有实际意义 否则 其效果往往不能令人满意 甚至会歪曲要素间的内在规律性 那么 怎样衡量曲线回归模型的好坏呢 在衡量一元线性回归模型的效果时 我们采用了相关系数的平方等于回归平方和与总平方和之比 即或用剩余平方和来表示 则为在选配曲线的过程中 要求所配曲线与地理数据拟和较好 可利用上面右式定义的量来衡量所配曲线效果的好坏 记作R2 称为相关指数 第五章地理系统要素间的相关分析与回归分析 相关指数越大 表明选配的回归曲线效果越好 剩余标准差越小 其回归模型的预测精度就越高 现以表5 8中数据为例 计算出剩余平方和与总平方和如表5 9所示 其相关指数为R2 1 0 0001 0 0298 1 0 0034 0 997剩余标准差为由此可见 地形坡度对径流系数影响的模型拟和效果很好 而且剩余标准差也很小 因此模型的预测精度也很高 第五章地理系统要素间的相关分析与回归分析 三 多元地理回归模型的建立一个地理系统的基本特点之一 是它具有多要素性 而且各要素之间相互联系 相互影响 当研究某一个要素y与其他要素x1 x2 x3 xn之间的定量关系时 就需要用多元回归分析方法 这里同样也有线性和非线性之分 下面分别介绍线性与非线性多元回归模型的建立方法 一 多要素线性地理回归模型的建立1 多要素线性地理回归模型的建立方法一般设其数学结构模型为y 0 1x 1 2x 2 3x 3 kx k 采用最小二乘法 得到回归模型为y b0 b1x1 b2x2 bkxk bk为偏回归系数 第五章地理系统要素间的相关分析与回归分析 偏回归系数的意义表明 当其他要素都固定时 该自变量每变化一个单位而使y平均改变的数值 偏回归系数的确定同样是依据最小二乘法原理 即使达到最小 式中 为观测数据的序号 将上式对b0 b1 bk求偏倒数 并令其都等于零 即 第五章地理系统要素间的相关分析与回归分析 经展开整理后得 第五章地理系统要素间的相关分析与回归分析 以上方程组称为正规方程组 由其系数构成得矩阵记作A X X 即上述方程组可写成Ab B的形式 其中B X Y 解这个方程组即可得到各个变量的偏回归系数 将求出的偏回归系数和常数项代入多元线性数学模型中 即可得到k元线性地理回归模型 第五章地理系统要素间的相关分析与回归分析 例如 某一国家某一经济区内木材生产指数y 以1955年为100 受该区森林蓄积量指数x1 木材价格指数x2和运输距离指数x3的影响 如表5 10所示 可利用Doolittle法或利用Excel等软件工具计算出其多元线性回归模型的偏回归系数及常数项 第五章地理系统要素间的相关分析与回归分析 2 多元线性回归模型的显著性检验在多元线性回归问题中 同一元线性回归一样也需要对回归模型进行显著性检验 如果经过检验是显著的 则说明建立的回归模型是有用的 否则就没有什么实际意义 在多元线性回归分析中 同样也存在回归平方和U与剩余平方和Q 两者的自由度分别k和n k 1 于是剩余标准差为S sqrt Q n k 1 同样可对整个回归模型进行显著性检验 通常采用F 检验法 F值为回归方差和剩余方差之比 即根据检验的结果 在F值的右上角可标注星号 例如 前面例子中的检验结果就表明多元线性关系具有高度显著性 第五章地理系统要素间的相关分析与回归分析 二 多要素非线性地理回归模型的建立在地理系统中 除部分问题是属线性关系外 还有大部分问题属于非线性关系 下面扼要地介绍两种多元非线性地理回归模型的建立方法 1 多项式回归模型的建立方法在地理系统中 有些曲线不能化为直线处理 如二次多项式就不能化为线性模型 一般的处理方法是将它化为二元线性回归模型 然后按照多元线性回归分析方法处理 这种方法可以处理大部分一元非线性回归模型 因为任何函数形式都可以在较小区间内用多项式逐步逼近 当多项式回归的自变量取两次幂时 便是二次多项式 即抛物线 其数学模型为y b0 b1x b2x2 令x1 x x2 x2 则模型变为y b0 b1x1 b2x2 可用二元线性回归的方法确定模型参数 第五章地理系统要素间的相关分析与回归分析 例如 依据黑龙江省的实测资料 表5 14 土温与地积温系数k之间的关系 便可用多项式回归化成线性回归来处理 将表5 14中的数据点绘成散点图5 7可知 这个问题可用抛物线来近似 用Excel等软件及手动计算均可得到具体的二次多项式模型 第五章地理系统要素间的相关分析与回归分析 若多项式回归的自变量为三次幂时 则为三次多项式 其数学表达式为y b0 b1x b2x2 b3x3例如 日本1931 1957年粮食生产指数 即可用三次多项式回归来拟合 日本粮食生产指数模型和拟合情况 见图5 9所示 第五章地理系统要素间的相关分析与回归分析 2 幂函数乘积模型的建立方法这是一种用途广泛 计算方便 物理意义清楚 要素间关系明确的数学模型 这种方法的基本思路是把某一要素y与其他要素xi之间的函数关系写成幂函数的连乘积形式 即y k x1a x2b x3c x4d 式中 k a b c d为待定地理参数 建立幂函数乘积模型的模型 也就是确定参数的过程 教材讲了一种办法 也可直接将幂函数乘积模型变换为多元线性回归模型显然更为简便 可对模型两侧同时取自然对数 对变换后的多元线性回归模型利用前面讲过的方法 确定各个参数 然后再根据变换关系将其重新转换为幂函数乘积模型 第五章地理系统要素间的相关分析与回归分析 例如 前苏联1965 1974年钢产量 y 与焦炭产量 r1 生铁产量 r2 和发电量 r3 之间的关系 便可用幂函数乘积模型来表达 原始数据如表5 16所示 按照书上的计算办法 可得到前苏联钢产量与焦炭产量 生铁产量和发电量之间关系可用下式来表达 y 1 637x10 0037x20 9779x30 0018其拟合效果良好 影响钢产量最大因素是生铁产量 其次为焦炭产量 第五章地理系统要素间的相关分析与回归分析 3地理系统的空间趋势面分析一 空间趋势面分析概述地理系统的最重要特征之一是它具有区域性 用数学的方法 以数学模型来模拟地理数据的空间分布及其区域性变化趋势的方法 称为趋势面分析 趋势面是一种光滑的数学曲面 它能集中代表地理数据在大范围内的空间变化趋势 趋势面只是实际曲面的一种近似 它反映了区域性的变化规律 受大范围的系统性因素所控制 剩余曲面则反映了局部性变化特点 受局部因素和随机因素所制约 前者对应于一个确定性函数 而后者则对应于一个随机性函数 一般常采用多项式函数来计算趋势面 第五章地理系统要素间的相关分析与回归分析 二 趋势面分析的数学模型 一 趋势面分析的数学原理设以zi xi yi 表示某一地理特征值在空间上的分布 图5 11 其中 xi yi 为平面上点的坐标 由上述已知 任一
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 纤维材料基础知识培训课件
- 苹果手机扫描数学试卷
- 动漫产业工艺流程探讨
- 2024年云南滇中新区直管区聘用制教师招聘笔试真题
- 六安东都人才发展有限公司招聘高中教师考试真题2024
- 去年包河七上数学试卷
- 萍乡中学高一数学试卷
- 红色革命app课件
- 清晰高考数学试卷
- 衢州小学数学试卷
- 动力网站-艾默生netsure801电源系统用户手册
- DB3302T 1079-2018 管线探测技术规程
- 大唐集团公司工作票、操作票使用和管理标准(版)
- 医学皮肤部年度业务报告课件
- 21年一消防工程师继续教育题
- 中国政治思想史完整版课件
- 太阳能热水系统问题与解决方案
- (完整版)物理化学上教案
- D型便梁工法(二)
- 氟化物与牙健康
- 疑难路段处理能力及室项目分析
评论
0/150
提交评论