




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、地理系统由各个要素组成,各要素之间存在着相互联系、相互影响和相地理系统由各个要素组成,各要素之间存在着相互联系、相互影响和相互制约,为了定量地研究各要素之间的数量关系,常用相关分析法和回互制约,为了定量地研究各要素之间的数量关系,常用相关分析法和回归分析法来确定它们之间的关系和性质,并概括成数学模型,进而作出归分析法来确定它们之间的关系和性质,并概括成数学模型,进而作出地理预测。地理预测。1 地理要素间的相关分析地理要素间的相关分析一、地理相关的意义一、地理相关的意义所谓相关,是指两个或两个以上的变量间相互关系是否密切。相关分析所谓相关,是指两个或两个以上的变量间相互关系是否密切。相关分析仅限
2、于测定两个或两个以上的变量间相关程度和性质。而地理相关那么仅限于测定两个或两个以上的变量间相关程度和性质。而地理相关那么是指应用相关分析法来研究各地理要素间的相互关系和联系强度。是指应用相关分析法来研究各地理要素间的相互关系和联系强度。在地理系统中,各要素间存在着各种不同的关系。在地理系统中,各要素间存在着各种不同的关系。确定性的关系,即函数关系,这在地理系统中比较少见,因为很多地理确定性的关系,即函数关系,这在地理系统中比较少见,因为很多地理要素的变化具有随机性的缘故;要素的变化具有随机性的缘故;相关关系,即要素间既存在较密切的关系,但又不能由一个要素的值精相关关系,即要素间既存在较密切的关
3、系,但又不能由一个要素的值精确地求出另一个要素的值确地求出另一个要素的值各要素之间完全没任何关系。如图各要素之间完全没任何关系。如图51所示:所示:从图中可以看出,假设设从图中可以看出,假设设x、y为两种地理要素。第一种情况,假设为两种地理要素。第一种情况,假设y严格随严格随x变化而变化,如变化而变化,如(a)所示,所所示,所有观测点均落在直线或曲线上,那么称为完全相关或函数关系;第二种情况,假设观测点落在直线或曲有观测点均落在直线或曲线上,那么称为完全相关或函数关系;第二种情况,假设观测点落在直线或曲线两旁,如线两旁,如(b)所示,那么称为统计相关;第三种情况,假设观测点分布散乱,那么两种地
4、理要素完全无所示,那么称为统计相关;第三种情况,假设观测点分布散乱,那么两种地理要素完全无关,相互独立。关,相互独立。二、地理相关程度的度量方法二、地理相关程度的度量方法计量地理学中用不同的指标来度量不同类型的地理相关的程度。计量地理学中用不同的指标来度量不同类型的地理相关的程度。一简单直线相关程度的度量一简单直线相关程度的度量一般情况下,当两个地理要素间为直线相关时,需要分析其相关程度和一般情况下,当两个地理要素间为直线相关时,需要分析其相关程度和相关方向。所谓相关程度指两者关系的密切程度,而相关方向可分为正相关方向。所谓相关程度指两者关系的密切程度,而相关方向可分为正相关与负相关。前者指两
5、个要素间呈同方向变化,而后者相反。这两者相关与负相关。前者指两个要素间呈同方向变化,而后者相反。这两者可用一个共同的指标度量,就是相关系数。可用一个共同的指标度量,就是相关系数。1. 一般常用的相关系数一般常用的相关系数(r)计算公式计算公式其中,其中, 上式计算出的相关系数,具有以下三点性质:上式计算出的相关系数,具有以下三点性质: 1相关系数的分布范围,介于相关系数的分布范围,介于1与与+1之间;之间; 2当相关系数为正值时,表示两个要素之间为正相关,当相关系数为正值时,表示两个要素之间为正相关,相关系数为负值时,表示两个要素之间为负相关;相关系数为负值时,表示两个要素之间为负相关; 3相
6、关系数的绝对值越大,表示两个要素间相关程度越相关系数的绝对值越大,表示两个要素间相关程度越密切。密切。 例例1:北京市多年各月平均气温与:北京市多年各月平均气温与5cm深的平均地温,数据深的平均地温,数据如表如表51所示。依据相关系数的计算公式可得:,由此可见,所示。依据相关系数的计算公式可得:,由此可见,北京市的各月平均气温与北京市的各月平均气温与5cm的平均地温呈正相关,而且相的平均地温呈正相关,而且相关极为密切。关极为密切。2. 顺序等级相关系数顺序等级相关系数rs计算公式计算公式顺序相关不但适用于数量资料的相关分析,而且适用于质的资料。表示顺序相关不但适用于数量资料的相关分析,而且适用
7、于质的资料。表示两个要素顺序间直线相关程度和方向的系数,称为顺序相关系数。当使两个要素顺序间直线相关程度和方向的系数,称为顺序相关系数。当使用两个要素间的数值计算相关系数不方便时,可用顺序相关系数的计算用两个要素间的数值计算相关系数不方便时,可用顺序相关系数的计算公式来求得。公式来求得。例例2:现仍以北京市各月平均气温与:现仍以北京市各月平均气温与5cm平均地温为例,列成表平均地温为例,列成表52说说明其计算过程。首先将表中两个要素的观测值按大小顺序排列起来,最明其计算过程。首先将表中两个要素的观测值按大小顺序排列起来,最大值排为大值排为1号,依次类推。将两个要素的顺序号相减,即为号,依次类推
8、。将两个要素的顺序号相减,即为d,将其平方,将其平方求和并带入上面公式,即可得到两者的顺序相关系数求和并带入上面公式,即可得到两者的顺序相关系数rs。二简单非线性相关程度的度量二简单非线性相关程度的度量表示简单非线性相关程度的统计量,通常用相关指数表示简单非线性相关程度的统计量,通常用相关指数Ryx来度量。相关来度量。相关指数的性质如下:指数的性质如下:1相关指数的分布范围介于相关指数的分布范围介于0到到1之间;之间;2相关指数的数值越大,两个要素间的曲线相关程度越密切。相关指数的数值越大,两个要素间的曲线相关程度越密切。3相关指数必大于或至少等于用同一批资料所求得的相关系数的绝相关指数必大于
9、或至少等于用同一批资料所求得的相关系数的绝对值。对值。三多要素相关与相关矩阵三多要素相关与相关矩阵对于多个地理要素,那么可计算出各要素两两之间的相关系数,并构成对于多个地理要素,那么可计算出各要素两两之间的相关系数,并构成相关矩阵。相关矩阵。例例3:现给出世界上自然植被的生产量与水热资源的原始地理数据表:现给出世界上自然植被的生产量与水热资源的原始地理数据表53,利用相关系数公式得到其相关矩阵,形式如下所示:,利用相关系数公式得到其相关矩阵,形式如下所示:三、相关系数的显著性检验三、相关系数的显著性检验为了判定我们所计算出来的相关系数是否有意义,通常还要进一步对相为了判定我们所计算出来的相关系
10、数是否有意义,通常还要进一步对相关系数作显著性检验。关系数作显著性检验。为了使用上方面,前人已经制出了相关系数检验表附录二。其中为了使用上方面,前人已经制出了相关系数检验表附录二。其中n表示所使用资料的个数自由度表示所使用资料的个数自由度f为为n-2,为信度。为信度。对计算出的相关系数进行显著性检验证明要素间相关程度是显著的之后,对计算出的相关系数进行显著性检验证明要素间相关程度是显著的之后,就可以对其进行进一步的回归分析了。就可以对其进行进一步的回归分析了。一、地理回归分析的意义和作用一、地理回归分析的意义和作用 地理系统各要素之间的相互关系,可通过大量的观测、试验或实验地理系统各要素之间的
11、相互关系,可通过大量的观测、试验或实验取得一定的地理数据,然后用数理统计的方法,寻找出隐藏在随机取得一定的地理数据,然后用数理统计的方法,寻找出隐藏在随机性后面的统计规律,而用回归方程来表达。性后面的统计规律,而用回归方程来表达。 地理回归分析主要是研究地理要素之间联系的数学表达式,有自变地理回归分析主要是研究地理要素之间联系的数学表达式,有自变量与因变量之分,从而可由自变量的取值来预测、延长或插补和控量与因变量之分,从而可由自变量的取值来预测、延长或插补和控制因变量的取值,所以它有地理预测的性质。制因变量的取值,所以它有地理预测的性质。 地理回归分析的主要内容包括:地理回归分析的主要内容包括
12、: 1. 由一组地理数据确定这些要素间的定量数学表达式,即回归模型;由一组地理数据确定这些要素间的定量数学表达式,即回归模型; 2. 利用回归模型,根据自变量的值来预测或控制因变量的取值。利用回归模型,根据自变量的值来预测或控制因变量的取值。 二、一元地理回归模型的建立二、一元地理回归模型的建立 一元地理回归是要解决两个要素间的定量关系。由于两个要一元地理回归是要解决两个要素间的定量关系。由于两个要素之间的数量关系类型的差异,一元地理回归包括线性回归素之间的数量关系类型的差异,一元地理回归包括线性回归模型和非线性回归模型分述如下:模型和非线性回归模型分述如下: 一一元线性地理回归模型的建立一一
13、元线性地理回归模型的建立 假设有两个要素变量假设有两个要素变量x和和y。x为自变量,为自变量,y为因变量。为因变量。x可以是降水量、蒸发量、土壤中的有机质含量等;可以是降水量、蒸发量、土壤中的有机质含量等;y可以是可以是河流径流量、土壤含水量等。假定一元线性模型结构为:河流径流量、土壤含水量等。假定一元线性模型结构为:yi =A+ Bxi+i 式中,式中,A、B为待定参数,为待定参数,i=1,2,.,n,而,而xi,yi为为n组观组观测数据,测数据,i为随机变量。参数为随机变量。参数A、B一般总是未知的,需根一般总是未知的,需根据观测值采用最小二乘法来估计。据观测值采用最小二乘法来估计。设设a
14、和和b分别为参数分别为参数A和和B的最小二乘估计值,于是便得到了一元线性回的最小二乘估计值,于是便得到了一元线性回归模型为归模型为上式代表上式代表x和和y之间关系的最正确拟和直线,通常称为回归直线。它满足之间关系的最正确拟和直线,通常称为回归直线。它满足y的实际观测值与回归值之间的误差平方和最小。这就是最小二乘法。的实际观测值与回归值之间的误差平方和最小。这就是最小二乘法。1. 参数参数a和和b的最小二乘估计的最小二乘估计根据最小二乘原理,可得根据最小二乘原理,可得a、b的计算公式如下:的计算公式如下:2. 一元线性地理回归模型的具体建立方法与步骤一元线性地理回归模型的具体建立方法与步骤建立一
15、元线性地理回归模型,就是用已有的地理数据来确定建立一元线性地理回归模型,就是用已有的地理数据来确定a和和b的值。的值。现仍以北京市各月平均气温现仍以北京市各月平均气温x与与5cm平均地温平均地温y为例,建立一元线性地理为例,建立一元线性地理回归模型的过程如下:回归模型的过程如下:1将表中的各项数据代入相应的计算公式,得到将表中的各项数据代入相应的计算公式,得到a、b的数值。的数值。2当参数当参数a与与b求出后,便可得出一元线性地理回归模型如下:求出后,便可得出一元线性地理回归模型如下:3. 一元线性地理回归模型的效果检验一元线性地理回归模型的效果检验当一元线性地理回归模型求出来以后,它的效果如
16、何,它所揭示的地理当一元线性地理回归模型求出来以后,它的效果如何,它所揭示的地理规律性强不强,用它来进行地理预测精度如何?所有这些问题都需要进规律性强不强,用它来进行地理预测精度如何?所有这些问题都需要进一步作出分析。一步作出分析。1回归模型估计的误差回归模型估计的误差由线性回归模型所得到的由线性回归模型所得到的y的估计值往往与实测值的估计值往往与实测值y不完全一致,它们之不完全一致,它们之间的误差称为估计误差,以标准差的形式表示为间的误差称为估计误差,以标准差的形式表示为在实际地理问题中,只要比较在实际地理问题中,只要比较S与允许的偏差即可。与允许的偏差即可。2回归模型的显著性检验回归模型的
17、显著性检验观测值观测值yi与其平均值与其平均值y的差异可用离差平方和来表示,记为的差异可用离差平方和来表示,记为S总。它又总。它又可以进行如下的分解:可以进行如下的分解:上式右侧的第一项为哪一项所有观测点上式右侧的第一项为哪一项所有观测点yi与回归值的残差平方和,表示与回归值的残差平方和,表示除了除了x对对y的线性影响以外的一切因素对的线性影响以外的一切因素对y的变异影响,故称为剩余平方的变异影响,故称为剩余平方和,记作和,记作Q;第二项反映了在;第二项反映了在y的总偏差中,由的总偏差中,由x与与y的线性关系引起的的线性关系引起的y的变化分布,故称为回归平方和,记作的变化分布,故称为回归平方和
18、,记作U。故有:。故有:S总总U+Q。一个回归效果的好坏取决于一个回归效果的好坏取决于U在总离差平方和中的比例或者在总离差平方和中的比例或者U与与Q的比值。的比值。假设取前者那么有:假设取前者那么有:从从U与与Q比值的大小来考虑,可利用如下的比值的大小来考虑,可利用如下的F检验方法。检验方法。根据前人的研究,统计量根据前人的研究,统计量FU/(Q/(n-2)符合第一自由度为符合第一自由度为1,第二自由,第二自由度为度为n-2的的F分布,根据前面学习的分布,根据前面学习的F检验方法,即可对回归模型的显检验方法,即可对回归模型的显著性进行检验。著性进行检验。二一元非线性地理回归模型的建立二一元非线
19、性地理回归模型的建立在许多实际地理问题中,有时两个要素之间的关系并不是线性关系,而在许多实际地理问题中,有时两个要素之间的关系并不是线性关系,而是某种非线性关系,这时我们选择适当的类型曲线比配直线更符合地理是某种非线性关系,这时我们选择适当的类型曲线比配直线更符合地理实际情况。例如:我国武夷山南坡地形高度与年降水量之间的关系,玉实际情况。例如:我国武夷山南坡地形高度与年降水量之间的关系,玉米产量与耗水量之间的关系等等。米产量与耗水量之间的关系等等。对于这一类地理问题,首先需要选配曲线,确定曲线的类型,然后再化对于这一类地理问题,首先需要选配曲线,确定曲线的类型,然后再化曲线回归模型为直线回归模
20、型处理。曲线回归模型为直线回归模型处理。1. 选配曲线的根本方法选配曲线的根本方法根据理论分析、过去的经验或观测数据的根据理论分析、过去的经验或观测数据的分布趋势与特点,来确定两个要素之间的曲线类型及其函数形式,从而分布趋势与特点,来确定两个要素之间的曲线类型及其函数形式,从而求非线性地理回归模型的过程及其方法,叫做曲线选配。求非线性地理回归模型的过程及其方法,叫做曲线选配。一般是先通过变量变化,把非线性函数关系化为线性关系,再采用线性一般是先通过变量变化,把非线性函数关系化为线性关系,再采用线性回归的方法确定参数。当曲线的函数类型确定后,下一步就是求函数中回归的方法确定参数。当曲线的函数类型
21、确定后,下一步就是求函数中的参数的参数a和和b。确定参数的方法仍然是最小二乘法。确定参数的方法仍然是最小二乘法。2. 地理上常见的非线性回归模型的建立方法地理上常见的非线性回归模型的建立方法在地理问题上,较常见的曲线类型有:幂函数型、指数函数型、对数函在地理问题上,较常见的曲线类型有:幂函数型、指数函数型、对数函数型等。下面说明不同类型的非线性地理回归模型的建立方法与步骤。数型等。下面说明不同类型的非线性地理回归模型的建立方法与步骤。1幂函数型幂函数型两个地理要素之间的幂函数表达式为两个地理要素之间的幂函数表达式为y=axb对上式两边取常用对数或自然对数,得对上式两边取常用对数或自然对数,得l
22、ny = lna + blnx令令Y=lny,A=lna,X=lnx,那么上式为,那么上式为 Y=A+bX这样就将曲线模型转化成线性模型了。这样就将曲线模型转化成线性模型了。例如:长白山北麓熔岩台地地貌形态的变化,见表例如:长白山北麓熔岩台地地貌形态的变化,见表56,即呈幂函数曲,即呈幂函数曲线型。设线型。设x表示各地点距白头山天池火口壁的距离表示各地点距白头山天池火口壁的距离km,y为熔岩台为熔岩台地各地点的海拔高度地各地点的海拔高度m。幂函数回归模型和拟和图如图。幂函数回归模型和拟和图如图54所示。所示。2指数函数型指数函数型两个地理要素之间的指数函数表达式为两个地理要素之间的指数函数表达
23、式为y=aebx或或y=ae-bx,y=abx然后对上式两边取常用对数或自然对数,那么得然后对上式两边取常用对数或自然对数,那么得lny=lna+(lnb)x令令Y=lny,Alna,B=lnb那么上式为那么上式为YABx这样指数函数模型就转化成线性模型了。这样指数函数模型就转化成线性模型了。例如:长白山北麓地形高度对年降水量的影响,即按指数规律递增,见例如:长白山北麓地形高度对年降水量的影响,即按指数规律递增,见表表57和图和图55所示。由图中模型可知,长白山北坡的年降水量是按指所示。由图中模型可知,长白山北坡的年降水量是按指数规律增加的,其相关指数达。数规律增加的,其相关指数达。3对数函数
24、型对数函数型两个地理要素之间的对数函数关系表达式为两个地理要素之间的对数函数关系表达式为y=a+blnx令令Xlnx,上式可直接转化为直线方程如下:,上式可直接转化为直线方程如下:Y=a+bX例如:当土壤湿度为最大田间持水量的例如:当土壤湿度为最大田间持水量的5060,雨强为,雨强为2.0 mm/min时,淋溶和退化黑钙土区的地形坡度对径流系数的影响,即符时,淋溶和退化黑钙土区的地形坡度对径流系数的影响,即符合对数规律。见表合对数规律。见表58和图和图56。径流系数随地形坡度的增加按对数律。径流系数随地形坡度的增加按对数律递增,相关指数达。当地形坡度为零度时,该区域径流系数为;当地形递增,相关
25、指数达。当地形坡度为零度时,该区域径流系数为;当地形坡度平均每增加坡度平均每增加1度时,该区径流系数平均增加。度时,该区径流系数平均增加。图表说明如下:图表说明如下:3. 一元非线性回归模型的效果检验一元非线性回归模型的效果检验在选配曲线的回归过程中,首先遇到的问题就是曲线类型的选择。因为在选配曲线的回归过程中,首先遇到的问题就是曲线类型的选择。因为曲线类型选择恰当,不仅对揭示出要素间的内在规律具有重要意义,而曲线类型选择恰当,不仅对揭示出要素间的内在规律具有重要意义,而且对于减少剩余误差、提高回归模型的效果更具有实际意义。否那么,且对于减少剩余误差、提高回归模型的效果更具有实际意义。否那么,
26、其效果往往不能令人满意,甚至会歪曲要素间的内在规律性。其效果往往不能令人满意,甚至会歪曲要素间的内在规律性。那么,怎样衡量曲线回归模型的好坏呢?在衡量一元线性回归模型的效那么,怎样衡量曲线回归模型的好坏呢?在衡量一元线性回归模型的效果时,我们采用了相关系数的平方等于回归平方和与总平方和之比,即果时,我们采用了相关系数的平方等于回归平方和与总平方和之比,即 或用剩余平方和来表示,那么为或用剩余平方和来表示,那么为在选配曲线的过程中,要求所配曲线与地理数据拟和较好,可利用上面在选配曲线的过程中,要求所配曲线与地理数据拟和较好,可利用上面右式定义的量来衡量所配曲线效果的好坏,记作右式定义的量来衡量所
27、配曲线效果的好坏,记作R2,称为相关指数。,称为相关指数。对于指数曲线 ,令 , 可以将其转化为直线形式: , 其中, ; 对于对数曲线 ,令 , ,可以将其转化为直线形式: ;对于幂函数曲线 ,令 , ,可以将其转化为直线形式: 其中, ; bxdyexbayyylnxx dalnxbaylnxbayyy xxlnbdxy xbayyylnxxlndaln对于双曲线 ,令 ,转化为直线形式: ; 对于S型曲线 ,可 转化为直线形式: ; 对于幂乘积 ,只要令 ,就可以将其转化为线性形式 其中, ;xxxyybaye,1,e1令xbayxbay1xbayxxyy1,1kkxxdxy2121kk
28、xxxy22110kkxxxxxxyyln,ln,ln,ln2211dln0对于对数函数和 只要令 ,就可以将其化为线性形式 例:表给出了某地区林地景观斑块面积area与周长perimeter的数据。下面我们建立林地景观斑块面积A与周长P之间的非线性回归模型 。 kkxxxylnlnln22110kkxxxy22110kkxxxxxxyyln,ln,ln,2211 序号面积A周长P序号面积A周长P110 447.370625.39242232 844.3004 282.043215 974.730612.286434 054.660289.307330 976.770775.7124430 8
29、33.840895.98049 442.902530.202451 823.355205.131510 858.9201 906.1034626 270.300968.060621 532.9101 297.9624713 573.9601 045.07276 891.680417.0584865 590.0802 250.43583 695.195243.90749157 270.4002 407.54992 260.180197.239502 086.426266.54110334.33299.729513 109.070261.8181111 749.080558.921522 038.
30、617320.396122 372.105199.667533 432.137253.335138 390.633592.893541 600.391230.030146 003.719459.467553 867.586419.406表5.2.1 某地区各个林地景观斑块面积m2与周长m 15527 620.2006 545.291561 946.184198.66116179 686.2002 960.4755777.30556.9021714 196.460597.993587 977.719715.7521822 809.1801 103.0705919 271.8201 011.127
31、1971 195.9401 154.118608 263.480680.710203 064.242245.049 6114 697.1301 234.1142146 9416.7008 226.009624 519.867326.317225 738.953498.6566313 157.6601 172.916238 359.465415.151646 617.270609.801246 205.016414.790 654 064.137437.355256 0619.0201 549.871665 645.820432.355261 4517.740791.943676 993.355
32、503.7842731 020.1001 700.965684 304.281267.9512826 447.1601 246.977696 336.383347.136297 985.926918.312702 651.414292.235303 638.766399.725712 656.824298.4733158 5425.10011 474.770721 846.988179.8663235 220.6401 877.476731 616.684172.8083310 067.820497.394741 730.563172.1433427 422.5701 934.5967511
33、303.970881.0423543 071.5501 171.4137614 019.790638.1763657 585.9402 275.389779 277.172862.0883728 254.1301 322.7957813 684.750712.78738497 261.0009 581.298791 949.164228.4033924 255.030994.906804 846.016324.481401 837.699229.40181521 457.4007 393.938411 608.625225.84282564 370.80012 212.410 解解:1作变量替
34、换,令:作变量替换,令: , ,将表中的原始数,将表中的原始数据进行对数变换,变换后得到的各新变量对应的观测据进行对数变换,变换后得到的各新变量对应的观测数据如表所示。数据如表所示。 AylnPxln序号y=lnAx=LnP序号y=lnAx=LnP1 9.254 1066.438 3794212.358 138.362 1862 9.678 7636.417 243 8.307 6225.667 487310.340 996.653 7824410.336 376.797 9184 9.153 0196.273 258457.508 4335.323 655 9.292 7427.552 81
35、64610.176 196.875 2946 9.977 3387.168 551479.515 9096.951 8417 8.838 076.033 2264811.091 187.718 8798 8.214 7895.496 7894911.965 727.786 3649 7.723 25.284 414507.643 2085.585 52810 5.812 1354.602 457518.042 0795.567 65111 9.371 536.326 008527.620 0275.7695 58表3.2.2 经对数变换后的数据127.771 5335.296 653538.1
36、40 9385.534 711139.034 8716.385 013547.378 0035.438 211148.700 1346.130 066558.260 3866.038 8391513.176 138.786 501567.573 6265.291 5971612.098 977.993 105574.347 7554.041 328179.560 7486.393 579588.984 4086.573 3341810.034 927.005 852599.866 3996.918 8211911.173 197.051 092609.019 6016.523 136208.0
37、27 5565.501 457619.595 4087.118 1092113.059 259.0150 56628.416 2385.787 871228.655 0326.211 917639.484 7597.067 248239.031 156.028 643648.797 4386.413 133248.733 1136.027 773658.309 9576.080 7442511.012 367.345 927668.638 6716.069 247269.583 1276.674 49678.852 7166.222 1472710.342 397.438 951688.367
38、 3655.590 8062810.182 97.128 478698.754 0635.849 717298.985 4366.822 537707.882 8485.677 56308.199 45.990 776717.884 8875.698 6783113.280 099.347 906727.521 3115.192 2133210.469 397.537 684737.388 1325.152 181339.217 0996.209 381747.456 2025.148 3263410.219 127.567 654759.332 9096.781 1053510.670 62
39、7.065 966769.548 2256.458 6143610.961 037.729 906779.135 3126.759 3583710.248 997.187 502789.524 0376.569 1823813.116 879.167 568797.575 1565.431 1123910.096 386.902 648808.485 9125.782 227407.516 275.435 4718113.164 388.908 416417.383 1355.419 8378213.243 479.410 208 2 以x为横坐标、y为纵坐标,在平面直角坐标系中作出散点图。很
40、明显,y与x呈线性关系。图3.2.2 林地景观斑块面积A与周长P之间的双对数关系 3根据所得表中的数据,运用建立线性回归模型的方法,建立y与x之间的线性回归模型,得到 对应于式,x与y的相关系数高 达 =0.966 5。 4将复原成双对数曲线,即 7505.0505.1xy7505.0ln505.1lnPA xyr相关指数越大,说明选配的回归曲线效果越好,剩余标准差越小,其回相关指数越大,说明选配的回归曲线效果越好,剩余标准差越小,其回归模型的预测精度就越高。现以表归模型的预测精度就越高。现以表58中数据为例,计算出剩余平方和中数据为例,计算出剩余平方和与总平方和如表与总平方和如表59所示。其
41、相关指数为所示。其相关指数为R2剩余标准差为剩余标准差为由此可见,地形坡度对径流系数影响的模型拟和效果很好,而且剩余标由此可见,地形坡度对径流系数影响的模型拟和效果很好,而且剩余标准差也很小,因此模型的预测精度也很高。准差也很小,因此模型的预测精度也很高。三、多元地理回归模型的建立三、多元地理回归模型的建立一个地理系统的根本特点之一,是它具有多要素性,而且各要素之间相一个地理系统的根本特点之一,是它具有多要素性,而且各要素之间相互联系、相互影响。当研究某一个要素互联系、相互影响。当研究某一个要素y与其他要素与其他要素x1,x2,x3,.,xn之间之间的定量关系时,就需要用多元回归分析方法。这里
42、同样也有线性和非线的定量关系时,就需要用多元回归分析方法。这里同样也有线性和非线性之分。下面分别介绍线性与非线性多元回归模型的建立方法。性之分。下面分别介绍线性与非线性多元回归模型的建立方法。一多要素线性地理回归模型的建立一多要素线性地理回归模型的建立1. 多要素线性地理回归模型的建立方法多要素线性地理回归模型的建立方法一般设其数学结构模型为一般设其数学结构模型为y=0+1x 1+2x 2+3x 3+.+kx k+采用最小二乘法,得到回归模型为采用最小二乘法,得到回归模型为y=b0+b1x1+b2x2+.+bkxkbk为偏回归系数为偏回归系数偏回归系数的意义说明:当其他要素都固定时,该自变量每
43、变化一个单偏回归系数的意义说明:当其他要素都固定时,该自变量每变化一个单位而使位而使y平均改变的数值。偏回归系数确实定同样是依据最小二乘法原平均改变的数值。偏回归系数确实定同样是依据最小二乘法原理,即使理,即使到达最小,式中到达最小,式中为观测数据的序号,将上式对为观测数据的序号,将上式对b0,b1,.,bk求偏倒数,求偏倒数,并令其都等于零,即并令其都等于零,即经展开整理后得经展开整理后得以上方程组称为正规方程组,由其系数构成得矩阵记作以上方程组称为正规方程组,由其系数构成得矩阵记作A AX XX,即,即上述方程组可写成上述方程组可写成Ab=B的形式,其中的形式,其中B=XY。解这个方程组即
44、可得到。解这个方程组即可得到各个变量的偏回归系数。各个变量的偏回归系数。将求出的偏回归系数和常数项代入多元线性数学模型中,即可得到将求出的偏回归系数和常数项代入多元线性数学模型中,即可得到k元元线性地理回归模型。线性地理回归模型。例如:某一国家某一经济区内木材生产指数例如:某一国家某一经济区内木材生产指数y以以1955年为年为100受该受该区森林蓄积量指数区森林蓄积量指数x1,木材价格指数,木材价格指数x2和运输距离指数和运输距离指数x3的影响,如表的影响,如表510所示。所示。可利用可利用Doolittle法或利用法或利用Excel等软件工具计算出其多元线性回归模型等软件工具计算出其多元线性
45、回归模型的偏回归系数及常数项。的偏回归系数及常数项。2. 多元线性回归模型的显著性检验多元线性回归模型的显著性检验在多元线性回归问题中,同一元线性回归一样也需要对回归模型进行显在多元线性回归问题中,同一元线性回归一样也需要对回归模型进行显著性检验。如果经过检验是显著的,那么说明建立的回归模型是有用的,著性检验。如果经过检验是显著的,那么说明建立的回归模型是有用的,否那么就没有什么实际意义。否那么就没有什么实际意义。在多元线性回归分析中,同样也存在回归平方和在多元线性回归分析中,同样也存在回归平方和U与剩余平方和与剩余平方和Q,两,两者的自由度分别者的自由度分别k和和n-k-1,于是剩余标准差为
46、,于是剩余标准差为Ssqrt(Q/(n-k-1)。同样可对整个回归模型进行显著性检验,通常采用同样可对整个回归模型进行显著性检验,通常采用F检验法。检验法。F值为回值为回归方差和剩余方差之比,即归方差和剩余方差之比,即根据检验的结果,在根据检验的结果,在F值的右上角可标注星号。值的右上角可标注星号。例如:前面例子中的检验结果就说明多元线性关系具有高度显著性。例如:前面例子中的检验结果就说明多元线性关系具有高度显著性。二多要素非线性地理回归模型的建立二多要素非线性地理回归模型的建立在地理系统中,除局部问题是属线性关系外,还有大局部问题属于非线在地理系统中,除局部问题是属线性关系外,还有大局部问题
47、属于非线性关系。下面扼要地介绍两种多元非线性地理回归模型的建立方法。性关系。下面扼要地介绍两种多元非线性地理回归模型的建立方法。在地理系统中,有些曲线不能化为直线处理,如二次多项式就不能化为在地理系统中,有些曲线不能化为直线处理,如二次多项式就不能化为线性模型。一般的处理方法是将它化为二元线性回归模型,然后按照多线性模型。一般的处理方法是将它化为二元线性回归模型,然后按照多元线性回归分析方法处理。这种方法可以处理大局部一元非线性回归模元线性回归分析方法处理。这种方法可以处理大局部一元非线性回归模型,因为任何函数形式都可以在较小区间内用多项式逐步逼近。型,因为任何函数形式都可以在较小区间内用多项
48、式逐步逼近。当多项式回归的自变量取两次幂时,便是二次多项式,即抛物线。其数当多项式回归的自变量取两次幂时,便是二次多项式,即抛物线。其数学模型为学模型为y=b0+b1x+b2x2,令,令x1=x,x2=x2,那么模型变为,那么模型变为y=b0+b1x1+b2x2。可用二元线性回归的方法确定模型参数。可用二元线性回归的方法确定模型参数。例如,依据黑龙江省的实测资料表例如,依据黑龙江省的实测资料表514,土温与地积温系数,土温与地积温系数k之间之间的关系,便可用多项式回归化成线性回归来处理。的关系,便可用多项式回归化成线性回归来处理。将表将表514中的数据点绘成散点图中的数据点绘成散点图57可知,
49、这个问题可用抛物线来近可知,这个问题可用抛物线来近似。用似。用Excel等软件及手动计算均可得到具体的二次多项式模型。等软件及手动计算均可得到具体的二次多项式模型。假设多项式回归的自变量为三次幂时,那么为三次多项式,其数学表达假设多项式回归的自变量为三次幂时,那么为三次多项式,其数学表达式为式为y=b0+b1x+b2x2+b3x3例如,日本例如,日本19311957年粮食生产指数,即可用三次多项式回归来拟年粮食生产指数,即可用三次多项式回归来拟合。日本粮食生产指数模型和拟合情况,见图合。日本粮食生产指数模型和拟合情况,见图59所示。所示。这是一种用途广泛,计算方便,物理意义清楚,要素间关系明确
50、的数学这是一种用途广泛,计算方便,物理意义清楚,要素间关系明确的数学模型。这种方法的根本思路是把某一要素模型。这种方法的根本思路是把某一要素y与其他要素与其他要素xi之间的函数关之间的函数关系写成幂函数的连乘积形式,即系写成幂函数的连乘积形式,即y=k*x1a*x2b*x3c*x4d.式中,式中,k、a、b、c、d为待定地理参数。建立幂函数乘积模型的模型,为待定地理参数。建立幂函数乘积模型的模型,也就是确定参数的过程。教材讲了一种方法,也可直接将幂函数乘积模也就是确定参数的过程。教材讲了一种方法,也可直接将幂函数乘积模型变换为多元线性回归模型显然更为简便。型变换为多元线性回归模型显然更为简便。
51、可对模型两侧同时取自然对数,对变换后的多元线性回归模型利用前面可对模型两侧同时取自然对数,对变换后的多元线性回归模型利用前面讲过的方法,确定各个参数,然后再根据变换关系将其重新转换为幂函讲过的方法,确定各个参数,然后再根据变换关系将其重新转换为幂函数乘积模型。数乘积模型。例如:前苏联例如:前苏联19651974年钢产量年钢产量y与焦炭产量与焦炭产量r1、生铁产量、生铁产量r2和发电量和发电量r3之间的关系,便可用幂函数乘积模型来表达。原之间的关系,便可用幂函数乘积模型来表达。原始数据如表始数据如表516所示。所示。按照书上的计算方法,可得到前苏联钢产量与焦炭产量、生铁产量和发按照书上的计算方法
52、,可得到前苏联钢产量与焦炭产量、生铁产量和发电量之间关系可用下式来表达:电量之间关系可用下式来表达:1x2x3其拟合效果良好,影响钢产量最大因素是生铁产量,其次为焦炭产量。其拟合效果良好,影响钢产量最大因素是生铁产量,其次为焦炭产量。 趋势面分析的一般原理 趋势面模型的适度检验 趋势面分析应用实例 趋势面分析,是利用数学曲面模拟地理系统要素在空间上的分布及变化趋势的一种数学方法。 它实质上是通过回归分析原理,运用最小二乘法拟合一个二维非线性函数,模拟地理要素在空间上的分布规律,展示地理要素在地域空间上的变化趋势。 趋势面分析方法常常被用来模拟资源、环境、人口及经济要素在空间上的分布规律,它是在
53、空间分析方面具有重要的应用价值 趋势面是一种抽象的数学曲面,它抽象并过滤掉了一些局域随机因素的影响,使地理要素的空间分布规律明显化。 因此,通常把实际的地理曲面分解为趋势面和剩余面两局部,前者反映地理要素的宏观分布规律,属于确定性因素作用的结果;而后者那么对应于微观局域,是随机因素影响的结果。 趋势面分析的一个根本要求,就是所选择的趋势面模型应该是剩余值最小,而趋势值最大,这样拟合度精度才能到达足够的准确性。空间趋势面分析,正是从地理要素分布的实际数据中分解出趋势值和剩余值,从而揭示地理要素空间分布的趋势与规律。 地理要素的空间分布曲面,大多都是非线性的,寻找这些非线性曲面的数学方程式比较困难
54、,通常可采取用多项式的形式进行拟合。 一建立趋势面模型一建立趋势面模型设 某 地 理 要 素 的 实 际 观 测 数 据为 , 趋势值拟合值为 ,那么有 式中:i即为剩余值残差值。显然,当xi,yi在空间上变动时,式就刻画了地理要素的实际分布曲面、趋势面和剩余面之间的互动关系。 ), 2 , 1)(,(niyxziii),(iiiyxziiiiiiiyxzyxz),(),( 趋势面分析的核心趋势面分析的核心:从实际观测值出发推算趋势面,一般采用回归分析方法,使得残差平方和趋于最小,即: min),(),(1212niiiiiiiniyxzyxzQ这就是在最小二乘法意义下的趋势曲面拟合。 用来计
55、算趋势面的数学方程式有多项式函数和傅立叶级数,其中最为常用的是多项式函数形式。因为任何一个函数都可以在一个适当的范围内用多项式来逼近,而且调整多项式的次数,可使所求的回归方程适合实际问题的需要。 多项式趋势面的形式 : 一次趋势面模型: 二次趋势面模型: 三次趋势面模型: yaxaaz21025423210yaxyaxayaxaaz25423210yaxyaxayaxaaz39282736yaxyayxaxa 5.3. 3 实质:根据观测值zi,xi,yii=1,2,n确定多项式的系数a0,a1,ap,使残差平方和最小。 过程: 将多项式回归非线性模型模型转化为多元线性回归模型。 令 那么pp
56、xaxaxaaz22110,2542321yxxyxxxyxxx 求求Q Q对对a0a0,a1a1,apap的偏导数,并令其等于的偏导数,并令其等于0 0,得正规方程组:得正规方程组:( (式中式中 为个为个p+Ip+I个未知量个未知量paaa,10其残差平方和为 nipipiiiniiixaxaxaazzzQ122211012)(niipininipipippiinipiniiininiipipiiniiniininipipizxxxaxxaxazxxxaxxaxazxaxana111111011111111110111110 用矩阵形式表示pnnnppxxxxxxxxxX212221212
57、111111paaaA10nzzzZ10那么式变为ZXXAXTT 对于二元二次多项式有 其正规方程组为 25423210yaxyaxayaxaaz 由式5.3. 7求解,可得:543210222222222221112111222212211222212121111111aaaaaayyxxyxyyxxyxyyxxyxyyyyxyxyxxxxyyyxxxnnnnnnnnnnnnnnnnnnnzzzyyyyxyxyxxxxyyyxxx10222212211222212121111ZXXXATT1)(5.3. 8 趋势面拟适宜度的趋势面拟适宜度的R2检验检验 趋势面拟适宜度的显著性趋势面拟适宜度的
58、显著性F检验检验 趋势面适度的逐次检验趋势面适度的逐次检验 趋势面分析拟合程度与回归模型的效果直接相关,因此,对趋势面分析进行适度性检验是一个关系到趋势面能否在实际研究中加以应用的关键问题,也是趋势面分析中不可缺少的重要环节。 这可以通过以下检验来完成: 一趋势面拟适宜度的一趋势面拟适宜度的R2检验检验n趋势面与实际面的拟合度系数趋势面与实际面的拟合度系数R R2 2是测定回归模型拟是测定回归模型拟合优度的重要指标。合优度的重要指标。n一般用变量一般用变量z z的总离差平方和中回归平方和所占的的总离差平方和中回归平方和所占的比重表示回归模型的拟合优度。比重表示回归模型的拟合优度。n总离差平方和
59、等于回归平方和与剩余平方和之和。总离差平方和等于回归平方和与剩余平方和之和。即即RDniiniiiTSSSSzzzzSS1212)()( 越大或 越小就表示因变量与自变量的关系越密切,回归的规律性越强、效果越好。记 越大,趋势面的拟合度就越高。 niiiDzzSS12)(niiRzzSS12)(RSSDSSTDTRSSSSSSSSR122R 为剩余平方和,它表示随机因素对的离差的影响, 为回归平方和,它表示个自变量对因变量的离差的总影响。 5.3. 9 趋势面适度的F检验,是对趋势面回归模型整体的显著性检验。 方法:是利用变量z的总离差平方和中剩余平方和与回归平方和的比值,确定变量z与自变量x、y之间的回归关系是否显著。即 结果
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 吉林省长春市十一中2015-2016学年高二数学上学期期初考试试题 文
- 2025-2030甜菊糖乳制品行业市场现状供需分析及重点企业投资评估规划分析研究报告
- 2025-2030年舞台表演服行业市场深度调研及前景趋势与投资研究报告
- 2025-2030年智能快递柜产业市场深度分析及发展趋势与投资战略研究报告
- 2025-2030年中国风机行业市场现状供需分析及投资评估规划分析研究报告
- 2025-2030年中国酚醛泡沫发泡剂行业市场现状供需分析及投资评估规划分析研究报告
- 2025-2030年中国角珠行业市场现状供需分析及投资评估规划分析研究报告
- 应急救援人员培训
- 2025-2030年中国管翅式换热器行业市场现状供需分析及投资评估规划分析研究报告
- 中央民族大学《硬笔书法》2023-2024学年第二学期期末试卷
- 2024秋招北森题库数学百题
- 形势与政策(贵州财经大学)知到智慧树章节答案
- 2023年新高考(新课标)全国2卷数学试题真题(含答案解析)
- DL∕T 904-2015 火力发电厂技术经济指标计算方法
- DL-T 1476-2023 电力安全工器具预防性试验规程
- 中国戏曲剧种鉴赏智慧树知到期末考试答案章节答案2024年上海戏剧学院等跨校共建
- 六年级趣味数学思维拓展题50道及答案
- 国开《Windows网络操作系统管理》形考任务4-配置故障转移群集服务实训
- 小学英语正在进行时用法及习题(含答案)
- 小黄瓜种植观察日记(课堂PPT)
- 焊缝外观质量检验规范
评论
0/150
提交评论