05地理要素间的回归分析省公开课一等奖全国示范课微课金奖课件_第1页
05地理要素间的回归分析省公开课一等奖全国示范课微课金奖课件_第2页
05地理要素间的回归分析省公开课一等奖全国示范课微课金奖课件_第3页
05地理要素间的回归分析省公开课一等奖全国示范课微课金奖课件_第4页
05地理要素间的回归分析省公开课一等奖全国示范课微课金奖课件_第5页
已阅读5页,还剩110页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五章地理要素回归分析(P59)第1节地理回归分析意义和作用第2节一元线性回归模型 第3节多元线性回归模型 第4节非线性回归模型建立方法 1第1页第1节地理回归分析意义和作用 相关分析揭示了地理要素之间相互关系亲密程度。但各要素之间相互关系深入详细化如某一要素与其它要素之间相互关系如能用一定函数形式给予近似地表示,那么它实用意义将会更大。2第2页在复杂地理系统中,一些要素改变极难预测或控制,相反,另外一些要素则轻易被预测或控制。若能在一些难测、难控要素与其它易测易控要素之间建立一个近似函数表示式,就能够比较轻易地经过那些易测、易控要素改变情况了解那些难测、难控要素改变情况。3第3页回归分析方法就是研究要素之间详细数量关系一个强有力工具,利用这种方法能够建立反应地理要素之间详细数量关系数学模型即回归模型。4第4页回归分析主要内容可概括为以下三个部分:①从一组地理数据出发,确定这些要素(变量)间定量数学表示式即回归模型;②依据一个或几个要素(变量)值来预测或控制另一个要素(因变量)取值;③从影响某一地理过程许多要素中,找出哪些要素(变量)是主要,哪些要素是次要,这些要素之间又有些什么关系。(逐步回归分析)5第5页回归分析所研究地理数学模型,依要素(变量)多少可分为一元地理回归模型和多元地理回归模型。依据线性和非线性关系可分为线性回归模型和非线性回归模型。6第6页第2节一元线性回归模型 2.1一元线性回归模型定义2.2参数a和b最小二乘预计2.3一元线性回归模型建立方法与步骤2.4一元线性回归模型显著性检验7第7页2.1一元线性回归模型定义假设有两个地理要素(变量)x和y,x为自变量,y为因变量。则一元线性回归模型基本结构形式为:8第8页参数A,B未知,需要依据yα与xα观察值采取最小二乘法来预计。设a和b分别为参数A和B最小二乘预计值(拟合值),则得到一元线性回归模型为:

公式(5.2)代表x与y之间相关关系拟合直线(回归直线)。9第9页2.2参数a和b最小二乘预计10第10页11第11页12第12页13第13页14第14页2.3一元线性回归模型建立方法与步骤建立一元线性回归模型过程就是用变量xi和yi实际观察数据来确定a和b值。例1:在下表(表5.1)中,将国内生产总值看作因变量y,将第一产业总产值看作自变量x,试建立它们之间一元线性回归模型。15第15页16第16页解答:17第17页18第18页用SPSS求算上例将表5.1数据输入或复制到SPSS中:19第19页进入线性回归分析界面20第20页进行自变量和因变量设置21第21页分析计算结果(一)22第22页分析计算结果(二)23第23页2.4一元线性回归模型显著性检验回归模型建立后需要对模型可信度进行检验,以判定模型质量。线性回归模型显著性检验采取F检验。在回归分析中,yn次观察值y1,y2,…,yn之间差异,能够用观察值yi与其平均值离差平方和来表示即总离差平方和,记为:24第24页25第25页26第26页27第27页方差分析:把平方和与自由度同时进行分解,并用F检验法对整个回归方程进行显著性检验。详细检验时常在方差分析表上进行(见表5.2)。28第28页我们来检验例1中所建立回归方程显著性情况。29第29页30第30页31第31页课堂练习训练学生课堂计算教材P60实例(利用spss软件进行)32第32页条件许可情况下课堂演示计算教材P60实例(利用MATLAB软件进行)数据已经准备在P65文本文件中第一个。33第33页第3节多元线性回归模型3.1多元线性回归模型建立3.2多元线性回归模型显著性检验

34第34页地理系统含有多要素性,而且各要素间相互联络、相互影响和相互制约。当研究某一个要素y与其它要素x1,x2,…,xn之间定量关系时需要用多元回归分析方法。多元地理回归模型更带有普遍性意义。35第35页3.1多元线性回归模型建立设某一要素y受k个要素x1,x2,…,xk影响,其内在联络是线性关系,经过N组观察,得到一组地理数据为ya,xa1,xa2,…xak,a=1,2,…,n。多元线性回归模型数学结构模型为:36第36页37第37页偏回归系数意义:当其它要素(自变量)都固定时,该自变量每改变一个单位而使因变量(y)平均改变数值。回归模型在几何上表示一个超平面,也可称为y对x1,x2,…,xk回归平面。依最小二乘法原理,即有:38第38页39第39页方程组(5.12)式经展开整理后得:40第40页方程组(5.13)式为正规方程组。由其系数所组成矩阵记做A,则A=X′X,即:41第41页显然,A为对称矩阵。正规方程组(5.13)式右端常数项所组成矩阵记做B,则B=X′Y,即42第42页当求出偏回归系数bj和常数项b0后再代入(5.11)式即可得k元线性地理回归模型。43第43页例2:某地域城市公共交通营运总额y与城市人口总数x1以及工农业总产值x2年平均统计数据如表5.4所表示。试建立y与x1及x2之间线性回归模型。44第44页解:据表5.4中数据,有45第45页因为计算量巨大,建立多元线性地理回归模型普通采取计算机来完成。以下分别介绍利用Matlab和统计软件SPSS来建立该实例多元地理回归模型步骤。46第46页利用Matlab计算例2多元地理回归模型在课堂进行详细演示(数据已经准备在P65文本文件中第2个。)47第47页48第48页利用SPSS建立例2多元地理回归模型在数据编辑器中输入原始数据或从EXCEL软件中复制粘贴过来。49第49页按照此步骤打开“线性回归”对话框。50第50页将因变量y输入到此框中将自变量x1,x2输入此框中51第51页在SPSS中依据多元回归时自变量选择不一样,多元回归能够有不一样计算方法。52第52页(1)全回归法(Enter)进行全回归时,全部自变量进入回归方程。使用此种方法,普通含有较高回归系数,但一些对因变量没有显著影响自变量也可能进入回归方程。53第53页(2)向前法(Forward)该方法先比较全部自变量与因变量偏相关系数,然后选择最大一个作回归系数显著性检验,决定其是否进入回归方程;缺点:某自变量选入方程后,就一直留在方程中,不再剔除,故该法又称“只进不出法”;因为在较早阶段进入回归方程当初认为最好变量在较晚阶段可能因为它与方程中其它变量之间相互关系而显得不再主要,因而有剔除必要,但向前法做不到这一点。54第54页(3)向后法(Backward)与向前法相反,向后法称为“只出不进法”;该法首先计算包含全部变量回归方程,然后用偏F检验逐一剔除对因变量无显著影响自变量,直到每一个自变量在偏F检验下都有显著性结果为止;优点:该法得到结果比全回归法简练;缺点:变量在向后消元过程中假如被剔除,它将永远不会在方程中重新出现,但该变量可能在其它变量剔除以后又对因变量有显著影响。55第55页(4)逐步回归法(Stepwise)该法是对向前法改进,它首先对偏相关系数最大变量作回归系数显著性检验,以决定该变量是否进入回归方程;然后对方程中每个变量作为最终选入方程变量求出偏F值,对偏F值最小那个变量作偏F检验,决定它是否留在回归方程中。重复此过程,直至没有变量被引入,也没有变量可剔除时为止。应用该法,现有引入变量也有剔除变量,原来被剔除变量在后面又可能被引入到回归方程中来。该法是当前应用较为广泛一个多元回归方法。56第56页我们应用全回归方法对实例2进行多元回归分析,得出一系列运算结果表(简单介绍以下)。57第57页变量输入输出表输入变量剔除变量采取方法是全回归58第58页模型综述表相关系数相关系数平方预计值标准误差调整相关系数平方值59第59页方差分析表60第60页系数分析表表中列出了常数项和各个自变量对应非标准化系数、标准化系数、t值和显著性水平(sig.)综合以上信息,用全回归方法最终得到多元线性回归方程式为:61第61页3.2多元线性回归模型显著性检验P66与一元线性回归模型一样,当多元线性回归模型建立以后也需要进行显著性检验。假如经过检验是显著则说明建立回归模型是有用,不然就毫无意义。62第62页与前面一元线性回归分析一样,因变量y观察值y1,y2,…,yn之间波动或差异是由两个原因引发,一是因为自变量x1,x2,…xk取值不一样,另一是受其它随机原因影响引发。为了从y总变差中把它们区分开来,就需要对回归模型进行方差分析,也就是将y总离差平方和S总(或Lyy)分解成两个部分,即回归平方和U与剩下平方和Q,即:S总=Lyy=U+Q63第63页在多元线性回归分析中,回归平方和表示是全部k个自变量对y变差总影响,它能够按公式:由以上公式可知:多个自变量与一个自变量情况完全相同,即回归平方和越大,则剩下平方和越小,线性关系越亲密,回归效果越好,方程预测精度就越高。64第64页在多元回归中,各个平方和自由度按下述标准来确定:①总平方和Lyy自由度为n-1;②回归平方和自由度等于自变量个数k;③剩下平方和自由度等于n-k-1。剩下平方和除以它自由度称为方差(均方),即:S2=Q/(n-K-1)在多元线性回归问题上,对整个回归进行显著性检验时,通惯用F检验法。检验F统计量为:65第65页当统计量F计算出来后就能够查F分布表对模型进行显著性检验。F分布表中有两个自由度,f1表示回归平方和自由度k(第一自由度),f2表示剩下平方和自由度n-k-1(第二自由度)。66第66页在进行检验时,首先列出多元线性回归方差分析表(见表5.9),然后查F分布表。在F分布表中列有三种不一样显著水平α值(0.10,0.05,0.01)并与其对应自由度数,将这三种含有不一样显著性水平F临界值与方差分析表中所计算出来F值进行比较:当F<F0.10(k,n-k-1)则称线性回归不显著,它表示y与k个自变量线性关系不亲密;当F值大于某一显著性水平下F临界值,则反应出线性回归在该α值水平上显著。67第67页68第68页在置信水平α=0.01下查F分布表(P306)得:F0.01(2,11)=7.21。因为F=38.722>>F0.01(2,11)=7.21,所以例2所建立回归方程在置信水平α=0.01下是显著。一样,在SPSS软件计算输出结果中其F值为38.722(见后页)。69第69页70第70页课堂练习学生课堂演示计算教材P65实例(利用spss或Matlab软件进行)建立二元线性回归方程。71第71页72第72页73第73页第4节非线性回归模型建立方法4.1一元非线性地理回归模型建立4.2多元非线性地理回归模型建立74第74页在复杂地理系统中除线性关系外,要素之间非线性关系也大量存在。这时选择适当类型曲线比配直线更符合地理实际情况。75第75页4.1一元非线性地理回归模型建立P674.1.1选配曲线与非线性关系线性化1.选配曲线概念曲线选配:依据理论分析、过去经验或观察数据分布趋势与特点来确定两个要素之间曲线类型及其函数形式,从而求非线性地理回归模型过程及其方法。76第76页当曲线函数类型确定后,下一步就是求函数中参数a和b。确定未知参数最惯用方法仍是最小二乘法。而对许多函数类型来说都是先经过变量变换,把非线性函数关系化为线性关系,然后再用求线性回归方法来确定未知参数。77第77页2.非线性关系线性化非线性关系线性化我们主要注意以下七种情况:78第78页79第79页4.1.2地理上常见非线性回归模型建立方法在地理问题上较常见曲线类型有幂函数型、指数函数型和对数函数型等。以下我们主要结合实际例子来说明非线性地理回归模型详细建立方法与步骤。80第80页(1)幂函数型我们从前面非线性关系线性化内容能够知道,两个地理要素(变量)之间幂函数表示式为:81第81页例3:长白山北麓熔岩台地地貌形态改变(见表5.10)呈幂函数曲线形。X表示各地点距白头山天池火山口壁距离(km),y为熔岩台地各地点海拔高度(m)。试建立其回归模型。82第82页解:83第83页表5.11线性回归模型建立计算表84第84页85第85页(2)指数函数型(计算原理一样,略)(3)对数函数型(计算原理一样,略)86第86页课堂练习学生演示计算教材P68页求解。Excel和SPSS两个软件结合。原始数据已经在05data_p69中准备好。87第87页4.1.3一元非线性回归模型效果检验在配曲线回归过程中,首先碰到问题是曲线类型选择。曲线类型选得恰当不但对揭示出要素间内在规律含有主要意义,而且对于降低剩下误差、提升回归模型效果更含有实际意义。不然,其结果往往不能令人满意,甚至会歪曲要素间内在规律性。所以需要对曲线回归模型进行效果检验。88第88页在配曲线回归中,要求所选配曲线与地理数据拟合很好,所以可用相关指数R2作为衡量所配曲线效果好坏指标。即:89第89页相关指数R2越大表明选配回归曲线效果越好,剩下标准差越小,其回归模型预测精度就越高。现以例3表5.10中数据为例来进行曲线回归模型效果检验。(1)依据表5.10中数据,计算出其剩下平方和与总平方和如表5.12所表示。90第90页91第91页(2)依据公式计算相关指数。相关指数为:R2=1-Q/Lyy=1-1201.14/547191.3333=0.9978另外也能够计算出剩下标准差:由上可见,距离火山口壁距离对海拔高程地形改变模型拟合效果很好,而且剩下标准差也很小,所以模型预测精度很高。92第92页4.2多元非线性地理回归模型建立在地理系统中,除部分问题是属线性关系外,还有大部分问题属于非线性关系。所以,需要深入研究多元非线性地理回归模型建立方法。我们重点介绍多项式回归模型多元非线性地理回归模型建立方法。93第93页在地理系统中因为各要素间关系十分错综复杂,有些回归曲线经过变量变换后可化为直线处理,但也有些曲线不能化为直线处理,如二次多项式就不能经过变量变换线性化,但可将它化为二元线性回归模型,然后按照多元线性回归分析方法处理。94第94页由此能够推广到包含许多要素(自变量)任意形式:这种方法能够处理相当一类非线性回归问题。它在回归分析中占有主要地位,其原因主要在于任何函数都可在较小区间内用多项式来逐步迫近。所以,在分析某一要素与其它要素定量关系时,可不问y与x确实切关系,可直接用多项式回归进行分析与计算,其效果往往很好。95第95页96第96页例4:下表(表5.13)为黑龙江省实测土温与地积温系数原始数据,试建立反应二者关系二次多项式回归模型。97第97页解:基本原理和传统计算方法(略)我们介绍利用SPSS软件来求解。98第98页利用SPSS软件求解例4方法与步骤该实例能够利用SPSS软件中曲线拟合功效求解。将数据输入或从EXCEL软件中复制粘贴。99第99页按照此步骤进入“曲线拟合”对话框100第100页在“曲线拟合”对话框中进行相关设置。输入因变量输入自变量101第101页选择此项,在回归方程式中包含常数项选择此项,生成拟合曲线图102第102页选择此项,显示ANOVA表(方差分析表)103第103页在Models方框中选择拟合模型。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论