第12章地球信息应用模型_第1页
第12章地球信息应用模型_第2页
第12章地球信息应用模型_第3页
第12章地球信息应用模型_第4页
第12章地球信息应用模型_第5页
已阅读5页,还剩85页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十二章地球信息应用模型地球信息科学引论主要内容1地球信息应用模型概述2地球信息统计分析模型3空间分析与系统结构模型4规划与决策模型

(1)基本概念模型:一定对象的状态、结构及其属性的简化表示。地球信息模型:就是用模型来表示地球信息的状态、结构及其属性。1地球信息应用模型概述

(1)基本概念地球信息模型的功能:①简化地球系统的结构,描述和认识地球系统的构造,把所关心的问题抽取出来;②汇集数据,综合系统的大量具体事实,发现内在规律,如回归模型、相关分析模型;③模拟系统过程,预测系统未来变化,如系统预测模型、系统动态学模型等;④担负逻辑职能,解释事物变化结果的必然性;⑤验证假说和理论,形成新的理论,如空间相互作用模型;⑥优化系统结构,设计新的方案,如各类优化模型。1地球信息应用模型概述

(1)基本概念地球信息应用模型:从以上对地球信息模型的定义及其功能的分析可以看出,地球信息模型有些主要用于进行理论研究,在现实中应用的并不多,而有一部分则侧重于解决现实世界中的许多实际问题,对于这一类模型我们将其称为地球信息应用模型。1地球信息应用模型概述

(2)地球信息应用模型分类①根据考虑时间因素与否,可将地球信息应用模型分为静态模型与动态模型。

静态模型不考虑时间因素,如运输模型、投入产出模型等;

动态模型则在模型中加入了时间因素,如经济计划模型、时间序列模型等。1地球信息应用模型概述

(2)地球信息应用模型分类②根据是否考虑随机项,可将地球信息应用模型分为确定性模型与随机模型。确定性模型不考虑随机项,即认为各因素对系统的影响是确定的;而在现实的地球系统中,随机性因素是大量存在的,不考虑随机性因素的影响,来模拟地球系统几乎是不可能的,因此许多模型都引入了随机项。1地球信息应用模型概述

(2)地球信息应用模型分类③根据模型的用途,可将地球信息应用模型分为理论模型、预测模型、模拟模型、最优化决策模型。理论模型主要用来进行理论推倒,阐明各种地理理论;预测模型主要用来预测系统的未来状态及发展方向;模拟模型也带有预测性质,主要用于模拟在不同环境条件下系统的运动轨迹,以分析其动态特性并进行多方案比较;最优化决策模型主要用于优化决策,一般有目标函数和约束条件组成,通过计算机按照一定的最优化算法搜索迭代求出使系统目标最优的最优解,提供各种决策方案。1地球信息应用模型概述

(2)地球信息应用模型分类④根据模型所表达的关系,可将地球信息应用模型分为三类:基于物理和化学原理的理论模型,如地表径流模型、海洋和大气环流模型等;基于原理和经验的混合模型,这类模型既有基于理论原理的确定性变量,也有应用经验手段加以确定的不确定性变量;基于变量之间的统计关系或启发式关系的模型,这类模型一般被统称为经验模型。1地球信息应用模型概述

(3)地球信息模型与相关学科的关系1地球信息应用模型概述地球系统科学信息科学地球信息科学地球信息模型定量化发展完善学科理论与结构

(4)地球信息模型的建立模型与现实原型的关系:反映与被反映的关系;模型的构造必须经过抽象分析过程,即经过对现实原型扬弃次要环节的过程;地球信息模型只能与地球系统现实原型具有相对一致性,事实上往往只能在基本环节上有近似的一致性。1地球信息应用模型概述

(4)地球信息模型的建立①分析问题,确定模型类型;②分析问题的主要因素和主要关系,确定模型变量;③进行正确抽象,将研究问题模型化;④对模型求解;⑤对模型进行检验;1地球信息应用模型概述

(5)人地思维与地球信息模型的建立人对事物的认识由浅入深的过程:可意会不能言传的感觉阶段;能够在与别人的当面讨论交谈中用口头(加上表情、声调等)加以表述;能够用文字加以表达;抽象概括地用形式化的数学语言来表达。1地球信息应用模型概述

(5)人地思维与地球信息模型的建立建造模型对能力的要求:理解实际问题的能力;抽象分析的能力;运用数学及计算机工具的能力;验证模型有效性的能力(通过实践或其它方法进行验证)。1地球信息应用模型概述主要内容1地球信息应用模型概述2地球信息统计分析模型3空间分析与系统结构模型4规划与决策模型

相关关系的概念;相关分析的种类;相关系数的计算;2.1相关分析

(1)概念函数关系

它反映现象之间存在着严格的依存关系,在这种关系中,对于某一变量的每一个数值,都有另一个变量的确定值与之相对应,并且这种关系可以用一个数学表达式反映出来。如:圆的面积与半径之间的关系,即2.1相关分析

(1)概念相关关系

它反映现象之间确实存在的,但关系数值不固定的相互依存关系。

相关关系是指现象之间确实存在数量上的相互依存关系。

现象之间数量依存关系的具体关系值不是固定的。2.1相关分析

(1)概念函数关系与相关关系的区别

函数关系是变量之间的一种严格、完全确定性的关系,即一个变量的数值完全有另一个(或一组)变量的数值所决定、控制。函数关系通常可以用数学公式确切地表示出来。相关关系难以像函数关系那样,用数学公式去准确表达。2.1相关分析

(1)概念函数关系与相关关系的联系

由于客观上常会出现观察或测量上的误差等原因,函数关系在实际工作中往往通过相关关系表现出来。当人们对某些现象内部规律有较深刻认识时,相关关系可能变为函数关系。为此,在研究相关关系时,又常常使用函数关系作为工具,用一定的函数关系表现相关关系的数量联系。2.1相关分析按相关的程度完全相关不完全相关不相关(2)种类2.1相关分析按相关方向正相关负相关(2)种类2.1相关分析按相关的形式线性相关非线性相关(2)种类2.1相关分析按变量多少单相关复相关偏相关(2)种类2.1相关分析(2)种类2.1相关分析相关分析和回归分析的任务

相关分析的主要内容揭示现象之间是否存在相关关系。确定相关关系的表现形式。确定现象变量间相关关系的密切程度和方向。回归分析的主要内容建立相关关系的回归方程。测定因变量的估计值与估计值的误差程度。2.1相关分析算相关系数并检验估计值的可靠度定数学模型定相关密切程度定有无相关和类型相关分析内容相关分析内容2.1相关分析相关表相关表是一种反映变量之间相关关系的统计表。将某一变量按其取值的大小排列,然后再将与其相关的另一变量的对应值平行排列,便可得到简单的相关表。例1:某地区某企业近8年产品产量与生产费用的相关情况如表6-1所示:2.1相关分析表6-1产品产量与生产费用相关表

从上表可看出,产品产量与生产费用之间存在一定的正相关关系。相关图相关图又称散点图,它是将相关表中的观测值在平面直角坐标系中用坐标点描绘出来,以表明相关点的分布状况。通过相关图,可以大致看出两个变量之间有无相关关系以及相关的形态、方向和密切程度。例2:以表6-1为例,用EXCEL绘制相关图如下

产品产量与生产费用相关图(五)相关系数

1.相关系数的定义相关系数是用来说明变量之间在直线相关条件下相关关系密切程度和方向的统计分析指标。其定义公式为:式中:表示数据项数,为自变量,为因变量。

相关系数公式的涵义理解

(1)两个变量之间的相关程度和方向,取决于两个变量离差乘积之和,当它为0时,为0;当它为正时,为正;当它为负时,为负。(2)相关程度的大小与计量单位无关。为了消除积差中两个变量原有计量单位的影响,将各变量的离差除以该变量数列的标准差,使之成为相对积差,即,所以相关系数是无量纲的数量。2.相关系数的计算

根据相关系数定义的公式推导得简化公式:例3:以表6-1为例,用EXCEL计算相关系数见表6-2。表6-2相关系数计算表

于是:

=0.9697相关系数的意义相关系数一般可以从正负符号和绝对数值的大小两个层面理解。正负说明现象之间是正相关还是负相关。绝对数值的大小说明两现象之间线性相关的密切程度。

(1)r的取值在-1到+1之间。(2)r=+1,为完全正相关;r=-1为完全负相关。表明变量之间为完全线性相关,即函数关系。(3)r=0,表明两变量无线性相关关系。(4)r>0,表明变量之间为正相关;r<0,表明变量之间为负相关。(5)r的绝对值越接近于1,表明线性相关关系越密切;r越接近于0,表明线性相关关系越不密切。

相关程度可分为以下几种情况:

①,为无线性相关;②0.3≤<0.5,为低度线性相关;③0.5≤<0.8,为显著线性相关;④≥0.8,一般称为高度线性相关。以上说明必须建立在相关系数通过显著性检验的基础之上。

(一)回归分析的概念和特点回归分析的概念回归分析就是对具有相关关系的变量之间数量变化的一般关系进行测定,确定一个相关的数学表达式,以便于进行估计或预测的统计方法。2.2回归分析回归分析的特点(1)在变量之间,必须根据研究目的具体确定哪些是自变量,哪个是因变量。(2)回归方程的作用在于,在给定自变量的数值情况下来估计因变量的可能值。一个回归方程只能做一种推算。推算的结果表明变量之间具体的变动关系。2.2回归分析(3)直线回归方程中,自变量的系数为回归系数。回归系数的符号为正时,表示正相关;回归系数的符号为负时,表示负相关。(4)确定回归方程时,只要求因变量是随机的,而自变量是给定的数值。2.2回归分析回归分析按回归变量个数分按回归形式分一元回归多元回归线形回归非线性回归回归分析的类型2.2回归分析一元线性回归分析

1.一元线性回归模型的确定设有两个变量和,变量的取值随变量取值的变化而变化,我们称为因变量,为自变量;反之亦然。一般来说,对于具有线性相关关系的两个变量,可以用一条直线方程来表示它们之间的关系,即:倚回归方程:倚回归方程:2.2回归分析聚类分析方法是按样品(或变量)的数据特征,把相似的样品(或变量)倾向于分在同一类中,把不相似的样品(或变量)倾向于分在不同类中。聚类分析根据分类对象不同分为Q型和R型聚类分析。2.3聚类分析距离和相似系数相似性度量:距离和相似系数。距离常用来度量样品之间的相似性,相似系数常用来度量变量之间的相似性。样品之间的距离和相似系数有着各种不同的定义,而这些定义与变量的类型有着非常密切的关系。2.3聚类分析变量的测量尺度通常变量按测量尺度的不同可以分为间隔、有序和名义尺度变量三类。间隔尺度变量:变量用连续的量来表示,如长度、重量、速度、温度等。有序尺度变量:变量度量时不用明确的数量表示,而是用等级来表示,如某产品分为一等品、二等品、三等品等有次序关系。名义尺度变量:变量用一些类表示,这些类之间既无等级关系也无数量关系,如性别、职业、产品的型号等。2.3聚类分析距离有多种定义方法,在聚类分析中最常用的是欧氏距离,即有当各变量的单位不同或测量值范围相差很大时,应先对各变量的数据作标准化处理。最常用的标准化处理是,令其中和分别为第个变量的样本均值和样本方差。相似系数聚类分析方法不仅用来对样品进行分类,而且可用来对变量进行分类,在对变量进行分类时,常常采用相似系数来度量变量之间的相似性。变量之间的这种相似性度量,在一些应用中要看相似系数的大小,而在另一些应用中要看相似系数绝对值的大小。相似系数(或其绝对值)越大,认为变量之间的相似性程度就越高;反之,则越低。聚类时,比较相似的变量倾向于归为一类,不太相似的变量归属不同的类。

相似系数一般需满足的条件(1),当且仅当和是常数;(2),对一切;(3),对一切。

最常用的两个相似系数系统聚类法系统聚类法是聚类分析诸方法中用得最多的一种。基本思想是:开始将个样品各自作为一类,并规定样品之间的距离和类与类之间的距离,然后将距离最近的两类合并成一个新类,计算新类与其他类的距离;重复进行两个最近类的合并,每次减少一类,直至所有的样品合并为一类。

常用的系统聚类方法一、最短距离法二、最长距离法三、中间距离法四、类平均法五、重心法六、离差平方和法(Ward方法)一、最短距离法定义类与类之间的距离为两类最近样品间的距离,即最短距离法的聚类步骤(1)规定样品之间的距离,计算n个样品的距离矩阵

,它是一个对称矩阵。(2)选择

中的最小元素,设为

,则将

合并成一个新类,记为

,即(3)计算新类

与任一类

之间距离的递推公式为最短距离法的聚类步骤在中,

所在的行和列合并成一个新行新列,对应

,该行列上的新距离值由(6.3.2)式求得,其余行列上的距离值不变,这样就得到新的距离矩阵,记作

。(4)对

重复上述对

的两步得

,如此下去直至所有元素合并成一类为止。如果某一步中最小的元素不止一个,则称此现象为结(tie),对应这些最小元素的类可以任选一对合并或同时合并。二、最长距离法类与类之间的距离定义为两类最远样品间的距离,即最长距离法与最短距离法的并类步骤完全相同,只是类间距离的递推公式有所不同。递推公式:最长距离法容易被异常值严重地扭曲,一个有效的方法是将这些异常值单独拿出来后再进行聚类。中间距离法类与类之间的距离既不取两类最近样品间的距离,也不取两类最远样品间的距离,而是取介于两者中间的距离。动态聚类法动态聚类法的基本思想是,选择一批凝聚点或给出一个初始的分类,让样品按某种原则向凝聚点凝聚,对凝聚点进行不断的修改或迭代,直至分类比较合理或迭代稳定为止。类的个数k可以事先指定,也可以在聚类过程中确定。选择初始凝聚点(或给出初始分类)的一种简单方法是采用随机抽选(或随机分割)样品的方法。地理系统是多要素的复杂系统。变量太多,会增加分析问题的难度与复杂性,而且多个变量之间是具有一定的相关关系的能否在相关分析的基础上,用较少的新变量代替原来较多的旧变量,而且使这些较少的新变量尽可能多地保留原来变量所反映的信息?主成分分析方法就是综合处理这种问题的一种强有力的工具。主成分分析是把原来多个变量划为少数几个综合指标的一种统计分析方法。从数学角度来看,这是一种降维处理技术2.4主成分分析问题的提出一项十分著名的工作是美国的统计学家斯通(stone)在1947年关于国民经济的研究。他曾利用美国1929一1938年各年的数据,得到了17个反映国民收入与支出的变量要素,例如雇主补贴、消费资料和生产资料、纯公共支出、净增库存、股息、利息外贸平衡等等。基本思想在进行主成分分析后,竟以97.4%的精度,用三新变量就取代了原17个变量。根据经济学知识,斯通给这三个新变量分别命名为总收入F1、总收入变化率F2和经济发展或衰退的趋势F3。更有意思的是,这三个变量其实都是可以直接测量的。斯通将他得到的主成分与实际测量的总收入I、总收入变化率I以及时间t因素做相关分析,得到下表:

F1F2F3iitF11

F201

F3001

i0.995-0.0410.057l

i-0.0560.948-0.124-0.102l

t-0.369-0.282-0.836-0.414-0.1121主成分分析是把各变量之间互相关联的复杂关系进行简化分析的方法。在社会经济的研究中,为了全面系统的分析和研究问题,必须考虑许多经济指标,这些指标能从不同的侧面反映我们所研究的对象的特征,但在某种程度上存在信息的重叠,具有一定的相关性。

主成分分析试图在力保数据信息丢失最少的原则下,对这种多变量的截面数据表进行最佳综合简化,也就是说,对高维变量空间进行降维处理。很显然,识辨系统在一个低维空间要比在一个高维空间容易得多。

(1)基于相关系数矩阵还是基于协方差矩阵做主成分分析。当分析中所选择的经济变量具有不同的量纲,变量水平差异很大,应该选择基于相关系数矩阵的主成分分析。

在力求数据信息丢失最少的原则下,对高维的变量空间降维,即研究指标体系的少数几个线性组合,并且这几个线性组合所构成的综合指标将尽可能多地保留原来指标变异方面的信息。这些综合指标就称为主成分。要讨论的问题是:(2)选择几个主成分。主成分分析的目的是简化变量,一般情况下主成分的个数应该小于原始变量的个数。关于保留几个主成分,应该权衡主成分个数和保留的信息。(3)如何解释主成分所包含的经济意义。数学模型与几何解释假设我们所讨论的实际问题中,有p个指标,我们把这p个指标看作p个随机变量,记为X1,X2,…,Xp,主成分分析就是要把这p个指标的问题,转变为讨论p个指标的线性组合的问题,而这些新的指标F1,F2,…,Fk(k≤p),按照保留主要信息量的原则充分反映原指标的信息,并且相互独立。这种由讨论多个指标降为少数几个综合指标的过程在数学上就叫做降维。主成分分析通常的做法是,寻求原指标的线性组合Fi。满足如下的条件:主成分之间相互独立,即无重叠的信息。即主成分的方差依次递减,重要性依次递减,即每个主成分的系数平方和为1。即•••••••••••••••••••••••••••••••••••••主成分分析的几何解释平移、旋转坐标轴•••••••••••••••••••••••••••••••••••••主成分分析的几何解释平移、旋转坐标轴•••••••••••••••••••••••••••••••••••••主成分分析

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论