空间统计分析课件_第1页
空间统计分析课件_第2页
空间统计分析课件_第3页
空间统计分析课件_第4页
空间统计分析课件_第5页
已阅读5页,还剩102页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第四章 空间统计分析初步 第四章 空间统计分析初步 本章主要内容探索性空间统计分析 地统计分析方法 本章主要内容探索性空间统计分析 空间统计分析,即空间数据(spatial data)的统计分析,是现代计量地理学中一个快速发展的方向和领域。空间统计分析,其核心就是认识与地理位置相关的数据间的空间依赖、空间关联或空间自相关,通过空间位置建立数据间的统计关系。 空间统计分析空间统计分析,即空间数据(spatial data)的统计分Why Do Spatial Analysis?“Everything is related to everything else, but closer things

2、 more so.” (attributed to Tobler)Toblers First Law地理学第一定律all attribute values on a geographic surface are related to each other, but closer values are more strongly related than are more distant onesWaldo Tobler,生于1930年,圣塔芭芭拉加州大学(UniversityofCalifornia,SantaBarbara,UCSB,加州大学圣塔芭芭拉分校)退休教授,美籍瑞士地理学家,制图学

3、家。Why Do Spatial Analysis?“EveryExamplesIs your educational level likely to be similar to your neighbors? 教育水平Are farm practices likely to be similar on neighboring farms? 农业实践Are housing values likely to be similar in nearby developments? 住房价格Do nearby neighborhoods have similar burglary rates?入户盗窃

4、罪率ExamplesIs your educational leCounty Homicide 杀人罪 Rates 1990County Homicide 杀人罪 Rates 1990Gini Index 1989Gini Index 1989LISA Cluster MapsHomicide Rate 1990Gini Index 1989LISA Cluster MapsHomicide Rate空间统计分析课件空间统计分析课件Examples of Research Using SDAEpidemiology (environmental exposure research)Crimin

5、ology (crime patterns)Education (neighborhood effects on attainment)Diffusion/adoption (technologies)Social movements (trade unions, demonstrations)Market analysis (housing and land price variation)Spillover effects (economic spillovers of universities)Regional studies (regional income variation & i

6、nequality)Demography (segregation patterns)Political science (election studies)Examples of Research Using SDA第1节 探索性空间统计分析 基本原理与方法 应用实例 第1节 探索性空间统计分析 基本原理与方法 通常定义一个二元对称空间权重矩阵W,来表达n个位置的空间区域的邻近关系,其形式如下 式中:Wij表示区域i与j的临近关系,它可以根据邻接标准或距离标准来度量。 一、基本原理与方法 (一)空间权重矩阵 通常定义一个二元对称空间权重矩阵W,来表达n个位置的根据连接性 简单的二进制邻接矩阵

7、根据距离 基于距离的二进制空间权重矩阵 两种最常用的确定空间权重矩阵的规则 根据连接性 简单的二进制邻接矩阵两种最常用的确定空间权重空间统计分析课件Weights Matrix Example123456789Simple Contiguity (rook) Matrix123456789101010000021010100003010001000410001010050101010106001010001700010001080000101019000001000Sample Region and UnitsWeights Matrix Example12345678(二)全局空间自相关 M

8、oran指数和Geary系数是两个用来度量空间自相关的全局指标。 Moran指数反映的是空间邻接或空间邻近的区域单元属性值的相似程度。Geary 系数与Moran指数存在负相关关系。 (二)全局空间自相关 Moran指数和Geary系数是两个用 如果是位置(区域)的观测值,则该变量的全局Moran指数I,用如下公式计算 式中: I 为Moran指数; ;。 如果是位置(区域)的观测值,则该变量的全局Moran指数ISpatial auto-correlationCorrelationCoefficient=Briggs UT-Dallas GISC 6382 Spring 2007Spatia

9、l CorrelationCoefficienThe expected value of Morans I under the null hypothesis of no spatial autocorrelation is方差为The expected value of Morans 空间统计分析课件 Geary 系数C计算公式如下 式中:C为Geary系数;其他变量同上式。 如果引入记号 Geary 系数C计算公式如下 则全局Moran指数I的计算公式也可以进一步写成 Moran指数I的取值一般在-1,1之间,小于0表示负相关,等于0表示不相关,大于0表示正相关; Geary系数C的取值一

10、般在0,2之间,大于1表示负相关,等于1表示不相关,而小于1表示正相关。 则全局Moran指数I的计算公式也可以进一步写成对于Moran指数,可以用标准化统计量Z来检验n个区域是否存在空间自相关关系,Z的计算公式为 对于Moran指数,可以用标准化统计量Z来检验n个区域是否存当Z值为正且显著时,表明存在正的空间自相关,也就是说相似的观测值(高值或低值)趋于空间集聚;当Z值为负且显著时,表明存在负的空间自相关,相似的观测值趋于分散分布; 当Z值为零时,观测值呈独立随机分布。当Z值为正且显著时,表明存在正的空间自相关,也就是说相似的观examplean arrangement of 10 cell

11、s with real-valued entries Table 510 Tabulated lattice dataa table of (x,y,z) triples, where rows are numbered 1,2 from the top and columns are likewise numbered 1,2 from the left, 371 4 82 5 96 10examplean arrangement of 10 celattice as a binary matrix using rooks move definitions lattice as a bina

12、ry matrix usiA. Computation of variance/covariance-like quantities, matrix CB. C*W: Adjustment by multiplication of the weighting matrix, W A. Computation of variance/cov;。I=10*16.19/(26*196.68) so I=0.0317 ;。I=10*16.19/(26*196.68) I=? 请完成I=0.26 I=? 请完成I=0.26 (三)局部空间自相关 局部空间自相关分析方法包括3种: 空间联系的局部指标(LI

13、SA) ; G统计量 ; Moran散点图。 (三)局部空间自相关 局部空间自相关分析方法空间联系的局部指标(LISA) 空间联系的局部指标(local indicators of spatial association ,缩写为LISA)满足下列两个条件:1)每个区域单元的LISA,是描述该区域单元周围显著的相似值区域单元之间空间集聚程度的指标;2)所有区域单元LISA的总和与全局的空间联系指标成比例。空间联系的局部指标(LISA) 空间联系的局部指标(loLISA包括局部Moran指数(local Moran)和局部Geary指数(local Geary),下面重点介绍和讨论局部Moran

14、指数。LISA包括局部Moran指数(local Moran)和局 局部Moran指数被定义为 可进一步写成 式中: 和 是经过标准差标准化的观测值。 局部Moran指数检验的标准化统计量为 局部Moran指数被定义为G 统计量 全局G统计量的计算公式为对每一个区域单元的统计量为 G 统计量 全局G统计量的计算公式为 对统计量的检验与局部Moran指数相似,其检验值为 显著的正值表示在该区域单元周围,高观测值的区域单元趋于空间集聚,而显著的负值表示低观测值的区域单元趋于空间集聚,与Moran指数只能发现相似值(正关联)或非相似性观测值(负关联)的空间集聚模式相比,具有能够探测出区域单元属于高值

15、集聚还是低值集聚的空间分布模式。 对统计量的检验与局部Moran指数相似,其检验值为 Moran散点图 以(Wz,z)为坐标点的Moran散点图,常来研究局部的空间不稳定性,它对空间滞后因子Wz和z数据对进行了可视化的二维图示。全局Moran指数,可以看作是Wz对于z的线性回归系数,对界外值以及对Moran指数具有强烈影响的区域单元,可通过标准回归来诊断出。由于数据对(Wz,z)经过了标准化,因此界外值可易由2sigma规则可视化地识别出来。Moran散点图 以(Wz,z)为坐标点的Moran Moran散点图的4个象限,分别对应于区域单元与其邻居之间4种类型的局部空间联系形式: 第1象限代表

16、了高观测值的区域单元被同是高值的区域所包围的空间联系形式; 第2象限代表了低观测值的区域单元被高值的区域所包围的空间联系形式; 第3象限代表了低观测值的区域单元被同是低值的区域所包围的空间联系形式; 第4象限代表了高观测值的区域单元被低值的区域所包围的空间联系形式。 Moran散点图的4个象限,分别对应于区域 与局部Moran指数相比,其重要的优势在于能够进一步具体区分区域单元和其邻居之间属于高值和高值、低值和低值、高值和低值、低值和高值之中的哪种空间联系形式。 并且,对应于Moran散点图的不同象限,可识别出空间分布中存在着哪几种不同的实体。 将Moran散点图与LISA显著性水平相结合,也

17、可以得到所谓的“Moran显著性水平图”,图中显示出显著的LISA区域,并分别标识出对应于Moran散点图中不同象限的相应区域。 与局部Moran指数相比,其重要的优势在于能够进一步二、应用实例 中国大陆30个省级行政区人均GDP的空间关联分析。根据各省(直辖市、自治区)之间的邻接关系,采用二进制邻接权重矩阵,选取各省(直辖市、自治区)19982002年人均GDP的自然对数,依照公式计算全局Moran指数I,计算其检验的标准化统计量Z(I),结果如下表所示。年份IZP19980.50014.503 50.000 019990.506 94.555 10.000 020000.511 24.59

18、7 80.000 020010.505 94.553 20.000 020020.501 34.532 60.000 0二、应用实例 中国大陆30个省级行政区人均GDP的 从表中可以看出,在19982002年期间,中国大陆30个省级行政区人均GDP的全局Moran指数均为正值;在正态分布假设之上,对Moran指数检验的结果也高度显著。这就是说,在19982002年期间,中国大陆30个省级行政区人均GDP存在着显著的、正的空间自相关,也就是说各省级行政区人均GDP水平的空间分布并非表现出完全的随机性,而是表现出相似值之间的空间集聚,其空间联系的特征是:较高人均GDP水平的省级行政区相对地趋于和较

19、高人均GDP水平的省级行政区相邻,或者较低人均GDP水平的省级行政区相对地趋于和较低人均GDP水平的省级行政区相邻。 从表中可以看出,在19982002年期间,中国大陆 选取2001年我国30个省级行政区人均GDP数据,计算局部Gi统计量和局部Gi统计量的检验值Z(Gi),并绘制统计地图如下。 选取2001年我国30个省级行政区人均GDP 检验结果表明,贵州、四川、云南西部3省的Z值在0.05的显著性水平下显著,重庆的Z值在0.1的显著性水平下显著,该4省市在空间上相连成片分布,而且从统计学意义上来说,与该区域相邻的省区,其人均GDP趋于为同样是人均GDP低值的省区所包围。由此形成人均GDP低

20、值与低值的空间集聚,据此可认识到西部落后省区趋于空间集聚的分布特征。 检验结果表明,贵州、四川、云南西部3省的Z东部的江苏、上海、浙江三省市的Z值在0.05的显著性水平下显著,天津的Z值在0.1的显著性水平下显著。而东部上海、江浙等发达省市趋于为一些相邻经济发展水平相对较高的省份所包围,东部发达地区的空间集聚分布特征也显现出来。东部的江苏、上海、浙江三省市的Z值在0.05的显著性水平下显 以(Wz,z)为坐标,进一步绘制Moran散点图 可以发现,多数省(直辖市、自治区)位于第1和第3象限内,为正的空间联系,属于低低集聚和高高集聚类型,而且位于第3象限内的低低集聚类型的省(直辖市、自治区)比位

21、于第1象限内的高高集聚类型的省(直辖市、自治区)更多一些。 以(Wz,z)为坐标,进一步绘制Moran散点图空间统计分析课件 上图进一步显示了30个省级行政区人均GDP局部集聚的空间结构。可以看出,从人均GDP水平相对地来看: 高值被高值包围的高高集聚省(直辖市)有:北京、天津、河南、安徽、湖北、江西、海南、广东、福建、浙江、山东、上海、江苏; 低值被低值包围的低低集聚省(自治区)有:黑龙江、内蒙古、新疆、吉林、甘肃、山西、陕西、青海、西藏、四川、云南、辽宁、贵州; 被低值包围的高值省(直辖市)有:重庆、广西、河北;被高值包围的低值省份只有湖南。 上图进一步显示了30个省级行政区人均GDP局部

22、集聚的空第2节 地统计分析方法地统计方法的基本原理 应用实例 第2节 地统计分析方法地统计方法的基本原理 地统计分析概述(Geostatistics)20世纪50年代,南非采矿工程师Daniel Krige总结多年金矿勘探经验,提出根据样品点的空间位置和样品点之间空间相关程度的不同,对每个样品观测值赋予一定的权重,进行移动加权平均,估计被样品点包围的未知点矿产储量,形成了克里金估计方法(kriging)的雏形。 20世纪60年代初期,法国地质数学家Georges Matheron提出数学形式的区域化变量,严格地给出了基本变异函数(variogram)的定义和一般克里金估计方法。 通过对变异函数

23、、克里金估计以及随机模拟方法的深入扩展,地统计学(Geostatistics)已经成为空间统计学的核心内容,其理论体系的深度和方法扩展宽度是其它空间统计方法无法比拟的。地统计分析概述(Geostatistics)20世纪50年Interpolating a surfaceInterpolating a surface地统计学是以区域化变量理论为基础,以变异函数为主要工具,研究那些在空间分布上既有随机性又有结构性,或空间相关和依赖性的自然现象的科学。 协方差函数和变异函数是以区域化变量理论为基础建立起来的地统计学的两个最基本的函数。地统计学的主要方法之一,克立格法就是建立在变异函数理论和结构分析

24、基础之上的。 地统计学是以区域化变量理论为基础,以变异函数为主要工具,研究(1) 随机过程与经典统计学相同的是,地统计学也是在大量样本的基础上,通过分析样本间的规律,探索其分布规律,并进行预测。地统计学认为研究区域中的所有样本值都是随机过程的结果,即所有样本值都不是相互独立的,它们是遵循一定的内在规律的。因此地统计学就是要揭示这种内在规律,并进行预测。 (2) 正态分布 在统计学分析中,假设大量样本是服从正态分布的,地统计学也不例外。在获得数据后首先应对数据进行分析,若不符合正态分布的假设,应对数据进行变换,转为符合正态分布的形式,并尽量选取可逆的变换形式。 一、地统计方法的基本原理 (一)

25、前提假设 (1) 随机过程一、地统计方法的基本原理 (一) 前提假设 (3)平稳性 对于统计学而言,重复的观点是其理论基础。统计学认为,从大量重复的观察中可以进行预测和估计,并可以了解估计的变化性和不确定性。对于大部分的空间数据而言,平稳性的假设是合理的。这其中包括两种平稳性:一是均值平稳,即假设均值是不变的并且与位置无关;另一类是与协方差函数有关的二阶平稳和与半变异函数有关的内蕴平稳。二阶平稳是假设具有相同的距离和方向的任意两点的协方差是相同的,协方差只与这两点的值相关而与它们的位置无关。内蕴平稳假设是指具有相同距离和方向的任意两点的方差(即变异函数)是相同的。二阶平稳和内蕴平稳都是为了获得

26、基本重复规律而作的基本假设,通过协方差函数和变异函数可以进行预测和估计预测结果的不确定性。(3)平稳性 当一个变量呈现为空间分布时,就称之为区域化变量(regionalized variable)。这种变量常常反映某种空间现象的特征,用区域化变量来描述的现象称之为区域化现象。 区域化变量,亦称区域化随机变量,G. Matheron(1963)将它定义为以空间点x的三个直角坐标为自变量的随机场 。 区域化变量具有两个最显著,而且也是最重要的特征,即随机性和结构性。一、地统计方法的基本原理 (二)区域化变量 当一个变量呈现为空间分布时,就称之为区域化变量(re(三)协方差函数 协方差函数的概念 区

27、域化随机变量之间的差异,可以用空间协方差来表示。 在概率论中,随机向量X与Y的协方差被定义为 区域化变量在空间点x和x+h处的两个随机变量和的二阶混合中心矩定义为Z(x)的自协方差函数,即(4.2.2)(4.2.1)(三)协方差函数 协方差函数的概念 (4.2.2)(4.2.协方差函数的计算公式 式中:h为两样本点空间分隔距离或距离滞后;为 在空间位置 处的实测值; 是 在 处距离偏离h的实测值i=1,2, , 是分隔距离为h时的样本点对(paris)总数, 和 分别为 和 的样本平均数,即(4.2.3)(4.2.4)(4.2.5)协方差函数的计算公式 (4.2.3)(4.2.4)(4.2.

28、若 = =m(常数),则上式可以改写为 式中:m为样本平均数,可由一般算术平均数公式求得,即 (4.2.6) 若 = (三)变异函数 变异函数的概念 变异函数(variograms),又称变差函数、变异矩,是地统计分析所特有的基本工具。 在一维条件下变异函数定义为,当空间点x在一维x轴上变化时,区域化变量Z(x)在点x和x+h处的值Z(x)与Z(x+h)差的方差的一半为区域化变量Z(x)在x轴方向上的变异函数,记为(h),即 (4.2.7)(三)变异函数 变异函数的概念 (4.2.7)平稳假设指区域化变量z(x)的任意N维分布函数不因空间点X发生位移而改变。这就要求随机函数z(x)的各阶矩都存

29、在,且平稳。 而二阶平稳假设,即要求区域化变量的一、二阶矩存在并平稳。 区域化变量z(x)若满足二阶平稳假设,则它具有以下性质: (1)z(x)的一阶原点距存在且平稳,即z(x)的数学期望存在且平稳: Ez(x)=Ez(x+h)=m (2)z(x)的二阶中心距和二阶混合中心距存在且平稳,即z(x)的方差存在且平稳和z(x)的协方差存在且平稳: Varz(x)=Varz(x+h)=S Covz(x),z(x+h)=Cov(h) 平稳假设指区域化变量z(x)的任意N维分布函数不因空间点X发 在二阶平稳假设条件下,对任意的h有 因此,公式可以改写为 从上式可知,变异函数依赖于两个自变量 x和h,当变

30、异函数 仅仅依赖于距离h而与位置x无关时, 可改写成 ,即 (4.2.9)(4.2.8) 在二阶平稳假设条件下,对任意的h有(4.2.9)(4变异函数的性质 设Z(x)是区域化变量,在满足二阶平稳假设条件下,变异函数式具有如下性质: (1) =0,即在h=0处,变异函数为0; (2) = ,即 关于直线h=0是对称的,它是一个偶函数; (3) 0,即 只能大于或等于0;变异函数的性质 (4)|h|时, c(0)或 =c(0),即 当空间距离增大时,变异函数接近先验方差 (5)- 必须是一个条件非负定函数,由- 构成的变异函数矩阵在条件 时,为非负定的。 (4)|h|时, c(0)或 =变异函数

31、的计算公式 设 是系统某属性Z在空间位置x处的值, 为一区域化随机变量,并满足二阶平稳假设,h为两样本点空间分隔距离, 和 分别是区域化变量 在空间位置 和 处的实测值i=1,2,N(h),那么,变异函数 的离散计算公式为(4.2.10)变异函数的计算公式 设 是系统某属性Z 这样对不同的空间分隔距离h,计算出相应的 和 值。如果分别以h为横坐标, 或 为纵坐标,画出协方差函数和变异函数曲线图,就可以直接展示区域化变量Z(x)的空间变异特点。可见,变异函数能同时描述区域化变量的随机性和结构性,从而在数学上对区域化变量进行严格分析,是空间变异规律分析和空间结构分析的有效工具。 这样对不同的空间分

32、隔距离h,计算出相应的 例如:假设某地区降水量Z(x)(单位:mm)是二维区域化随机变量,满足二阶平稳假设,其观测值的空间正方形网格数据如图4.2.1所示(点与点之间的距离为h=1 km)。试计算其南北方向及西北和东南方向的变异函数。例如:假设某地区降水量Z(x)(单位:mm)是二维区域化随机图4.2.1 空间正方形网格数据(点间距h=1 km) 从图4.2.1可以看出,空间上有些点,由于某种原因没有采集到。如果没有缺失值,可直接对正方形网格数据结构计算变异函数;在有缺失值的情况下,也可以计算变异函数。只要“跳过”缺失点位置即可(图4.2.2)。图4.2.1 空间正方形网格数据(点间距h=1

33、km) 首先计算南北方向上的变异函数值,由变异函数的计算公式可得 =385/72=5.35 图4.2.2 缺失值情况下样本数对的组成和计算过程为缺失值 首先计算南北方向上的变异函数值,由变异函数的计算公式 同样计算出 最后,得到南北方向和西北东南方向上的变异函数计算结果见下表。同样可以计算东西方向上的变异函数。 方向 南北 方向 西北东南 h12345h1.412.824.245.657.07N(h) 36 27 21 13 5 N(h) 322113825.359.2617.5525.6922.907.0612.9530.8558.1350.00 同样计算出 方向 变异函数的参数 变异函数有

34、个非常重要的参数,即基台值(sill)、变程(range)或称空间依赖范围(range of spatial dependence)、块金值(nugget)或称区域不连续性值(localized discontinuity)和分维数(fractal dimension)。 前3个参数可以直接从变异函数图中得到。它们决定变异函数的形状与结构。 变异函数的形状反映自然现象空间分布结构或空间相关的类型,同时还能给出这种空间相关的范围。变异函数的参数 变异函数有个非常重要的参数,即基台值半变异值的变化随着距离的加大而增加,协方差随着距离的而减小。这主要是由于半变异函数和协方差函数都是事物空间相关系数的

35、表现,当两事物彼此距离较小时,它们是相似的,因此协方差值较大,而半变异值较小;反之,协方差值较小,而半变异值较大。当变异函数随着间隔距离h的增大,从非零值达到一个相对稳定的常数时,该常数称为基台值C0+C。当半变异函数值超过基台值时,即函数值不随采样点间隔距离而改变时,空间相关性不存在。 当间隔距离h=0时,(0)= C0,该值称为块金值或块金方差(nugget variance)。 基台值是系统或系统属性中最大的变异,变异函数达到基台值时的间隔距离a称为变程。变程表示在ha以后,区域化变量Z(x)空间相关性消失。 块金值表示区域化变量在小于抽样尺度时非连续变异,由区域化变量的属性或测量误差决

36、定。 半变异值的变化随着距离的加大而增加,协方差随着距离的而减小。上述个参数可从变异函数曲线图直接得到,或通过估计曲线回归参数得到。第4个参数,即分维数用于表示变异函数的特性,由变异函数 和间隔距离h之间的关系确定 分维数D为双对数直线回归方程中的斜率,它是一个无量纲数。分维数D的大小,表示变异函数曲线的曲率,可以作为随机变异的量度。但该随机分维数D与形状分维数有本质的不同。上述个参数可从变异函数曲线图直接得到,或通过估计曲线回归参变异函数的理论模型 地统计学将变异函数理论模型分为3大类: 第1类是有基台值模型,包括球状模型、指数模型、高斯模型、线性有基台值模型和纯块金效应模型; 第2类是无基

37、台值模型,包括幂函数模型、线性无基台值模型、抛物线模型; 第3类是孔穴效应模型。 下面有代表性地介绍几种常见的变异函数理论模型。 变异函数的理论模型 地统计学将变异函数理论模型分为3大 纯块金效应模型:其一般公式为 式中:c00,为先验方差。该模型相当于区域化变量为随机分布,样本点间的协方差函数对于所有距离h均等于0,变量的空间相关不存在。 (4.2.11) 纯块金效应模型:其一般公式为(4 球状模型:其一般公式为 式中:c0为块金(效应)常数;c为拱高;c0+c为基台值;a为变程。当c0=0,c=1时,称为标准球状模型。球状模型是地统计分析中应用最广泛的理论模型,许多区域化变量的理论模型都可

38、以用该模型去拟合。 (4.2.12) 球状模型:其一般公式为 (4.2.12 指数模型:其一般公式为 式中:c0和c意义与前相同,但a不是变程。当h=3时, ,即 ,从而指数模型的变程 约为 。当c0=0,c=1时,称为标准指数模型。(4.2.13) 指数模型:其一般公式为(4.2.13) 高斯模型:其一般公式为 式中:c0和c意义与前相同,a也不是变程。当 时, ,即 ,因此高斯模型的变程 约为 。当 时,称为标准高斯函数模型。(4.2.14) 高斯模型:其一般公式为(4.2.14) 幂函数模型:其一般公式为 式中:为幂指数。当变化时,这种模型可以反映在原点附近的各种性状。但是必须小于2,若

39、 ,则函数 就不再是一个条件非负定函数了,也就是说它已经不能成为变异函数了。 (4.2.15) 幂函数模型:其一般公式为 (4.2.15) 对数模型:其一般公式为 显然,当 ,这与变异函数的性质 不符 。因此,对数模型不能描述点支撑上的区域化变量的结构。(4.2.16) 对数模型:其一般公式为 (4.2.16线性有基台值模型:其一般公式为 式中:该模型的变程为a,基台值为 。 线性无基台值模型:其一般公式为 从式中可以看出,该模型没有基台值,也没有变程。 (4.2.18)(4.2.17)线性有基台值模型:其一般公式为 (4.2.18)(4例如:某地区降水量是一个区域化变量,其变异函数 的实测值

40、及距离h的关系见下表,下面我们试用回归分析方法建立其球状变异函数模型。实测值(h)距离h实测值(h)距离h2.10.69.24.94.31.110.35.15.72.210.56.26.52.510.97.57.83.111.29.58.83.812.49.8例如:某地区降水量是一个区域化变量,其变异函数 的实测 从上面的介绍和讨论,我们知道,球状变异函数的一般形式为 当 时,有 从上面的介绍和讨论,我们知道,球状变异函数的一般形式 如果记 ,则可以得到线性模型 根据表中的数据,对上式进行最小二乘拟合,得到 (4.2.20) 计算可知,上式的显著性检验参数F=114.054,R2=0.962,

41、可见模型的拟合效果是很好的。(4.2.19) 如果记 比较(4.2.20)式与(4.2.19)式,并做简单计算可知:c0=2.048,c=1.154,a=8.353,所以,球状变异函数模型为(4.2.21) 比较(4.2.20)式与(4.2.19)式,并做简 (四)克立格插值方法 克立格(Kriging)插值法,又称空间局部估计或空间局部插值法,是地统计学的主要内容之一。克立格法是建立在变异函数理论及结构分析基础之上的,它是在有限区域内对区域化变量的取值进行无偏最优估计的一种方法。 克立格法适用的条件是,如果变异函数和相关分析的结果表明区域化变量存在空间相关性。 其实质是利用区域化变量的原始数

42、据和变异函数的结构特点,对未采样点的区域化变量的取值进行线性无偏、最优估计。 (四)克立格插值方法 克立格(Krigin 克立格插值(riging interpolation)是根据变异函数模型而发展起来的一系列地统计的空间插值方法,包括: 普通克立格法(ordinary riging); 泛克立格法(universal riging); 指示克立格法(indicator riging); 析取克立格法(disjunctive riging); 协同克立格法(cokriging)等。 下面仅对普通克立格法作一些简单介绍。 克立格插值(riging interpola 首先假设区域化变量 满足二

43、阶平稳假设和本征假设,其数学期望为m,协方差函数 及变异函数 存在。即 假设在待估计点(x)的临域内共有n个实测点,即x1,x2,xn,其样本值为 。那么,普通克里格法的插值公式为 (4.2.22) 首先假设区域化变量 满足 其中 为权重系数,表示各空间样本点 处的观测值 对估计值 的贡献程度。 可见,克立格插值的关键就是计算权重系数 。显然,权重系数的求取必须满足两个条件: 一是使 的估计是无偏的,即偏差的数学期望为零; 二是最优的,即使估计值 和实际值 之差的平方和最小。 为此,需要满足以下两个条件: 其中 为权重系数,表示各空 (1)无偏性。要使 成为 的无偏估计量,即 。 当 时,也就

44、是当 时,则有 这时, 为 的无偏估计量。 (2)最优性。在满足无偏性条件下,估计方差为(4.2.23) (1)无偏性。要使 成为 的无偏估计 使用协方差函数表达,它可以进一步写为 (4.2.24) 为使估计方差最小,根据拉格朗日乘数原理,令 (4.2.25) 求F对 和 的偏导数,并令其为0,得克立格方程组 (4.2.26) 使用协方差函数表达,它可以进一步写为 (4.2.27)(4.2.28)整理后得 解线性方程组(4.2.27)式,求出权重系数i和拉格朗日系数,代入公式(4.2.24),可得克立格估计方差 (4.2.27)(4.2.28)整理后得 在变异函数存在的条件下,根据协方差与变异

45、函数的关系: 或 ,也可以用变异函数表示普通克立格方程组和克立格估计方差,即 (4.2.29) 解线性方程组(4.2.27)式,求出权重系数 和拉格朗日乘数,代入公式(4.2.24),可得克立格估计方差 ,即 (4.2.30) 在变异函数存在的条件下,根据协上述过程也可用矩阵形式表示,令 则普通克立格方程组为 (4.2.31)解方程组(4.2.31)式,可得 (4.2.32)其估计方差为 (4.2.33) 上述过程也可用矩阵形式表示,令 也可以将克立格方程组和估计方差用变异函数写成上述矩阵形式。令 在以上的介绍中,区域化变量 的数学期望 可以是已知或未知的。如果m是已知常数,称为简单克立格法;

46、如果m是未知常数,称为普通克立格法。不管是哪一种方法,均可根据方法计算权重系数和克立格估计量。 (4.2.34)(4.2.35) (4.2.36) 也可以将克立格方程组和估计方差用 以图4.2.1为例,4个观测点x1,x2,x3,x4的观测值分别为Z(x1)=37、Z(x2)=42、Z(x3)=36、Z(x4)=35,如果假设降水量的变异函数是向同性(即变异函数在各个方向的变化都相同)的二维球状模型,其具体形式为(4.2.21)式。现在,我们用普通克立格法估计观测点x0的降水量值Z(x0)。 根据普通克立格法的基本原理,我们知道,Z(x0)估计的基本公式应该是 以图4.2.1为例,4个观测点x1,x2,x 根据公式(4.2.32),可知 (4.2.37) 根据协方差与变异函数的关系以及(4.2.21)式,可得协方差函数 根据公式(4.2.32),可知 当 时, 根据克立格矩阵的对称性,当 时, ,由此计算可得 当 时,空间统计分析课件 将以上计算结果代入克立格方程组(4.2.31 ),得 空间统计分析课件 即克立

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论